国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智譜首席科學(xué)家唐杰:很快將推出新一代模型GLM-5

0
分享至

1月8日智譜上市當(dāng)天,清華大學(xué)計(jì)算機(jī)系教授、智譜創(chuàng)立發(fā)起人兼首席科學(xué)家唐杰發(fā)布內(nèi)部信,宣布很快將推出新一代模型GLM-5。

唐杰說,今天是“智譜生命中激動(dòng)人心的一天”。他沒有直接回應(yīng)大模型公司的商業(yè)模式爭議或給出智譜2026年商業(yè)化目標(biāo),但強(qiáng)調(diào),真正“有人用”,能幫到更多的人的理論、技術(shù)或產(chǎn)品才是智譜在追逐AGI路上的重要成就。

除了GLM-5的發(fā)布,內(nèi)部信還介紹了2026年智譜聚焦的三個(gè)技術(shù)方向,包括全新的模型架構(gòu)設(shè)計(jì),更通用的RL(強(qiáng)化學(xué)習(xí))范式以及對模型持續(xù)學(xué)習(xí)與自主進(jìn)化的探索。它們均圍繞基礎(chǔ)模型能力提升展開。

以下是唐杰公開信全文:

用“咖啡”的精神做AGI

在香港科技大學(xué)做短期訪問時(shí),和楊強(qiáng)教授在實(shí)驗(yàn)室一樓的咖啡廳偶然碰到。我說這幾天咖啡喝的太多,感覺有點(diǎn)上癮,需要戒一戒了。

楊老師說:“為什么要戒呢?上癮也不一定是壞事呀,如果我們做研究能像喝咖啡一樣上癮,又何愁研究做不好呢?”。

是啊,“上癮”便是人生的精彩所在,無論是研究,還是其它事,只要專注、努力,就一定能做好。

“讓機(jī)器像人一樣思考”是智譜自始至終的愿景和理想,也是智譜人持之以恒奮斗的唯一目標(biāo)。

2018年底,在人腦認(rèn)知的雙系統(tǒng)理論的啟發(fā)下,我們設(shè)計(jì)了一個(gè)擁有快思考+慢思考的機(jī)器“認(rèn)知”系統(tǒng)。2019年我們正式成立智譜,開始嘗試探索AGI,實(shí)現(xiàn)“讓機(jī)器像人一樣思考”的宏偉愿景。

這里的最大挑戰(zhàn)可能是直到今天也沒有人包括我們自己能夠給出一個(gè)準(zhǔn)確的AGI定義以及如何實(shí)現(xiàn)AGI的技術(shù)路徑,也許這正是探索AGI的魅力所在。

我們處在歷史上一個(gè)從未有過的非凡時(shí)刻,一個(gè)技術(shù)再一次顛覆式地改變世界的時(shí)刻。大模型不僅是通用人工智能的關(guān)鍵底座,更有望成為驅(qū)動(dòng)生產(chǎn)力變革的核心引擎。

回顧一路走來的歷程,我們能走到今天的一個(gè)重要原因是,我們始終堅(jiān)持做讓用戶真正用得上的AI技術(shù)。只有真正有人用的理論、技術(shù)或產(chǎn)品才能最終成為AGI之路上的重要成就。當(dāng)然,不是所有的創(chuàng)新都能成功,我們也有很多有風(fēng)險(xiǎn)的項(xiàng)目都以敗告終,但這也往往教會了我們從失敗中汲取力量,這讓智譜變得更強(qiáng)大,對AGI的理解也更深刻。更重要的是,這讓我們注重實(shí)用的同時(shí),不再只盯著短期收益:幫助用戶、幫助國家、幫助全球科技進(jìn)步成為智譜的長期目標(biāo)。

2020年,我們推出了自己的大模型算法架構(gòu)GLM,并開始嘗試訓(xùn)練100億參數(shù)的基座模型,模型很成功,得到包括美團(tuán)在內(nèi)的很多企業(yè)試用,這是一個(gè)很大膽的嘗試,因?yàn)楫?dāng)年還是BERT模型橫行的小模型時(shí)代。但當(dāng)時(shí)的成功距離我們夢想中的AGI還遙不可及。部分原因是模型的知識量還不夠大,而另一部分原因則是模型還不會像人一樣推理思考。

2021到2022年,大模型發(fā)展并不順利,大多數(shù)人并不接受“讓機(jī)器像人一樣思考”這種類似登月一樣的瘋狂計(jì)劃,也不認(rèn)為這可能是個(gè)非常大的技術(shù)變革機(jī)會,或者害怕失敗。我們還是決定賭一把,用更多數(shù)據(jù)訓(xùn)練一個(gè)1300億參數(shù)的大模型。

這個(gè)決策很難,因?yàn)檫€不能影響公司總體發(fā)展節(jié)奏。為此我們成立了兩個(gè)專門的小型創(chuàng)新團(tuán)隊(duì),一個(gè)負(fù)責(zé)模型訓(xùn)練,這就是后來公司的GLM三劍客;另一個(gè)則獨(dú)立負(fù)責(zé)MaaS平臺建設(shè),當(dāng)時(shí)這兩個(gè)小團(tuán)隊(duì)可能互相都不知道對方的存在。2022年中,GLM-130B訓(xùn)出來了,其中很多精細(xì)的設(shè)計(jì)引起了全球關(guān)注;同時(shí)MaaS平臺上線,也就是現(xiàn)在的bigmodel.cn,有了第一批真正的API用戶。隨后,我們正式在公司成立了AI院,專注下一代大模型研發(fā);成立MaaS平臺部,負(fù)責(zé)對外提供大模型API服務(wù)。有時(shí)候,我們需要找到有足夠大膽夢想的人(甚至專門投入更多精力去找這樣的人),一個(gè)大膽宏偉的目標(biāo)也許決定了一半的成功。

2023年,我和國內(nèi)一個(gè)頂尖的創(chuàng)業(yè)前輩(其實(shí)他比我小不少)聊AI可能對未來的改變,我們一致認(rèn)為AI會顛覆搜索、顛覆瀏覽器,會給每個(gè)人帶來一個(gè)全新的AI助手;甚至有了這個(gè)AI助手后,我們也不再需要應(yīng)用商店,反之我們可能需要為AI打造一個(gè)“API商店”,可能這個(gè)API商店的底層邏輯就是顛覆現(xiàn)有的操作系統(tǒng);隨后,也許更重大的顛覆是計(jì)算機(jī)本身,因?yàn)閷脮r(shí)我們可能不是需要一個(gè)給人用的計(jì)算機(jī)了,而是適合AI的計(jì)算機(jī)。

這個(gè)變革發(fā)生的意義將是無窮的,因?yàn)樗鼘氐字厮苡?jì)算機(jī)底層邏輯,挑戰(zhàn)計(jì)算機(jī)界用了80年的奠基石——馮諾伊曼體系。聊到這里的時(shí)候,我們不約而同覺得我們對AI的投入還太少了,還不夠All-in。

現(xiàn)實(shí)也是殘酷的,All-in不僅需要堅(jiān)定的信念,也需要極其強(qiáng)大的資金、團(tuán)隊(duì)支持,更需要精準(zhǔn)的預(yù)判。2023到2024年是全球大模型的爆發(fā)年,大廠紛紛“All-in”大模型,國內(nèi)也掀起創(chuàng)業(yè)高潮,百模大戰(zhàn)、各種AI助手層出不窮。

我們那時(shí)候可能也有失誤,有技術(shù)的也有商業(yè)的。現(xiàn)在復(fù)盤,可能原因是我們自己在追逐AGI的路上有迷失的時(shí)候,會被眼前的短期收益、短期熱鬧所迷惑。AGI是個(gè)技術(shù)變革,技術(shù)是平權(quán)的,是公開透明的,是要讓所有人都能用的上并從中獲益。

隨后DeepSeek的出現(xiàn)警醒了我們,文鋒2023年創(chuàng)業(yè)的時(shí)候和我聊過,當(dāng)時(shí)我并沒有意識到他對AGI如此執(zhí)著,感謝他帶給我很多不一樣的思考。選擇對AGI技術(shù)的執(zhí)著追求,不斷探索AGI的上界,同時(shí)精準(zhǔn)的未來預(yù)判成為下一步智譜需要不斷改進(jìn)和升華的地方。這兩年讓我們經(jīng)歷很多,更重要的是“強(qiáng)化學(xué)習(xí)”了我們對AGI、對公司治理和商業(yè)競爭的認(rèn)知。

過去一年,我們其實(shí)做了一次比較系統(tǒng)的“強(qiáng)化”。我們喊出了“定力”與“成就”的口號,要求大家保持定力,不驕不躁,不妄自菲薄,成就智譜每個(gè)人手上的事,成就自己。

年初的時(shí)候,一切都那么難,模型效果達(dá)不到預(yù)期,全國上下價(jià)格戰(zhàn),殺出重圍需要找到一個(gè)精準(zhǔn)的突破口。

我們堅(jiān)守了陣地,終于找到Coding作為突破口。

如果說4月份GLM-4.1的發(fā)布像是象征性的試探,那7月底的GLM-4.5的發(fā)布幾乎更是一場決戰(zhàn),所有技術(shù)、平臺、業(yè)務(wù)團(tuán)隊(duì)捏一把汗,日日夜夜加班,我們終于迎來一場久逢的勝利,接著GLM-4.6和GLM-4.7讓我們模型能力方面和那些國際頂尖模型并駕齊驅(qū)。我們的GLM-4.7 在包括AA、競技場等多項(xiàng)評測中獲得開源模型、國產(chǎn)模型的SOTA,來自用戶側(cè)的模型Coding和Agent真實(shí)體感也非常好,全球184個(gè)國家的15萬開發(fā)者朋友使用GLM Coding Plan,GLM-4.7發(fā)布后MaaS平臺ARR年化收入超過5億(其中海外收入超過2億),從2000萬到5億(25倍)僅用了10個(gè)月。

總體來說,在模型側(cè)我們?nèi)缙谕瓿闪四瓿醵ㄏ碌?月發(fā)一個(gè)“穩(wěn)住陣腳”的模型、年中發(fā)一個(gè)“上牌桌”的模型(即成為 one of the best)、年底發(fā)一個(gè)Top 1的模型的整體戰(zhàn)略。這為我們后續(xù)繼續(xù)沖刺AGI技術(shù)高地打下重要根基。

我們的「主權(quán)AI」也迎來全新進(jìn)展:馬來西亞國家級MaaS平臺基于Z.ai開源模型構(gòu)建,GLM成為馬來的國民級模型。主權(quán)AI出海是我參加了總書記座談會后被總書記的“中國AI要走出國門”感召,但說實(shí)話我也不知道應(yīng)該怎么做,我們的國際團(tuán)隊(duì)敢拼敢打敢成事,完成中國大模型出海從無到有的一個(gè)里程碑。業(yè)務(wù)方面,我們敢于競爭,再次完成了年度超一倍的營收增長目標(biāo)。

在種種困難和機(jī)遇并存的情況下,今天,我們以一種幾乎不可能的姿勢成為了全球大模型第一股,這表明了市場對我們技術(shù)與商業(yè)價(jià)值的認(rèn)可?!癕ake impossible possible”——還記得我們曾經(jīng)說過的嗎?

這一年來,蛻變最大的可能是不是智譜,而是一群一線的年輕人,他們把很多看起來不可能的事,真的做成了。

2026年,公司的目標(biāo)是成為國際領(lǐng)跑的大模型企業(yè)。過去一年大家討論大模型,很多在聊應(yīng)用、聊生態(tài)。

真正決定下一階段格局的,還是更底層的兩件事——模型架構(gòu)與學(xué)習(xí)范式。同時(shí),應(yīng)用側(cè)可能會出現(xiàn)一個(gè)清晰的方向:AI替代不同工種/任務(wù)的爆發(fā)年。

基于這一判斷,我們在2026年將聚焦于:

  • GLM-5。很快GLM-5將跟大家見面,通過進(jìn)一步的Scaling和很多全新技術(shù)改進(jìn),相信GLM-5會帶給大家很多新奇體驗(yàn),讓AI幫大家完成更多真實(shí)任務(wù)。

  • 全新的模型架構(gòu)設(shè)計(jì)。已經(jīng)廣泛使用近10年的Transformer架構(gòu)已經(jīng)顯露出一些不足,包括超長上下文的計(jì)算開銷、記憶機(jī)制、更新機(jī)制等。這些都需要探索全新的模型架構(gòu),發(fā)現(xiàn)新的Scaling范式,通過芯片-算法協(xié)同設(shè)計(jì)等技術(shù)提高計(jì)算效率。

  • 具有更強(qiáng)泛化能力的RL。當(dāng)前主流的RLVR范式雖然在數(shù)學(xué)和代碼領(lǐng)域取得了成功,但其依賴人工構(gòu)造可驗(yàn)證環(huán)境的局限性也日益凸顯。今年需要探索更通用的RL范式,支持AI不僅能在人類指令下完成特定任務(wù),更要能理解并執(zhí)行跨越數(shù)小時(shí)甚至數(shù)天的長時(shí)程任務(wù)。

  • 最具挑戰(zhàn)性的探索,是開啟通往持續(xù)學(xué)習(xí)與自主進(jìn)化的道路。當(dāng)前所有主流的AI模型,其智能在部署后基本上是靜態(tài)的。它們通過一次性的、耗資巨大的訓(xùn)練過程獲得知識,然后在應(yīng)用中逐漸過時(shí)。這與人腦能夠從與世界的持續(xù)交互中不斷學(xué)習(xí)、進(jìn)化的方式截然不同。我們需要對下一代學(xué)習(xí)范式——在線學(xué)習(xí)(Online Learning)或持續(xù)學(xué)習(xí)(Continual Learning)進(jìn)行前瞻性布局。

我們不是一家傳統(tǒng)公司,我們也不打算成為其中之一。我們希望成為一家一切皆有可能發(fā)生的AI原生公司:打造不斷提升智能上界的下一代模型,研發(fā)AI為核心的產(chǎn)品服務(wù)用戶。我們要讓AI成為每個(gè)人最得力的助手,幫助我們完成任務(wù)。我們認(rèn)為還需要利用AI參與治理公司降本增效、做到更公平。

隨著時(shí)間的推移,一個(gè)公司往往會習(xí)慣于做同樣的事情,做漸進(jìn)式的改進(jìn),這會限制我們的創(chuàng)新力。但在AI時(shí)代,一切都是變革式的,我們需要有點(diǎn)“不舒服”才能保持創(chuàng)新力,才能提出革命性的想法推動(dòng)下一個(gè)大的增長領(lǐng)域。

因此,我們在智譜內(nèi)部設(shè)立了一個(gè)全新部門X-Lab,這個(gè)部門將致力于用開放的方式把更多年輕人聚集,做前沿性探索,包括全新的模型架構(gòu)、新的認(rèn)知范式、還將孵化新項(xiàng)目,不局限于軟件或是硬件。同時(shí),我們也會擴(kuò)大對外投資,不僅僅是戰(zhàn)略聯(lián)合已有的被投企業(yè),也要開辟新的版圖,讓整個(gè)行業(yè)貫通起來,讓整個(gè)生態(tài)一起繁榮。在X-Lab,每個(gè)人的使命就是做完全顛覆式的創(chuàng)新,最終回歸到AGI的主線。

今天是智譜生命中激動(dòng)人心的一天,是智譜歷史上一個(gè)重要的里程碑,更是智譜一個(gè)全新時(shí)代的開啟。我很喜歡Z.ai這個(gè)品牌,Z是字母表中的最后一個(gè),代表終極境地,我們希望在AGI的探索歷程上能走到智能的終極境地,這是我們努力的目標(biāo)。我們非常興奮:

- 有一個(gè)雄心勃勃、改變世界的事業(yè)

- 著眼長遠(yuǎn)利益、放眼未來

- 更加專注,探索AGI的本質(zhì)

- 用AI賦能偉大的企業(yè)家和公司的蓬勃發(fā)展

- 用更精準(zhǔn)的預(yù)判抓住企業(yè)發(fā)展機(jī)遇

- 最終,希望我們能夠?yàn)槿祟惿鐣聿灰粯拥腁I,切實(shí)推動(dòng)人類福祉的進(jìn)步。

這是一個(gè)無與倫比的開心時(shí)刻,這種開心不是一時(shí)的多巴胺,而是探索AGI之路上積累起來的內(nèi)啡肽,讓我們更加專注,腳踏實(shí)地,持續(xù)前行!

唐杰

2026.1.8





特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
哈梅內(nèi)伊身亡,布達(dá)諾夫:俄羅斯會接受美國為烏克蘭提供的安全保證 | 狼叔看世界

哈梅內(nèi)伊身亡,布達(dá)諾夫:俄羅斯會接受美國為烏克蘭提供的安全保證 | 狼叔看世界

狼叔看世界
2026-03-01 11:40:52
認(rèn)可牢A的都是什么群體?來看老徐調(diào)查的結(jié)果

認(rèn)可牢A的都是什么群體?來看老徐調(diào)查的結(jié)果

讀鬼筆記
2026-03-01 17:48:55
據(jù)稱伊朗首次使用“法塔赫-2”導(dǎo)彈襲擊美軍基地

據(jù)稱伊朗首次使用“法塔赫-2”導(dǎo)彈襲擊美軍基地

環(huán)球網(wǎng)資訊
2026-03-01 20:05:07
隨著中國男籃2連勝,日本送韓國2連敗,本小組3支出線隊(duì)基本如下

隨著中國男籃2連勝,日本送韓國2連敗,本小組3支出線隊(duì)基本如下

小火箭愛體育
2026-03-01 18:43:21
美軍瞞不住了!炸航母基地,炸11億美元雷達(dá),幾十萬噸燃油被點(diǎn)燃

美軍瞞不住了!炸航母基地,炸11億美元雷達(dá),幾十萬噸燃油被點(diǎn)燃

書紀(jì)文譚
2026-03-01 23:26:27
不到24小時(shí),美以對伊完成二次打擊,俄媒警告:川普在逼中國下場

不到24小時(shí),美以對伊完成二次打擊,俄媒警告:川普在逼中國下場

東極妙嚴(yán)
2026-02-28 17:56:12
女單頒獎(jiǎng)!王曼昱領(lǐng)獎(jiǎng)杯開心,孫穎莎獲全程歡呼,展可愛一幕!

女單頒獎(jiǎng)!王曼昱領(lǐng)獎(jiǎng)杯開心,孫穎莎獲全程歡呼,展可愛一幕!

籃球資訊達(dá)人
2026-03-01 20:51:07
全線拉升!剛剛,超10萬人爆倉!伊朗總統(tǒng),最新發(fā)聲!伊朗股市按下“暫停鍵”

全線拉升!剛剛,超10萬人爆倉!伊朗總統(tǒng),最新發(fā)聲!伊朗股市按下“暫停鍵”

每日經(jīng)濟(jì)新聞
2026-03-01 19:40:50
哈梅內(nèi)伊:舊時(shí)代的最后一個(gè)獨(dú)裁者

哈梅內(nèi)伊:舊時(shí)代的最后一個(gè)獨(dú)裁者

黔有虎
2026-03-01 19:08:14
哈梅內(nèi)伊之死和伊朗性史

哈梅內(nèi)伊之死和伊朗性史

哲空空
2026-03-01 11:14:17
美軍方稱摧毀伊朗伊斯蘭革命衛(wèi)隊(duì)總部

美軍方稱摧毀伊朗伊斯蘭革命衛(wèi)隊(duì)總部

財(cái)聯(lián)社
2026-03-02 03:44:09
阿聯(lián)酋應(yīng)對137枚導(dǎo)彈209架無人機(jī)襲擊

阿聯(lián)酋應(yīng)對137枚導(dǎo)彈209架無人機(jī)襲擊

每日經(jīng)濟(jì)新聞
2026-03-01 12:19:49
20名伊朗女排姑娘,剛創(chuàng)造了62年紀(jì)錄,卻被導(dǎo)彈永遠(yuǎn)留在了訓(xùn)練場

20名伊朗女排姑娘,剛創(chuàng)造了62年紀(jì)錄,卻被導(dǎo)彈永遠(yuǎn)留在了訓(xùn)練場

眼界縱橫
2026-03-01 21:50:28
今起,這些錢不用交了!國家明確:3月1日起,一批收費(fèi)取消

今起,這些錢不用交了!國家明確:3月1日起,一批收費(fèi)取消

陳博世財(cái)經(jīng)
2026-03-01 10:46:47
一個(gè)U盤裝走180億,200萬人的血汗錢48小時(shí)人間蒸發(fā)

一個(gè)U盤裝走180億,200萬人的血汗錢48小時(shí)人間蒸發(fā)

流蘇晚晴
2026-03-01 16:54:18
胡塞武裝、黎巴嫩真主黨和哈馬斯就哈梅內(nèi)伊遇害發(fā)聲

胡塞武裝、黎巴嫩真主黨和哈馬斯就哈梅內(nèi)伊遇害發(fā)聲

參考消息
2026-03-01 20:06:21
真相大白!王曼昱丟冠原因曝光,是打不過莎莎嗎?張繼科早有預(yù)言

真相大白!王曼昱丟冠原因曝光,是打不過莎莎嗎?張繼科早有預(yù)言

曹說體育
2026-03-01 22:16:15
大滿貫不和諧一幕:王曼昱2-4孫穎莎 比輸球可怕是觀眾一邊倒支持

大滿貫不和諧一幕:王曼昱2-4孫穎莎 比輸球可怕是觀眾一邊倒支持

侃球熊弟
2026-03-01 20:27:26
暴雪藍(lán)色預(yù)警:山西、河北、山東、河南等地部分地區(qū)有暴雪

暴雪藍(lán)色預(yù)警:山西、河北、山東、河南等地部分地區(qū)有暴雪

界面新聞
2026-03-01 10:11:27
北京,男子貸款70萬買155萬的邁巴赫s480跑滴滴,每天睡到自然醒,網(wǎng)友:不敢相信!

北京,男子貸款70萬買155萬的邁巴赫s480跑滴滴,每天睡到自然醒,網(wǎng)友:不敢相信!

神奇故事
2026-03-01 23:49:43
2026-03-02 05:51:00
開源中國 incentive-icons
開源中國
每天為開發(fā)者推送最新技術(shù)資訊
7604文章數(shù) 34502關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長回應(yīng)

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財(cái)經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬輛

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
旅游
本地
軍事航空

藝術(shù)要聞

清代豪門過年儀式感

數(shù)碼要聞

曝蘋果WWDC 26將推Core AI框架取代Core ML并公布多項(xiàng)AI功能

旅游要聞

春雨落瘦西湖,梅花一開,才是江南真春天!

本地新聞

津南好·四時(shí)總相宜

軍事要聞

伊朗前總統(tǒng)內(nèi)賈德遇襲身亡

無障礙瀏覽 進(jìn)入關(guān)懷版