国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

姚順雨“露臉”,和唐杰楊植麟探討AGI之路

0
分享至



“我相信今年可能是AI for Science的一個爆發(fā)年,因為很多能力大大提升,我們可以做更多的事情?!?/strong>在昨日舉行的AGI-Next前沿峰會上,清華大學教授、智譜首席科學家唐杰這樣說道。

據(jù)了解,該峰會由清華大學基礎(chǔ)模型北京重點實驗室發(fā)起,旨在探討全球AGI發(fā)展的新范式與面臨的挑戰(zhàn)。

活動還邀請了Kimi創(chuàng)始人、CEO楊植麟,阿里Qwen技術(shù)負責人林俊旸,加拿大皇家學院院士、香港科技大學榮休教授楊強,以及此前被騰訊高調(diào)官宣的CEO首席科學家姚順雨參與了報告和分享,中國“開源四杰”一次聚齊了三家。

“開源四杰”是DeepLearning.AI創(chuàng)始人、斯坦福大學兼職教授吳恩達給出的定義,他曾在社媒上表示,盡管美國在頂尖閉源模型上保持優(yōu)勢,但在開源領(lǐng)域,中國的DeepSeek R1、Kimi K2、Qwen3和GLM-4.5等模型已經(jīng)領(lǐng)先于美國最好的開源產(chǎn)品。

最近一段時間,中國大模型企業(yè)也在資本市場上動作不斷。就在本場峰會舉辦的前三天,智譜剛剛在港交所敲鐘上市。本周,智譜股價已上揚至158港元,市值來到700億港元。

而在幾周前,月之暗面方面宣布剛剛完成了一輪5億美元規(guī)模融資,投后估值來到43億美元。

“開源四杰”中未能在本次活動現(xiàn)身的DeepSeek,也在近期傳出將在今年2月中旬推出DeepSeek V4的傳聞,外媒報道稱其將具備更強的編碼能力。

2026剛剛開年,中國大模型圍場已經(jīng)熱鬧起來。

01

“大模型應對GDP產(chǎn)生

5%-10%的影響”

在圓桌座談環(huán)節(jié),姚順雨并未現(xiàn)身活動現(xiàn)場,而是遠程加入了這場關(guān)于AGI新范式的討論。



“對于ToC來說,大部分人不需要用到這么強的智能。今天用ChatGPT和去年相比,寫交換代數(shù)和伽羅瓦理論的能力變強了,但是大部分人基本感受不到?!痹谡劶皩δP吐肪€分化的看法時,姚順雨表示,大模型在ToC和ToB,以及模型和應用分層兩個維度上,都發(fā)生了明顯的分化。

“AI Coding夸張一點來講,已經(jīng)在重塑整個計算機行業(yè)做事的方式,人不再是寫代碼,而是用自然語言和電腦去交流?!痹谝樣昕磥恚琓oB行業(yè)正呈現(xiàn)一個模型分化趨勢,即大部分用戶其實更傾向于用最強的模型。“最好的模型是200美元/月,第二強或者差一些的模型是50美元/月、20美元/月。我們發(fā)現(xiàn)像很多美國人愿意溢價用最好的模型?!?/strong>

在姚順雨看來,AI在ToC應用上的垂直整合已經(jīng)看到效果,無論是ChatGPT還是豆包,模型和產(chǎn)品是強耦合、緊密迭代的,“但對于ToB而言,這個趨勢似乎是相反的,模型在變得越來越強、越來越好,但同樣會有很多應用層的東西,應用好的模型在不同的生產(chǎn)力環(huán)節(jié)。”

“這一仗從DeepSeek出來之后,已經(jīng)結(jié)束了?!闭f起模型分化,唐杰坦言,DeepSeek在2025年初的橫空出世,已經(jīng)終結(jié)了大模型排隊做對話和搜索的時代,讓他開始思考下一階段一定要“讓AI做一件事情”。他表示,在和團隊爭論很久后,才決定把重心放在Coding上。

而在談到當下RL(強化學習)正成為行業(yè)主流訓練方式時,尤其是RLVR(編者注:可驗證獎勵強化學習,一種在既定標準下的機器自主學習),姚順雨給出了他的觀察。

“現(xiàn)在自主學習是一個非常熱門的詞,在硅谷的大街小巷,甚至路邊的咖啡館里,大家都在談?wù)?。”談及模型自主學習的技術(shù)路線,姚順雨表示,自主學習會面臨“在什么場景下,基于什么獎勵函數(shù)做”的問題,比如掌握某一業(yè)務(wù)場景的代碼能力,和學習某一種自然科學,是完全不同的自主學習方法論。

“這個事情其實已經(jīng)發(fā)生了?!币樣晏岬?,OpenAI就在利用用戶數(shù)據(jù)不斷彌合人聊天的風格,Claude已經(jīng)為自身這個項目完成了95%的代碼,這都可以算是一種自主學習。

在姚順雨看來,自主學習在過去一年中已出現(xiàn)清晰信號。他提到,Cursor團隊已在真實環(huán)境中,實現(xiàn)按小時級別用最新用戶數(shù)據(jù)持續(xù)學習與迭代,盡管受限于預訓練能力,整體效果仍不及OpenAI,但路徑的可行性已被證明。

“我對今年會有非常大的范式革新有信心,在持續(xù)學習、模型記憶能力,甚至多模態(tài)領(lǐng)域,都有可能出現(xiàn)新的范式變革?!痹谔平艿谋硎鲋?,這份信心來源于在大模型研發(fā)領(lǐng)域,學術(shù)界正在跟上工業(yè)界的腳步。

“兩年前,一些高校老師手上都沒有卡(算力),如今很多高校都有了算力配置,也開始進行大模型架構(gòu)、持續(xù)學習的相關(guān)研究?!痹谔平芸磥恚瑢W術(shù)界已經(jīng)加速鋪開AI研究的土壤,有望孵化出新的創(chuàng)新種子。

“一個創(chuàng)新的出現(xiàn),一定是某個事情有大量的投入,并且它的Efficiency(這里指模型訓練的投入產(chǎn)出比)到了瓶頸?!碧平苓M一步解釋這一觀點。他表示,如果AI行業(yè)繼續(xù)Scaling,盡管這樣做仍會有收益,但當成本到達某一個數(shù)量級,就需要訓練范式的創(chuàng)新。

“一方面既然要Scaling up,Scaling肯定會帶來智能上界的提升;但同時應該定義Intelligence Efficiency,即智能的效率,用更少的投入獲得智能的增量?!碧平苓@樣總結(jié)他對未來模型訓練范式的觀察。

另一邊,作為Agent領(lǐng)域的知名研究學者,姚順雨也分享了他對Agent迭代的前瞻。

“目前看來,ToB或者說生產(chǎn)力Agent才剛剛開始?!?strong>姚順雨表示,即使今天開始,世界上所有的模型訓練全部停止,但是把這些模型部署到企業(yè)中,已經(jīng)能帶來10倍甚至100倍的收益?!按竽P蛻獙DP產(chǎn)生5%-10%的影響,但是今天它對GDP的影響還不到1%?!?/strong>

而在唐杰看來,判斷一個Agent的功能邏輯是否成立,首先要看它是否真正解決了對人有價值的問題。早期不少Agent看似復雜,但最終發(fā)現(xiàn)通過更好的Prompt或基礎(chǔ)能力即可完成,獨立Agent的存在價值隨之消失。

“基座的應用永遠是矛盾。”唐杰表示,如果實現(xiàn)成本過高,而調(diào)用現(xiàn)成API就能解決,Agent的合理性就會被削弱;但一旦需求價值足夠大,基座模型又可能把能力直接吸收進來。

對于Agent的演進,加拿大皇家學院院士、香港科技大學榮休教授楊強將其劃分為四個階段:從目標與規(guī)劃均由人定義,到逐步由模型參與,再到完全由大模型內(nèi)生完成。他指出,當前階段的Agent仍高度依賴人工設(shè)定,本質(zhì)是工具化系統(tǒng);真正的拐點在于模型開始觀察人類工作并利用真實數(shù)據(jù),進而自主生成目標與行動路徑。

對于Agent的未來,楊強給出了他的定義:“Agent應該是由大模型內(nèi)生的一個native系統(tǒng)?!?/p>

“很多時候不是說人類替代了人類工作,而是會使用這些工具的人,在替代那些不會使用工具的人?!币樣甑牧硪粋€觀察,來自AI時代大眾對大模型認知的參差。

“今天中國能做到一個很有意義的事情,是更好的教育,教育大家怎么更好地使用大模型產(chǎn)品。”姚順雨如是說道。

02

Scaling仍在繼續(xù),

但訓練范式在變

“今年是RLVR(可驗證獎勵強化學習)爆發(fā)年?!闭劶癝caling模式的進化,唐杰表示,在RLVR爆發(fā)之前,行業(yè)內(nèi)只能通過人類反饋數(shù)據(jù)來做,但人類反饋的數(shù)據(jù)中“噪音”也非常多,而且場景也非常單一。“但如果我們有一個可驗證的環(huán)境,就可以讓機器自己去探索、去發(fā)現(xiàn)反饋數(shù)據(jù),實現(xiàn)自我成長?!?/strong>



唐杰所說的RLVR,是指在推理訓練中,只對模型最終是否完成目標給反饋,而不評判表達方式或推理風格。系統(tǒng)會依據(jù)預設(shè)規(guī)則自動判斷結(jié)果:如數(shù)學是否得到唯一正確解、代碼是否通過測試。模型在多次嘗試中,僅當結(jié)果被驗證成功時才獲得獎勵,失敗則不獎勵,從而調(diào)整其推理策略。

RLVR的反饋可自動生成、標準一致,因此同一套推理任務(wù)可以被反復、大規(guī)模(scaling)用于訓練。

“大家可能會問,是不是智能越來越強,我們直接把模型不停地訓就行了?”在報告環(huán)節(jié),唐杰拋出了這樣一個問題。他表示,2025年初,DeepSeek的橫空出世給了業(yè)內(nèi)很多“震撼”,標志著大模型已經(jīng)基本解決了Chat(對話)和搜索部分,“這個范式可能基本上快到頭了,剩下更多的反而是工程和技術(shù)上的問題?!?/p>

“今天(行業(yè)內(nèi))訓練的范式發(fā)生了很大變化。過往我們不管做什么事情,都會由人工將輸入和輸出標注出來?!痹诎l(fā)言中,阿里Qwen大模型負責人林俊旸同樣提及了模型的訓練范式。他表示,早期訓模型時,只要有標注的數(shù)據(jù),有“輸入”和“輸出”就可以進行訓練,“現(xiàn)在則是要把更多的數(shù)據(jù),放到實驗中去訓練。”

林俊旸以xAI為例進一步解釋了這一觀點。xAI團隊此前在直播中透露,Grok 4在RL(強化學習)階段投入的算力,是市面上其他任何模型的10倍以上。

“如此大規(guī)模的RL的數(shù)據(jù),我雖然覺得他們有點浪費,但另一方面也意味著RL有很多的想象空間?!绷挚D說道。



“我們發(fā)現(xiàn)可能基于MUON二階優(yōu)化器,它的效果會非常好,體現(xiàn)在它有兩倍的Token Efficiency的提升。”在月之暗面CEO楊植麟的分享中,他反復提到Token Efficiency這個概念,“你的Token Efficiency越高,意味著你可以用盡可能少的Token得到一樣的效果?!?/strong>

楊植麟提到的Muon,是一種用于大模型訓練的優(yōu)化器。在訓練過程中,模型會不斷計算預測結(jié)果與正確答案之間的誤差,優(yōu)化器的任務(wù)就是根據(jù)這個誤差,計算參數(shù)該如何更新。優(yōu)化器不決定模型上限,但會直接影響訓練所需的Token數(shù)量和算力成本。

“我認為基于先驗實現(xiàn)AGI,可能會更早發(fā)生。”總結(jié)個人觀察時,楊植麟表示,Agent訓練本質(zhì)是一個搜索問題:在大量可能的行動與推理路徑中,找到有效解。更強的基礎(chǔ)模型和預訓練,相當于提供更好的先驗(Prior,已有知識與約束),能提前排除大量無意義或錯誤的嘗試,從而減少搜索空間、提升Token Efficiency。



“什么是Agent最基礎(chǔ)的能力?是編程,(任何)計算機完成編程動作,就可以執(zhí)行?!碧平苓@樣解構(gòu)Agent的技術(shù)邏輯。他在現(xiàn)場舉例說明,不管是Claude的Computer Use,還是幾周前剛剛發(fā)布的豆包手機助手,抑或是名聲大噪的Manus,“異步”執(zhí)行都是一個關(guān)鍵屬性。

“幫我搜集一下,今天關(guān)于清華大學在小紅書上所有的討論,然后將關(guān)于某某的全部整理出來,生成相關(guān)的文檔?!碧平芘e例說明,像這樣一個任務(wù),往往要經(jīng)歷幾十步,甚至上百步流程。AI必須在后臺自動運行、持續(xù)判斷與執(zhí)行。換言之,大模型在Agent和Coding上的能力,將是一個映射在Device Use(設(shè)備端側(cè)使用)上的命題。

在總結(jié)環(huán)節(jié),唐杰進一步闡釋了他的理念,“在我看來計算機有三個能力:第一,計算機的表示和計算;第二,編程;第三,本質(zhì)上是搜索。”他認為,正是這三種能力的疊加,使計算機具備了走向“超級智能”的潛力。

回到訓練層面上,唐杰坦言,他認為Scaling仍將繼續(xù),但重點正在發(fā)生變化,“已知的是我們不斷加數(shù)據(jù)、不斷探索上限。還有Scaling未知,就是我們不知道的新的范式是什么。”

03

做大模型要敢于冒險,

走出榜單的束縛

展望下一個AGI的范式和行業(yè)未來,唐杰毫不掩飾作為AI研究學者的審視態(tài)度:“我們做了一些開源的成功,可能有些人會覺得很興奮,覺得中國的大模型好像已經(jīng)超過美國了,但可能真正的答案是,我們的差距目前并未縮小?!?/strong>

正視挑戰(zhàn)和差距的同時,唐杰也分享了他眼中的國產(chǎn)模型發(fā)展方向。在他看來,2025年只是多模態(tài)適應的適應期。未來關(guān)鍵在于,模型能否像人類一樣,把視覺、聲音、觸覺等信息統(tǒng)一整合,形成原生、多源協(xié)同的整體感知能力,這是多模態(tài)能力躍遷的核心難題。

唐杰進一步指出,大模型在記憶、持續(xù)學習與自我認知上仍明顯不足。當前模型缺乏分層記憶結(jié)構(gòu),如何把個人記憶擴展為可長期保存的人類集體知識,并在此基礎(chǔ)上探索反思與自我認知能力,將是下一階段最具挑戰(zhàn)、也最值得投入的方向。

“目前的模型已經(jīng)有一定的反思能力,但如何形成自我認知還是很難的問題?!碧平鼙硎?,對于大模型是否能有自我認知,在基礎(chǔ)模型研究領(lǐng)域一直都存在爭議,“我覺得模型的自我認識是有可能的,這個領(lǐng)域值得我們探索?!?/strong>

“在國內(nèi),大家對于刷榜或者數(shù)字看得更重一些?!痹趯υ捴?,姚順雨對當下的AI研究文化也給出了個人視角的觀察。他以DeepSeek為例闡述這一觀點:“他們(DeepSeek)就沒有那么關(guān)注榜單的數(shù)字,反而會更注重:第一,什么是正確的事情;第二,什么是你自己能體驗出好或者不好的。”



他進一步舉例,Claude可能在編程或者軟件工程的榜單上并非排名最高,但卻獲得了業(yè)內(nèi)公認的好評。“這需要大家能夠走出榜單的束縛,在體驗上去感受是不是正確的過程?!?/p>

“我們到底能不能引領(lǐng)新的范式,這可能是今天中國AI產(chǎn)業(yè)唯一要解決的問題?!币樣晏寡裕捌渌凶龅氖虑?,無論是商業(yè)、產(chǎn)業(yè)設(shè)計還是做工程,我們某種程度上已經(jīng)比美國做得更好?!?/p>

“我還是挺樂觀的?!边@位1998年出生的AI頂尖學者表示,任何一個新業(yè)態(tài)一旦被發(fā)現(xiàn),在中國就能夠很快復現(xiàn),甚至局部做得更好,“在制造業(yè)、新能源車領(lǐng)域,這樣的例子已經(jīng)不斷發(fā)生?!?/p>

在唐杰看來,中國AI產(chǎn)業(yè)的機會,在于聰明且敢冒險的年輕人,在于持續(xù)改善的營商環(huán)境;而在產(chǎn)業(yè)中的每個人身上,“就是我們能不能堅持,能不能在一條路上敢做、敢冒險。”

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國借給委內(nèi)瑞拉的650億打了水漂?美財長放話:別想從那拿石油

中國借給委內(nèi)瑞拉的650億打了水漂?美財長放話:別想從那拿石油

王二哥老搞笑
2026-02-28 11:04:45
2月24號,據(jù)路透社報道的消息,伊朗已經(jīng)接近與中方達成一項協(xié)議

2月24號,據(jù)路透社報道的消息,伊朗已經(jīng)接近與中方達成一項協(xié)議

百態(tài)人間
2026-02-26 15:31:05
特朗普宣布打擊伊朗

特朗普宣布打擊伊朗

界面新聞
2026-02-28 15:35:57
為了拯救沙化草原,我們一口氣養(yǎng)了5萬只雞,結(jié)果很快被打臉

為了拯救沙化草原,我們一口氣養(yǎng)了5萬只雞,結(jié)果很快被打臉

果殼
2026-02-26 16:26:23
外媒:伊朗擊落一架美軍機,價值幾十億的戰(zhàn)略飛機

外媒:伊朗擊落一架美軍機,價值幾十億的戰(zhàn)略飛機

大國之翼
2026-02-28 06:30:03
東詹翻臉三大鏡頭曝光!入場就鬧翻,隊友手足無措,艾頓成替罪羊

東詹翻臉三大鏡頭曝光!入場就鬧翻,隊友手足無措,艾頓成替罪羊

嘴炮體壇
2026-02-28 11:26:34
現(xiàn)場畫面!以色列打擊伊朗

現(xiàn)場畫面!以色列打擊伊朗

環(huán)球時報國際
2026-02-28 15:00:59
大S一對子女去醫(yī)院探望馬筱梅,11歲玥兒抱小弟弟的畫面好溫馨!

大S一對子女去醫(yī)院探望馬筱梅,11歲玥兒抱小弟弟的畫面好溫馨!

娛樂團長
2026-02-27 12:27:55
“手機將全面漲價”,沖上熱搜

“手機將全面漲價”,沖上熱搜

南方都市報
2026-02-27 14:31:12
趴在中國仁愛礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

趴在中國仁愛礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

小小科普員
2025-11-21 20:23:24
2026兩會即將召開,霍啟剛遭央媒點名,信息量大,郭晶晶放心了

2026兩會即將召開,霍啟剛遭央媒點名,信息量大,郭晶晶放心了

動物奇奇怪怪
2026-02-28 09:29:30
中國四位最“不靠譜”專家,“忽悠”央視28年,為何還能爆火至今

中國四位最“不靠譜”專家,“忽悠”央視28年,為何還能爆火至今

小莜讀史
2026-02-27 20:30:12
年后快遞員大批離職,他們不是不想干了,而是心徹底涼了!

年后快遞員大批離職,他們不是不想干了,而是心徹底涼了!

一口娛樂
2026-02-27 16:55:34
請假2小時被開除續(xù)!老板態(tài)度強硬發(fā)聲,當事人曝更多,官方介入

請假2小時被開除續(xù)!老板態(tài)度強硬發(fā)聲,當事人曝更多,官方介入

離離言幾許
2026-02-27 23:55:40
蔣家后人含淚召開發(fā)布會,請求遷靈回大陸,兩句話讓全場沉默

蔣家后人含淚召開發(fā)布會,請求遷靈回大陸,兩句話讓全場沉默

老范談史
2026-02-27 19:55:01
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
六位快樂的罕見病女孩相約長沙錄歌:一定要見面,怕再失去我們中的任何一個

六位快樂的罕見病女孩相約長沙錄歌:一定要見面,怕再失去我們中的任何一個

瀟湘晨報
2026-02-27 22:17:26
公開宣稱要創(chuàng)造條件解體俄羅斯,內(nèi)部確實很難!布達諾夫干得不錯

公開宣稱要創(chuàng)造條件解體俄羅斯,內(nèi)部確實很難!布達諾夫干得不錯

鷹眼Defence
2026-02-27 12:52:36
突然被扣費,連續(xù)數(shù)月不知情! 上海已有多人遭遇! 快查, 你的錢有沒有"消失"?

突然被扣費,連續(xù)數(shù)月不知情! 上海已有多人遭遇! 快查, 你的錢有沒有"消失"?

新浪財經(jīng)
2026-02-27 17:11:04
女孩當小姐,一晚要提供4到5次上門服務(wù),2015年被親人點到不赴約

女孩當小姐,一晚要提供4到5次上門服務(wù),2015年被親人點到不赴約

漢史趣聞
2025-11-08 09:27:32
2026-02-28 16:40:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2254文章數(shù) 8044關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

內(nèi)塔尼亞胡:美以軍事行動目標是推翻伊朗政權(quán)

頭條要聞

內(nèi)塔尼亞胡:美以軍事行動目標是推翻伊朗政權(quán)

體育要聞

球隊主力全報銷?頂風擺爛演都不演了

娛樂要聞

疑似王一博被爆私密聊天記錄

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

藝術(shù)
手機
教育
健康
軍事航空

藝術(shù)要聞

2025第十四屆中國藝術(shù)節(jié)全國優(yōu)秀美術(shù)作品展 | 入選油畫選刊

手機要聞

發(fā)布次日即聯(lián)動:三星將推《崩壞:星穹鐵道》昔漣版S26 Ultra

教育要聞

我給兩會捎句話丨剛性保障中小學每天一節(jié)體育課

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

軍事要聞

美國以色列聯(lián)合襲擊伊朗 實時戰(zhàn)況

無障礙瀏覽 進入關(guān)懷版