網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

離開(kāi)OpenAI后，這位27歲的首席AI科學(xué)家要帶騰訊走向AI的下半場(chǎng)｜姚順雨

2025-12-17 20:41:00　來(lái)源: AI進(jìn)化論花生

北京舉報(bào)

分享至

今年9月，姚順雨從OpenAI離職的消息傳出來(lái)的時(shí)候，就已經(jīng)有很多傳聞?wù)f他會(huì)加入騰訊，甚至有人說(shuō)騰訊給出了"億元年薪"。這個(gè)新聞一直沒(méi)得到肯定，也沒(méi)否定，就這么在AI圈懸著。

在今天，騰訊的一則內(nèi)部公告終于讓這個(gè)從硅谷到中國(guó)的AI圈頂級(jí)人才流轉(zhuǎn)塵埃落定了。

27歲的姚順雨正式出任騰訊「CEO/總裁辦公室」首席AI科學(xué)家，直接向總裁劉熾平匯報(bào)，同時(shí)兼任AI Infra部、大語(yǔ)言模型部負(fù)責(zé)人。年薪是不是這么夸張我們無(wú)人知曉，但騰訊確實(shí)動(dòng)了真格——同時(shí)宣布升級(jí)大模型研發(fā)架構(gòu)，新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部。

朱嘯虎前段時(shí)間剛說(shuō)「騰訊還沒(méi)真正發(fā)力」，評(píng)價(jià)騰訊往往等局面打明白后再加速追趕——從第五第六，追到第三第二，最后追到第一。今天騰訊就用一個(gè)27歲的年輕人回應(yīng)了。

微信就是這么干的。2011年從零起步，一年時(shí)間追上QQ，最終成為移動(dòng)互聯(lián)網(wǎng)時(shí)代的王者。這次騰訊要在AI領(lǐng)域重演這個(gè)故事，姚順雨是關(guān)鍵棋子。

但問(wèn)題是...為什么是他？

騰訊為什么會(huì)有信心，讓一個(gè)27歲的年輕人，掌舵騰訊AI的下半場(chǎng)？

姚班出來(lái)的，都不是普通人

要說(shuō)姚順雨的起點(diǎn)，得從2015年說(shuō)起。那年他高考704分，安徽省理科探花，進(jìn)了清華姚班。

AI圈的人都知道姚班是什么概念。每年只招30人左右，出了一批又一批頂尖人才。但姚班厲害的地方，我覺(jué)得不只是招到了天才，更在于它提供了一套系統(tǒng)的訓(xùn)練體系。

這讓我想到費(fèi)曼說(shuō)的第一性原理——真正重要的不是記住多少知識(shí)，而是學(xué)會(huì)如何思考。姚班從大一開(kāi)始就讓學(xué)生接觸前沿研究，參與實(shí)際項(xiàng)目。培養(yǎng)的不只是編程能力，更是發(fā)現(xiàn)問(wèn)題、定義問(wèn)題、解決問(wèn)題的能力。

姚順雨在這個(gè)環(huán)境里待了4年，建立了扎實(shí)的理論基礎(chǔ)和研究直覺(jué)。2019年畢業(yè)后，他去了普林斯頓讀博，導(dǎo)師是Karthik Narasimhan，專(zhuān)注語(yǔ)言智能體和人機(jī)交互。這個(gè)方向選擇為他后來(lái)的突破埋下了伏筆。

ReAct和Tree of Thoughts，這兩篇論文改變了什么？

普林斯頓的五年，姚順雨其實(shí)就做了一件事：把大語(yǔ)言模型從「對(duì)話系統(tǒng)」變成「任務(wù)執(zhí)行系統(tǒng)」。這在今天當(dāng)然算不得多新鮮的概念，畢竟今年就是所謂AI Agent的元年。我們也見(jiàn)證過(guò)今年年初能實(shí)際執(zhí)行操作，幫用戶解決問(wèn)題的Manus的誕生。

但回到兩年前，也就是2023月的時(shí)候，這還是鮮被討論的一個(gè)概念，姚順雨發(fā)表了ReAct論文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很簡(jiǎn)單：讓大語(yǔ)言模型不只能"想"（推理），還能"做"（行動(dòng)），而且兩者交替進(jìn)行。

傳統(tǒng)的Chain of Thought（思維鏈）只讓模型"想"，但不讓它"做"。ReAct的突破在于，讓模型在推理的同時(shí)，可以調(diào)用工具、查詢信息、執(zhí)行操作，再根據(jù)反饋繼續(xù)推理。這種"想-做-想-做"的循環(huán)，讓AI從"回答問(wèn)題的系統(tǒng)"變成了"解決問(wèn)題的助手"。

這篇論文在2023年的ICLR大會(huì)上被評(píng)為Oral（頂會(huì)中只有不到5%的論文能拿到的榮譽(yù)）。更重要的是，ReAct成了整個(gè)AI Agent領(lǐng)域的基礎(chǔ)框架，至今已被引用超過(guò)4300次。

2023年5月，姚順雨又發(fā)了Tree of Thoughts（思維樹(shù)）。如果說(shuō)ReAct是讓AI學(xué)會(huì)"邊想邊做"，那Tree of Thoughts就是讓AI學(xué)會(huì)"深思熟慮"。

有個(gè)數(shù)據(jù)很能說(shuō)明問(wèn)題：在Game of 24這個(gè)經(jīng)典游戲里，GPT-4用傳統(tǒng)思維鏈方法，成功率只有4%。用了Tree of Thoughts后，成功率直接飆到74%。這不是漸進(jìn)式改進(jìn)，是范式級(jí)的跨越。

Tree of Thoughts的核心想法是：讓AI解決問(wèn)題時(shí)，不只是線性思考，而是像人類(lèi)一樣，探索多個(gè)可能的推理路徑，評(píng)估每條路徑的可行性，必要時(shí)回溯重來(lái)。這種"搜索式思考"讓大語(yǔ)言模型真正有了規(guī)劃和決策能力。

這篇論文也在2023年的NeurIPS大會(huì)上拿了Oral。

到2024年5月答辯的時(shí)候，姚順雨的博士論文題目是《Language Agents: From Next-Token Prediction to Digital Automation》（語(yǔ)言智能體：從下一個(gè)詞預(yù)測(cè)到數(shù)字自動(dòng)化）。這個(gè)標(biāo)題其實(shí)很精準(zhǔn)地概括了他五年的研究成果：讓大語(yǔ)言模型從"預(yù)測(cè)文字"變成"執(zhí)行任務(wù)"。

現(xiàn)在的Google Scholar顯示，姚順雨論文的總引用次數(shù)達(dá)到19977次，h-index為27。這個(gè)數(shù)據(jù)在27歲這個(gè)年齡段，還真挺夸張的。

去OpenAI的8個(gè)月，他干了什么？

2024年8月，剛從普林斯頓畢業(yè)的姚順雨加入了OpenAI。

這是個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)。此前的姚順雨是純學(xué)術(shù)派——理論框架、基準(zhǔn)測(cè)試、論文發(fā)表。但在OpenAI的8個(gè)月，他完成了從"學(xué)術(shù)派"到"產(chǎn)品派"的轉(zhuǎn)變，而且速度快得有點(diǎn)驚人。

他深度參與了OpenAI在2024年底推出的三個(gè)重要產(chǎn)品：

Computer-Using Agent：讓AI像人類(lèi)一樣操作電腦，移動(dòng)鼠標(biāo)、點(diǎn)擊按鈕、瀏覽網(wǎng)頁(yè)
Deep Research：讓AI在互聯(lián)網(wǎng)上自主研究，整理信息，生成報(bào)告
Operator：OpenAI首個(gè)正式發(fā)布的Agent產(chǎn)品

這些產(chǎn)品背后，都能看到ReAct和Tree of Thoughts的影子。姚順雨在學(xué)術(shù)上提出的"推理與行動(dòng)結(jié)合"框架，在這里變成了真實(shí)可用的產(chǎn)品功能。

8個(gè)月時(shí)間，參與3個(gè)核心產(chǎn)品的開(kāi)發(fā)——這個(gè)速度在OpenAI這樣的頂尖公司也很罕見(jiàn)。說(shuō)明姚順雨不只會(huì)寫(xiě)論文，還有快速落地、快速迭代的產(chǎn)品能力。

不過(guò)，真正讓他變得被大眾所熟知的，其實(shí)是他在今年4月份發(fā)表的《AI的下半場(chǎng)》的文章。

這篇文章在AI圈引起了很多討論，因?yàn)樗岢隽艘粋€(gè)在當(dāng)時(shí)看來(lái)很大膽的判斷：

"AI正處在中場(chǎng)休息。"

過(guò)去幾十年，AI的主要精力都在開(kāi)發(fā)新的訓(xùn)練方法和模型。從DeepBlue、AlphaGo，到GPT-4、o-series，歷史性的突破都來(lái)自"如何訓(xùn)練出更好的模型"。但現(xiàn)在，游戲規(guī)則在變。

他總結(jié)了一個(gè)"配方"：大規(guī)模語(yǔ)言預(yù)訓(xùn)練 + 數(shù)據(jù)和算力擴(kuò)展 + "推理與行動(dòng)"理念。這個(gè)配方已經(jīng)基本標(biāo)準(zhǔn)化、產(chǎn)業(yè)化了，能解決各種各樣的任務(wù)——軟件開(kāi)發(fā)、創(chuàng)意寫(xiě)作、IMO級(jí)別的數(shù)學(xué)題、鍵鼠操作，甚至長(zhǎng)篇問(wèn)答。

那么，AI的下半場(chǎng)要做什么？

"下半場(chǎng)將把重心從'解決問(wèn)題'轉(zhuǎn)向'定義問(wèn)題'。我們不再只問(wèn)'能不能訓(xùn)練出一個(gè)模型解決X問(wèn)題？'，而是要問(wèn)'我們究竟應(yīng)該讓AI去做什么？又該如何衡量真正的進(jìn)展？'"

姚順雨提出了一個(gè)關(guān)鍵概念：效用問(wèn)題（Utility Problem）。

"AI已經(jīng)在國(guó)際象棋和圍棋上擊敗了世界冠軍，在SAT和律師資格考試中超過(guò)了大多數(shù)人類(lèi)，甚至在IOI和IMO上拿下了金牌?？墒澜绮](méi)有發(fā)生太大改變——至少?gòu)慕?jīng)濟(jì)和GDP的角度來(lái)看如此。"

問(wèn)題出在哪？他認(rèn)為，根源在于我們的評(píng)估方式跟現(xiàn)實(shí)世界不一致。

比如，在評(píng)估中，任務(wù)"應(yīng)該"自動(dòng)運(yùn)行：智能體接收輸入，自主執(zhí)行，得到獎(jiǎng)勵(lì)。但現(xiàn)實(shí)中，智能體必須在任務(wù)過(guò)程中持續(xù)跟人類(lèi)互動(dòng)——你不會(huì)只給客服發(fā)一段超長(zhǎng)文字，等上10分鐘，就指望對(duì)方給你一份完整回復(fù)。

再比如，評(píng)估"應(yīng)該"是i.i.d.（獨(dú)立同分布）的。如果有500個(gè)任務(wù)的測(cè)試集，就會(huì)獨(dú)立運(yùn)行每個(gè)任務(wù)，最后取平均?？稍诂F(xiàn)實(shí)中，我們解決問(wèn)題往往是順序進(jìn)行的，不是并行。一個(gè)Google工程師處理代碼庫(kù)問(wèn)題時(shí)，隨著對(duì)代碼越來(lái)越熟悉，效率會(huì)越來(lái)越高；但一個(gè)AI Agent在同一個(gè)代碼庫(kù)中解決了很多問(wèn)題，卻無(wú)法獲得這種"熟悉度"。

所以，下半場(chǎng)的新玩法是：

"開(kāi)發(fā)新的評(píng)估方式或任務(wù)，以衡量真實(shí)世界的效用。用現(xiàn)有配方去解決它們，或在配方上加入新的組件。"

這需要什么？產(chǎn)品經(jīng)理的思維方式。

騰訊為什么選他？

騰訊不缺技術(shù)，也不缺人才。過(guò)去一年，騰訊混元發(fā)布了超過(guò)30個(gè)新模型，混元2.0在復(fù)雜推理和文本生成場(chǎng)景國(guó)內(nèi)領(lǐng)先，混元3D模型保持全球領(lǐng)先水準(zhǔn)。

但騰訊缺的，可能是一個(gè)能帶他們走向AI下半場(chǎng)的人。

姚順雨的價(jià)值，我覺(jué)得不只在學(xué)術(shù)成就，而在于他對(duì)"AI應(yīng)該解決什么問(wèn)題"的理解。

學(xué)術(shù)貢獻(xiàn)：他定義了AI Agent的基本范式——ReAct讓AI學(xué)會(huì)"邊想邊做"，Tree of Thoughts讓AI學(xué)會(huì)"深思熟慮"。這些不是漸進(jìn)式改進(jìn)，而是范式級(jí)創(chuàng)新。

產(chǎn)品能力：他在OpenAI的8個(gè)月，證明了不只會(huì)寫(xiě)論文，還能把理論快速轉(zhuǎn)化為產(chǎn)品。Computer-Using Agent、Deep Research、Operator——都是真實(shí)可用的產(chǎn)品，不是實(shí)驗(yàn)室demo。

思想深度：《AI的下半場(chǎng)》不是簡(jiǎn)單的行業(yè)預(yù)測(cè)，而是對(duì)整個(gè)AI研究方法論的深刻反思。他看到了AI從"刷榜"到"創(chuàng)造價(jià)值"的轉(zhuǎn)折點(diǎn)，這是騰訊需要的戰(zhàn)略視野。

這讓我想到張小龍說(shuō)的產(chǎn)品哲學(xué)——好的產(chǎn)品不是功能堆砌，而是找到真正的用戶需求。姚順雨對(duì)"效用問(wèn)題"的思考，本質(zhì)上就是在追問(wèn)：AI到底應(yīng)該為用戶創(chuàng)造什么價(jià)值？

2025年5月，姚順雨在一次和張小郡的對(duì)談中被問(wèn)到："如果你是微信一號(hào)位，會(huì)怎么做Agent？"

他說(shuō)："我可能會(huì)不急，先觀望觀望。"

這種思考方式，恰恰是騰訊最需要的——不是盲目跟風(fēng)，不是簡(jiǎn)單模仿，而是深刻理解技術(shù)本質(zhì)，找到真正有價(jià)值的應(yīng)用場(chǎng)景。

12月17日，騰訊官宣姚順雨的同時(shí)，還宣布了一系列組織架構(gòu)調(diào)整：升級(jí)大模型研發(fā)架構(gòu)，新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部。AI Infra部負(fù)責(zé)大模型訓(xùn)練和推理平臺(tái)技術(shù)能力建設(shè)，聚焦分布式訓(xùn)練、高性能推理等核心技術(shù)。

這是個(gè)信號(hào)：騰訊不只是挖了個(gè)明星研究員，而是在為高強(qiáng)度的技術(shù)攻關(guān)補(bǔ)齊兵力、夯實(shí)底座。

他能給騰訊帶來(lái)什么？

短期來(lái)看，姚順雨肯定會(huì)提升混元的Agent能力。

ReAct和Tree of Thoughts已經(jīng)是AI Agent領(lǐng)域的基礎(chǔ)框架，被廣泛應(yīng)用。姚順雨對(duì)這些框架的理解和實(shí)踐經(jīng)驗(yàn)，會(huì)直接提升混元在任務(wù)執(zhí)行、多步推理、工具調(diào)用等方面的能力。

中期來(lái)看，他可能會(huì)推動(dòng)微信生態(tài)的AI改造。

在那次對(duì)談中，姚順雨提到，微信既承載社交關(guān)系，也承載職業(yè)交互——購(gòu)物咨詢、法律服務(wù)、客服溝通等。如果能把Agent能力深度整合到微信生態(tài)，讓每個(gè)用戶都能擁有自己的AI助手，想象空間會(huì)很大。

朱嘯虎說(shuō)騰訊往往是"追趕者"，但歷史告訴我們，騰訊追趕能力極強(qiáng)。微信從零起步，一年追上QQ，最終超越QQ成為移動(dòng)互聯(lián)網(wǎng)時(shí)代的王者。這次騰訊要在AI領(lǐng)域重演這個(gè)故事。

姚順雨的加入，讓這個(gè)故事有了不同可能性。他不只是執(zhí)行者，更是思想者。他對(duì)"效用問(wèn)題"的理解，對(duì)"AI下半場(chǎng)"的預(yù)判，對(duì)"評(píng)估方式"的反思，都代表著一種新的研究范式和產(chǎn)品思維。

27歲，對(duì)大多數(shù)人來(lái)說(shuō)，可能還在摸索職業(yè)方向。

但姚順雨已經(jīng)參與定義了AI Agent的基本范式，參與了OpenAI的核心產(chǎn)品開(kāi)發(fā)，成為了騰訊AI的掌舵人。

AI的下半場(chǎng)，剛開(kāi)始。

騰訊能不能在這場(chǎng)競(jìng)賽中追到第一名，誰(shuí)都無(wú)法預(yù)測(cè)。事實(shí)上，這也不是簡(jiǎn)單地靠招幾個(gè)「小天才」型人物就能解決的問(wèn)題。

不過(guò)你至少也借此看到騰訊的方向和決心，他們希望讓AI具備在現(xiàn)實(shí)世界現(xiàn)實(shí)場(chǎng)景中解決問(wèn)題的能力，這是騰訊作為守位者的需要，也是姚順雨所真正擅長(zhǎng)的。

以及，有一點(diǎn)可以確定的是：國(guó)內(nèi)的頭部企業(yè)也具有吸引硅谷頭部人才的能力，AI圈國(guó)內(nèi)與國(guó)外華人的競(jìng)爭(zhēng)還在持續(xù)發(fā)生。

而這個(gè)27歲的年輕人，已經(jīng)站在了AI下半場(chǎng)的舞臺(tái)中央。

參考資料：

姚順雨個(gè)人網(wǎng)站: https://ysymyth.github.io/
《AI的下半場(chǎng)》: https://ysymyth.github.io/The-Second-Half/
Latent.Space訪談: https://www.latent.space/p/shunyu
Tree of Thoughts論文: https://arxiv.org/abs/2305.10601
ReAct項(xiàng)目官網(wǎng): https://react-lm.github.io/
騰訊新聞: https://36kr.com/p/3599367248412930

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.