![]()
今年9月,姚順雨從OpenAI離職的消息傳出來(lái)的時(shí)候,就已經(jīng)有很多傳聞?wù)f他會(huì)加入騰訊,甚至有人說(shuō)騰訊給出了"億元年薪"。這個(gè)新聞一直沒(méi)得到肯定,也沒(méi)否定,就這么在AI圈懸著。
在今天,騰訊的一則內(nèi)部公告終于讓這個(gè)從硅谷到中國(guó)的AI圈頂級(jí)人才流轉(zhuǎn)塵埃落定了。
27歲的姚順雨正式出任騰訊「CEO/總裁辦公室」首席AI科學(xué)家,直接向總裁劉熾平匯報(bào),同時(shí)兼任AI Infra部、大語(yǔ)言模型部負(fù)責(zé)人。年薪是不是這么夸張我們無(wú)人知曉,但騰訊確實(shí)動(dòng)了真格——同時(shí)宣布升級(jí)大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部。
朱嘯虎前段時(shí)間剛說(shuō)「騰訊還沒(méi)真正發(fā)力」,評(píng)價(jià)騰訊往往等局面打明白后再加速追趕——從第五第六,追到第三第二,最后追到第一。今天騰訊就用一個(gè)27歲的年輕人回應(yīng)了。
微信就是這么干的。2011年從零起步,一年時(shí)間追上QQ,最終成為移動(dòng)互聯(lián)網(wǎng)時(shí)代的王者。這次騰訊要在AI領(lǐng)域重演這個(gè)故事,姚順雨是關(guān)鍵棋子。
但問(wèn)題是...為什么是他?
騰訊為什么會(huì)有信心,讓一個(gè)27歲的年輕人,掌舵騰訊AI的下半場(chǎng)?
姚班出來(lái)的,都不是普通人
要說(shuō)姚順雨的起點(diǎn),得從2015年說(shuō)起。那年他高考704分,安徽省理科探花,進(jìn)了清華姚班。
AI圈的人都知道姚班是什么概念。每年只招30人左右,出了一批又一批頂尖人才。但姚班厲害的地方,我覺(jué)得不只是招到了天才,更在于它提供了一套系統(tǒng)的訓(xùn)練體系。
這讓我想到費(fèi)曼說(shuō)的第一性原理——真正重要的不是記住多少知識(shí),而是學(xué)會(huì)如何思考。姚班從大一開(kāi)始就讓學(xué)生接觸前沿研究,參與實(shí)際項(xiàng)目。培養(yǎng)的不只是編程能力,更是發(fā)現(xiàn)問(wèn)題、定義問(wèn)題、解決問(wèn)題的能力。
姚順雨在這個(gè)環(huán)境里待了4年,建立了扎實(shí)的理論基礎(chǔ)和研究直覺(jué)。2019年畢業(yè)后,他去了普林斯頓讀博,導(dǎo)師是Karthik Narasimhan,專(zhuān)注語(yǔ)言智能體和人機(jī)交互。這個(gè)方向選擇為他后來(lái)的突破埋下了伏筆。
ReAct和Tree of Thoughts,這兩篇論文改變了什么?
普林斯頓的五年,姚順雨其實(shí)就做了一件事:把大語(yǔ)言模型從「對(duì)話系統(tǒng)」變成「任務(wù)執(zhí)行系統(tǒng)」。這在今天當(dāng)然算不得多新鮮的概念,畢竟今年就是所謂AI Agent的元年。我們也見(jiàn)證過(guò)今年年初能實(shí)際執(zhí)行操作,幫用戶解決問(wèn)題的Manus的誕生。
但回到兩年前,也就是2023月的時(shí)候,這還是鮮被討論的一個(gè)概念,姚順雨發(fā)表了ReAct論文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很簡(jiǎn)單:讓大語(yǔ)言模型不只能"想"(推理),還能"做"(行動(dòng)),而且兩者交替進(jìn)行。
傳統(tǒng)的Chain of Thought(思維鏈)只讓模型"想",但不讓它"做"。ReAct的突破在于,讓模型在推理的同時(shí),可以調(diào)用工具、查詢信息、執(zhí)行操作,再根據(jù)反饋繼續(xù)推理。這種"想-做-想-做"的循環(huán),讓AI從"回答問(wèn)題的系統(tǒng)"變成了"解決問(wèn)題的助手"。
這篇論文在2023年的ICLR大會(huì)上被評(píng)為Oral(頂會(huì)中只有不到5%的論文能拿到的榮譽(yù))。更重要的是,ReAct成了整個(gè)AI Agent領(lǐng)域的基礎(chǔ)框架,至今已被引用超過(guò)4300次。
2023年5月,姚順雨又發(fā)了Tree of Thoughts(思維樹(shù))。如果說(shuō)ReAct是讓AI學(xué)會(huì)"邊想邊做",那Tree of Thoughts就是讓AI學(xué)會(huì)"深思熟慮"。
有個(gè)數(shù)據(jù)很能說(shuō)明問(wèn)題:在Game of 24這個(gè)經(jīng)典游戲里,GPT-4用傳統(tǒng)思維鏈方法,成功率只有4%。用了Tree of Thoughts后,成功率直接飆到74%。這不是漸進(jìn)式改進(jìn),是范式級(jí)的跨越。
Tree of Thoughts的核心想法是:讓AI解決問(wèn)題時(shí),不只是線性思考,而是像人類(lèi)一樣,探索多個(gè)可能的推理路徑,評(píng)估每條路徑的可行性,必要時(shí)回溯重來(lái)。這種"搜索式思考"讓大語(yǔ)言模型真正有了規(guī)劃和決策能力。
這篇論文也在2023年的NeurIPS大會(huì)上拿了Oral。
到2024年5月答辯的時(shí)候,姚順雨的博士論文題目是《Language Agents: From Next-Token Prediction to Digital Automation》(語(yǔ)言智能體:從下一個(gè)詞預(yù)測(cè)到數(shù)字自動(dòng)化)。這個(gè)標(biāo)題其實(shí)很精準(zhǔn)地概括了他五年的研究成果:讓大語(yǔ)言模型從"預(yù)測(cè)文字"變成"執(zhí)行任務(wù)"。
現(xiàn)在的Google Scholar顯示,姚順雨論文的總引用次數(shù)達(dá)到19977次,h-index為27。這個(gè)數(shù)據(jù)在27歲這個(gè)年齡段,還真挺夸張的。
![]()
去OpenAI的8個(gè)月,他干了什么?
2024年8月,剛從普林斯頓畢業(yè)的姚順雨加入了OpenAI。
這是個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)。此前的姚順雨是純學(xué)術(shù)派——理論框架、基準(zhǔn)測(cè)試、論文發(fā)表。但在OpenAI的8個(gè)月,他完成了從"學(xué)術(shù)派"到"產(chǎn)品派"的轉(zhuǎn)變,而且速度快得有點(diǎn)驚人。
他深度參與了OpenAI在2024年底推出的三個(gè)重要產(chǎn)品:
Computer-Using Agent:讓AI像人類(lèi)一樣操作電腦,移動(dòng)鼠標(biāo)、點(diǎn)擊按鈕、瀏覽網(wǎng)頁(yè)
Deep Research:讓AI在互聯(lián)網(wǎng)上自主研究,整理信息,生成報(bào)告
Operator:OpenAI首個(gè)正式發(fā)布的Agent產(chǎn)品
這些產(chǎn)品背后,都能看到ReAct和Tree of Thoughts的影子。姚順雨在學(xué)術(shù)上提出的"推理與行動(dòng)結(jié)合"框架,在這里變成了真實(shí)可用的產(chǎn)品功能。
8個(gè)月時(shí)間,參與3個(gè)核心產(chǎn)品的開(kāi)發(fā)——這個(gè)速度在OpenAI這樣的頂尖公司也很罕見(jiàn)。說(shuō)明姚順雨不只會(huì)寫(xiě)論文,還有快速落地、快速迭代的產(chǎn)品能力。
不過(guò),真正讓他變得被大眾所熟知的,其實(shí)是他在今年4月份發(fā)表的《AI的下半場(chǎng)》的文章。
![]()
這篇文章在AI圈引起了很多討論,因?yàn)樗岢隽艘粋€(gè)在當(dāng)時(shí)看來(lái)很大膽的判斷:
"AI正處在中場(chǎng)休息。"
過(guò)去幾十年,AI的主要精力都在開(kāi)發(fā)新的訓(xùn)練方法和模型。從DeepBlue、AlphaGo,到GPT-4、o-series,歷史性的突破都來(lái)自"如何訓(xùn)練出更好的模型"。但現(xiàn)在,游戲規(guī)則在變。
他總結(jié)了一個(gè)"配方":大規(guī)模語(yǔ)言預(yù)訓(xùn)練 + 數(shù)據(jù)和算力擴(kuò)展 + "推理與行動(dòng)"理念。這個(gè)配方已經(jīng)基本標(biāo)準(zhǔn)化、產(chǎn)業(yè)化了,能解決各種各樣的任務(wù)——軟件開(kāi)發(fā)、創(chuàng)意寫(xiě)作、IMO級(jí)別的數(shù)學(xué)題、鍵鼠操作,甚至長(zhǎng)篇問(wèn)答。
那么,AI的下半場(chǎng)要做什么?
"下半場(chǎng)將把重心從'解決問(wèn)題'轉(zhuǎn)向'定義問(wèn)題'。我們不再只問(wèn)'能不能訓(xùn)練出一個(gè)模型解決X問(wèn)題?',而是要問(wèn)'我們究竟應(yīng)該讓AI去做什么?又該如何衡量真正的進(jìn)展?'"
姚順雨提出了一個(gè)關(guān)鍵概念:效用問(wèn)題(Utility Problem)。
"AI已經(jīng)在國(guó)際象棋和圍棋上擊敗了世界冠軍,在SAT和律師資格考試中超過(guò)了大多數(shù)人類(lèi),甚至在IOI和IMO上拿下了金牌??墒澜绮](méi)有發(fā)生太大改變——至少?gòu)慕?jīng)濟(jì)和GDP的角度來(lái)看如此。"
問(wèn)題出在哪?他認(rèn)為,根源在于我們的評(píng)估方式跟現(xiàn)實(shí)世界不一致。
比如,在評(píng)估中,任務(wù)"應(yīng)該"自動(dòng)運(yùn)行:智能體接收輸入,自主執(zhí)行,得到獎(jiǎng)勵(lì)。但現(xiàn)實(shí)中,智能體必須在任務(wù)過(guò)程中持續(xù)跟人類(lèi)互動(dòng)——你不會(huì)只給客服發(fā)一段超長(zhǎng)文字,等上10分鐘,就指望對(duì)方給你一份完整回復(fù)。
再比如,評(píng)估"應(yīng)該"是i.i.d.(獨(dú)立同分布)的。如果有500個(gè)任務(wù)的測(cè)試集,就會(huì)獨(dú)立運(yùn)行每個(gè)任務(wù),最后取平均??稍诂F(xiàn)實(shí)中,我們解決問(wèn)題往往是順序進(jìn)行的,不是并行。一個(gè)Google工程師處理代碼庫(kù)問(wèn)題時(shí),隨著對(duì)代碼越來(lái)越熟悉,效率會(huì)越來(lái)越高;但一個(gè)AI Agent在同一個(gè)代碼庫(kù)中解決了很多問(wèn)題,卻無(wú)法獲得這種"熟悉度"。
所以,下半場(chǎng)的新玩法是:
"開(kāi)發(fā)新的評(píng)估方式或任務(wù),以衡量真實(shí)世界的效用。用現(xiàn)有配方去解決它們,或在配方上加入新的組件。"
這需要什么?產(chǎn)品經(jīng)理的思維方式。
騰訊為什么選他?
騰訊不缺技術(shù),也不缺人才。過(guò)去一年,騰訊混元發(fā)布了超過(guò)30個(gè)新模型,混元2.0在復(fù)雜推理和文本生成場(chǎng)景國(guó)內(nèi)領(lǐng)先,混元3D模型保持全球領(lǐng)先水準(zhǔn)。
但騰訊缺的,可能是一個(gè)能帶他們走向AI下半場(chǎng)的人。
姚順雨的價(jià)值,我覺(jué)得不只在學(xué)術(shù)成就,而在于他對(duì)"AI應(yīng)該解決什么問(wèn)題"的理解。
學(xué)術(shù)貢獻(xiàn):他定義了AI Agent的基本范式——ReAct讓AI學(xué)會(huì)"邊想邊做",Tree of Thoughts讓AI學(xué)會(huì)"深思熟慮"。這些不是漸進(jìn)式改進(jìn),而是范式級(jí)創(chuàng)新。
產(chǎn)品能力:他在OpenAI的8個(gè)月,證明了不只會(huì)寫(xiě)論文,還能把理論快速轉(zhuǎn)化為產(chǎn)品。Computer-Using Agent、Deep Research、Operator——都是真實(shí)可用的產(chǎn)品,不是實(shí)驗(yàn)室demo。
思想深度:《AI的下半場(chǎng)》不是簡(jiǎn)單的行業(yè)預(yù)測(cè),而是對(duì)整個(gè)AI研究方法論的深刻反思。他看到了AI從"刷榜"到"創(chuàng)造價(jià)值"的轉(zhuǎn)折點(diǎn),這是騰訊需要的戰(zhàn)略視野。
這讓我想到張小龍說(shuō)的產(chǎn)品哲學(xué)——好的產(chǎn)品不是功能堆砌,而是找到真正的用戶需求。姚順雨對(duì)"效用問(wèn)題"的思考,本質(zhì)上就是在追問(wèn):AI到底應(yīng)該為用戶創(chuàng)造什么價(jià)值?
2025年5月,姚順雨在一次和張小郡的對(duì)談中被問(wèn)到:"如果你是微信一號(hào)位,會(huì)怎么做Agent?"
他說(shuō):"我可能會(huì)不急,先觀望觀望。"
這種思考方式,恰恰是騰訊最需要的——不是盲目跟風(fēng),不是簡(jiǎn)單模仿,而是深刻理解技術(shù)本質(zhì),找到真正有價(jià)值的應(yīng)用場(chǎng)景。
12月17日,騰訊官宣姚順雨的同時(shí),還宣布了一系列組織架構(gòu)調(diào)整:升級(jí)大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部。AI Infra部負(fù)責(zé)大模型訓(xùn)練和推理平臺(tái)技術(shù)能力建設(shè),聚焦分布式訓(xùn)練、高性能推理等核心技術(shù)。
這是個(gè)信號(hào):騰訊不只是挖了個(gè)明星研究員,而是在為高強(qiáng)度的技術(shù)攻關(guān)補(bǔ)齊兵力、夯實(shí)底座。
他能給騰訊帶來(lái)什么?
短期來(lái)看,姚順雨肯定會(huì)提升混元的Agent能力。
ReAct和Tree of Thoughts已經(jīng)是AI Agent領(lǐng)域的基礎(chǔ)框架,被廣泛應(yīng)用。姚順雨對(duì)這些框架的理解和實(shí)踐經(jīng)驗(yàn),會(huì)直接提升混元在任務(wù)執(zhí)行、多步推理、工具調(diào)用等方面的能力。
中期來(lái)看,他可能會(huì)推動(dòng)微信生態(tài)的AI改造。
在那次對(duì)談中,姚順雨提到,微信既承載社交關(guān)系,也承載職業(yè)交互——購(gòu)物咨詢、法律服務(wù)、客服溝通等。如果能把Agent能力深度整合到微信生態(tài),讓每個(gè)用戶都能擁有自己的AI助手,想象空間會(huì)很大。
朱嘯虎說(shuō)騰訊往往是"追趕者",但歷史告訴我們,騰訊追趕能力極強(qiáng)。微信從零起步,一年追上QQ,最終超越QQ成為移動(dòng)互聯(lián)網(wǎng)時(shí)代的王者。這次騰訊要在AI領(lǐng)域重演這個(gè)故事。
姚順雨的加入,讓這個(gè)故事有了不同可能性。他不只是執(zhí)行者,更是思想者。他對(duì)"效用問(wèn)題"的理解,對(duì)"AI下半場(chǎng)"的預(yù)判,對(duì)"評(píng)估方式"的反思,都代表著一種新的研究范式和產(chǎn)品思維。
27歲,對(duì)大多數(shù)人來(lái)說(shuō),可能還在摸索職業(yè)方向。
但姚順雨已經(jīng)參與定義了AI Agent的基本范式,參與了OpenAI的核心產(chǎn)品開(kāi)發(fā),成為了騰訊AI的掌舵人。
AI的下半場(chǎng),剛開(kāi)始。
騰訊能不能在這場(chǎng)競(jìng)賽中追到第一名,誰(shuí)都無(wú)法預(yù)測(cè)。事實(shí)上,這也不是簡(jiǎn)單地靠招幾個(gè)「小天才」型人物就能解決的問(wèn)題。
不過(guò)你至少也借此看到騰訊的方向和決心,他們希望讓AI具備在現(xiàn)實(shí)世界現(xiàn)實(shí)場(chǎng)景中解決問(wèn)題的能力,這是騰訊作為守位者的需要,也是姚順雨所真正擅長(zhǎng)的。
以及,有一點(diǎn)可以確定的是:國(guó)內(nèi)的頭部企業(yè)也具有吸引硅谷頭部人才的能力,AI圈國(guó)內(nèi)與國(guó)外華人的競(jìng)爭(zhēng)還在持續(xù)發(fā)生。
而這個(gè)27歲的年輕人,已經(jīng)站在了AI下半場(chǎng)的舞臺(tái)中央。
參考資料:
姚順雨個(gè)人網(wǎng)站: https://ysymyth.github.io/
《AI的下半場(chǎng)》: https://ysymyth.github.io/The-Second-Half/
Latent.Space訪談: https://www.latent.space/p/shunyu
Tree of Thoughts論文: https://arxiv.org/abs/2305.10601
ReAct項(xiàng)目官網(wǎng): https://react-lm.github.io/
騰訊新聞: https://36kr.com/p/3599367248412930
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.