網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

姚順雨最新訪(fǎng)談：AI下半場(chǎng)，機(jī)會(huì)在這一點(diǎn)

2026-01-17 21:43:29　來(lái)源: 筆記俠

北京舉報(bào)

分享至

內(nèi)容來(lái)源：2025年5月，語(yǔ)言即世界工作室，張小珺商業(yè)訪(fǎng)談錄對(duì)話(huà)姚順雨分享。

分享嘉賓：姚順雨，OpenAI前研究員，現(xiàn)任騰訊“CEO/總裁辦公室”首席AI科學(xué)家，AI Infra部及大語(yǔ)言模型部負(fù)責(zé)人。

高級(jí)筆記達(dá)人丨天朗明月

責(zé)編| 柒排版| 拾零

第 9392篇深度好文：12809字 | 30 分鐘閱讀

商業(yè)趨勢(shì)

筆記君說(shuō)：

都說(shuō)AGI（通用人工智能）是AI的終極目標(biāo)，但通往它的道路似乎越來(lái)越擁擠：

一邊是大模型能力持續(xù)“溢出”；另一邊是AI創(chuàng)業(yè)公司陷入集體焦慮，跟風(fēng)復(fù)刻ChatGPT的同質(zhì)化產(chǎn)品找不到差異化。

這個(gè)困境背后，是AI行業(yè)一個(gè)核心矛盾的轉(zhuǎn)化：過(guò)去，我們焦慮的是“如何訓(xùn)練出一個(gè)更強(qiáng)的模型”；現(xiàn)在，我們困惑的是“如何定義一個(gè)有價(jià)值的任務(wù)”，以真正釋放模型那被“低估”的驚人能力。

這標(biāo)志著AI發(fā)展已悄然進(jìn)入“下半場(chǎng)”。上半場(chǎng)的英雄是算法和算力，下半場(chǎng)的核心將是定義者與組織者——他們懂得如何設(shè)計(jì)互動(dòng)、編排任務(wù)、構(gòu)建環(huán)境，讓AI從“聰明的聊天者”成長(zhǎng)為“可靠的行動(dòng)者”。

OpenAI前研究員、AI Agent研究方向的核心探索者姚順雨，將這種行動(dòng)者稱(chēng)為“Language Agent（語(yǔ)言智能體）”。他指出，Agent的本質(zhì)是通過(guò)語(yǔ)言實(shí)現(xiàn)推理，通過(guò)推理實(shí)現(xiàn)泛化，它正是通往AGI的必經(jīng)形態(tài)。

那么，在這個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)上，創(chuàng)業(yè)者的機(jī)會(huì)到底在哪里？

或許，答案就隱藏在這句反共識(shí)的洞察里：“最大的機(jī)會(huì)，在于設(shè)計(jì)不同于ChatGPT的交互方式。”

今天，讓我們跟隨姚順雨的思考，從“上半場(chǎng)”到“下半場(chǎng)”，看懂AI Agent如何重劃競(jìng)爭(zhēng)版圖，并在這場(chǎng)變革中，找到屬于每個(gè)組織與個(gè)體的價(jià)值支點(diǎn)。

本文根據(jù)對(duì)姚順雨的訪(fǎng)談進(jìn)行整理，內(nèi)容有所刪減，希望能給到你啟發(fā)。

一、核心洞察：

厘清時(shí)代主要矛盾，錨定AGI演進(jìn)路徑

1.核心論斷：AI競(jìng)賽進(jìn)入“下半場(chǎng)”，勝負(fù)手轉(zhuǎn)移

2025年4月，在發(fā)布博文《The Second Half》（下半場(chǎng)）前，我受邀去斯坦福一門(mén)課做talk。

當(dāng)時(shí)想，能講點(diǎn)什么？沒(méi)法講太技術(shù)，只能講更哲學(xué)的內(nèi)容，就想到the second half這個(gè)話(huà)題。

① 矛盾轉(zhuǎn)化：從上半場(chǎng)依賴(lài)“模型與算力”到下半場(chǎng)依賴(lài)“基準(zhǔn)任務(wù)與環(huán)境”

大家過(guò)去往往更關(guān)注模型訓(xùn)練、方法設(shè)計(jì)和算力，但我覺(jué)得現(xiàn)在的bottleneck（瓶頸）已經(jīng)轉(zhuǎn)移了：變成怎么去定義好的任務(wù)，怎么去定義好的環(huán)境。

現(xiàn)在主線(xiàn)正從“上半場(chǎng)”轉(zhuǎn)向“下半場(chǎng)”，我說(shuō)的主線(xiàn)是基于“Language Agent”（語(yǔ)言智能體）。

② 本質(zhì)揭示：Agent是構(gòu)建AGI的必然形態(tài)與關(guān)鍵路徑

有人問(wèn)：語(yǔ)言的智能體和傳統(tǒng)Agent的本質(zhì)區(qū)別是什么？在回答這個(gè)問(wèn)題前，我們先說(shuō)下Agent。

第一，什么是Agent？

從自然語(yǔ)言處理的角度講，Agent是相對(duì)于一個(gè)只會(huì)生成文章或?qū)υ?huà)的系統(tǒng)而言。它能和外界交互，比如使用計(jì)算器、互聯(lián)網(wǎng)，或調(diào)用各種工具。

也就是說(shuō)，不僅能生成內(nèi)容，還能操作和互動(dòng)。但從更廣義的AI背景看，Agent是一個(gè)非常古老的概念：

任何能進(jìn)行自我決策、與環(huán)境交互，并試圖optimize reward（優(yōu)化獎(jiǎng)勵(lì)）的系統(tǒng)，都可以被稱(chēng)為Agent。

從這個(gè)角度出發(fā)，你可以說(shuō)AlphaGo是Agent，也可以說(shuō)Waymo是Agent，甚至可以說(shuō)機(jī)器人是Agent。

第二，語(yǔ)言賦予推理能力

為什么語(yǔ)言非常獨(dú)特？因?yàn)樗侨嗽谶@個(gè)世界完成各種各樣事情的工具，像火或筆一樣。

2020年以前，大家沒(méi)把這個(gè)事想清楚，覺(jué)得語(yǔ)音、文字、圖像、視頻都是一些數(shù)據(jù)，沒(méi)什么區(qū)別。

但我覺(jué)得最大區(qū)別是：語(yǔ)言是人為了實(shí)現(xiàn)泛化而發(fā)明出來(lái)的工具，這一點(diǎn)比其他東西更本質(zhì)。

這是我的個(gè)人觀(guān)點(diǎn)，我之所以這么說(shuō)，是因?yàn)樵诖饲?，如果你在一個(gè)特定環(huán)境上訓(xùn)練，模型只能在這個(gè)環(huán)境表現(xiàn)良好，不能輕易遷移到其他環(huán)境。

但現(xiàn)在，你在一個(gè)環(huán)境上訓(xùn)練，模型可以適應(yīng)更多不同環(huán)境。所以，我覺(jué)得它還是泛化的，它能夠推理。

所以，“Language Agent”（語(yǔ)言智能體）和傳統(tǒng)Agent的本質(zhì)區(qū)別是可以推理。它們最大區(qū)別在于，語(yǔ)言模型提供了一個(gè)足夠強(qiáng)的先驗(yàn)（prior），這個(gè)先驗(yàn)讓你可以推理，而推理又可以在不同的環(huán)境間泛化。

第三，推理帶來(lái)泛化

具體怎么理解？舉個(gè)簡(jiǎn)單的例子。

我做ReAct（ReAct:Synergizing Reasoning and Acting in Language Models，在語(yǔ)言模型中協(xié)同推理與行動(dòng)，是一種讓大語(yǔ)言模型在與外部環(huán)境交互時(shí)，同時(shí)進(jìn)行“推理”和“行動(dòng)”的方法框架，簡(jiǎn)單說(shuō)就是瀏覽維基百科進(jìn)行推理）一個(gè)很強(qiáng)的動(dòng)機(jī)是：我做完colm（計(jì)算機(jī)語(yǔ)言處理）我的第一個(gè)工作之后，在思考一個(gè)問(wèn)題：

為什么我可以一下子去玩一個(gè)新的游戲，但現(xiàn)在這些系統(tǒng)或AI需要幾十萬(wàn)步甚至幾百萬(wàn)步訓(xùn)練，才能完成類(lèi)似的事？

我發(fā)現(xiàn)，是因?yàn)槲铱梢运伎?。我看到一個(gè)全新的環(huán)境會(huì)想：這個(gè)燈是黑的，那可能有危險(xiǎn)，基于常識(shí)可能有怪獸；我現(xiàn)在最重要的是點(diǎn)亮燈。基于之前的上下文（Context），燈在我后面，那我應(yīng)該先向后走。

如果沒(méi)有這樣的思考能力，而是直接從復(fù)雜語(yǔ)言去預(yù)測(cè)“我要往后走”，就很難——沒(méi)有推理做不到。

所以核心是推理能力，推理才能帶來(lái)泛化。

綜上所述，現(xiàn)在終于有可能出現(xiàn)一個(gè)單一模型能夠做所有任務(wù)。之前認(rèn)為這不太可能，但現(xiàn)在是有可能的——你可以在很多不同任務(wù)上做強(qiáng)化學(xué)習(xí)，而且它能遷移到更多任務(wù)。

因此，Agent是構(gòu)建AGI的必然形態(tài)與關(guān)鍵路徑。她的核心價(jià)值在于，通過(guò)語(yǔ)言賦予的推理能力，實(shí)現(xiàn)跨環(huán)境、跨任務(wù)的泛化（Generalization）。

③ 格局預(yù)判：未來(lái)世界將呈現(xiàn)“單極多元”格局

大多數(shù)人對(duì)AGI的想象就是一個(gè)模型，就像這個(gè)世界上最聰明的人，他擁有所有知識(shí)、能力，比我們都聰明，是最強(qiáng)智能體。

但我現(xiàn)在的感覺(jué)是：不同的交互方式下，有不同“好”的定義，有不同“強(qiáng)”的邊界。

OpenAI可能會(huì)成為一個(gè)類(lèi)似Google的公司，成為新世界里非常重要的一環(huán)——但這并不代表，這個(gè)世界就會(huì)被這樣一個(gè)單極系統(tǒng)壟斷，或者是單方壓倒另一方。

最終的智能邊界，是由不同交互方式?jīng)Q定，而不是由一個(gè)single model（單一模型）決定。

未來(lái)，模型的能力可能會(huì)產(chǎn)生beyond ChatGPT（超越ChatGPT）的交互方式，變成Super App（超級(jí)應(yīng)用），這里想象空間非常大。

比如，我想造一個(gè)朋友。這個(gè)朋友不需要數(shù)學(xué)、物理特別強(qiáng)，數(shù)學(xué)太強(qiáng)反而不自然。也許它的記憶也不一定特別好，會(huì)犯錯(cuò)，有感情，也不是特別rational（理性）。但這也是有價(jià)值的。

當(dāng)然，也可能會(huì)出現(xiàn)一個(gè)由Agent組成的社會(huì)。

總之，未來(lái)世界將呈現(xiàn)“單極多元”格局，底座是少數(shù)強(qiáng)大的基礎(chǔ)模型（單極），上層是圍繞不同交互方式構(gòu)建的海量、多元Agent應(yīng)用生態(tài)。

2.認(rèn)知重置：為何這是根本性轉(zhuǎn)折？

首先，對(duì)研究者來(lái)說(shuō)，科研范式重心已經(jīng)發(fā)生轉(zhuǎn)移，即從算法改進(jìn)（Method）已經(jīng)轉(zhuǎn)變?yōu)槿蝿?wù)環(huán)境設(shè)計(jì)（Task/Environment）。

大家過(guò)去往往更關(guān)注模型訓(xùn)練、方法設(shè)計(jì)，但我覺(jué)得現(xiàn)在的bottleneck（瓶頸）已經(jīng)轉(zhuǎn)移了：變成怎么去定義好的任務(wù)，怎么去定義好的環(huán)境。

我覺(jué)得，從語(yǔ)言出發(fā)，去定義Reasoning（推理）、定義Agent，我們終于有了一個(gè)非常general（通用）的方法，而且這個(gè)方法是可泛化的——我們實(shí)現(xiàn)了一個(gè)基點(diǎn)時(shí)刻。

其次，對(duì)創(chuàng)業(yè)者來(lái)說(shuō)，競(jìng)爭(zhēng)壁壘已經(jīng)從“獲取或微調(diào)最新模型”，轉(zhuǎn)向“設(shè)計(jì)新交互”。

ChatGPT或所有做模型的公司，都在做類(lèi)似ChatGPT的產(chǎn)品。ChatGPT的本質(zhì)是：你是在像和人交互一樣去進(jìn)行和數(shù)字世界的交互。

如果你做舊的interface，你利用這些新的模型，很容易被ChatGPT取代。如果你的交互方式很像ChatGPT，你有什么理由不被ChatGPT取代？如果你做的是新的交互方式，但模型沒(méi)有繼續(xù)變好、沒(méi)有新的溢出能力，也很難做。

所以，對(duì)于創(chuàng)業(yè)公司來(lái)說(shuō)，最關(guān)鍵的是做新的交互方式設(shè)計(jì)。

二、方法論：

構(gòu)建下一代AI系統(tǒng)的四大行動(dòng)支柱

1.第一支柱：任務(wù)定義——新核心競(jìng)爭(zhēng)力的鍛造場(chǎng)

當(dāng)你有一個(gè)非常差的任務(wù)，你永遠(yuǎn)不可能學(xué)到非常好的東西。

① 核心原則：任務(wù)和環(huán)境很重要

首先，你要找一個(gè)足夠有挑戰(zhàn)的任務(wù)，這個(gè)任務(wù)能做出本質(zhì)的新方法。

當(dāng)你想做Agent或語(yǔ)言Agent，實(shí)際上沒(méi)什么選擇，只能去做文字游戲。Zork是個(gè)非常經(jīng)典的文字游戲。你在一個(gè)基于文字的世界里，有點(diǎn)像一個(gè)互動(dòng)腳本，可以往下走、往上走，可以去各個(gè)房間，可以做各種各樣的事。

其次，是環(huán)境。

我們還拿Zork游戲來(lái)說(shuō)。時(shí)間一長(zhǎng)，你會(huì)發(fā)現(xiàn)，這個(gè)環(huán)境還是有很多缺陷，能學(xué)到的局限在這個(gè)環(huán)境，這個(gè)環(huán)境還是不夠大。

而且你如果用RL學(xué)這個(gè)環(huán)境，就會(huì)像用RL學(xué)傳統(tǒng)的視頻游戲，可以把這個(gè)游戲打通關(guān)，但對(duì)于其他任務(wù)沒(méi)有遷移作用。

也像下圍棋，你可以把圍棋下得特別好，但對(duì)世界上其他事情沒(méi)有價(jià)值。所以，我們需要一個(gè)更好的環(huán)境。

② 優(yōu)秀任務(wù)：“三板斧”檢驗(yàn)清單

如何設(shè)定一個(gè)優(yōu)秀的任務(wù)？我分享下我的“三板斧”檢驗(yàn)清單：

第一，結(jié)果導(dǎo)向：獎(jiǎng)勵(lì)（Reward）基于最終結(jié)果，而非過(guò)程。

不同的人有不同的flavor（風(fēng)格），我從很早就有一個(gè)偏好，我想定義一個(gè)基于結(jié)果的reward（獎(jiǎng)勵(lì)），而不是基于過(guò)程的，而且這個(gè)reward應(yīng)該是基于規(guī)則、可計(jì)算的，而不是來(lái)自人的偏好、模型的偏好，或者一些黑盒指標(biāo)。

第二，白盒規(guī)則：獎(jiǎng)勵(lì)機(jī)制清晰、可計(jì)算、避免基于人類(lèi)主觀(guān)偏好。

我們做WebShop（網(wǎng)上購(gòu)物）的時(shí)候，最困難的一點(diǎn)是，怎么定義reward。我覺(jué)得做任何RL（強(qiáng)化學(xué)習(xí)）任務(wù)最難的不是建環(huán)境，而是怎么設(shè)計(jì)reward。

我希望這個(gè)reward是不noisy（不噪聲大）的，是可解釋的，是白盒的（white-box），不是那種黑盒的東西（black-box）。

事實(shí)證明，這也是現(xiàn)在RL成功的關(guān)鍵。像math（數(shù)學(xué)）和coding（編程）這種任務(wù)，之所以能做出來(lái)，核心就是：

其一，Reward是基于結(jié)果，不是基于過(guò)程；

其二，Reward是白盒的、基于規(guī)則的，不是基于人的偏好或模型的偏好。

比如，一個(gè)數(shù)學(xué)題答案是3，它就是3——只要你得出的是3，就是對(duì)的；不是3，就是錯(cuò)的。但如果你reward是基于過(guò)程，就會(huì)出現(xiàn)hacking（投機(jī)取巧）。

再比如SWE-bench這類(lèi)工作：

其一，它是結(jié)果導(dǎo)向，而不是過(guò)程導(dǎo)向；

其二，它的reward是基于規(guī)則、白盒的，而不是來(lái)自人或模型的主觀(guān)偏好。

總之，我后面做的很多task，也都是用同樣的filter（篩選標(biāo)準(zhǔn)）。

第三，價(jià)值閉環(huán)：任務(wù)本身應(yīng)對(duì)應(yīng)真實(shí)世界中有價(jià)值的場(chǎng)景片段。

假設(shè)你去優(yōu)化人的偏好、模型的偏好，也會(huì)出現(xiàn)hacking。比如你生成一段非常優(yōu)美的代碼，但它并不解決實(shí)際問(wèn)題。所以，任務(wù)本身應(yīng)該是真實(shí)世界的場(chǎng)景片段。

③ 高級(jí)思維：環(huán)境是最外層記憶

某種程度上，我們說(shuō)MCP（模型上下文協(xié)議）也是hack（利用）Context的一種方法，本質(zhì)也是Memory。

從Agent角度看，這個(gè)世界有一個(gè)Memory Hierarchy（記憶層級(jí)）。Memory Hierarchy最外層永遠(yuǎn)是環(huán)境。

有點(diǎn)像你考慮電腦，它有個(gè)Memory Hierarchy，從CPU緩存到內(nèi)存再到硬盤(pán)，但最外層的Memory永遠(yuǎn)是外部環(huán)境。比如我插一個(gè)U盤(pán)、拔一個(gè)U盤(pán)，或者把東西上傳到互聯(lián)網(wǎng)，或者做個(gè)音樂(lè)變成光盤(pán)。

前年冬天，我讀到馮諾依曼臨終前寫(xiě)的一本書(shū)《The Computer and the Brain》（計(jì)算機(jī)與大腦），最讓我印象深刻的一句話(huà)是：Essentially,the Environment is always the most outer part of the Memory Hierarchy.（基本上，環(huán)境永遠(yuǎn)是記憶層級(jí)中最外層的部分。）

這很哲學(xué)。

對(duì)于人，你有你的Memory Hierarchy，有Working Memory（工作記憶）、Long-Term Memory（長(zhǎng)期記憶）在腦子里，但最外層是你的筆記本、Google Doc、Notion，這些是你最外層Memory Hierarchy的一部分。

2.第二支柱：交互創(chuàng)新——打破“擬人化”路徑依賴(lài)

① 核心機(jī)會(huì)：設(shè)計(jì)不同于ChatGPT的交互方式

現(xiàn)在很多應(yīng)用型創(chuàng)業(yè)公司很擔(dān)心，大模型公司的模型能力溢出會(huì)把他們做的Agent吞掉。事實(shí)上，創(chuàng)業(yè)公司應(yīng)該擔(dān)心的是模型有沒(méi)有溢出能力，這樣你就真的什么都做不了了。

有溢出能力是個(gè)非常好的事情，這幾乎意味著你有機(jī)會(huì)。

創(chuàng)業(yè)公司最大機(jī)會(huì)是：能設(shè)計(jì)不同的interface（交互方式），或者說(shuō)人和數(shù)字世界交互的方式。

比如，你的Chatbot是像人一樣的東西——你和他聊天，給他布置任務(wù)，讓他幫你做Deep Research（深入研究）或者寫(xiě)代碼——交互方式是像人，或者像助手一樣的交互方式。

如果你能用模型通用能力，創(chuàng)造不同的交互方式，就能創(chuàng)造巨大的機(jī)會(huì)。

所以，對(duì)于創(chuàng)業(yè)公司來(lái)說(shuō)，創(chuàng)造不同的交互方式，并且模型不停有新的溢出能力，賦能到這些新的交互方式——兩者缺一不可，就能創(chuàng)造巨大的機(jī)會(huì)。

② 創(chuàng)新交互路徑：Copilot入侵式和Canvas原生式

說(shuō)到交互方式的創(chuàng)新，人和人交互已經(jīng)幾千年、幾萬(wàn)年，甚至是幾百萬(wàn)年，這是對(duì)人最自然的形態(tài)，肯定是最顯然的Super App。

由此，除了文字外，我們還可以有“像人一樣”的交互方式。具體分成以下兩種：

第一，侵入式（Copilot）：像Cursor一樣，嵌入集成開(kāi)發(fā)環(huán)境（如IDE），成為增強(qiáng)人類(lèi)能力的“副駕駛”。

Cursor創(chuàng)造了一種新的交互，準(zhǔn)確說(shuō)它不是像人一樣的交互，而是像Copilot（副駕駛）一樣，屬于侵入式。雖然它是IDE（集成開(kāi)發(fā)環(huán)境），但在你寫(xiě)代碼的時(shí)候，它能給你提示或編輯。沒(méi)有人和人是這樣交互的，這是它的價(jià)值所在。

第二，原生式（Canvas）：像Manus或理想中的“生成式畫(huà)布”，創(chuàng)造全新的、為Agent協(xié)作而生的數(shù)字工作空間。

Canvas是一個(gè)好的嘗試，可以基于現(xiàn)在的任務(wù)，在線(xiàn)生成最符合情境、個(gè)性和任務(wù)的前端。這是值得探索的方向，但也很難。

③ 競(jìng)爭(zhēng)動(dòng)態(tài)：世界是“相互抄”的

關(guān)于競(jìng)爭(zhēng)，傳統(tǒng)上大家認(rèn)為發(fā)生的事情是：大廠(chǎng)先做出來(lái)一個(gè)東西，創(chuàng)業(yè)公司就可以開(kāi)始抄。比如做出ChatGPT，我可以去抄一下ChatGPT，做一個(gè)類(lèi)似的事情。

但現(xiàn)在，似乎反過(guò)來(lái)也可以成立。

小廠(chǎng)可以先做一個(gè)事情，它創(chuàng)造出來(lái)一個(gè)交互的創(chuàng)新或者產(chǎn)品的創(chuàng)新，做模型的公司也可以去借鑒或者應(yīng)用，這點(diǎn)還是挺有意思。

很多時(shí)候大家會(huì)說(shuō)，模型做得越來(lái)越好了，是給創(chuàng)業(yè)公司作嫁衣了。因?yàn)槟銊?chuàng)造很好的模型，如果沒(méi)有自己運(yùn)用特別好，這些創(chuàng)業(yè)公司就用好了。

但也可以反過(guò)來(lái)，如果你創(chuàng)造一個(gè)非常好的交互，但沒(méi)有能力把模型或底層能力做特別好，大公司也可以借鑒你的交互，再加上它的模型能力，做得也特別好。

這世界是個(gè)相互抄的關(guān)系，而不是一個(gè)單向抄的關(guān)系。

3.第三支柱：能力演進(jìn)——從“工具”到“同仁”的階梯

① 大模型能力分級(jí)（L1-L5）解讀

OpenAI提出的大模型能力分級(jí)從Level 1到Level 5，很多人都很熟悉了：

Level 1是聊天機(jī)器人（Chatbot）

Level 2是推理者（Reasoner）

Level 3是智能體（Agent）

Level 4是創(chuàng)新者（Innovator）

Level 5是組織者（Organizer）

不知道你有沒(méi)有這個(gè)疑問(wèn)：為什么是先有聊天機(jī)器人、推理者，然后才是Agent？要回答這個(gè)問(wèn)題，可以分成以下兩個(gè)部分：

第一，從L1到L2，再到L3，現(xiàn)在已完成，它們是能力遞進(jìn)關(guān)系，核心是讓模型從“聊”到“想”再到“干”。

它們的邏輯是，首先你要有語(yǔ)言的先驗(yàn)知識(shí)，基于語(yǔ)言的先驗(yàn)知識(shí)，最早能做出來(lái)的應(yīng)用是Chatbot（L1）。

接下來(lái)，基于語(yǔ)言先驗(yàn)，你需要具備推理能力，這是Reasoner（L2）。

當(dāng)你既有語(yǔ)言知識(shí)，又具備推理能力，才可能進(jìn)一步做各種Agent（L3），尤其是能泛化的Agent。

也就是說(shuō)，Agent建立在Chatbot和Reasoner能力之上。

第二，L4-Innovator（創(chuàng)新者）與L5-Organizer（組織者）正在進(jìn)行中，現(xiàn)在是正交探索——個(gè)體創(chuàng)造與群體協(xié)作的雙軌發(fā)展

很明顯，今天Agent發(fā)展最關(guān)鍵的兩個(gè)方向：

其一，讓它擁有自己的reward（獎(jiǎng)勵(lì)），能自己探索；

其二，是Multi-Agent（多智能體），讓它們之間能形成組織結(jié)構(gòu)。

這兩個(gè)方向，我覺(jué)得是正交，它們可以并行發(fā)展。誰(shuí)是Level 4，誰(shuí)是Level 5，我不確定，但這兩個(gè)事情是顯然的下一步。

首先，當(dāng)你作為一個(gè)Innovator：

其一，你需要一個(gè)Long-Term Memory（長(zhǎng)期記憶）。比如，我是Wiles（安德魯·懷爾斯，數(shù)學(xué)家），我研究費(fèi)馬大定理，可能花了20年。我就需要一個(gè)長(zhǎng)期記憶。

其二，我有這個(gè)長(zhǎng)期記憶還不夠，還需要有內(nèi)在的reward。因?yàn)樵谀阏嬲C明那件事之前，沒(méi)有任何外部獎(jiǎng)勵(lì)（Extrinsic Reward）——你沒(méi)有獲獎(jiǎng)，沒(méi)有做成任何“可交付”的事情，也沒(méi)人給你feedback（反饋）。你需要自己給自己反饋。

這是所有Innovator最重要的。無(wú)論你是藝術(shù)家、科學(xué)家、文學(xué)家，還是任何類(lèi)型的創(chuàng)作者，對(duì)吧？

其次，作為一個(gè)Organization（組織）：

其一，你需要解決的問(wèn)題是：Agent和Agent之間怎么協(xié)作？怎么讓Multi-Agent（多智能體）協(xié)作scale（規(guī)模化）？

現(xiàn)在的Agent就像一個(gè)普通大學(xué)生，做一個(gè)數(shù)字化的實(shí)習(xí)生?；蛘哒f(shuō)，AGI就是一個(gè)普通一本大學(xué)生在電腦上能做所有事情的一個(gè)能力。

其二，搞清楚人類(lèi)社會(huì)的邊界是什么？當(dāng)然這覆蓋80%或90%的人。

但我們最崇拜的人，是哪兩種？一種是創(chuàng)造新東西，在認(rèn)知或?qū)徝郎祥_(kāi)創(chuàng)新領(lǐng)域的人：愛(ài)因斯坦、高更、梵高、貝多芬；另一種是能創(chuàng)造新組織、偉大組織的人：伊隆·馬斯克、喬布斯。

很自然，個(gè)體的創(chuàng)造力和組織的協(xié)作能力——都非常重要。

② 下個(gè)階段需突破3個(gè)關(guān)鍵點(diǎn)

第一，是Utility（效用）的問(wèn)題

為什么我們現(xiàn)在的模型，推理很強(qiáng)，考試很強(qiáng)，玩游戲很強(qiáng)；但它還沒(méi)創(chuàng)造出足夠經(jīng)濟(jì)價(jià)值？——根本原因是：它沒(méi)有這些Context（上下文）。

人類(lèi)社會(huì)比較tricky（復(fù)雜微妙）的一點(diǎn)是：當(dāng)然，我們確實(shí)寫(xiě)下了很多東西——我們用文字、Google Doc、Notion，記錄了很多東西，但很多Context永遠(yuǎn)只存在人的大腦，是通過(guò)一個(gè)分布式的系統(tǒng)來(lái)維護(hù)。

比如，你老板跟你之間的行為習(xí)慣，或者一些很難用語(yǔ)言總結(jié)下來(lái)的信息。這些Context存在于人的腦海里。人沒(méi)辦法把這些東西全部寫(xiě)下來(lái)。

這就導(dǎo)致——人是不可或缺的。

只有人有這樣的能力：進(jìn)入一個(gè)環(huán)境，獲得這個(gè)環(huán)境里的Context。

如果這個(gè)問(wèn)題解決了，Utility問(wèn)題就可以在很大程度被解決。

第二，是Intrinsic（內(nèi)生獎(jiǎng)勵(lì)問(wèn)題。

很多創(chuàng)新者之所以能在沒(méi)有外在激勵(lì)的情況下堅(jiān)持，是因?yàn)樗袃?nèi)在的價(jià)值觀(guān)或激勵(lì)機(jī)制。

這個(gè)問(wèn)題，AI和神經(jīng)科學(xué)已經(jīng)研究多年，嬰兒是最典型的例子。

當(dāng)他們是嬰兒的時(shí)候，他們擁有基于好奇心或自我激勵(lì)的機(jī)制。比如，很多嬰兒會(huì)反復(fù)玩一個(gè)玩具，用嘴去咬一個(gè)東西，或者做一些看似“無(wú)意義”的動(dòng)作。

你說(shuō)他獲得了什么reward嗎？他沒(méi)有升職加薪，沒(méi)有拿到錢(qián)，沒(méi)有任何外在激勵(lì)——他只是好奇。他的動(dòng)機(jī)是：“如果我做這個(gè)事，我會(huì)有什么樣的感覺(jué)？”如果這個(gè)感覺(jué)是新的、不同的，他就可以從中學(xué)習(xí)。

也就是說(shuō)，好奇心、掌控感、安全感，是一些內(nèi)在動(dòng)機(jī)。正是這些東西驅(qū)動(dòng)了人去做某些事。否則，很難從純粹理性角度解釋?zhuān)核麨槭裁匆觯?/p>

但有意思的是，當(dāng)人長(zhǎng)大之后，會(huì)發(fā)生重要變化：

當(dāng)你是嬰兒，你對(duì)世界的理解，是基于視覺(jué)、觸覺(jué)，基于物理世界的。你學(xué)習(xí)的是，怎么把觸覺(jué)、聽(tīng)覺(jué)、視覺(jué)，以及對(duì)骨骼系統(tǒng)的控制結(jié)合起來(lái)；

當(dāng)你長(zhǎng)大之后，你對(duì)世界的理解方式變了，變成一個(gè)基于語(yǔ)言、推理、文字系統(tǒng)的理解。你開(kāi)始思考：這個(gè)世界是怎么運(yùn)作的？我怎么才能開(kāi)一個(gè)公司？怎么才能升職？怎么才能做成一些事情？你玩的，不再是一個(gè)物理游戲，而是一個(gè)文字游戲。

在這個(gè)文字游戲里，當(dāng)然也存在內(nèi)在激勵(lì)，但又好像和嬰兒時(shí)期的好奇驅(qū)動(dòng)不太一樣。

這是AI面臨的挑戰(zhàn)：傳統(tǒng)AI，比如玩迷宮、做機(jī)器人仿真，它可以定義一些基于世界模型或者模仿嬰兒階段好奇心的內(nèi)在激勵(lì)。

但當(dāng)AI在玩的是一個(gè)語(yǔ)言游戲，要怎么定義內(nèi)在激勵(lì)？——這個(gè)問(wèn)題就變得不太一樣了。

第三，是多智能體之間的協(xié)作問(wèn)題。

基于基礎(chǔ)模型往上長(zhǎng)，Agent生態(tài)樹(shù)在我的腦海中，呈現(xiàn)的是這樣一個(gè)結(jié)構(gòu)：

首先，一個(gè)方向是：fundamental research（基礎(chǔ)研究）怎么演變？或者說(shuō)，方法怎么演變？

其次，另一個(gè)方向是：應(yīng)用，或者它的交互方式（interaction）有怎樣的演變？

這兩個(gè)方向之間有關(guān)聯(lián)，但它們需要不同的人去探索不同的方向。

比如Cursor并沒(méi)有在fundamental research（基礎(chǔ)研究）上做什么創(chuàng)新，但做了交互方式上的創(chuàng)新。

在fundamental research上，比較重要的有三方面：

一個(gè)是Memory（記憶）；

一個(gè)是Intrinsic Reward（內(nèi)生獎(jiǎng)勵(lì)機(jī)制）；

還有一個(gè)是Multi-Agent（多智能體系統(tǒng)）。

這也跟OpenAI提出的Innovator（L4、創(chuàng)新者）和Organization（L5、組織者）框架很像，它們屬于正交，可以并行發(fā)展。

所以，我們需要解決多智能體之間的協(xié)作問(wèn)題。

4.第四支柱：系統(tǒng)思維——擁抱“簡(jiǎn)單且通用”的設(shè)計(jì)哲學(xué)

① 研究心法：追求簡(jiǎn)單而通用

我一直有這個(gè)非共識(shí)：我想要去做Agent，一直想做簡(jiǎn)單且通用的東西，我不想做一個(gè)很復(fù)雜、但只能在一個(gè)領(lǐng)域奏效的東西。

這個(gè)方向在傳統(tǒng)意義上很難被接受，大家習(xí)慣了做AI的方式：把問(wèn)題不停細(xì)分，做很多細(xì)分方法，可能并沒(méi)有多少人想做一個(gè)簡(jiǎn)單且通用的系統(tǒng)，或者認(rèn)為這是可能的——尤其20年之內(nèi)。

現(xiàn)在我還是覺(jué)得，我自己最喜歡的工作是ReAct。之后，基于這兩個(gè)方向：一方面做更多方法（method），一方面做更多任務(wù)（task）。

但總體來(lái)說(shuō)，我的研究有兩個(gè)核心：一是怎么去做一些有價(jià)值、和現(xiàn)實(shí)世界更相關(guān)的任務(wù)和環(huán)境；二是怎么去做一些簡(jiǎn)單、但又通用的方法。

所以，Agent最吸引我的就是它的可泛化性（generalizable），即絕大多數(shù)事，你都可以用語(yǔ)言表達(dá)。

我當(dāng)時(shí)隱隱約約有個(gè)直覺(jué)：你如果真想去實(shí)現(xiàn)AGI（通用人工智能）——那時(shí)還沒(méi)人提“AGI”這個(gè)詞，但如果你真的想做一個(gè)非常通用的系統(tǒng)（general system），你就得去構(gòu)建一個(gè)智能體。

② 創(chuàng)新策源地：從垂直細(xì)分到通用思維的AI范式回歸

回頭看AI歷史，很久很久以前，從Herbert Simon（赫伯特·西蒙）在1960年代開(kāi)始，大家最早的想法就是要做一個(gè)Agent。

當(dāng)時(shí)大家的野心很大——想用一個(gè)夏天搞定視覺(jué)，再用另一個(gè)夏天搞定語(yǔ)言，拼在一起，去做一個(gè)Agent，他就應(yīng)該比人還聰明，但這事太難了。

慢慢地，AI變得非常碎片化，大家研究的問(wèn)題越來(lái)越小。比如，有的人研究視覺(jué)一小部分問(wèn)題，有的人研究語(yǔ)言某個(gè)子任務(wù)，越來(lái)越細(xì)分，越來(lái)越垂直。

但到2015年之后，開(kāi)始出現(xiàn)Scaling Law（擴(kuò)展規(guī)律），包括很多研究突破，歷史上一些關(guān)鍵時(shí)刻也在提示我們：

也許我們應(yīng)該從這種“垂直式思維（vertical thinking）”重新回到更“通用式思維（general thinking）”，再去嘗試構(gòu)建真正通用的系統(tǒng)。

③ 個(gè)人品質(zhì)：以雜學(xué)積淀塑造通用性思維與跨界視野

在我成長(zhǎng)路上，對(duì)我啟發(fā)大的是看書(shū)。我是一個(gè)喜歡看雜書(shū)的人。什么書(shū)都看，什么電影都看，什么地方都想去。

我從小就是一個(gè)比較general（通用）的人——我想試圖變得很通用，試圖了解很多不同的學(xué)科，做很多不同的事情。

但后來(lái)我發(fā)現(xiàn)，一個(gè)人即使再聰明、再有精力，他能理解的知識(shí)或能做的事情，也只是人類(lèi)社會(huì)積累的知識(shí)的很小一部分。更好的是，你去創(chuàng)造一個(gè)比你更通用、更general的事情。

我好像一直對(duì)于通用性，有一種執(zhí)念或追求。通用性意味著什么？我不知道，但我從小就是想學(xué)習(xí)很多不同學(xué)科，都很有意思。

我在姚班很多同學(xué)，他們是那種很deep（深度的）、很focus（專(zhuān)注的）同學(xué)——我去做競(jìng)賽，我就把這個(gè)事做到極致，不停刷題，做到世界金牌。

但我好像不是那種性格，我是那種——我會(huì)看很多數(shù)學(xué)，也會(huì)看很多歷史，會(huì)看各種各樣亂七八糟的東西。

三、實(shí)戰(zhàn)推演：

在轉(zhuǎn)折點(diǎn)上如何決策與行動(dòng)？

1.給創(chuàng)業(yè)者的行動(dòng)指南：在夾縫中定義未來(lái)

① 第一步：找到一個(gè)真正有價(jià)值的場(chǎng)景

Agent創(chuàng)業(yè)，當(dāng)前主要瓶頸是算力。Agent的token用量驚人，單個(gè)用戶(hù)消耗可能是Chatbot的500到1000倍，疊加幾百萬(wàn)用戶(hù)后成本極高。

這種情況下，Agent該如何擴(kuò)展？我覺(jué)得最重要的點(diǎn)是——你得先找到一個(gè)好的應(yīng)用。

事實(shí)上，Cost（成本）本身不是最大問(wèn)題，問(wèn)題是你的成本并不能證明你的performance（性能）或value（價(jià)值）是合理的。

如果這是一個(gè)很有價(jià)值的事，我花500美元，但可以賺1000美元——根本不是問(wèn)題。這不是technical bottleneck（技術(shù)瓶頸），而是product-market fit（產(chǎn)品與市場(chǎng)契合度）的問(wèn)題。

所以，現(xiàn)在最關(guān)鍵的，是要找到真正有價(jià)值的應(yīng)用。

② 壁壘構(gòu)建：短期靠交互創(chuàng)新，長(zhǎng)期靠Context（用戶(hù)上下文)

首先，短期內(nèi)要靠交互創(chuàng)新。

比如，Manus，交互創(chuàng)新想象空間是很高的。

它的一個(gè)價(jià)值是給人非常general（通用）的感覺(jué)，你可以有每個(gè)階段的Killer App（殺手級(jí)應(yīng)用），比如它做PPT特別好，做Deep Research特別好，或者做其他東西特別好。

iPhone或iPad是非常通用的產(chǎn)品形態(tài)，但它一開(kāi)始，都有一些Killer App支持它有momentum（增長(zhǎng)動(dòng)能）。包括ChatGPT，包括微信，很多偉大產(chǎn)品都這樣。

你有一個(gè)足夠通用、簡(jiǎn)單，或第一性的交互方式，它有很多想象空間。但你去維護(hù)它，或者設(shè)計(jì)路徑的時(shí)候，你能有各種各樣的應(yīng)用，使它不停地增長(zhǎng)。

其次，長(zhǎng)期靠積累獨(dú)特的用戶(hù)上下文（Context）和環(huán)境。

現(xiàn)在對(duì)于ChatGPT比較重要的是Memory（記憶），這是可能產(chǎn)生壁壘的地方。

如果沒(méi)有Memory，大家拼誰(shuí)的模型更強(qiáng)。但有了Memory，拼的不僅是誰(shuí)的模型更強(qiáng)，而是用戶(hù)用哪個(gè)更多、哪個(gè)粘性更強(qiáng)。

我積累了更多Context，它能給我更好體驗(yàn)，我就會(huì)有粘性——這或許是研究?jī)?yōu)勢(shì)轉(zhuǎn)化成商業(yè)優(yōu)勢(shì)的方式。

③ 警惕“數(shù)據(jù)飛輪”幻覺(jué)

大多數(shù)公司還沒(méi)有形成數(shù)據(jù)飛輪,他們依賴(lài)模型變好，利用模型變好的溢出能力。

如果你要有數(shù)據(jù)飛輪，首先你要能自己去訓(xùn)模型，并且能通過(guò)交互有很好的reward，使你能把好的數(shù)據(jù)和不好的數(shù)據(jù)分開(kāi)。

比較成功的是Midjourney（用戶(hù)偏好直接驅(qū)動(dòng)模型優(yōu)化），有非常清晰的reward——人更喜歡哪張圖，這個(gè)reward和應(yīng)用是對(duì)齊的，reward做得更好，公司就更成功，模型也更好——一切都對(duì)齊。

有了這種情況，才能自己訓(xùn)練模型，做數(shù)據(jù)飛輪。

這個(gè)過(guò)程必須比較非主線(xiàn)。因?yàn)槿绻苤骶€(xiàn)，我也可以通過(guò)Pre-Training或RL提升能力，靠泛化或其他方式。

總的來(lái)說(shuō)，只有像Midjourney這樣，獎(jiǎng)勵(lì)機(jī)制與產(chǎn)品價(jià)值完全對(duì)齊的閉環(huán)，才能形成飛輪,大部分公司目前還沒(méi)有形成飛輪。

2.給企業(yè)決策者的戰(zhàn)略研判：防守與進(jìn)攻

① CEO的第一課：以技術(shù)認(rèn)知驅(qū)動(dòng)戰(zhàn)略決策與價(jià)值創(chuàng)造

假若我是一個(gè)CEO，做的第一件事就是親自深度學(xué)習(xí)技術(shù)本質(zhì)，做出不被誤導(dǎo)的戰(zhàn)略決策。

首先，我肯定會(huì)學(xué)習(xí)，我會(huì)想弄清楚這個(gè)事情到底是什么。

如果你作為CEO不懂這個(gè)事情，所有事情會(huì)變得很難。很多時(shí)候，一個(gè)公司的bottleneck（瓶頸）就在于，CEO對(duì)這個(gè)事理解不夠。如果你不理解，去招一些很好的人、做一些事情，你很可能被他們忽悠。

其次，要從創(chuàng)造新的價(jià)值來(lái)思考問(wèn)題。

畢竟你不是技術(shù)專(zhuān)家，而是一個(gè)CEO，你有一些場(chǎng)景、一些資源、一些優(yōu)勢(shì)。從第一性原理看，一個(gè)新的技術(shù)產(chǎn)生了，你要思考的是，怎么用這些新技術(shù)結(jié)合你現(xiàn)在的資源去創(chuàng)造新的價(jià)值。

此外，你可以嘗試做一個(gè)和當(dāng)前業(yè)務(wù)完全不一樣、但價(jià)值非常大的事情，比如ChatGPT，但對(duì)大多數(shù)公司來(lái)說(shuō)，即使很有錢(qián)、很強(qiáng)，也不一定make sense（合理）。

② 大公司策略：依托護(hù)城河優(yōu)勢(shì)防御顛覆性交互創(chuàng)新

站在公司的角度看，大公司的戰(zhàn)略其實(shí)很簡(jiǎn)單，依托現(xiàn)有用戶(hù)基礎(chǔ)、數(shù)據(jù)資源、場(chǎng)景優(yōu)勢(shì)以及Context（護(hù)城河），穩(wěn)健融合Agent能力，重點(diǎn)防御顛覆性交互方式帶來(lái)的創(chuàng)新沖擊。

為什么要重點(diǎn)防御？原因是全新的交互方式會(huì)改變我們的世界。就像一開(kāi)始互聯(lián)網(wǎng)誕生，最早Super App只是把郵件升級(jí)成Email，Amazon已經(jīng)算非常創(chuàng)新的東西了?，F(xiàn)在就像那個(gè)階段——我們的想象力仍被以往的交互方式所限制，還有許多尚未誕生的交互方式。

但肯定會(huì)有很多不同的交互方式，訓(xùn)練完全不同的模型，創(chuàng)造出不同的系統(tǒng)。

當(dāng)然，這類(lèi)東西很難和ChatGPT比強(qiáng)弱，它們是不同應(yīng)用，有不同價(jià)值。比如，微信做Agent。

如果我是微信的一號(hào)，對(duì)做不做Agent？我可能會(huì)不急，先觀(guān)望觀(guān)望。

我好像沒(méi)有理由要急。我會(huì)觀(guān)察，我會(huì)學(xué)習(xí)AI，會(huì)觀(guān)察有沒(méi)有什么新的交互方式很有意思。但我不會(huì)急著去做很多事——我有易守難攻的地方，為什么要急著進(jìn)攻呢？

比較危險(xiǎn)的是一個(gè)顛覆性的創(chuàng)新。

真正的危險(xiǎn)，不是說(shuō)一個(gè)類(lèi)似于微信的東西打敗了微信，而是一個(gè)很不一樣的東西打敗了微信。

就像微信打敗了QQ，當(dāng)時(shí)擔(dān)心的并不是一個(gè)類(lèi)似QQ的東西打敗了QQ，而是一個(gè)很不一樣的產(chǎn)品去打敗這個(gè)東西。

我們需要對(duì)顛覆性創(chuàng)新有所警惕。

③ 投資與布局邏輯：聚焦特定Context與數(shù)字環(huán)境構(gòu)建的平臺(tái)

作為投資者，如何做好allocate（分配）？這是個(gè)很好的問(wèn)題，實(shí)際上取決于你有多少精力，或者有多少資源分配顆粒度。

當(dāng)然現(xiàn)在OpenAI、Anthropic，這些模型層公司，大概率會(huì)有更大價(jià)值。

還有一類(lèi)很有價(jià)值的，是能積累User Context（用戶(hù)上下文），或者能構(gòu)建特殊Environment（環(huán)境）的公司。最終如果AI或AGI是一個(gè)系統(tǒng)，它需要有Intelligence（智能），需要有Environment，還需要有User Context，或者對(duì)用戶(hù)的理解。

現(xiàn)在有很多User Data（用戶(hù)數(shù)據(jù)）或User Context的公司，有點(diǎn)像發(fā)明車(chē)之前的煤炭、煤礦，或者像發(fā)明汽車(chē)之前的石油公司。

從這個(gè)角度，微信或大平臺(tái)，還是一個(gè)易守難攻的好平臺(tái)，它積攢大量的Context。

如果Intelligence是一個(gè)可以逐漸民主化、逐漸變得便宜、逐漸普及，擁有這樣的平臺(tái)，擁有這樣的Environment，擁有這樣的Context，可能會(huì)是一個(gè)很強(qiáng)的壁壘，它可能還是一個(gè)很好的投資。

3.給研究者與個(gè)人的啟示：在范式轉(zhuǎn)換中定位

① 職業(yè)選擇：在時(shí)代機(jī)遇中追尋高上限價(jià)值

我的成長(zhǎng)路徑其實(shí)挺按部就班的，也沒(méi)有跳級(jí)，沒(méi)有做什么很surprising（讓人驚訝）的事情。

但我對(duì)一個(gè)東西的價(jià)值，或者taste（品味），有自己的看法。大家往往會(huì)傾向于做一個(gè)確定性比較高的事情，包括做研究、做公司。

但我覺(jué)得恰好是這個(gè)時(shí)代，你去做上限更高的事情是更好的，因?yàn)楝F(xiàn)在有一個(gè)巨大的機(jī)會(huì)。

如果沒(méi)有這樣一個(gè)巨大的機(jī)會(huì)，最佳路徑可能是去做incremental（漸進(jìn)式）、確定性強(qiáng)的事情，一步一步地積累，但恰好有一個(gè)上限非常高的事情。

如果你敢想，或者你膽子特別大，或者你想象力很豐富，就會(huì)有好事發(fā)生。

② 思維變革：從算法改進(jìn)轉(zhuǎn)向任務(wù)定義

現(xiàn)在，AI科研范式重心已經(jīng)從上半場(chǎng)轉(zhuǎn)移到了下半場(chǎng)，即從算法改進(jìn)（Method）已經(jīng)轉(zhuǎn)變?yōu)槿蝿?wù)環(huán)境設(shè)計(jì)（Task/Environment）。

這帶來(lái)一個(gè)本質(zhì)變化：以前我面對(duì)很多怪獸，需要造出各種不同武器去打它們；現(xiàn)在我有了一把通用武器，比如機(jī)關(guān)槍?zhuān)也恍枰贋槊總€(gè)怪獸單獨(dú)造武器。接下來(lái)要思考的問(wèn)題就變成：我該朝哪個(gè)方向開(kāi)槍?zhuān)?/p>

現(xiàn)在方法的問(wèn)題已基本解決，真正重要的是——我們要用這個(gè)通用方法，從“我能解決什么問(wèn)題”轉(zhuǎn)變?yōu)椤拔覒?yīng)該定義什么問(wèn)題”。

總之，我們要成為一名“問(wèn)題設(shè)計(jì)師”和“任務(wù)架構(gòu)師”。

③ 終極動(dòng)力：為世界創(chuàng)造渴望，過(guò)程中享受有趣

關(guān)于驅(qū)動(dòng)力，我用一個(gè)非常俗的話(huà)說(shuō)：希望你對(duì)這個(gè)世界創(chuàng)造一些不同——探索新的、根本性的研究，是一種創(chuàng)造不同的方式；創(chuàng)造一種完全不同的新的產(chǎn)品形態(tài)，也是一種創(chuàng)造不同的方式。

如果我現(xiàn)在去做一家類(lèi)似xAI或Thinking Machine的公司，或者做一個(gè)類(lèi)似Chatbot或Assistant的產(chǎn)品，還是可能賺很多錢(qián)，商業(yè)上很成功；但如果我做了一個(gè)形態(tài)很不一樣的東西，失敗了，我起碼探索了不一樣?xùn)|西。

我導(dǎo)師令我印象最深的是這樣一句話(huà)，學(xué)術(shù)圈經(jīng)常發(fā)生這樣的事——你有一個(gè)想法，然后別人做了，你會(huì)很煩。他說(shuō)：If someone else can do it,then it's okay to let them do it（如果別人能做，那就讓他們?nèi)プ霭桑?/p>

所以，我覺(jué)得真正的價(jià)值在于對(duì)這個(gè)社會(huì)產(chǎn)生價(jià)值。

從人類(lèi)全局的角度，如果這個(gè)事情很多人能做，別人做可能是不是也沒(méi)有什么區(qū)別？對(duì)這個(gè)社會(huì)，或者對(duì)整體來(lái)說(shuō)，似乎沒(méi)有什么變化。

或者，你也可以去做一些不一樣的探索。我覺(jué)得，最終你要對(duì)這個(gè)社會(huì)產(chǎn)生價(jià)值。

但這個(gè)時(shí)代很幸運(yùn)的一點(diǎn)：這個(gè)技術(shù)非常通用，這個(gè)技術(shù)非常偉大，有足夠多探索的空間。

另一點(diǎn)是，我想讓生活更有趣，更有意思，更快樂(lè)，就去做一些自己喜歡的事情。

這很難用語(yǔ)言解釋?zhuān)褪且粋€(gè)taste（品味）或preference（偏好）的問(wèn)題。

參考資料：

1.2025年9月11日，《獨(dú)家對(duì)話(huà)OpenAI姚順雨：生成新世界的系統(tǒng)》，語(yǔ)言即世界language is world

*文章為作者獨(dú)立觀(guān)點(diǎn)，不代表筆記俠立場(chǎng)。

好文閱讀推薦：

“子彈筆記”是筆記俠的矩陣公眾號(hào)，聚焦職場(chǎng)效率追求、人際關(guān)系與高潛成長(zhǎng)者，幫你3分鐘吃透核心觀(guān)點(diǎn)和方法論。歡迎關(guān)注～

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.