国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

姚順雨最新訪(fǎng)談:AI下半場(chǎng),機(jī)會(huì)在這一點(diǎn)

0
分享至



內(nèi)容來(lái)源:2025年5月,語(yǔ)言即世界工作室,張小珺商業(yè)訪(fǎng)談錄對(duì)話(huà)姚順雨分享。

分享嘉賓:姚順雨,OpenAI前研究員,現(xiàn)任騰訊“CEO/總裁辦公室”首席AI科學(xué)家,AI Infra部及大語(yǔ)言模型部負(fù)責(zé)人。

高級(jí)筆記達(dá)人丨天朗明月

責(zé)| 柒排版| 拾零

第 9392篇深度好文:12809字 | 30 分鐘閱讀

商業(yè)趨勢(shì)

筆記君說(shuō):

都說(shuō)AGI(通用人工智能)是AI的終極目標(biāo),但通往它的道路似乎越來(lái)越擁擠:

一邊是大模型能力持續(xù)“溢出”;另一邊是AI創(chuàng)業(yè)公司陷入集體焦慮,跟風(fēng)復(fù)刻ChatGPT的同質(zhì)化產(chǎn)品找不到差異化。

這個(gè)困境背后,是AI行業(yè)一個(gè)核心矛盾的轉(zhuǎn)化:過(guò)去,我們焦慮的是“如何訓(xùn)練出一個(gè)更強(qiáng)的模型”;現(xiàn)在,我們困惑的是“如何定義一個(gè)有價(jià)值的任務(wù)”,以真正釋放模型那被“低估”的驚人能力。

這標(biāo)志著AI發(fā)展已悄然進(jìn)入“下半場(chǎng)”。上半場(chǎng)的英雄是算法和算力,下半場(chǎng)的核心將是定義者與組織者——他們懂得如何設(shè)計(jì)互動(dòng)、編排任務(wù)、構(gòu)建環(huán)境,讓AI從“聰明的聊天者”成長(zhǎng)為“可靠的行動(dòng)者”。

OpenAI前研究員、AI Agent研究方向的核心探索者姚順雨,將這種行動(dòng)者稱(chēng)為“Language Agent(語(yǔ)言智能體)”。他指出,Agent的本質(zhì)是通過(guò)語(yǔ)言實(shí)現(xiàn)推理,通過(guò)推理實(shí)現(xiàn)泛化,它正是通往AGI的必經(jīng)形態(tài)。

那么,在這個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)上,創(chuàng)業(yè)者的機(jī)會(huì)到底在哪里?

或許,答案就隱藏在這句反共識(shí)的洞察里:“最大的機(jī)會(huì),在于設(shè)計(jì)不同于ChatGPT的交互方式。”

今天,讓我們跟隨姚順雨的思考,從“上半場(chǎng)”到“下半場(chǎng)”,看懂AI Agent如何重劃競(jìng)爭(zhēng)版圖,并在這場(chǎng)變革中,找到屬于每個(gè)組織與個(gè)體的價(jià)值支點(diǎn)。

本文根據(jù)對(duì)姚順雨的訪(fǎng)談進(jìn)行整理,內(nèi)容有所刪減,希望能給到你啟發(fā)。

一、核心洞察:

厘清時(shí)代主要矛盾,錨定AGI演進(jìn)路徑

1.核心論斷:AI競(jìng)賽進(jìn)入“下半場(chǎng)”,勝負(fù)手轉(zhuǎn)移

2025年4月,在發(fā)布博文《The Second Half》(下半場(chǎng))前,我受邀去斯坦福一門(mén)課做talk。

當(dāng)時(shí)想,能講點(diǎn)什么?沒(méi)法講太技術(shù),只能講更哲學(xué)的內(nèi)容,就想到the second half這個(gè)話(huà)題。

① 矛盾轉(zhuǎn)化:從上半場(chǎng)依賴(lài)“模型與算力”到下半場(chǎng)依賴(lài)“基準(zhǔn)任務(wù)與環(huán)境”

大家過(guò)去往往更關(guān)注模型訓(xùn)練、方法設(shè)計(jì)和算力,但我覺(jué)得現(xiàn)在的bottleneck(瓶頸)已經(jīng)轉(zhuǎn)移了:變成怎么去定義好的任務(wù),怎么去定義好的環(huán)境。

現(xiàn)在主線(xiàn)正從“上半場(chǎng)”轉(zhuǎn)向“下半場(chǎng)”,我說(shuō)的主線(xiàn)是基于“Language Agent”(語(yǔ)言智能體)。

② 本質(zhì)揭示:Agent是構(gòu)建AGI的必然形態(tài)與關(guān)鍵路徑

有人問(wèn):語(yǔ)言的智能體和傳統(tǒng)Agent的本質(zhì)區(qū)別是什么?在回答這個(gè)問(wèn)題前,我們先說(shuō)下Agent。

第一,什么是Agent?

從自然語(yǔ)言處理的角度講,Agent是相對(duì)于一個(gè)只會(huì)生成文章或?qū)υ?huà)的系統(tǒng)而言。它能和外界交互,比如使用計(jì)算器、互聯(lián)網(wǎng),或調(diào)用各種工具。

也就是說(shuō),不僅能生成內(nèi)容,還能操作和互動(dòng)。但從更廣義的AI背景看,Agent是一個(gè)非常古老的概念:

任何能進(jìn)行自我決策、與環(huán)境交互,并試圖optimize reward(優(yōu)化獎(jiǎng)勵(lì))的系統(tǒng),都可以被稱(chēng)為Agent。

從這個(gè)角度出發(fā),你可以說(shuō)AlphaGo是Agent,也可以說(shuō)Waymo是Agent,甚至可以說(shuō)機(jī)器人是Agent。

第二,語(yǔ)言賦予推理能力

為什么語(yǔ)言非常獨(dú)特?因?yàn)樗侨嗽谶@個(gè)世界完成各種各樣事情的工具,像火或筆一樣。

2020年以前,大家沒(méi)把這個(gè)事想清楚,覺(jué)得語(yǔ)音、文字、圖像、視頻都是一些數(shù)據(jù),沒(méi)什么區(qū)別。

但我覺(jué)得最大區(qū)別是:語(yǔ)言是人為了實(shí)現(xiàn)泛化而發(fā)明出來(lái)的工具,這一點(diǎn)比其他東西更本質(zhì)。

這是我的個(gè)人觀(guān)點(diǎn),我之所以這么說(shuō),是因?yàn)樵诖饲?,如果你在一個(gè)特定環(huán)境上訓(xùn)練,模型只能在這個(gè)環(huán)境表現(xiàn)良好,不能輕易遷移到其他環(huán)境。

但現(xiàn)在,你在一個(gè)環(huán)境上訓(xùn)練,模型可以適應(yīng)更多不同環(huán)境。所以,我覺(jué)得它還是泛化的,它能夠推理。

所以,“Language Agent”(語(yǔ)言智能體)和傳統(tǒng)Agent的本質(zhì)區(qū)別是可以推理。它們最大區(qū)別在于,語(yǔ)言模型提供了一個(gè)足夠強(qiáng)的先驗(yàn)(prior),這個(gè)先驗(yàn)讓你可以推理,而推理又可以在不同的環(huán)境間泛化。

第三,推理帶來(lái)泛化

具體怎么理解?舉個(gè)簡(jiǎn)單的例子。

我做ReAct(ReAct:Synergizing Reasoning and Acting in Language Models,在語(yǔ)言模型中協(xié)同推理與行動(dòng),是一種讓大語(yǔ)言模型在與外部環(huán)境交互時(shí),同時(shí)進(jìn)行“推理”和“行動(dòng)”的方法框架,簡(jiǎn)單說(shuō)就是瀏覽維基百科進(jìn)行推理)一個(gè)很強(qiáng)的動(dòng)機(jī)是:我做完colm(計(jì)算機(jī)語(yǔ)言處理)我的第一個(gè)工作之后,在思考一個(gè)問(wèn)題:

為什么我可以一下子去玩一個(gè)新的游戲,但現(xiàn)在這些系統(tǒng)或AI需要幾十萬(wàn)步甚至幾百萬(wàn)步訓(xùn)練,才能完成類(lèi)似的事?

我發(fā)現(xiàn),是因?yàn)槲铱梢运伎?。我看到一個(gè)全新的環(huán)境會(huì)想:這個(gè)燈是黑的,那可能有危險(xiǎn),基于常識(shí)可能有怪獸;我現(xiàn)在最重要的是點(diǎn)亮燈。基于之前的上下文(Context),燈在我后面,那我應(yīng)該先向后走。

如果沒(méi)有這樣的思考能力,而是直接從復(fù)雜語(yǔ)言去預(yù)測(cè)“我要往后走”,就很難——沒(méi)有推理做不到。

所以核心是推理能力,推理才能帶來(lái)泛化。


綜上所述,現(xiàn)在終于有可能出現(xiàn)一個(gè)單一模型能夠做所有任務(wù)。之前認(rèn)為這不太可能,但現(xiàn)在是有可能的——你可以在很多不同任務(wù)上做強(qiáng)化學(xué)習(xí),而且它能遷移到更多任務(wù)。

因此,Agent是構(gòu)建AGI的必然形態(tài)與關(guān)鍵路徑。她的核心價(jià)值在于,通過(guò)語(yǔ)言賦予的推理能力,實(shí)現(xiàn)跨環(huán)境、跨任務(wù)的泛化(Generalization)。

③ 格局預(yù)判:未來(lái)世界將呈現(xiàn)“單極多元”格局

大多數(shù)人對(duì)AGI的想象就是一個(gè)模型,就像這個(gè)世界上最聰明的人,他擁有所有知識(shí)、能力,比我們都聰明,是最強(qiáng)智能體。

但我現(xiàn)在的感覺(jué)是:不同的交互方式下,有不同“好”的定義,有不同“強(qiáng)”的邊界。

OpenAI可能會(huì)成為一個(gè)類(lèi)似Google的公司,成為新世界里非常重要的一環(huán)——但這并不代表,這個(gè)世界就會(huì)被這樣一個(gè)單極系統(tǒng)壟斷,或者是單方壓倒另一方。

最終的智能邊界,是由不同交互方式?jīng)Q定,而不是由一個(gè)single model(單一模型)決定。

未來(lái),模型的能力可能會(huì)產(chǎn)生beyond ChatGPT(超越ChatGPT)的交互方式,變成Super App(超級(jí)應(yīng)用)這里想象空間非常大。

比如,我想造一個(gè)朋友。這個(gè)朋友不需要數(shù)學(xué)、物理特別強(qiáng),數(shù)學(xué)太強(qiáng)反而不自然。也許它的記憶也不一定特別好,會(huì)犯錯(cuò),有感情,也不是特別rational(理性)。但這也是有價(jià)值的。

當(dāng)然,也可能會(huì)出現(xiàn)一個(gè)由Agent組成的社會(huì)。

總之,未來(lái)世界將呈現(xiàn)“單極多元”格局,底座是少數(shù)強(qiáng)大的基礎(chǔ)模型(單極),上層是圍繞不同交互方式構(gòu)建的海量、多元Agent應(yīng)用生態(tài)。


2.認(rèn)知重置:為何這是根本性轉(zhuǎn)折?

首先,對(duì)研究者來(lái)說(shuō),科研范式重心已經(jīng)發(fā)生轉(zhuǎn)移,即從算法改進(jìn)(Method)已經(jīng)轉(zhuǎn)變?yōu)槿蝿?wù)環(huán)境設(shè)計(jì)(Task/Environment)。

大家過(guò)去往往更關(guān)注模型訓(xùn)練、方法設(shè)計(jì),但我覺(jué)得現(xiàn)在的bottleneck(瓶頸)已經(jīng)轉(zhuǎn)移了:變成怎么去定義好的任務(wù),怎么去定義好的環(huán)境。

我覺(jué)得,從語(yǔ)言出發(fā),去定義Reasoning(推理)、定義Agent,我們終于有了一個(gè)非常general(通用)的方法,而且這個(gè)方法是可泛化的——我們實(shí)現(xiàn)了一個(gè)基點(diǎn)時(shí)刻。

其次,對(duì)創(chuàng)業(yè)者來(lái)說(shuō),競(jìng)爭(zhēng)壁壘已經(jīng)從“獲取或微調(diào)最新模型”,轉(zhuǎn)向“設(shè)計(jì)新交互”。

ChatGPT或所有做模型的公司,都在做類(lèi)似ChatGPT的產(chǎn)品。ChatGPT的本質(zhì)是:你是在像和人交互一樣去進(jìn)行和數(shù)字世界的交互。

如果你做舊的interface,你利用這些新的模型,很容易被ChatGPT取代。如果你的交互方式很像ChatGPT,你有什么理由不被ChatGPT取代?如果你做的是新的交互方式,但模型沒(méi)有繼續(xù)變好、沒(méi)有新的溢出能力,也很難做。

所以,對(duì)于創(chuàng)業(yè)公司來(lái)說(shuō),最關(guān)鍵的是做新的交互方式設(shè)計(jì)。

二、方法論:

構(gòu)建下一代AI系統(tǒng)的四大行動(dòng)支柱

1.第一支柱:任務(wù)定義——新核心競(jìng)爭(zhēng)力的鍛造場(chǎng)

當(dāng)你有一個(gè)非常差的任務(wù),你永遠(yuǎn)不可能學(xué)到非常好的東西。

① 核心原則:任務(wù)和環(huán)境很重要

首先,你要找一個(gè)足夠有挑戰(zhàn)的任務(wù),這個(gè)任務(wù)能做出本質(zhì)的新方法。

當(dāng)你想做Agent或語(yǔ)言Agent,實(shí)際上沒(méi)什么選擇,只能去做文字游戲。Zork是個(gè)非常經(jīng)典的文字游戲。你在一個(gè)基于文字的世界里,有點(diǎn)像一個(gè)互動(dòng)腳本,可以往下走、往上走,可以去各個(gè)房間,可以做各種各樣的事。

其次,是環(huán)境。

我們還拿Zork游戲來(lái)說(shuō)。時(shí)間一長(zhǎng),你會(huì)發(fā)現(xiàn),這個(gè)環(huán)境還是有很多缺陷,能學(xué)到的局限在這個(gè)環(huán)境,這個(gè)環(huán)境還是不夠大。

而且你如果用RL學(xué)這個(gè)環(huán)境,就會(huì)像用RL學(xué)傳統(tǒng)的視頻游戲,可以把這個(gè)游戲打通關(guān),但對(duì)于其他任務(wù)沒(méi)有遷移作用。

也像下圍棋,你可以把圍棋下得特別好,但對(duì)世界上其他事情沒(méi)有價(jià)值。所以,我們需要一個(gè)更好的環(huán)境。


② 優(yōu)秀任務(wù):“三板斧”檢驗(yàn)清單

如何設(shè)定一個(gè)優(yōu)秀的任務(wù)?我分享下我的“三板斧”檢驗(yàn)清單:

第一,結(jié)果導(dǎo)向:獎(jiǎng)勵(lì)(Reward)基于最終結(jié)果,而非過(guò)程。

不同的人有不同的flavor(風(fēng)格),我從很早就有一個(gè)偏好,我想定義一個(gè)基于結(jié)果的reward(獎(jiǎng)勵(lì)),而不是基于過(guò)程的,而且這個(gè)reward應(yīng)該是基于規(guī)則、可計(jì)算的,而不是來(lái)自人的偏好、模型的偏好,或者一些黑盒指標(biāo)。

第二,白盒規(guī)則:獎(jiǎng)勵(lì)機(jī)制清晰、可計(jì)算、避免基于人類(lèi)主觀(guān)偏好。

我們做WebShop(網(wǎng)上購(gòu)物)的時(shí)候,最困難的一點(diǎn)是,怎么定義reward。我覺(jué)得做任何RL(強(qiáng)化學(xué)習(xí))任務(wù)最難的不是建環(huán)境,而是怎么設(shè)計(jì)reward。

我希望這個(gè)reward是不noisy(不噪聲大)的,是可解釋的,是白盒的(white-box),不是那種黑盒的東西(black-box)。

事實(shí)證明,這也是現(xiàn)在RL成功的關(guān)鍵。像math(數(shù)學(xué))和coding(編程)這種任務(wù),之所以能做出來(lái),核心就是:

其一,Reward是基于結(jié)果,不是基于過(guò)程;

其二,Reward是白盒的、基于規(guī)則的,不是基于人的偏好或模型的偏好。

比如,一個(gè)數(shù)學(xué)題答案是3,它就是3——只要你得出的是3,就是對(duì)的;不是3,就是錯(cuò)的。但如果你reward是基于過(guò)程,就會(huì)出現(xiàn)hacking(投機(jī)取巧)。

再比如SWE-bench這類(lèi)工作:

其一,它是結(jié)果導(dǎo)向,而不是過(guò)程導(dǎo)向;

其二,它的reward是基于規(guī)則、白盒的,而不是來(lái)自人或模型的主觀(guān)偏好。

總之,我后面做的很多task,也都是用同樣的filter(篩選標(biāo)準(zhǔn))。

第三,價(jià)值閉環(huán):任務(wù)本身應(yīng)對(duì)應(yīng)真實(shí)世界中有價(jià)值的場(chǎng)景片段

假設(shè)你去優(yōu)化人的偏好、模型的偏好,也會(huì)出現(xiàn)hacking。比如你生成一段非常優(yōu)美的代碼,但它并不解決實(shí)際問(wèn)題。所以,任務(wù)本身應(yīng)該是真實(shí)世界的場(chǎng)景片段。

③ 高級(jí)思維:環(huán)境是最外層記憶

某種程度上,我們說(shuō)MCP(模型上下文協(xié)議)也是hack(利用)Context的一種方法,本質(zhì)也是Memory。

從Agent角度看,這個(gè)世界有一個(gè)Memory Hierarchy(記憶層級(jí))Memory Hierarchy最外層永遠(yuǎn)是環(huán)境。


有點(diǎn)像你考慮電腦,它有個(gè)Memory Hierarchy,從CPU緩存到內(nèi)存再到硬盤(pán),但最外層的Memory永遠(yuǎn)是外部環(huán)境。比如我插一個(gè)U盤(pán)、拔一個(gè)U盤(pán),或者把東西上傳到互聯(lián)網(wǎng),或者做個(gè)音樂(lè)變成光盤(pán)。

前年冬天,我讀到馮諾依曼臨終前寫(xiě)的一本書(shū)《The Computer and the Brain》(計(jì)算機(jī)與大腦),最讓我印象深刻的一句話(huà)是:Essentially,the Environment is always the most outer part of the Memory Hierarchy.(基本上,環(huán)境永遠(yuǎn)是記憶層級(jí)中最外層的部分。)

這很哲學(xué)。

對(duì)于人,你有你的Memory Hierarchy,有Working Memory(工作記憶)、Long-Term Memory(長(zhǎng)期記憶)在腦子里,但最外層是你的筆記本、Google Doc、Notion,這些是你最外層Memory Hierarchy的一部分。

2.第二支柱:交互創(chuàng)新——打破“擬人化”路徑依賴(lài)

① 核心機(jī)會(huì):設(shè)計(jì)不同于ChatGPT的交互方式

現(xiàn)在很多應(yīng)用型創(chuàng)業(yè)公司很擔(dān)心,大模型公司的模型能力溢出會(huì)把他們做的Agent吞掉。事實(shí)上,創(chuàng)業(yè)公司應(yīng)該擔(dān)心的是模型有沒(méi)有溢出能力,這樣你就真的什么都做不了了。

有溢出能力是個(gè)非常好的事情,這幾乎意味著你有機(jī)會(huì)。

創(chuàng)業(yè)公司最大機(jī)會(huì)是:能設(shè)計(jì)不同的interface(交互方式),或者說(shuō)人和數(shù)字世界交互的方式。

比如,你的Chatbot是像人一樣的東西——你和他聊天,給他布置任務(wù),讓他幫你做Deep Research(深入研究)或者寫(xiě)代碼——交互方式是像人,或者像助手一樣的交互方式。

如果你能用模型通用能力,創(chuàng)造不同的交互方式,就能創(chuàng)造巨大的機(jī)會(huì)。

所以,對(duì)于創(chuàng)業(yè)公司來(lái)說(shuō),創(chuàng)造不同的交互方式,并且模型不停有新的溢出能力,賦能到這些新的交互方式——兩者缺一不可,就能創(chuàng)造巨大的機(jī)會(huì)。


② 創(chuàng)新交互路徑:Copilot入侵式和Canvas原生式

說(shuō)到交互方式的創(chuàng)新,人和人交互已經(jīng)幾千年、幾萬(wàn)年,甚至是幾百萬(wàn)年,這是對(duì)人最自然的形態(tài),肯定是最顯然的Super App。

由此,除了文字外,我們還可以有“像人一樣”的交互方式。具體分成以下兩種:

第一,侵入式(Copilot):像Cursor一樣,嵌入集成開(kāi)發(fā)環(huán)境(如IDE),成為增強(qiáng)人類(lèi)能力的“副駕駛”。

Cursor創(chuàng)造了一種新的交互,準(zhǔn)確說(shuō)它不是像人一樣的交互,而是像Copilot(副駕駛)一樣,屬于侵入式。雖然它是IDE(集成開(kāi)發(fā)環(huán)境),但在你寫(xiě)代碼的時(shí)候,它能給你提示或編輯。沒(méi)有人和人是這樣交互的,這是它的價(jià)值所在。

第二,原生式(Canvas):像Manus或理想中的“生成式畫(huà)布”,創(chuàng)造全新的、為Agent協(xié)作而生的數(shù)字工作空間。

Canvas是一個(gè)好的嘗試,可以基于現(xiàn)在的任務(wù),在線(xiàn)生成最符合情境、個(gè)性和任務(wù)的前端。這是值得探索的方向,但也很難。

③ 競(jìng)爭(zhēng)動(dòng)態(tài):世界是“相互抄”的

關(guān)于競(jìng)爭(zhēng),傳統(tǒng)上大家認(rèn)為發(fā)生的事情是:大廠(chǎng)先做出來(lái)一個(gè)東西,創(chuàng)業(yè)公司就可以開(kāi)始抄。比如做出ChatGPT,我可以去抄一下ChatGPT,做一個(gè)類(lèi)似的事情。

但現(xiàn)在,似乎反過(guò)來(lái)也可以成立。

小廠(chǎng)可以先做一個(gè)事情,它創(chuàng)造出來(lái)一個(gè)交互的創(chuàng)新或者產(chǎn)品的創(chuàng)新,做模型的公司也可以去借鑒或者應(yīng)用,這點(diǎn)還是挺有意思。

很多時(shí)候大家會(huì)說(shuō),模型做得越來(lái)越好了,是給創(chuàng)業(yè)公司作嫁衣了。因?yàn)槟銊?chuàng)造很好的模型,如果沒(méi)有自己運(yùn)用特別好,這些創(chuàng)業(yè)公司就用好了。

但也可以反過(guò)來(lái),如果你創(chuàng)造一個(gè)非常好的交互,但沒(méi)有能力把模型或底層能力做特別好,大公司也可以借鑒你的交互,再加上它的模型能力,做得也特別好。

這世界是個(gè)相互抄的關(guān)系,而不是一個(gè)單向抄的關(guān)系。


3.第三支柱:能力演進(jìn)——從“工具”到“同仁”的階梯

① 大模型能力分級(jí)(L1-L5)解讀

OpenAI提出的大模型能力分級(jí)從Level 1到Level 5,很多人都很熟悉了:

Level 1是聊天機(jī)器人(Chatbot)

Level 2是推理者(Reasoner)

Level 3是智能體(Agent)

Level 4是創(chuàng)新者(Innovator)

Level 5是組織者(Organizer)

不知道你有沒(méi)有這個(gè)疑問(wèn):為什么是先有聊天機(jī)器人、推理者,然后才是Agent?要回答這個(gè)問(wèn)題,可以分成以下兩個(gè)部分:

第一,從L1到L2,再到L3,現(xiàn)在已完成,它們是能力遞進(jìn)關(guān)系,核心是讓模型從“聊”到“想”再到“干”。

它們的邏輯是,首先你要有語(yǔ)言的先驗(yàn)知識(shí),基于語(yǔ)言的先驗(yàn)知識(shí),最早能做出來(lái)的應(yīng)用是Chatbot(L1)。

接下來(lái),基于語(yǔ)言先驗(yàn),你需要具備推理能力,這是Reasoner(L2)。

當(dāng)你既有語(yǔ)言知識(shí),又具備推理能力,才可能進(jìn)一步做各種Agent(L3),尤其是能泛化的Agent。

也就是說(shuō),Agent建立在Chatbot和Reasoner能力之上。

第二,L4-Innovator(創(chuàng)新者)與L5-Organizer(組織者)正在進(jìn)行中,現(xiàn)在是正交探索——個(gè)體創(chuàng)造與群體協(xié)作的雙軌發(fā)展

很明顯,今天Agent發(fā)展最關(guān)鍵的兩個(gè)方向:

其一,讓它擁有自己的reward(獎(jiǎng)勵(lì)),能自己探索;

其二,是Multi-Agent(多智能體),讓它們之間能形成組織結(jié)構(gòu)。

這兩個(gè)方向,我覺(jué)得是正交,它們可以并行發(fā)展。誰(shuí)是Level 4,誰(shuí)是Level 5,我不確定,但這兩個(gè)事情是顯然的下一步。

首先,當(dāng)你作為一個(gè)Innovator

其一,你需要一個(gè)Long-Term Memory(長(zhǎng)期記憶)。比如,我是Wiles(安德魯·懷爾斯,數(shù)學(xué)家),我研究費(fèi)馬大定理,可能花了20年。我就需要一個(gè)長(zhǎng)期記憶。

其二,我有這個(gè)長(zhǎng)期記憶還不夠,還需要有內(nèi)在的reward。因?yàn)樵谀阏嬲C明那件事之前,沒(méi)有任何外部獎(jiǎng)勵(lì)(Extrinsic Reward)——你沒(méi)有獲獎(jiǎng),沒(méi)有做成任何“可交付”的事情,也沒(méi)人給你feedback(反饋)。你需要自己給自己反饋。

這是所有Innovator最重要的。無(wú)論你是藝術(shù)家、科學(xué)家、文學(xué)家,還是任何類(lèi)型的創(chuàng)作者,對(duì)吧?

其次,作為一個(gè)Organization(組織)

其一,你需要解決的問(wèn)題是:Agent和Agent之間怎么協(xié)作?怎么讓Multi-Agent(多智能體)協(xié)作scale(規(guī)模化)?

現(xiàn)在的Agent就像一個(gè)普通大學(xué)生,做一個(gè)數(shù)字化的實(shí)習(xí)生?;蛘哒f(shuō),AGI就是一個(gè)普通一本大學(xué)生在電腦上能做所有事情的一個(gè)能力。

其二,搞清楚人類(lèi)社會(huì)的邊界是什么?當(dāng)然這覆蓋80%或90%的人。

但我們最崇拜的人,是哪兩種?一種是創(chuàng)造新東西,在認(rèn)知或?qū)徝郎祥_(kāi)創(chuàng)新領(lǐng)域的人:愛(ài)因斯坦、高更、梵高、貝多芬;另一種是能創(chuàng)造新組織、偉大組織的人:伊隆·馬斯克、喬布斯。

很自然,個(gè)體的創(chuàng)造力和組織的協(xié)作能力——都非常重要。

② 下個(gè)階段需突破3個(gè)關(guān)鍵點(diǎn)

第一,是Utility(效用)的問(wèn)題

為什么我們現(xiàn)在的模型,推理很強(qiáng),考試很強(qiáng),玩游戲很強(qiáng);但它還沒(méi)創(chuàng)造出足夠經(jīng)濟(jì)價(jià)值?——根本原因是:它沒(méi)有這些Context(上下文)。

人類(lèi)社會(huì)比較tricky(復(fù)雜微妙)的一點(diǎn)是:當(dāng)然,我們確實(shí)寫(xiě)下了很多東西——我們用文字、Google Doc、Notion,記錄了很多東西,但很多Context永遠(yuǎn)只存在人的大腦,是通過(guò)一個(gè)分布式的系統(tǒng)來(lái)維護(hù)。


比如,你老板跟你之間的行為習(xí)慣,或者一些很難用語(yǔ)言總結(jié)下來(lái)的信息。這些Context存在于人的腦海里。人沒(méi)辦法把這些東西全部寫(xiě)下來(lái)。

這就導(dǎo)致——人是不可或缺的。

只有人有這樣的能力:進(jìn)入一個(gè)環(huán)境,獲得這個(gè)環(huán)境里的Context。

如果這個(gè)問(wèn)題解決了,Utility問(wèn)題就可以在很大程度被解決。

第二,是Intrinsic(內(nèi)生獎(jiǎng)勵(lì)問(wèn)題。

很多創(chuàng)新者之所以能在沒(méi)有外在激勵(lì)的情況下堅(jiān)持,是因?yàn)樗袃?nèi)在的價(jià)值觀(guān)或激勵(lì)機(jī)制。

這個(gè)問(wèn)題,AI和神經(jīng)科學(xué)已經(jīng)研究多年,嬰兒是最典型的例子。

當(dāng)他們是嬰兒的時(shí)候,他們擁有基于好奇心或自我激勵(lì)的機(jī)制。比如,很多嬰兒會(huì)反復(fù)玩一個(gè)玩具,用嘴去咬一個(gè)東西,或者做一些看似“無(wú)意義”的動(dòng)作。

你說(shuō)他獲得了什么reward嗎?他沒(méi)有升職加薪,沒(méi)有拿到錢(qián),沒(méi)有任何外在激勵(lì)——他只是好奇。他的動(dòng)機(jī)是:“如果我做這個(gè)事,我會(huì)有什么樣的感覺(jué)?”如果這個(gè)感覺(jué)是新的、不同的,他就可以從中學(xué)習(xí)。

也就是說(shuō),好奇心、掌控感、安全感,是一些內(nèi)在動(dòng)機(jī)。正是這些東西驅(qū)動(dòng)了人去做某些事。否則,很難從純粹理性角度解釋?zhuān)核麨槭裁匆觯?/p>

但有意思的是,當(dāng)人長(zhǎng)大之后,會(huì)發(fā)生重要變化

當(dāng)你是嬰兒,你對(duì)世界的理解,是基于視覺(jué)、觸覺(jué),基于物理世界的。你學(xué)習(xí)的是,怎么把觸覺(jué)、聽(tīng)覺(jué)、視覺(jué),以及對(duì)骨骼系統(tǒng)的控制結(jié)合起來(lái);

當(dāng)你長(zhǎng)大之后,你對(duì)世界的理解方式變了,變成一個(gè)基于語(yǔ)言、推理、文字系統(tǒng)的理解。你開(kāi)始思考:這個(gè)世界是怎么運(yùn)作的?我怎么才能開(kāi)一個(gè)公司?怎么才能升職?怎么才能做成一些事情?你玩的,不再是一個(gè)物理游戲,而是一個(gè)文字游戲。


在這個(gè)文字游戲里,當(dāng)然也存在內(nèi)在激勵(lì),但又好像和嬰兒時(shí)期的好奇驅(qū)動(dòng)不太一樣。

這是AI面臨的挑戰(zhàn):傳統(tǒng)AI,比如玩迷宮、做機(jī)器人仿真,它可以定義一些基于世界模型或者模仿嬰兒階段好奇心的內(nèi)在激勵(lì)。

但當(dāng)AI在玩的是一個(gè)語(yǔ)言游戲,要怎么定義內(nèi)在激勵(lì)?——這個(gè)問(wèn)題就變得不太一樣了。

第三,是多智能體之間的協(xié)作問(wèn)題。

基于基礎(chǔ)模型往上長(zhǎng),Agent生態(tài)樹(shù)在我的腦海中,呈現(xiàn)的是這樣一個(gè)結(jié)構(gòu):

首先,一個(gè)方向是:fundamental research(基礎(chǔ)研究)怎么演變?或者說(shuō),方法怎么演變?

其次,另一個(gè)方向是:應(yīng)用,或者它的交互方式(interaction)有怎樣的演變?

這兩個(gè)方向之間有關(guān)聯(lián),但它們需要不同的人去探索不同的方向。

比如Cursor并沒(méi)有在fundamental research(基礎(chǔ)研究)上做什么創(chuàng)新,但做了交互方式上的創(chuàng)新。

在fundamental research上,比較重要的有三方面:

一個(gè)是Memory(記憶);

一個(gè)是Intrinsic Reward(內(nèi)生獎(jiǎng)勵(lì)機(jī)制);

還有一個(gè)是Multi-Agent(多智能體系統(tǒng))。

這也跟OpenAI提出的Innovator(L4、創(chuàng)新者)和Organization(L5、組織者)框架很像,它們屬于正交,可以并行發(fā)展。

所以,我們需要解決多智能體之間的協(xié)作問(wèn)題。

4.第四支柱:系統(tǒng)思維——擁抱“簡(jiǎn)單且通用”的設(shè)計(jì)哲學(xué)

① 研究心法:追求簡(jiǎn)單而通用

我一直有這個(gè)非共識(shí):我想要去做Agent,一直想做簡(jiǎn)單且通用的東西,我不想做一個(gè)很復(fù)雜、但只能在一個(gè)領(lǐng)域奏效的東西。

這個(gè)方向在傳統(tǒng)意義上很難被接受,大家習(xí)慣了做AI的方式:把問(wèn)題不停細(xì)分,做很多細(xì)分方法,可能并沒(méi)有多少人想做一個(gè)簡(jiǎn)單且通用的系統(tǒng),或者認(rèn)為這是可能的——尤其20年之內(nèi)。

現(xiàn)在我還是覺(jué)得,我自己最喜歡的工作是ReAct。之后,基于這兩個(gè)方向:一方面做更多方法(method),一方面做更多任務(wù)(task)。

但總體來(lái)說(shuō),我的研究有兩個(gè)核心:一是怎么去做一些有價(jià)值、和現(xiàn)實(shí)世界更相關(guān)的任務(wù)和環(huán)境;二是怎么去做一些簡(jiǎn)單、但又通用的方法。

所以,Agent最吸引我的就是它的可泛化性(generalizable),即絕大多數(shù)事,你都可以用語(yǔ)言表達(dá)。

我當(dāng)時(shí)隱隱約約有個(gè)直覺(jué):你如果真想去實(shí)現(xiàn)AGI(通用人工智能)——那時(shí)還沒(méi)人提“AGI”這個(gè)詞但如果你真的想做一個(gè)非常通用的系統(tǒng)(general system),你就得去構(gòu)建一個(gè)智能體。

② 創(chuàng)新策源地:從垂直細(xì)分到通用思維的AI范式回歸

回頭看AI歷史,很久很久以前,從Herbert Simon(赫伯特·西蒙)在1960年代開(kāi)始,大家最早的想法就是要做一個(gè)Agent。

當(dāng)時(shí)大家的野心很大——想用一個(gè)夏天搞定視覺(jué),再用另一個(gè)夏天搞定語(yǔ)言,拼在一起,去做一個(gè)Agent,他就應(yīng)該比人還聰明,但這事太難了。

慢慢地,AI變得非常碎片化,大家研究的問(wèn)題越來(lái)越小。比如,有的人研究視覺(jué)一小部分問(wèn)題,有的人研究語(yǔ)言某個(gè)子任務(wù),越來(lái)越細(xì)分,越來(lái)越垂直。

但到2015年之后,開(kāi)始出現(xiàn)Scaling Law(擴(kuò)展規(guī)律),包括很多研究突破,歷史上一些關(guān)鍵時(shí)刻也在提示我們:

也許我們應(yīng)該從這種“垂直式思維(vertical thinking)”重新回到更“通用式思維(general thinking)”,再去嘗試構(gòu)建真正通用的系統(tǒng)。


③ 個(gè)人品質(zhì):以雜學(xué)積淀塑造通用性思維與跨界視野

在我成長(zhǎng)路上,對(duì)我啟發(fā)大的是看書(shū)。我是一個(gè)喜歡看雜書(shū)的人。什么書(shū)都看,什么電影都看,什么地方都想去。

我從小就是一個(gè)比較general(通用)的人——我想試圖變得很通用,試圖了解很多不同的學(xué)科,做很多不同的事情。

但后來(lái)我發(fā)現(xiàn),一個(gè)人即使再聰明、再有精力,他能理解的知識(shí)或能做的事情,也只是人類(lèi)社會(huì)積累的知識(shí)的很小一部分。更好的是,你去創(chuàng)造一個(gè)比你更通用、更general的事情。

我好像一直對(duì)于通用性,有一種執(zhí)念或追求。通用性意味著什么?我不知道,但我從小就是想學(xué)習(xí)很多不同學(xué)科,都很有意思。

我在姚班很多同學(xué),他們是那種很deep(深度的)、很focus(專(zhuān)注的)同學(xué)——我去做競(jìng)賽,我就把這個(gè)事做到極致,不停刷題,做到世界金牌。

但我好像不是那種性格,我是那種——我會(huì)看很多數(shù)學(xué),也會(huì)看很多歷史,會(huì)看各種各樣亂七八糟的東西。

三、實(shí)戰(zhàn)推演:

在轉(zhuǎn)折點(diǎn)上如何決策與行動(dòng)?

1.給創(chuàng)業(yè)者的行動(dòng)指南:在夾縫中定義未來(lái)

① 第一步:找到一個(gè)真正有價(jià)值的場(chǎng)景

Agent創(chuàng)業(yè),當(dāng)前主要瓶頸是算力。Agent的token用量驚人,單個(gè)用戶(hù)消耗可能是Chatbot的500到1000倍,疊加幾百萬(wàn)用戶(hù)后成本極高。

這種情況下,Agent該如何擴(kuò)展?我覺(jué)得最重要的點(diǎn)是——你得先找到一個(gè)好的應(yīng)用。

事實(shí)上,Cost(成本)本身不是最大問(wèn)題,問(wèn)題是你的成本并不能證明你的performance(性能)或value(價(jià)值)是合理的。

如果這是一個(gè)很有價(jià)值的事,我花500美元,但可以賺1000美元——根本不是問(wèn)題。這不是technical bottleneck(技術(shù)瓶頸),而是product-market fit(產(chǎn)品與市場(chǎng)契合度)的問(wèn)題。

所以,現(xiàn)在最關(guān)鍵的,是要找到真正有價(jià)值的應(yīng)用。

② 壁壘構(gòu)建:短期靠交互創(chuàng)新,長(zhǎng)期靠Context(用戶(hù)上下文)

首先,短期內(nèi)要靠交互創(chuàng)新。

比如,Manus,交互創(chuàng)新想象空間是很高的。

它的一個(gè)價(jià)值是給人非常general(通用)的感覺(jué),你可以有每個(gè)階段的Killer App(殺手級(jí)應(yīng)用),比如它做PPT特別好,做Deep Research特別好,或者做其他東西特別好。

iPhone或iPad是非常通用的產(chǎn)品形態(tài),但它一開(kāi)始,都有一些Killer App支持它有momentum(增長(zhǎng)動(dòng)能)。包括ChatGPT,包括微信,很多偉大產(chǎn)品都這樣。

你有一個(gè)足夠通用、簡(jiǎn)單,或第一性的交互方式,它有很多想象空間。但你去維護(hù)它,或者設(shè)計(jì)路徑的時(shí)候,你能有各種各樣的應(yīng)用,使它不停地增長(zhǎng)。

其次,長(zhǎng)期靠積累獨(dú)特的用戶(hù)上下文(Context)和環(huán)境。

現(xiàn)在對(duì)于ChatGPT比較重要的是Memory(記憶),這是可能產(chǎn)生壁壘的地方。

如果沒(méi)有Memory,大家拼誰(shuí)的模型更強(qiáng)。但有了Memory,拼的不僅是誰(shuí)的模型更強(qiáng),而是用戶(hù)用哪個(gè)更多、哪個(gè)粘性更強(qiáng)。

我積累了更多Context,它能給我更好體驗(yàn),我就會(huì)有粘性——這或許是研究?jī)?yōu)勢(shì)轉(zhuǎn)化成商業(yè)優(yōu)勢(shì)的方式。

③ 警惕“數(shù)據(jù)飛輪”幻覺(jué)

大多數(shù)公司還沒(méi)有形成數(shù)據(jù)飛輪,他們依賴(lài)模型變好,利用模型變好的溢出能力。

如果你要有數(shù)據(jù)飛輪,首先你要能自己去訓(xùn)模型,并且能通過(guò)交互有很好的reward,使你能把好的數(shù)據(jù)和不好的數(shù)據(jù)分開(kāi)。

比較成功的是Midjourney(用戶(hù)偏好直接驅(qū)動(dòng)模型優(yōu)化),有非常清晰的reward——人更喜歡哪張圖,這個(gè)reward和應(yīng)用是對(duì)齊的,reward做得更好,公司就更成功,模型也更好——一切都對(duì)齊。

有了這種情況,才能自己訓(xùn)練模型,做數(shù)據(jù)飛輪。

這個(gè)過(guò)程必須比較非主線(xiàn)。因?yàn)槿绻苤骶€(xiàn),我也可以通過(guò)Pre-Training或RL提升能力,靠泛化或其他方式。

總的來(lái)說(shuō),只有像Midjourney這樣,獎(jiǎng)勵(lì)機(jī)制與產(chǎn)品價(jià)值完全對(duì)齊的閉環(huán),才能形成飛輪,大部分公司目前還沒(méi)有形成飛輪。

2.給企業(yè)決策者的戰(zhàn)略研判:防守與進(jìn)攻

① CEO的第一課:以技術(shù)認(rèn)知驅(qū)動(dòng)戰(zhàn)略決策與價(jià)值創(chuàng)造

假若我是一個(gè)CEO,做的第一件事就是親自深度學(xué)習(xí)技術(shù)本質(zhì),做出不被誤導(dǎo)的戰(zhàn)略決策。

首先,我肯定會(huì)學(xué)習(xí),我會(huì)想弄清楚這個(gè)事情到底是什么。

如果你作為CEO不懂這個(gè)事情,所有事情會(huì)變得很難。很多時(shí)候,一個(gè)公司的bottleneck(瓶頸)就在于,CEO對(duì)這個(gè)事理解不夠。如果你不理解,去招一些很好的人、做一些事情,你很可能被他們忽悠。

其次,要從創(chuàng)造新的價(jià)值來(lái)思考問(wèn)題。

畢竟你不是技術(shù)專(zhuān)家,而是一個(gè)CEO,你有一些場(chǎng)景、一些資源、一些優(yōu)勢(shì)。從第一性原理看,一個(gè)新的技術(shù)產(chǎn)生了,你要思考的是,怎么用這些新技術(shù)結(jié)合你現(xiàn)在的資源去創(chuàng)造新的價(jià)值。

此外,你可以嘗試做一個(gè)和當(dāng)前業(yè)務(wù)完全不一樣、但價(jià)值非常大的事情,比如ChatGPT,但對(duì)大多數(shù)公司來(lái)說(shuō),即使很有錢(qián)、很強(qiáng),也不一定make sense(合理)。

② 大公司策略:依托護(hù)城河優(yōu)勢(shì)防御顛覆性交互創(chuàng)新

站在公司的角度看,大公司的戰(zhàn)略其實(shí)很簡(jiǎn)單,依托現(xiàn)有用戶(hù)基礎(chǔ)、數(shù)據(jù)資源、場(chǎng)景優(yōu)勢(shì)以及Context(護(hù)城河),穩(wěn)健融合Agent能力,重點(diǎn)防御顛覆性交互方式帶來(lái)的創(chuàng)新沖擊。

為什么要重點(diǎn)防御?原因是全新的交互方式會(huì)改變我們的世界。就像一開(kāi)始互聯(lián)網(wǎng)誕生,最早Super App只是把郵件升級(jí)成Email,Amazon已經(jīng)算非常創(chuàng)新的東西了?,F(xiàn)在就像那個(gè)階段——我們的想象力仍被以往的交互方式所限制,還有許多尚未誕生的交互方式。

但肯定會(huì)有很多不同的交互方式,訓(xùn)練完全不同的模型,創(chuàng)造出不同的系統(tǒng)。

當(dāng)然,這類(lèi)東西很難和ChatGPT比強(qiáng)弱,它們是不同應(yīng)用,有不同價(jià)值。比如,微信做Agent。

如果我是微信的一號(hào),對(duì)做不做Agent?我可能會(huì)不急,先觀(guān)望觀(guān)望。

我好像沒(méi)有理由要急。我會(huì)觀(guān)察,我會(huì)學(xué)習(xí)AI,會(huì)觀(guān)察有沒(méi)有什么新的交互方式很有意思。但我不會(huì)急著去做很多事——我有易守難攻的地方,為什么要急著進(jìn)攻呢?

比較危險(xiǎn)的是一個(gè)顛覆性的創(chuàng)新。

真正的危險(xiǎn),不是說(shuō)一個(gè)類(lèi)似于微信的東西打敗了微信,而是一個(gè)很不一樣的東西打敗了微信。

就像微信打敗了QQ,當(dāng)時(shí)擔(dān)心的并不是一個(gè)類(lèi)似QQ的東西打敗了QQ,而是一個(gè)很不一樣的產(chǎn)品去打敗這個(gè)東西。

我們需要對(duì)顛覆性創(chuàng)新有所警惕。

③ 投資與布局邏輯:聚焦特定Context與數(shù)字環(huán)境構(gòu)建的平臺(tái)

作為投資者,如何做好allocate(分配)?這是個(gè)很好的問(wèn)題,實(shí)際上取決于你有多少精力,或者有多少資源分配顆粒度。

當(dāng)然現(xiàn)在OpenAI、Anthropic,這些模型層公司,大概率會(huì)有更大價(jià)值。

還有一類(lèi)很有價(jià)值的,是能積累User Context(用戶(hù)上下文),或者能構(gòu)建特殊Environment(環(huán)境)的公司。最終如果AI或AGI是一個(gè)系統(tǒng),它需要有Intelligence(智能),需要有Environment,還需要有User Context,或者對(duì)用戶(hù)的理解。

現(xiàn)在有很多User Data(用戶(hù)數(shù)據(jù))或User Context的公司,有點(diǎn)像發(fā)明車(chē)之前的煤炭、煤礦,或者像發(fā)明汽車(chē)之前的石油公司。

從這個(gè)角度,微信或大平臺(tái),還是一個(gè)易守難攻的好平臺(tái),它積攢大量的Context。

如果Intelligence是一個(gè)可以逐漸民主化、逐漸變得便宜、逐漸普及,擁有這樣的平臺(tái),擁有這樣的Environment,擁有這樣的Context,可能會(huì)是一個(gè)很強(qiáng)的壁壘,它可能還是一個(gè)很好的投資。

3.給研究者與個(gè)人的啟示:在范式轉(zhuǎn)換中定位

① 職業(yè)選擇:在時(shí)代機(jī)遇中追尋高上限價(jià)值

我的成長(zhǎng)路徑其實(shí)挺按部就班的,也沒(méi)有跳級(jí),沒(méi)有做什么很surprising(讓人驚訝)的事情。

但我對(duì)一個(gè)東西的價(jià)值,或者taste(品味),有自己的看法。大家往往會(huì)傾向于做一個(gè)確定性比較高的事情,包括做研究、做公司。

但我覺(jué)得恰好是這個(gè)時(shí)代,你去做上限更高的事情是更好的,因?yàn)楝F(xiàn)在有一個(gè)巨大的機(jī)會(huì)。

如果沒(méi)有這樣一個(gè)巨大的機(jī)會(huì),最佳路徑可能是去做incremental(漸進(jìn)式)、確定性強(qiáng)的事情,一步一步地積累,但恰好有一個(gè)上限非常高的事情。

如果你敢想,或者你膽子特別大,或者你想象力很豐富,就會(huì)有好事發(fā)生。

② 思維變革:從算法改進(jìn)轉(zhuǎn)向任務(wù)定義

現(xiàn)在,AI科研范式重心已經(jīng)從上半場(chǎng)轉(zhuǎn)移到了下半場(chǎng),即從算法改進(jìn)(Method)已經(jīng)轉(zhuǎn)變?yōu)槿蝿?wù)環(huán)境設(shè)計(jì)(Task/Environment)。

這帶來(lái)一個(gè)本質(zhì)變化:以前我面對(duì)很多怪獸,需要造出各種不同武器去打它們;現(xiàn)在我有了一把通用武器,比如機(jī)關(guān)槍?zhuān)也恍枰贋槊總€(gè)怪獸單獨(dú)造武器。接下來(lái)要思考的問(wèn)題就變成:我該朝哪個(gè)方向開(kāi)槍?zhuān)?/p>

現(xiàn)在方法的問(wèn)題已基本解決,真正重要的是——我們要用這個(gè)通用方法,從“我能解決什么問(wèn)題”轉(zhuǎn)變?yōu)椤拔覒?yīng)該定義什么問(wèn)題”。

總之,我們要成為一名“問(wèn)題設(shè)計(jì)師”和“任務(wù)架構(gòu)師”。

③ 終極動(dòng)力:為世界創(chuàng)造渴望,過(guò)程中享受有趣

關(guān)于驅(qū)動(dòng)力,我用一個(gè)非常俗的話(huà)說(shuō):希望你對(duì)這個(gè)世界創(chuàng)造一些不同——探索新的、根本性的研究,是一種創(chuàng)造不同的方式;創(chuàng)造一種完全不同的新的產(chǎn)品形態(tài),也是一種創(chuàng)造不同的方式。

如果我現(xiàn)在去做一家類(lèi)似xAI或Thinking Machine的公司,或者做一個(gè)類(lèi)似Chatbot或Assistant的產(chǎn)品,還是可能賺很多錢(qián),商業(yè)上很成功;但如果我做了一個(gè)形態(tài)很不一樣的東西,失敗了,我起碼探索了不一樣?xùn)|西。

我導(dǎo)師令我印象最深的是這樣一句話(huà),學(xué)術(shù)圈經(jīng)常發(fā)生這樣的事——你有一個(gè)想法,然后別人做了,你會(huì)很煩。他說(shuō):If someone else can do it,then it's okay to let them do it(如果別人能做,那就讓他們?nèi)プ霭桑?/p>

所以,我覺(jué)得真正的價(jià)值在于對(duì)這個(gè)社會(huì)產(chǎn)生價(jià)值。

從人類(lèi)全局的角度,如果這個(gè)事情很多人能做,別人做可能是不是也沒(méi)有什么區(qū)別?對(duì)這個(gè)社會(huì),或者對(duì)整體來(lái)說(shuō),似乎沒(méi)有什么變化。

或者,你也可以去做一些不一樣的探索。我覺(jué)得,最終你要對(duì)這個(gè)社會(huì)產(chǎn)生價(jià)值。

但這個(gè)時(shí)代很幸運(yùn)的一點(diǎn):這個(gè)技術(shù)非常通用,這個(gè)技術(shù)非常偉大,有足夠多探索的空間。

另一點(diǎn)是,我想讓生活更有趣,更有意思,更快樂(lè),就去做一些自己喜歡的事情。

這很難用語(yǔ)言解釋?zhuān)褪且粋€(gè)taste(品味)或preference(偏好)的問(wèn)題。

參考資料:

1.2025年9月11日,《獨(dú)家對(duì)話(huà)OpenAI姚順雨生成新世界的系統(tǒng)》,語(yǔ)言即世界language is world

*文章為作者獨(dú)立觀(guān)點(diǎn),不代表筆記俠立場(chǎng)。

好文閱讀推薦:

“子彈筆記”是筆記俠的矩陣公眾號(hào),聚焦職場(chǎng)效率追求、人際關(guān)系與高潛成長(zhǎng)者,幫你3分鐘吃透核心觀(guān)點(diǎn)和方法論。歡迎關(guān)注~

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
據(jù)稱(chēng)伊朗首次使用“法塔赫-2”導(dǎo)彈襲擊美軍基地

據(jù)稱(chēng)伊朗首次使用“法塔赫-2”導(dǎo)彈襲擊美軍基地

環(huán)球網(wǎng)資訊
2026-03-01 20:05:07
近期,一名中國(guó)男子去泰國(guó)玩,花6000泰銖找21歲女孩,悲劇發(fā)生了

近期,一名中國(guó)男子去泰國(guó)玩,花6000泰銖找21歲女孩,悲劇發(fā)生了

鯨探所長(zhǎng)
2026-03-01 14:38:25
交了物業(yè)費(fèi)還收車(chē)位管理費(fèi)?2026年這4種情況,你可以直接拒交

交了物業(yè)費(fèi)還收車(chē)位管理費(fèi)?2026年這4種情況,你可以直接拒交

阿離家居
2026-03-01 16:53:47
演都不演了!剛復(fù)出就開(kāi)演唱會(huì),票價(jià)賣(mài)到1280,到底誰(shuí)給的自信

演都不演了!剛復(fù)出就開(kāi)演唱會(huì),票價(jià)賣(mài)到1280,到底誰(shuí)給的自信

樂(lè)悠悠娛樂(lè)
2026-03-01 10:27:25
哈梅內(nèi)伊被精準(zhǔn)斬首,為何伊朗人民載歌載舞?

哈梅內(nèi)伊被精準(zhǔn)斬首,為何伊朗人民載歌載舞?

歷史總在押韻
2026-03-01 11:59:19
美國(guó)2個(gè)月內(nèi)悍然對(duì)兩國(guó)領(lǐng)導(dǎo)人發(fā)動(dòng)襲擊,繼委內(nèi)瑞拉、伊朗之后,下一個(gè)會(huì)是誰(shuí)?專(zhuān)家:有可能是古巴

美國(guó)2個(gè)月內(nèi)悍然對(duì)兩國(guó)領(lǐng)導(dǎo)人發(fā)動(dòng)襲擊,繼委內(nèi)瑞拉、伊朗之后,下一個(gè)會(huì)是誰(shuí)?專(zhuān)家:有可能是古巴

極目新聞
2026-03-01 15:07:54
中國(guó)軍號(hào):對(duì)于那一天我們不期待,但絕不懼怕!

中國(guó)軍號(hào):對(duì)于那一天我們不期待,但絕不懼怕!

瀟湘晨報(bào)
2026-03-01 15:18:15
哈梅內(nèi)伊,突然“回歸天國(guó)”

哈梅內(nèi)伊,突然“回歸天國(guó)”

中國(guó)新聞周刊
2026-03-01 12:28:08
哈梅內(nèi)伊身亡,布達(dá)諾夫:俄羅斯會(huì)接受美國(guó)為烏克蘭提供的安全保證 | 狼叔看世界

哈梅內(nèi)伊身亡,布達(dá)諾夫:俄羅斯會(huì)接受美國(guó)為烏克蘭提供的安全保證 | 狼叔看世界

狼叔看世界
2026-03-01 11:40:52
上海浦東機(jī)場(chǎng)多架航班返航!中國(guó)旅客:我已經(jīng)哭過(guò)了,感到后怕;中東機(jī)場(chǎng)改簽排隊(duì)數(shù)百米,國(guó)內(nèi)三大航可免費(fèi)退改簽

上海浦東機(jī)場(chǎng)多架航班返航!中國(guó)旅客:我已經(jīng)哭過(guò)了,感到后怕;中東機(jī)場(chǎng)改簽排隊(duì)數(shù)百米,國(guó)內(nèi)三大航可免費(fèi)退改簽

大象新聞
2026-03-01 14:45:10
今起,這些錢(qián)不用交了!國(guó)家明確:3月1日起,一批收費(fèi)取消

今起,這些錢(qián)不用交了!國(guó)家明確:3月1日起,一批收費(fèi)取消

陳博世財(cái)經(jīng)
2026-03-01 10:46:47
哈梅內(nèi)伊:舊時(shí)代的最后一個(gè)獨(dú)裁者

哈梅內(nèi)伊:舊時(shí)代的最后一個(gè)獨(dú)裁者

黔有虎
2026-03-01 19:08:14
56歲許晴,無(wú)美顏無(wú)濾鏡素顏亮相,狀態(tài)好到讓人不敢相信

56歲許晴,無(wú)美顏無(wú)濾鏡素顏亮相,狀態(tài)好到讓人不敢相信

復(fù)轉(zhuǎn)小能手
2026-03-01 22:15:02
3月3日元宵節(jié),牢記:1不留,2不洗,3不穿,4不空!馬年大吉

3月3日元宵節(jié),牢記:1不留,2不洗,3不穿,4不空!馬年大吉

阿龍美食記
2026-03-01 16:17:49
世界首次五百?gòu)?qiáng)斷崖差:日本149家,美國(guó)151家,中國(guó)3家,現(xiàn)在呢

世界首次五百?gòu)?qiáng)斷崖差:日本149家,美國(guó)151家,中國(guó)3家,現(xiàn)在呢

紀(jì)中百大事
2026-03-01 12:24:25
特朗普稱(chēng)美方“基本摧毀”伊朗海軍總部

特朗普稱(chēng)美方“基本摧毀”伊朗海軍總部

財(cái)聯(lián)社
2026-03-02 01:29:13
伊朗總統(tǒng)等將領(lǐng)導(dǎo)國(guó)家,為何其不單獨(dú)接掌?委內(nèi)瑞拉模式會(huì)再現(xiàn)么

伊朗總統(tǒng)等將領(lǐng)導(dǎo)國(guó)家,為何其不單獨(dú)接掌?委內(nèi)瑞拉模式會(huì)再現(xiàn)么

聞號(hào)說(shuō)經(jīng)濟(jì)
2026-03-01 12:08:37
哈梅內(nèi)伊接班人真狠人,一夜打遍中東美軍:打出半個(gè)世紀(jì)最強(qiáng)戰(zhàn)績(jī)

哈梅內(nèi)伊接班人真狠人,一夜打遍中東美軍:打出半個(gè)世紀(jì)最強(qiáng)戰(zhàn)績(jī)

社會(huì)日日鮮
2026-03-01 13:37:07
1971年伊朗花20億干這么愚蠢的事情,最終成為最昂貴的葬禮

1971年伊朗花20億干這么愚蠢的事情,最終成為最昂貴的葬禮

爆角追蹤
2026-03-01 15:28:53
哈梅內(nèi)伊死后,有伊朗人分析:現(xiàn)在還沒(méi)到慶祝的時(shí)候

哈梅內(nèi)伊死后,有伊朗人分析:現(xiàn)在還沒(méi)到慶祝的時(shí)候

小蘿卜絲
2026-03-01 09:56:11
2026-03-02 04:07:00
筆記俠 incentive-icons
筆記俠
互聯(lián)網(wǎng)最前沿的創(chuàng)業(yè)筆記
9949文章數(shù) 77600關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂(lè)要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來(lái)襲

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

汽車(chē)要聞

理想汽車(chē)2月交付26421輛 歷史累計(jì)交付超159萬(wàn)輛

態(tài)度原創(chuàng)

藝術(shù)
旅游
數(shù)碼
手機(jī)
公開(kāi)課

藝術(shù)要聞

看!這位伊朗超模如何顛覆你的美麗認(rèn)知!

旅游要聞

青州春雨刷屏,千年古城煙雨朦朧,藏著最動(dòng)人的東方浪漫!

數(shù)碼要聞

曝蘋(píng)果WWDC 26將推Core AI框架取代Core ML并公布多項(xiàng)AI功能

手機(jī)要聞

現(xiàn)場(chǎng)直擊!榮耀Robot Phone機(jī)器人手機(jī)長(zhǎng)啥樣

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版