国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

我們和田淵棟做了一次年末總結(jié):關(guān)于Scaling、頓悟及AGI還有多遠(yuǎn)

0
分享至

2025 年 10 月,Meta 宣布裁減 AI 部門約 600 名員工,這場(chǎng)劇烈的人事震蕩,將田淵棟推向了公眾視野的中心。作為 Meta FAIR(Facebook AI Research,F(xiàn)acebook 人工智能研究院)的研究科學(xué)家總監(jiān),田淵棟在這家公司工作了超過(guò)十年,主導(dǎo)了從圍棋 AI Dark Forest/OpenGo,表示學(xué)習(xí)(Representation Learning),打開(kāi)模型黑箱,到大模型長(zhǎng)文本快速高效推理,還有連續(xù)思維鏈(Coconut,Chain of Continuous Thought)等一系列前沿研究。

他離職的消息傳出后,OpenAI、英偉達(dá)、xAI 等公司紛紛在社交媒體評(píng)論區(qū)公開(kāi)搶人,場(chǎng)面頗為壯觀。

兩個(gè)月過(guò)去,當(dāng)硅谷的喧囂逐漸平息,我們?cè)谀昴┡c田淵棟進(jìn)行了一次長(zhǎng)談。彼時(shí)他已卸下管理者的身份,正處于一個(gè)“比較好的時(shí)間段”——用他自己的話說(shuō),可以做一些探索。

在年末的這次對(duì)話中,我們請(qǐng)他一起回顧這一年。他談到了為什么 Scaling Law“肯定有效果,只是不那么有趣”;為什么他相信一定存在某條隱藏的路線,“可以讓現(xiàn)在的智能以一千倍的效率來(lái)達(dá)成”;為什么當(dāng)前的 Transformer 框架可能不是最終的解,“必須有一個(gè)完全不一樣的跳躍”。他也坦言,關(guān)于 AI 能否達(dá)到人類學(xué)習(xí)效率這個(gè)問(wèn)題,今年的研究讓他“更清楚地看到了差距”。更近,還談不上。

他認(rèn)為未來(lái)研究者最需要的是 taste,“本質(zhì)上是指方向的能力,用強(qiáng)化學(xué)習(xí)的話說(shuō),就是那個(gè)值函數(shù)”。談到未來(lái)個(gè)體的工作方式,他說(shuō):“以后一定會(huì)出現(xiàn)一人 CEO 的情況,我自己是公司的 CEO,下面有一堆 AI 幫我把事情干了。”

以下是我們的對(duì)話實(shí)錄。

十年最大的收獲,是形成獨(dú)立的 research taste

DeepTech:你在 Meta 工作了十年,現(xiàn)在回頭看,最大的收獲是什么?離開(kāi)之后有什么新的感受?

田淵棟:十年里面應(yīng)該說(shuō)發(fā)生了很多事情,僅僅一兩句話很難概括。總的來(lái)說(shuō),這十年最大的收獲還是讓自己通過(guò)努力獲得了獨(dú)立和獨(dú)特的研究品味(research taste),能夠從初心出發(fā)立項(xiàng),逐步追逐自己想要做的長(zhǎng)期研究。

當(dāng)然,最近一兩年的最大收獲是積累了很多大模型研發(fā)的實(shí)戰(zhàn)經(jīng)驗(yàn),包括參與 Llama 項(xiàng)目,對(duì)推理模型的具體問(wèn)題有了更深的理解。

雖然最后 Llama 4 由于種種原因沒(méi)有太成功,但我們還是在強(qiáng)化學(xué)習(xí)訓(xùn)練的核心問(wèn)題上有一些探索,比如說(shuō)訓(xùn)練穩(wěn)定性、訓(xùn)推互動(dòng)、模型架構(gòu)設(shè)計(jì),和預(yù)訓(xùn)練/中期訓(xùn)練的互動(dòng),長(zhǎng)思維鏈的算法,數(shù)據(jù)生成的方式,后訓(xùn)練框架的設(shè)計(jì)等等。這個(gè)經(jīng)驗(yàn)本身是很重要的,對(duì)我的研究思路也帶來(lái)了很大的改變。

離開(kāi)之后,很多偏管理的事務(wù)消失了,我能更集中地做自己真正想做的事情,親手推進(jìn)一些工作。而且我現(xiàn)在想做的一些方向,并不完全依賴大規(guī)模資源,因此這是一個(gè)相對(duì)合適的階段,可以開(kāi)展探索。

今年做了什么:圍繞泛化與訓(xùn)練效率的幾條關(guān)鍵線索

DeepTech:你每年都會(huì)在知乎上寫(xiě)年終總結(jié),今年也快到尾聲了。能不能先帶大家回顧一下你今年的主要研究工作?它們之間有什么聯(lián)系?

田淵棟:今年應(yīng)該也會(huì)寫(xiě)。距離 12 月 31 號(hào)還有幾天,而且有大語(yǔ)言模型幫忙,寫(xiě)作效率會(huì)比以前高一些。

今年大部分時(shí)間都在 Llama 那邊幫忙,研究工作如果要找一個(gè)主線的話,大概是:如何找到更有效率的訓(xùn)練方法,找到更好的方式打開(kāi)模型的黑箱,知道泛化能力的來(lái)源。我覺(jué)得這些是比較有意思的方向。

值得一提的是幾篇文章。比如我自己做的關(guān)于 Grokking(頓悟現(xiàn)象)的分析,探討神經(jīng)網(wǎng)絡(luò)在訓(xùn)練的時(shí)候如何達(dá)到泛化的效果,數(shù)據(jù)的多寡是否能得出頓悟和泛化的深層次數(shù)學(xué)規(guī)律。

還有一篇叫“The Path Not Taken”,分析了強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)微調(diào)之間有什么區(qū)別,為什么會(huì)導(dǎo)致最終效果的不同。之前已經(jīng)有文章指出,如果你用 on-policy data(即由模型自己生成的數(shù)據(jù))去訓(xùn)練模型,模型會(huì)較少產(chǎn)生災(zāi)難性遺忘或者過(guò)擬合的問(wèn)題。但如果你用外來(lái)的數(shù)據(jù)強(qiáng)制讓模型學(xué)習(xí),它就會(huì)產(chǎn)生一些奇怪的現(xiàn)象。


圖丨相關(guān)論文(來(lái)源:arXiv)

后來(lái)我們進(jìn)一步發(fā)現(xiàn),二者對(duì)內(nèi)部權(quán)重的改動(dòng)方式并不相同。強(qiáng)化學(xué)習(xí)改變權(quán)重時(shí),不會(huì)去觸動(dòng)那些最大的特征向量的方向,只在比較小的特征方向上進(jìn)行改變,這樣其實(shí)沒(méi)有影響模型的筋骨,只是做了一些微調(diào)。但如果你直接在模型上做微調(diào),且數(shù)據(jù)并非模型自生成,就有可能改變它的筋骨,導(dǎo)致一些本質(zhì)行為的變化。

還有像 Deep Confidence 那篇論文,研究怎么樣通過(guò)置信度來(lái)提高效率。這篇更偏工程和實(shí)用化一點(diǎn),也許我并不用打開(kāi)黑箱子,只要觀察第一層某些 token 之間的置信度變化,就能大致判斷當(dāng)前推理過(guò)程是否存在問(wèn)題;先剔除那些不太好的推理軌跡,保留更自信的推理過(guò)程,最終效果往往會(huì)更好。

通過(guò)這些工作,我們可以更好地了解模型在推理和學(xué)習(xí)過(guò)程中,什么樣的權(quán)重變化是本質(zhì)的變化,什么樣的方式能夠讓模型變得更強(qiáng)。我覺(jué)得這應(yīng)該是以后比較重要的一個(gè)方向。

DeepTech:我們還注意到,你今年在研究實(shí)踐上做了一個(gè)新的嘗試,就是用 AI 輔助研究?

田淵棟:對(duì),這篇關(guān)于 Grokking 的文章,其實(shí)是通過(guò)我自己和 GPT 相互腦暴之后做出來(lái)的,跟之前的做法完全不一樣。效率比以前高很多,也許以前四五個(gè)月做一篇文章,花很多時(shí)間。現(xiàn)在可能只需要幾個(gè)禮拜,就能做一篇比較好的、至少對(duì)業(yè)界的難題有一些洞察(insights)的文章出來(lái)。

像八月之前我們都還在 Llama 團(tuán)隊(duì),沒(méi)有太多時(shí)間去做研究,回到 FAIR 之后,我本來(lái)以為重新開(kāi)始研究工作需要花些時(shí)間,想不到換這種方式之后,很快就有突破了,這點(diǎn)讓我很有觸動(dòng)。

所以我覺(jué)得整個(gè)研究的范式和學(xué)習(xí)的范式,都可能會(huì)發(fā)生很大的變化。2026 年會(huì)有很大的區(qū)別。

DeepTech:我注意到你今年的很多工作都在探討一個(gè)主題:模型思考和推理的效率。比如 Deep Confidence 通過(guò)自信度篩選提高推理效率,GSM-∞ 探索長(zhǎng)文本推理的復(fù)雜度,Grokking 揭示如何用更少的樣本實(shí)現(xiàn)泛化。這條主線最終想解決的問(wèn)題是什么?

田淵棟:最終目標(biāo)當(dāng)然是希望找到更好的算法來(lái)訓(xùn)練模型,或更好地優(yōu)化模型推理過(guò)程。我們希望達(dá)到人的那種能力:數(shù)據(jù)很少,但模型能力依然能變強(qiáng)。

但是我覺(jué)得從長(zhǎng)期上來(lái)說(shuō),這條路可能需要一個(gè)完全不一樣的算法。現(xiàn)在 Transformer 框架可能不是最終的解,我傾向于認(rèn)為必須出現(xiàn)一次完全不一樣的跳躍,從當(dāng)前的算法跳入到另一套完全不同的算法。

過(guò)去大家已經(jīng)在現(xiàn)有算法架構(gòu)上已經(jīng)做了非常多改進(jìn),但是如果你要再往下走得更深,有可能要對(duì)這個(gè)問(wèn)題的本質(zhì)進(jìn)行一個(gè)比較好的理解。像我這篇關(guān)于頓悟的文章,對(duì)“模型如何學(xué)到更好的表示”給出了一種比較新的想法,算是一個(gè)新的突破,后面應(yīng)該也會(huì)繼續(xù)深入。

DeepTech:我也覺(jué)得目前這些思路,包括 test-time scaling(推理時(shí)擴(kuò)展)之類的,似乎是有上限的。真正重要的就是像你在 grokking 所研究的,在訓(xùn)練過(guò)程中找到合適的內(nèi)部表示。

田淵棟:是的,我覺(jué)得 TTS 還是有上限的,最終還是要靠更好的表示來(lái)達(dá)到泛化目的。試想預(yù)訓(xùn)練的數(shù)據(jù)里面全是枚舉法,做 RL 使勁刷 token 能頓悟出數(shù)學(xué)歸納法嗎?我覺(jué)得以現(xiàn)在大模型的能力,這個(gè)不太可能。

這也解釋了為什么像伽羅華(群論的奠基人)這樣的人是天才,他能在幾乎沒(méi)有多少樣本的情況下發(fā)現(xiàn)新的抽象和思維方式。這種跨時(shí)代的“科學(xué)發(fā)現(xiàn)”,現(xiàn)在的大模型還是做不到的。以后如果有一個(gè)更好的方式學(xué)到這些表示,對(duì)后訓(xùn)練會(huì)有很大的幫助。

Scaling 還能繼續(xù),但解決不了學(xué)習(xí)效率

DeepTech:你在去年的年終總結(jié)中提到,等到 Scaling Law 到了極限,理解內(nèi)在機(jī)制才會(huì)變得關(guān)鍵。最近伊利亞(Ilya Sutskever)也在說(shuō)我們從 Scaling 時(shí)代到了研究時(shí)代。從你今年的研究來(lái)看,我們現(xiàn)在靠近 Scaling 的真正極限了嗎?什么信號(hào)才會(huì)告訴我們這條路到頭了?

田淵棟:我在兩月前的硅谷 101 訪談里面也提到了比較相似的觀點(diǎn),比如說(shuō)人腦的數(shù)據(jù)效率很高,模型泛化能力從哪里來(lái),研究品味(research taste)很重要等等。Scaling Laws 應(yīng)該說(shuō)現(xiàn)在還沒(méi)有完全到極限。因?yàn)檫€是有很多辦法可以提高效果,你看 Gemini 3 出來(lái)之后,還是有很多辦法可以讓模型變得比原來(lái)更強(qiáng)很多。

只是說(shuō)現(xiàn)在的問(wèn)題是,這個(gè) Scaling 最終能不能達(dá)到人這樣的效率,也就是人能在小樣本下迅速學(xué)會(huì)新東西的能力。

大廠當(dāng)然可以繼續(xù)堆樣本、堆訓(xùn)練,把模型越做越大。我聽(tīng)說(shuō) Gemini 3 模型就非常大。通過(guò)這種方式,總能不斷塞入更多知識(shí),讓模型越來(lái)越強(qiáng)。

但是另外一方面,我們也必須面對(duì)這個(gè)現(xiàn)實(shí):人的頭腦功耗非常低,吃的東西也是有上限的,但是人不管怎么樣,在某些方面還是要遠(yuǎn)遠(yuǎn)超過(guò) AI 現(xiàn)在的能力。所以作為科學(xué)家或者做基礎(chǔ)研究的人,你還是要去思考這種問(wèn)題:到底是為什么?也許存在一條隱藏的路線,可以讓現(xiàn)在的智能以一千倍的效率來(lái)達(dá)成。

如果我們?cè)倮^續(xù)卷這個(gè) Scaling,肯定是有效果的,只是說(shuō)對(duì)于像我這樣的人來(lái)說(shuō),可能會(huì)覺(jué)得這不是特別有趣,還是想要做些別的。所以就是總要有人去探索不一樣的路線,而不是所有人都扎堆在同一方向。畢竟智能的終級(jí)答案還沒(méi)有揭曉。

DeepTech:你在去年的年終總結(jié)里給 AGI(Artificial General Intelligence,通用人工智能)下的定義是看 AI 能否達(dá)到人類的學(xué)習(xí)效率,尤其是從小樣本中頓悟的能力。從你今年的研究來(lái)看,我們離這個(gè)定義的 AGI 是更近了,還是差距更清楚了?

田淵棟:應(yīng)該說(shuō)是更清楚看到差距了。更近應(yīng)該還談不上,因?yàn)楫吘鼓瞧?Grokking 的文章并沒(méi)有完全給出一個(gè)更好的算法,只是用來(lái)做分析。我們可以分析出來(lái)它內(nèi)部的學(xué)習(xí)過(guò)程是什么樣子,明白了為什么,之后才能想辦法做改進(jìn)。

這篇文章跟以前很多對(duì) Grokking 的分析文章相比,應(yīng)該說(shuō)是開(kāi)了一個(gè)新的思路,而且這個(gè)新思路現(xiàn)在看起來(lái)是越來(lái)越像是對(duì)的了。本來(lái)這篇文章是要假設(shè)訓(xùn)練中存在正則化才可能出現(xiàn)特征涌現(xiàn),這個(gè)和實(shí)驗(yàn)不太符合;但后來(lái)在評(píng)審的壓力下我又有了新的發(fā)現(xiàn),同樣的框架,可以證明沒(méi)正則化也會(huì)出現(xiàn)特征涌現(xiàn)。總體而言,我認(rèn)為這是一個(gè)較大的突破。

至少對(duì)于這個(gè)領(lǐng)域來(lái)說(shuō),有很多人在做 feature learning(特征學(xué)習(xí)),那么這些特征是通過(guò)什么過(guò)程學(xué)出來(lái)的?我們這篇文章可能會(huì)給大家?guī)?lái)一些有意思的、新的思路。

DeepTech:明年會(huì)繼續(xù)在這個(gè)研究的基礎(chǔ)上做進(jìn)一步探索嗎?

田淵棟:應(yīng)該會(huì)的,在最近的一次訪談中我談到過(guò)一些可能的思路:核心還是 feature learning,也就是如何超越線性化視角(例如 NTK),理解特征如何從數(shù)據(jù)中被抓取出來(lái)并進(jìn)入網(wǎng)絡(luò)權(quán)重。一旦 feature learning 這一層被解開(kāi),我們就有機(jī)會(huì)做 reverse engineering,更清楚地看見(jiàn)模型究竟如何學(xué)習(xí)、如何預(yù)測(cè)。

再往下一步,我認(rèn)為應(yīng)當(dāng)回到對(duì)稱性。群的本質(zhì)正是對(duì)稱性。數(shù)據(jù)構(gòu)成的流形應(yīng)當(dāng)存在某種全局結(jié)構(gòu),這才是泛化性的基礎(chǔ);如果輸入具有群結(jié)構(gòu),在其之上就會(huì)產(chǎn)生更緊致的表示,從而超越單純的記憶能力,獲得泛化的結(jié)果。

不過(guò)更具體的細(xì)節(jié)我暫不便展開(kāi),因?yàn)槲疫@邊接下來(lái)會(huì)有比較大的變化。

DeepTech:好的,期待你之后的研究成果。你之前提到目前的 AI 研究需要“從煉金術(shù)到化學(xué)的轉(zhuǎn)變”。你認(rèn)為這個(gè)轉(zhuǎn)變會(huì)是漸進(jìn)的,還是需要一個(gè)“頓悟”的時(shí)刻?需要基礎(chǔ)范式的改變嗎?

田淵棟:我覺(jué)得還是需要范式的改變??赡芪覀冏罱K的算法不是跟現(xiàn)在一樣的,肯定會(huì)出現(xiàn)完全不一樣的算法體系。

如果我們觀察人類大腦,會(huì)發(fā)現(xiàn)它是在一套極其嚴(yán)苛的硬件約束下,實(shí)現(xiàn)了一套極高效率的邏輯。

在生物學(xué)上存在各種各樣的約束,比如說(shuō)人是不能做梯度傳遞的,人神經(jīng)元之間的傳導(dǎo)速度非常慢,是毫秒級(jí)而不是納秒級(jí),而且人腦不可能以很高的帶寬把大量數(shù)據(jù)從一端傳到另一端,這些都是人腦的很大局限。

所以我們現(xiàn)在看到的 AI 系統(tǒng),是大量人類精心設(shè)計(jì)出來(lái)的體系,在某些能力上遠(yuǎn)超人腦本身。但是為什么人作為一個(gè)整體能夠做出很好的預(yù)測(cè),能夠有這樣的認(rèn)知能力?我覺(jué)得有可能是整個(gè)算法是不一樣的。

至于新算法的轉(zhuǎn)變是不是漸進(jìn)的,我覺(jué)得可以參考?xì)v史。一開(kāi)始有一些人在嘗試,后來(lái)發(fā)現(xiàn)有效果了,嘗試的人就越來(lái)越多,最終變成下一個(gè)時(shí)代的主流。

DeepTech:那除了學(xué)習(xí)人類本身的思考方式之外,會(huì)不會(huì)讓 AI 更強(qiáng)大的方法,反而可能與人腦思維模式完全不同?

田淵棟:這個(gè)是有可能的。但是我一直有一個(gè)信念:對(duì)于人也好,機(jī)器也好,或者其他生物也好,某種底層的數(shù)學(xué)原理都應(yīng)該是比較接近的。因?yàn)閿?shù)據(jù)在那兒,大家都看到一樣的數(shù)據(jù),通過(guò)某種比較有趣的數(shù)學(xué)變換,最終達(dá)到相似的表示,同時(shí)對(duì)問(wèn)題有相似的理解。

已經(jīng)有一些研究把人腦神經(jīng)元放電表示與大模型的表示進(jìn)行對(duì)比,發(fā)現(xiàn)兩者相關(guān)性較強(qiáng)。雖然算法不同,但表示可能相近。這也解釋了為什么今天的 AI 和人類還蠻相似的,比如都會(huì)舉一反三,都會(huì)有幻覺(jué),都會(huì)犯錯(cuò)誤,不像以前科幻小說(shuō)里描述的 AI 非常精確、沒(méi)有情感?,F(xiàn)在的 AI 更像是個(gè)“文科生”。

也許就是兩條不同的道路可能得到相似的內(nèi)部表示。但人腦得到這個(gè)表示的效率遠(yuǎn)遠(yuǎn)高于現(xiàn)在 AI 的效率,這是為什么 AI 現(xiàn)在還是需要很多很多樣本去把這個(gè)表示學(xué)出來(lái)。如果我們能夠找到更好的對(duì)于這個(gè)表示的學(xué)習(xí)過(guò)程,也許就能得到更高效的新算法。

DeepTech:今年你有沒(méi)有看到一些在新的方向上比較有意思的探索?

田淵棟:最近有一些,比如 sparse/linear attention(稀疏/線性注意力)怎么做,如何對(duì)自注意力機(jī)制做更多變體;還有進(jìn)一步加速推理的一些手段,我們也做了一些(例如 DeepConf 和 ThreadsWeaver)。

另一個(gè)方向是隱空間推理。現(xiàn)在已有很多人在探索這條路。我們?nèi)ツ昴甑子幸黄恼陆?Coconut(連續(xù)思維鏈),做完之后整個(gè)組被拉去做 Llama,沒(méi)有時(shí)間做后續(xù)。但明顯能看見(jiàn)整個(gè) community 都非常有熱情,大家想要在上面做各種各樣的工作,特別在后訓(xùn)練和強(qiáng)化學(xué)習(xí)上也有些比較有意思的結(jié)果。

我覺(jué)得以后推理過(guò)程本身可能真的是在連續(xù)隱空間中進(jìn)行的,連續(xù)的內(nèi)部表示其實(shí)很重要——思考未必用語(yǔ)言 token 表達(dá),有些思考并不以語(yǔ)言形式呈現(xiàn),而是通過(guò)某種抽象的高維向量來(lái)表示思考過(guò)程,這有時(shí)候會(huì)變得更有效率。

我們有一篇文章證明,隱空間推理的效率其實(shí)比顯式的 token 效率要高,并分析了兩者差異。隱空間推理的推理鏈長(zhǎng)度可以顯著短于顯式空間,可能呈平方關(guān)系。而且可以看出來(lái)為什么能做到這一點(diǎn),很多時(shí)候所謂思維鏈并不是推理的過(guò)程本身,往往是人類在得到了答案之后,再用答案反推出一個(gè)看起來(lái)合理的解釋。真正的推理可能是在這個(gè)思維鏈產(chǎn)生之前發(fā)生的。


圖丨相關(guān)論文(來(lái)源:arXiv)

在這篇文章中這一點(diǎn)被體現(xiàn)得很清楚:搜索時(shí)我可以保留所有可能的路徑,但當(dāng)某條路徑達(dá)到目的地后,才回過(guò)頭去找那條“應(yīng)該思考”的路徑。這比顯式把所有路徑都寫(xiě)出來(lái)更高效。所以如果繼續(xù)深挖,我相信會(huì)出現(xiàn)更高效的推理方式。

變革性答案會(huì)出現(xiàn)在哪里

DeepTech:那么,可能帶來(lái)變革性研究的突破會(huì)出現(xiàn)在哪里?最近 IBM 總裁克里希納說(shuō),現(xiàn)有研究路徑可能很難達(dá)到 AGI,而變革性答案可能來(lái)自學(xué)術(shù)界而非產(chǎn)業(yè)界,你怎么看?

田淵棟:這有可能,但學(xué)術(shù)界也有學(xué)術(shù)界的問(wèn)題。我傾向把答案看得更廣,它可能來(lái)自一些不被看好、或者不被看好卻堅(jiān)持下去的方向。這些方向可能來(lái)自學(xué)術(shù)界,也可能來(lái)自小公司或小實(shí)驗(yàn)室。

因?yàn)榇蟮膶?shí)驗(yàn)室有些時(shí)候研究方向太過(guò)于集中了,大家都在追趕。所有的時(shí)間和精力都花在怎么樣讓最終的數(shù)字從 5% 變成 10%,或者 10% 變成 20%。其實(shí)很難去想到一個(gè)全新的瘋狂想法。

長(zhǎng)期追趕,會(huì)使人更難提出全新的、甚至“瘋狂”的想法。相反,如果有時(shí)間去思考新路徑,這些地方可能產(chǎn)生新范式,而新范式也可能與 AGI 結(jié)合起來(lái)。

所以這個(gè)地方不一定是在學(xué)術(shù)界,可能在別的地方,完全看最聰明的頭腦和最前沿的資本怎么樣結(jié)合起來(lái)。

DeepTech:包括 Meta 最近的一系列變革,比如 FAIR 的一些基礎(chǔ)研究人員轉(zhuǎn)入新的超智能實(shí)驗(yàn)室,還有其他一些巨頭的變動(dòng)。這種變化是不是意味著大廠的實(shí)驗(yàn)室將來(lái)會(huì)更注重商業(yè)化方向,更基礎(chǔ)的理論性研究將來(lái)會(huì)是什么樣的存在?

田淵棟:應(yīng)該這樣說(shuō),每個(gè)巨頭現(xiàn)在都處于一個(gè)比較焦慮的狀態(tài)。因?yàn)榇蠹叶疾幌M谶@場(chǎng)比賽中落后,落后可能會(huì)意味著全面的落后。如果真的 AGI 來(lái)了,它可能在很快的時(shí)間內(nèi)學(xué)會(huì)所有的東西。第一個(gè)造出來(lái)的系統(tǒng)會(huì)越跑越快,就是所謂的 recursive self-improvement(遞歸自我改進(jìn)),不斷自我迭代,最終的模型變得非常強(qiáng),理想上超過(guò)人類的能力,達(dá)到所謂超人工智能(Superintelligence,或者簡(jiǎn)寫(xiě)為 ASI)。

如果大家知道模型能力在超過(guò)某個(gè)臨界點(diǎn)是指數(shù)增長(zhǎng)的話,那么一旦你的指數(shù)增長(zhǎng)比別人快一點(diǎn)點(diǎn),以后就會(huì)越來(lái)越快、越來(lái)越多,最終會(huì)把整個(gè)市場(chǎng)全部吃掉。這個(gè)是之前一個(gè)未來(lái)學(xué)家科茲威爾講的“嚇尿指數(shù)”(St-Your-Pants Index),也是大家的一個(gè)焦慮的點(diǎn)。

因?yàn)檫@種焦慮,巨頭很難投入大量時(shí)間做基礎(chǔ)研究:他們可能會(huì)覺(jué)得這就是我們現(xiàn)在的目的,如果不做這個(gè)我們就完蛋了,所以會(huì)花很多時(shí)間和精力去做這個(gè)。

當(dāng)然你可以說(shuō)這個(gè)事情不太可能發(fā)生,但一旦發(fā)生了,那就是 0 和 1 的區(qū)別,要不就登上 ASI 的快車,要不就成為無(wú)關(guān)人士。和將來(lái)的無(wú)窮大相比,現(xiàn)在手上的幾百億美金,其實(shí)和街邊的乞丐也沒(méi)什么區(qū)別了。大模型最近的飛速發(fā)展,也是會(huì)給人這樣的印象——之前的知識(shí)或者積累什么的,好像都沒(méi)什么用了。

這個(gè)可能是大家深層次的焦慮所在。應(yīng)該說(shuō)不僅 Meta,其他公司最近也頻繁有一些變化。大廠高管的職業(yè)穩(wěn)定性也不像以前那么穩(wěn)定。過(guò)去相對(duì)穩(wěn)定,很多事可以做很多年;現(xiàn)在如果做不出來(lái),就會(huì)發(fā)生進(jìn)一步調(diào)整。至少投資方或 CEO 會(huì)更緊張,于是出現(xiàn)這些變化。

那么基礎(chǔ)性、理論性的研究,要怎么做呢?大公司還有很多組,每個(gè)組都有自己的一些小生態(tài)。在那么大的一個(gè)生態(tài)位里面,總是存在一些角落是可以做一些基礎(chǔ)性研究的。

但是這些生態(tài)在時(shí)間空間上不夠連續(xù),可能這兩個(gè)月可以做,明年那兩個(gè)月就不行;今天這個(gè)組可以做,明天那個(gè)組就不行。因?yàn)樽儎?dòng)很大,就會(huì)出現(xiàn)這種問(wèn)題。如何解決,我們也沒(méi)有答案,因?yàn)檫@確實(shí)是很新的局面。

研究方式正在重寫(xiě)

DeepTech:關(guān)于 AI 輔助研究,這也是一個(gè)非常新的變化。AI 給你最大的價(jià)值是什么?有沒(méi)有被 AI 啟發(fā)過(guò)的時(shí)刻?

田淵棟:AI 現(xiàn)在其實(shí)更像一個(gè)博士生,或者說(shuō)是一個(gè)博聞強(qiáng)記、知道很多東西的人,但是很多時(shí)候它抓不住重點(diǎn),思路和想法都沒(méi)有那么銳利。

什么叫他的思維非常銳利?就是說(shuō)他能一針見(jiàn)血地發(fā)現(xiàn)問(wèn)題在哪里,話也不多。我們說(shuō)“He is very sharp”,或者有個(gè)形容詞是“人狠話不多”??戳艘幌轮?,“這句話不對(duì)”,或者“這地方有問(wèn)題,你快點(diǎn)把它解決”,沒(méi)有空話套話。這樣的能力,現(xiàn)在 AI 是沒(méi)有的?,F(xiàn)在 AI 是倒過(guò)來(lái)的,就是那種話特別多但是沒(méi)有一句話是重點(diǎn),這個(gè)時(shí)候會(huì)非常煩惱。

但即便如此,它仍然非常有價(jià)值。第一,它很博學(xué),能給出大量想法。大多數(shù)想法可能不對(duì),但偶爾會(huì)有一兩個(gè)讓人覺(jué)得“有點(diǎn)意思”,值得繼續(xù)深挖。這時(shí)人充當(dāng) verifier(驗(yàn)證者),或教練、法官,把有價(jià)值的部分抓出來(lái)并判斷方向,這一點(diǎn)非常重要。AI 提供候選想法,人負(fù)責(zé)篩選與判斷,最終找到好方向。

所以我也有很多時(shí)候是被 AI 啟發(fā)的,覺(jué)得某些角度很有意思,可能挖下去能體現(xiàn)出更好的東西,從而發(fā)現(xiàn)新方向。

另外當(dāng)然是 AI 可以幫你做很多臟活累活,有些代碼你不用寫(xiě)。如果你用過(guò) Claude Code 或者 Codex,你會(huì)發(fā)現(xiàn)現(xiàn)在編程的方式已經(jīng)完全不一樣了。

最早大模型出來(lái)之后,它輔助編程的方式是加速,變成 Copilot,我先寫(xiě)一段 comments,述接下來(lái)要做什么,再讓它生成代碼,這個(gè)還沒(méi)那么快,是第一代 AI 輔助編程。

第二代 AI 輔助編程變成了類似于 agent 這種類型,我告訴它怎么改文件,讓它自動(dòng)修改?,F(xiàn)在基本進(jìn)入第三代:給它一個(gè)很大的代碼庫(kù),甚至我也未必完全理解代碼庫(kù)細(xì)節(jié),只要提出需求,比如重構(gòu)、加功能、找 bug,它就能協(xié)助完成。

所以人慢慢從寫(xiě)代碼的人變成項(xiàng)目經(jīng)理,變成教授那樣的角色。通過(guò)這個(gè)方式,我就不要再參與具體執(zhí)行,可以把精力集中在這個(gè)問(wèn)題怎么樣去建模,怎么樣往正確的方向去走,以及做指導(dǎo)和判斷。很多臟活累活 AI 可以自己做了,這是最大的價(jià)值。人的洞察力越強(qiáng),AI 對(duì)人的幫助就越大。

綜合下來(lái),跟一年前的我相比,加上這個(gè) GPT-5 的話,我效率可能提高了四到五倍的樣子。而且還有很大空間,還有很多地方可以讓它繼續(xù)把事情做得更好。

DeepTech:現(xiàn)在 AI 就像一個(gè)非常勤懇的博士生,一天不知疲倦地干活,可以幫你發(fā)現(xiàn)一些以前人們可能發(fā)現(xiàn)過(guò)但沒(méi)有注意到的方向,然后給你提出來(lái)。你識(shí)別到了之后,又可以在這些方向上進(jìn)一步去挖掘。

田淵棟:對(duì),這是 AI 現(xiàn)在最大的助力。而且這個(gè)事情,如果一個(gè)人越聰明,或者說(shuō)越有見(jiàn)地,或者對(duì)這個(gè)業(yè)內(nèi)有經(jīng)驗(yàn)的話,他加 AI 的效率提升是高于一個(gè)新手加 AI 的提升。所以這其實(shí)是一個(gè)強(qiáng)者越強(qiáng)的模式,是一個(gè)很不一樣的趨勢(shì)。反過(guò)來(lái),新手加 AI 可能會(huì)把事情搞砸,因?yàn)橐恍┛赡艹鲥e(cuò)的代碼被不加甄別地放進(jìn)去了。

DeepTech:你認(rèn)為一個(gè)人加頂尖 AI 這種工作模式,未來(lái)有可能達(dá)到一個(gè)小型研究團(tuán)隊(duì)的產(chǎn)出效率嗎?

田淵棟:我覺(jué)得是有可能的,甚至還會(huì)超過(guò)。因?yàn)槿伺c人協(xié)作需要時(shí)間,比如周末晚上我不可能發(fā)消息要求你立刻做事,就算發(fā)了,你也未必馬上做,可能兩天后才完成。

但 AI 永遠(yuǎn)在線,你給它一個(gè) idea,它立刻開(kāi)始做。這個(gè)過(guò)程應(yīng)該說(shuō)是遠(yuǎn)遠(yuǎn)高于以前老師帶學(xué)生這樣的過(guò)程。只要老師清楚自己要做什么,這種效率往往高于傳統(tǒng)“老師帶學(xué)生”的方式。

DeepTech:如果這樣的話,會(huì)對(duì)未來(lái)做研究的組織形態(tài)意味著什么樣的影響?

田淵棟:其實(shí)現(xiàn)在已經(jīng)有發(fā)生變化了。今年我已經(jīng)知道不少學(xué)術(shù)界的老師已經(jīng)出走學(xué)術(shù)界,要么創(chuàng)業(yè),要么加入大廠的一些團(tuán)隊(duì),做一些 hands-on 的工作,參與大模型研發(fā)。這種從學(xué)術(shù)界到工業(yè)界的遷移非常突然,而且在加速。

之后會(huì)發(fā)生什么,沒(méi)人能確定。而且確實(shí)有不少博士生可能已經(jīng)提前畢業(yè)或者很早畢業(yè),比如以前博士需要五六年,但現(xiàn)在有時(shí)兩三年就畢業(yè),因?yàn)椴划厴I(yè)機(jī)會(huì)就會(huì)錯(cuò)過(guò)。為什么?因?yàn)閷?duì)他們來(lái)說(shuō),一個(gè)博士畢業(yè)的文憑和一個(gè)大廠的機(jī)會(huì)相比,權(quán)衡在變化:過(guò)去可能傾向先讀完再找工作,現(xiàn)在天平開(kāi)始傾斜。由此,很多老師未必能招到學(xué)生,也會(huì)帶來(lái)一系列連鎖變化。

DeepTech:在這種研究模式下,你認(rèn)為未來(lái)的研究者最需要的核心能力是什么?是想象力,執(zhí)行力,還是我們現(xiàn)在經(jīng)常提到的研究品味(research taste)?

田淵棟:我覺(jué)得 taste 是很重要的,因?yàn)?taste 本質(zhì)上來(lái)說(shuō)是一個(gè)指方向的能力,你認(rèn)為這個(gè)方向有道理,就會(huì)堅(jiān)持并往下走。用強(qiáng)化學(xué)習(xí)的角度來(lái)說(shuō),taste 就是那個(gè)在當(dāng)前路徑還不完整不清晰時(shí)的值函數(shù)(value function)。

值函數(shù)能告訴你在這個(gè)研究還沒(méi)有開(kāi)展之前,或者剛剛開(kāi)展的時(shí)候,哪條路不能走、哪條路可以走,這就是研究品味的關(guān)鍵作用。如果沒(méi)有 taste,那么能探索的方向太多,但很多方向到不了你想要的結(jié)果,會(huì)浪費(fèi)大量時(shí)間;有 taste,值函數(shù)就能引導(dǎo)你走向更可能正確的道路。

除此之外,執(zhí)行力與恒心也很重要?,F(xiàn)在大家都有大模型,但很多人只是嘗鮮,用一用覺(jué)得不錯(cuò),就放下了。真正能做成事的人,往往能夠長(zhǎng)期使用工具,在同一件事上持續(xù)深挖,把它做到足夠好。

以前的武俠小說(shuō),大家都在搶一本武功秘籍,或者大家去找阿拉丁神燈許愿望。但是現(xiàn)在是倒過(guò)來(lái)的邏輯:武功秘籍到處都有,人手一本,或者人手不止一本,很便宜就可以看到,賣家還天天愁你不用,每天使勁推銷。但很多人沒(méi)有時(shí)間和精力去學(xué);就算看了,也鉆不進(jìn)去,也就學(xué)不會(huì)。

在這種情況下,更重要的是專注與恒心:愿意長(zhǎng)期投入;同時(shí)具備行動(dòng)力,愿意去看、去做,而不是每天刷手機(jī)。再加上一點(diǎn)運(yùn)氣與探索,最終才能做出與他人不同的東西。

總之,想象力、研究品味、恒心與行動(dòng)力,這些能力都需要具備,才更可能成功。

DeepTech:你也會(huì)寫(xiě)小說(shuō),前段時(shí)間剛看了你的小說(shuō)《幽夜星火》。這個(gè)小說(shuō)是有用 AI 在輔助創(chuàng)作嗎?

田淵棟:這個(gè)沒(méi)有,這是之前寫(xiě)的?!队囊剐腔稹肥恰镀茣灾姟返暮罄m(xù),還沒(méi)寫(xiě)完,我現(xiàn)在不是很滿意,之后可能會(huì)做較大修改,修改后再出版會(huì)更好。當(dāng)然,當(dāng)時(shí)的寫(xiě)作方式和現(xiàn)在也不一樣了?,F(xiàn)在有很多 AI 工具可用,可以建立工作流,提高寫(xiě)小說(shuō)的效率,這也是現(xiàn)在在做的事情。

DeepTech:你在《破曉之鐘》的序言里寫(xiě)了一句話:小說(shuō)和做研究都是去找出一條新的路徑來(lái)。反過(guò)來(lái)看,小說(shuō)創(chuàng)作對(duì)于你做 AI 研究有什么反哺嗎?

田淵棟:我覺(jué)得目前看起來(lái)還是更像是一個(gè)思維的放松,跟做研究本身不一樣的一個(gè)思維方式,能去探索一些不一樣的東西,去想、去思考,這個(gè)會(huì)很有趣。對(duì)換腦筋、同時(shí)保證思維的活躍性挺有幫助的。有些時(shí)候會(huì)想到一些奇怪的事情,這些事情不是特別清楚,但是如果換換腦子再回來(lái)會(huì)有很多想法。

DeepTech:明年小說(shuō)創(chuàng)作上會(huì)有什么計(jì)劃嗎?

田淵棟:看時(shí)間吧,我可能還是會(huì)比較忙。但應(yīng)該會(huì)找一些時(shí)間寫(xiě)一寫(xiě),因?yàn)檫@也是一種放松與調(diào)劑。希望把第二部寫(xiě)完,給大家一些有意思的內(nèi)容。其實(shí)第二部很多高潮橋段早就想好了,只是需要在新的環(huán)境里把它們真正寫(xiě)出來(lái)。

DeepTech:你前面提到的一句話我覺(jué)得非常有感觸。就是 AI 行業(yè)變化非???,模型的迭代、公司的戰(zhàn)略調(diào)整之類的。作為剛剛經(jīng)歷過(guò)這種調(diào)整或動(dòng)蕩的研究者,你覺(jué)得在這種不確定的環(huán)境當(dāng)中如何保持自己的方向感或者掌控感?

田淵棟:首先是要有自己的信念,就是 research belief,這個(gè)很重要。更具體說(shuō),就是 taste?,F(xiàn)在每天有無(wú)數(shù)文章發(fā)布,隨便刷 arXiv 都是新論文。如果一直追趕,就會(huì)產(chǎn)生強(qiáng)烈不確定感,仿佛今天不看完就會(huì)落后于時(shí)代。

這不是一個(gè)正確的思維方式。因?yàn)槿绻@么做,那會(huì)非常累,而且也永遠(yuǎn)處于追趕地位。更好的辦法是我有一個(gè)想法,我一定要把它做出來(lái),或者相信這個(gè)想法很重要,認(rèn)為它能通向正確的路徑。有這樣一個(gè)信念之后,再去找相應(yīng)的文章。這樣一方面有更多時(shí)間思考,另一方面也更容易做出與別人不同的東西。

DeepTech:我看你之前的訪談下面有評(píng)論說(shuō)“優(yōu)秀的人是先有世界觀,然后才有方法論”,這和你剛才說(shuō)的很契合。

田淵棟:對(duì),是這樣子。世界觀是一個(gè)提綱挈領(lǐng)的關(guān)系,這個(gè)提綱告訴我這個(gè)人我要做什么,然后再去尋找方法。因?yàn)槿绻獙W(xué)會(huì)所有東西再去做,那是不可能的,永遠(yuǎn)學(xué)不完。有提綱之后再去搜索的話,效率永遠(yuǎn)高于你把所有的知識(shí)都學(xué)完的,因?yàn)槟銜?huì)知道什么細(xì)節(jié)是關(guān)鍵的,什么則無(wú)關(guān)緊要。

DeepTech:你個(gè)人是怎么判斷什么研究或者什么方向值得長(zhǎng)期投入的呢?

田淵棟:這有三樣不同的東西。首先是你內(nèi)心喜歡什么,這是內(nèi)在的動(dòng)力。比如說(shuō)你做這件事情很開(kāi)心,也不必先考慮它對(duì)這個(gè)世界有什么價(jià)值,這是一個(gè)很重要的要求。

其次是你的能力能做到什么程度,有些人能力強(qiáng),隨隨便便就把一件別人覺(jué)得困難的研究問(wèn)題解決了,自己也不會(huì)覺(jué)得特別辛苦。第三是看對(duì)外的經(jīng)濟(jì)和社會(huì)價(jià)值,做出來(lái)的東西是不是為大眾所稱道。

這三樣?xùn)|西必須得占一樣,然后才能保證這個(gè)事情能往前推進(jìn)。只是不同的人權(quán)重不一樣——有些人說(shuō)我特別想要外界對(duì)我的承認(rèn),或者工資很高,這個(gè)也是可以的,那他就會(huì)做那些待遇很豐厚的工作。還有一些人說(shuō)我并不指望外面給我很多工資,但是我做這件事情讓我覺(jué)得很開(kāi)心,也一樣成立。最終還是要看每個(gè)人在這幾根軸上的權(quán)重有多少,用它來(lái)去衡量自己想做什么工作。

我當(dāng)然會(huì)建議所有人在這三根線上都試一試,看哪些工作是你最喜歡、最有內(nèi)心滿足感但是不賺錢的,哪些工作是你能賺到更多錢但是內(nèi)心不滿足的,還有什么工作是你能力很強(qiáng)但是你不愿意做的。這些東西都可以組合,最終你發(fā)現(xiàn)有一些交集,有一些東西既能讓你賺到足夠的錢,又能夠讓你有內(nèi)心滿足感,那么這些方向可能是你將來(lái)的職業(yè)。

DeepTech:這也可能是一個(gè)比較理想的狀態(tài)。

田淵棟:是,但是要不停地去嘗試。最怕的是不嘗試,天天抱怨不喜歡現(xiàn)在的工作,卻不去試別的可能性,也不去尋找真正讓自己開(kāi)心的方向。長(zhǎng)期陷在抱怨里,對(duì)個(gè)人并不好。

DeepTech:是的,也許可以先賺夠錢再去嘗試更喜歡的方向;或者先做滿足的事,再努力賺錢。

田淵棟:對(duì),都是有可能的。而且不同階段的權(quán)衡不一樣。剛畢業(yè)時(shí)更需要經(jīng)濟(jì)基礎(chǔ),那當(dāng)然可以先去賺錢;如果經(jīng)濟(jì)壓力不大,時(shí)間就會(huì)變得更重要。人的一生時(shí)間有限,用這段時(shí)間做出最有意思的東西很重要。不同階段心態(tài)不同,最終判斷也會(huì)不同。

DeepTech:那如果你現(xiàn)在可以完全自由地選擇一個(gè)研究方向,不受任何資源或者發(fā)表壓力的話,你最想攻克的問(wèn)題是什么?

田淵棟:自然而然就是我之前做的那些,關(guān)于神經(jīng)網(wǎng)絡(luò)如何有好的表示,如何進(jìn)行頓悟,怎么樣能夠獲得泛化能力,怎么樣讓它變得更強(qiáng),怎么樣讓它變得有跟人一樣的效率,這些都是我想要做的問(wèn)題。應(yīng)該說(shuō)我的研究方向一直以來(lái)都比較特立獨(dú)行,當(dāng)然與此同時(shí)也注重與整個(gè)人工智能大方向的結(jié)合,這樣至少還能跟上,而不是被時(shí)代淘汰。

2026 我們可以期待什么

DeepTech:最后做一個(gè)總結(jié)和展望。2025 年對(duì)你來(lái)說(shuō)也是一個(gè)比較重要的節(jié)點(diǎn),如果給今年做一個(gè)小結(jié),你最大的收獲是什么?

田淵棟:收獲還是不小的。一個(gè)是參與了 Llama 項(xiàng)目,會(huì)有很多經(jīng)驗(yàn),對(duì)大模型的研發(fā)和具體問(wèn)題有更深的理解。至少對(duì)于我們來(lái)說(shuō)有這樣 hands-on 的 experience,雖然只有幾個(gè)月,但改變了我對(duì)于很多問(wèn)題的一些想法和思路,這是很重要的。而且對(duì)我的人生也會(huì)帶來(lái)很大的改變。在離職之后,基本上我所有時(shí)間都在自己動(dòng)手,應(yīng)該說(shuō)也有更多 hands-on 的經(jīng)驗(yàn)了。

另外就是怎么樣用 AI 和人的相互交互,如何讓 AI 幫助研究變得更快、更高效,并幫助我們找到更好的方向。今年我找到了更有效的方法,讓 AI 更好、更快地提高研究速度與效率。

在這種變化下,我們的研究方式會(huì)和過(guò)去非常不同。我們正處于一個(gè)特殊的節(jié)點(diǎn)上,繼續(xù)往后走,世界,至少學(xué)術(shù)世界,可能會(huì)與過(guò)去完全不同。這是很大的變化。當(dāng)然,研究本身也有不少進(jìn)展,比如隱空間推理被更多人使用;對(duì)頓悟的理解更深入;對(duì)強(qiáng)化學(xué)習(xí)、對(duì) fine-tuning 的理解也更深入一些。

當(dāng)然之后我的年終總結(jié)會(huì)講得更詳細(xì)一點(diǎn)。

DeepTech:在你看來(lái),明年 AI 領(lǐng)域最值得期待的進(jìn)展會(huì)是什么?

田淵棟:我同意最近大家的一些新看法。因?yàn)橹辽僭趦扇昵?,AI 仍偏實(shí)驗(yàn)室階段,這兩年大家更多在“刷榜”,推理模型很強(qiáng),很多問(wèn)題被解決,包括 IMO(國(guó)際數(shù)學(xué)奧林匹克)、ICPC(國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽)這類數(shù)學(xué)與編程競(jìng)賽也能解決。

2026 年的話,我覺(jué)得可能大家不再滿足于刷榜了,因?yàn)榇蠹叶紩?huì)刷。之前也有看到一條有意思的推特說(shuō)“只要是有榜就能上去”。這句話雖然說(shuō)是夸張的,但我覺(jué)得它是對(duì)的。只要有榜,總有辦法可以刷上去,我也從各種途徑知道各種刷榜的技巧。但是問(wèn)題就在于:第一,沒(méi)有榜你怎么刷?第二,AI 能否落地,能否給大家?guī)?lái)實(shí)際結(jié)果?

大家花了那么多錢,多少個(gè) billion 的錢去做 AI,AI 確實(shí)給大家提供很多幫助。但經(jīng)濟(jì)上這些投入能得到多少回報(bào),會(huì)影響整個(gè)投資環(huán)境與投資人心態(tài)。所謂回報(bào),核心就是:能不能通過(guò) AI 得到真實(shí)的 business value(商業(yè)價(jià)值),這會(huì)成為下一階段更主流的方向。

比如 OpenAI 發(fā)布 GPT-5.2 時(shí),你看 Sam Altman 會(huì)強(qiáng)調(diào)“能帶來(lái)什么價(jià)值”,而不再?gòu)?qiáng)調(diào)刷榜到什么程度,因?yàn)榇蠹叶贾滥芩⑸先ィP(guān)鍵是能否產(chǎn)生實(shí)際價(jià)值。

再比如說(shuō) AI 幫你做 PPT,最近 Nano Banana 非?;?,為什么?是因?yàn)樗芸斓貛湍阕?PPT。這個(gè)完全改變了辦公室的流程。類似地,能否用 AI 做 Excel 表格、做各種報(bào)表文檔,這些都會(huì)成為重點(diǎn)。


(來(lái)源:田淵棟)

所以 2026 年有很多的變化可能會(huì)跟我們?nèi)粘I钕⑾⑾嚓P(guān)。包括學(xué)術(shù),AI 參與學(xué)術(shù)工作后,它能否比以前做得更好?如果我們通過(guò) AI 能夠極大地提高 scientific discovery(科學(xué)發(fā)現(xiàn))的速度,那它就非常有價(jià)值。應(yīng)該說(shuō)明年或后年,可能是 AI 如何證明自己價(jià)值的關(guān)鍵階段。

DeepTech:非常期待明年能看到一些突破的進(jìn)展。很多人甚至說(shuō) 26 年、27 年是 AGI 的元年,我覺(jué)得這個(gè)可能還是稍微有點(diǎn)遠(yuǎn),但一些大的突破應(yīng)該還是可以看到的。

田淵棟:我覺(jué)得是這樣子的。這個(gè)是比較有趣的一個(gè)狀態(tài),我們既作為研究員,又作為一個(gè)觀察者,看能否見(jiàn)證一些有意思的事情。AGI 可能還需要一點(diǎn)時(shí)間,還需要一些突破,我覺(jué)得按照現(xiàn)在的方案堆數(shù)據(jù)還是不行的。

另外再?gòu)膶?xiě)小說(shuō)這件事來(lái)說(shuō),AI 寫(xiě)小說(shuō)的風(fēng)格跟以前也是完全不一樣的。以前可能容易寫(xiě)出一些無(wú)聊套路,比如“最終王子公主幸福地生活在一起了”,沒(méi)什么意思。

但是現(xiàn)在 AI 已經(jīng)學(xué)到更多有意思的套路,或者有意思的思路,能夠讓小說(shuō)本身變得非常有趣。未來(lái)也許會(huì)出現(xiàn) AI 在創(chuàng)作與文學(xué)上的突破,關(guān)鍵看大家怎么用,但我認(rèn)為應(yīng)該會(huì)發(fā)生。

DeepTech:我前段時(shí)間用 Gemini 3 和 Claude 4.5,我覺(jué)得它們的文筆已經(jīng)非常出色了。

田淵棟:對(duì),大概是這樣子。這是一個(gè)非常大的變化,而且很多時(shí)候看文筆已經(jīng)出色了,文筆不再是壁壘。那么有壁壘的地方就是你的創(chuàng)意和你的思路,你的想法到底是什么。

我現(xiàn)在的感受是:AI 在寫(xiě)局部段落時(shí)已經(jīng)非常好,但對(duì)整個(gè)故事走向或結(jié)局的把控還是差一點(diǎn)。比如像 Gemini3 能寫(xiě)出那么多有意思的小點(diǎn)子,然后發(fā)現(xiàn)最后的結(jié)局居然比較平凡沒(méi)有張力,就會(huì)失望。相比之下,頂級(jí)的小說(shuō)家在這方面其實(shí)還是比較厲害的,所以應(yīng)該說(shuō)人在這方面還有不少優(yōu)勢(shì)的。

DeepTech:未來(lái)可能我們更多要扮演的角色更像是一個(gè) CEO,去把控底下的各種 AI 做事的方向。

田淵棟:是,以后一定會(huì)出現(xiàn)一人 CEO 的情況。就是我自己是公司的 CEO,然后我下面有一堆 AI 幫我把事情干了。

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國(guó)家終于出手了!不僅是李梓萌被牽連,就連全紅嬋張文宏也沒(méi)逃過(guò)

國(guó)家終于出手了!不僅是李梓萌被牽連,就連全紅嬋張文宏也沒(méi)逃過(guò)

巧手曉廚娘
2025-12-26 21:34:40
又是高價(jià)預(yù)制菜?被曝湯底澆頭均是袋裝!事發(fā)知名連鎖店,上海門店最多

又是高價(jià)預(yù)制菜?被曝湯底澆頭均是袋裝!事發(fā)知名連鎖店,上海門店最多

新民晚報(bào)
2026-01-07 20:34:36
腦梗的源頭被查出,肥肉沒(méi)上榜,第1名很多人可能每天都在吃!

腦梗的源頭被查出,肥肉沒(méi)上榜,第1名很多人可能每天都在吃!

全球軍事記
2025-11-29 13:46:37
太囂張了!歐拉弄穿蘇提達(dá)專用服裝高調(diào)秀年度照,到底是誰(shuí)給她的底氣

太囂張了!歐拉弄穿蘇提達(dá)專用服裝高調(diào)秀年度照,到底是誰(shuí)給她的底氣

小魚(yú)愛(ài)魚(yú)樂(lè)
2026-01-08 08:32:32
一瓶肉寶王扯出驚天劇本!探店博主刪視頻跑路,16歲燒雞少年涼了

一瓶肉寶王扯出驚天劇本!探店博主刪視頻跑路,16歲燒雞少年涼了

一盅情懷
2025-12-27 17:59:26
她身為黃埔軍校的?;ǎc葉帥離異后獨(dú)自教子,建國(guó)后出任副主席,其子亦被授予少將軍銜

她身為黃埔軍校的校花,與葉帥離異后獨(dú)自教子,建國(guó)后出任副主席,其子亦被授予少將軍銜

史海孤雁
2026-01-02 17:46:14
保時(shí)捷卡宴跑網(wǎng)約車,幾塊錢的單也接!已經(jīng)接了1798單!

保時(shí)捷卡宴跑網(wǎng)約車,幾塊錢的單也接!已經(jīng)接了1798單!

網(wǎng)約車焦點(diǎn)
2026-01-06 11:55:46
李詠遺孀哈文現(xiàn)狀:定居美國(guó)富人區(qū),7年了沒(méi)再婚,女婿條件不錯(cuò)

李詠遺孀哈文現(xiàn)狀:定居美國(guó)富人區(qū),7年了沒(méi)再婚,女婿條件不錯(cuò)

削桐作琴
2026-01-03 14:25:54
攝影還是監(jiān)控?小米17 Ultra的2億像素鏡頭或引發(fā)訴訟潮

攝影還是監(jiān)控?小米17 Ultra的2億像素鏡頭或引發(fā)訴訟潮

手機(jī)中國(guó)
2026-01-07 07:58:08
記者:英冠布萊克本流浪者隊(duì)28歲中鋒蓋伊將加盟上海申花

記者:英冠布萊克本流浪者隊(duì)28歲中鋒蓋伊將加盟上海申花

懂球帝
2026-01-08 18:58:39
朱芳雨上訴成功!籃協(xié)官宣認(rèn)錯(cuò),漏判山西兩違體,迪亞洛逃過(guò)一劫

朱芳雨上訴成功!籃協(xié)官宣認(rèn)錯(cuò),漏判山西兩違體,迪亞洛逃過(guò)一劫

多特體育說(shuō)
2026-01-08 21:17:30
美硬扣俄油輪后,不到24小時(shí),特朗普迎來(lái)噩耗,這一次沒(méi)人能幫他

美硬扣俄油輪后,不到24小時(shí),特朗普迎來(lái)噩耗,這一次沒(méi)人能幫他

尋途
2026-01-08 20:39:40
向太爆料方媛三胎為郭富城生兒子,打破四大天王女兒魔咒

向太爆料方媛三胎為郭富城生兒子,打破四大天王女兒魔咒

胖子的勇氣
2026-01-06 19:47:36
胰腺癌去世的人越來(lái)越多!專家:牢記飯后4不做,飯前3不吃

胰腺癌去世的人越來(lái)越多!專家:牢記飯后4不做,飯前3不吃

岐黃傳人孫大夫
2025-12-20 11:45:03
公示!北京985大學(xué)生,擬轉(zhuǎn)入地方高校

公示!北京985大學(xué)生,擬轉(zhuǎn)入地方高校

麥可思研究
2026-01-06 14:03:01
阿根廷球迷沮喪!?梅西向美媒發(fā)表"引人注目的言論",并談及未來(lái)

阿根廷球迷沮喪!?梅西向美媒發(fā)表"引人注目的言論",并談及未來(lái)

峰云峰雨
2026-01-08 12:21:06
國(guó)產(chǎn)香煙加了助燃劑?測(cè)試發(fā)現(xiàn)只能燒4分鐘,而日本煙能燒7分鐘

國(guó)產(chǎn)香煙加了助燃劑?測(cè)試發(fā)現(xiàn)只能燒4分鐘,而日本煙能燒7分鐘

回旋鏢
2026-01-01 21:00:24
驚艷!全紅嬋 “換頭式” 長(zhǎng)大,長(zhǎng)發(fā)披肩秒變甜妹

驚艷!全紅嬋 “換頭式” 長(zhǎng)大,長(zhǎng)發(fā)披肩秒變甜妹

帶你逛體壇
2025-12-31 08:03:04
家有哪3生肖,1月9號(hào)起財(cái)運(yùn)如潮涌,貴人不斷,富貴穩(wěn)穩(wěn)來(lái)

家有哪3生肖,1月9號(hào)起財(cái)運(yùn)如潮涌,貴人不斷,富貴穩(wěn)穩(wěn)來(lái)

毅談生肖
2026-01-08 11:36:47
解放前的成都原來(lái)還有這么雄偉壯觀的城墻,那時(shí)候通惠門還在!

解放前的成都原來(lái)還有這么雄偉壯觀的城墻,那時(shí)候通惠門還在!

史之銘
2026-01-08 07:47:12
2026-01-09 01:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16097文章數(shù) 514462關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

體育要聞

世乒賽銀牌得主,說(shuō)自己夢(mèng)里都是孫穎莎

娛樂(lè)要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評(píng)

財(cái)經(jīng)要聞

微軟CTO韋青:未來(lái)人類會(huì)花錢"戒手機(jī)"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
房產(chǎn)
數(shù)碼
軍事航空

藝術(shù)要聞

震撼!阿森西奧的人體繪畫(huà)揭示情感的深淵!

珍珠專場(chǎng)|| 無(wú)論18歲還是80歲,總是會(huì)為它再一次心動(dòng)

房產(chǎn)要聞

豪宅搶瘋、剛需撿漏……2025年,一張房票改寫(xiě)了廣州市場(chǎng)格局

數(shù)碼要聞

CES 2026 | TCL實(shí)業(yè)攜全球首創(chuàng)SQD-Mini LED顯示技術(shù)亮相

軍事要聞

特朗普提出將美國(guó)軍費(fèi)提升至1.5萬(wàn)億美元

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版