国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

拒絕OpenAI的謝賽寧:語言是AI的“鴉片” LLM走偏了

0
分享至


謝賽寧,90后華人科學(xué)家,剛剛和圖靈獎(jiǎng)得主楊立昆一起創(chuàng)立了AMI Labs,拿到了10.3億美元的種子輪融資。他接受了《商業(yè)訪談錄》張小珺的訪談,全長(zhǎng)7個(gè)多小時(shí)。

為什么要逃離硅谷?

這個(gè)問題的答案,藏在一個(gè)更大的分歧里——到底什么才是真正的智能?

現(xiàn)在的硅谷,所有人都在卷LLM。卷參數(shù)量,卷token數(shù),卷benchmark排名。這場(chǎng)軍備競(jìng)賽里,研究者失去了定義問題的能力。你不再問"什么是對(duì)的",只能問"怎么在榜單上拿第一"。

謝賽寧覺得這條路走偏了。「硅谷已經(jīng)被LLM催眠了,完全被它催眠了。」

他打了個(gè)比方:語言模型是預(yù)測(cè)下一個(gè)字符,世界模型是預(yù)測(cè)下一個(gè)狀態(tài)。聽起來只是換了個(gè)詞?不是的。這是兩種完全不同的智能觀。

AMI Labs從第一天起,就在全球設(shè)了四個(gè)辦公室:巴黎、紐約、蒙特利爾、新加坡。唯獨(dú)沒有硅谷。

謝賽寧說:「被催眠的人總有醒來的一刻。那時(shí)候我們完全不排除去硅谷設(shè)立公司?!沟F(xiàn)在,他們要做的是「反向的OpenAI」。

什么是「反向的OpenAI」?

「正向的OpenAI」很簡(jiǎn)單:從互聯(lián)網(wǎng)下載數(shù)據(jù),訓(xùn)練GPT模型,推向市場(chǎng)。

「反向的OpenAI」要難得多:數(shù)據(jù)沒辦法直接從互聯(lián)網(wǎng)下載,沒有捷徑可走。

謝賽寧說了一個(gè)很有意思的故事。1958年,美國(guó)銀行(BOA)推出了Visa信用卡,賺得盆滿缽滿。它還藏著掖著,別人問就說是賠錢生意。直到財(cái)務(wù)上藏不住了,其他銀行才發(fā)現(xiàn)被主導(dǎo)了市場(chǎng)。

怎么辦?他們把所有地方銀行組織起來,變成一個(gè)聯(lián)盟,一起推出了萬事達(dá)卡(Mastercard)。這就是為什么萬事達(dá)卡能跟Visa分庭抗禮。

AMI Labs也想做類似的事。他們要打造的是一個(gè)「草根聯(lián)盟」,讓那些有真實(shí)世界數(shù)據(jù)、有具體問題要解決的公司,一起共建世界模型。

「世界需要世界模型,世界模型需要世界?!?/p>

硅谷的氧氣被抽走了

為什么要?jiǎng)?chuàng)業(yè)?謝賽寧說,在學(xué)校里有很大的困境。缺算力是一方面。但更重要的是,他覺得自己可能會(huì)陷入「中等paper陷阱」,有點(diǎn)像「中等收入陷阱」。你會(huì)發(fā)一些不錯(cuò)的論文,但由于資源限制,沒辦法真的把idea變成新的突破。

那為什么不加入現(xiàn)有的大廠或?qū)嶒?yàn)室?「這件事就會(huì)壓榨你的research的空間,會(huì)抽走這個(gè)環(huán)境給你充分自由去做研究的氧氣?!?/p>

他在Google DeepMind時(shí),整個(gè)GenAI部門只有他一個(gè)人腳踩兩只船,在公司兼職,還在學(xué)校做研究。大家對(duì)學(xué)術(shù)界、對(duì)純粹探索性的研究是有點(diǎn)抵觸的。

核心模型訓(xùn)練的部門,必須在高度競(jìng)爭(zhēng)的賽道上卷到最前面。這是他們唯一的目標(biāo)。這是一場(chǎng)「軍備競(jìng)賽」。在這樣的有限游戲下,在這樣強(qiáng)競(jìng)爭(zhēng)的環(huán)境下,每個(gè)公司都似乎失去了定義問題的能力。

謝賽寧的選擇是:逃出來。「我們來一起創(chuàng)造一個(gè)更好的、更對(duì)研究員友好的組織?!?/p>

在LLM之外,有一個(gè)隱形的世界

2025年秋天,謝賽寧的一個(gè)導(dǎo)師問他:你去問問Yann LeCun,他好像最近在Meta待得不是很順心。

謝賽寧的第一直覺是:這怎么可能?Yann至少在那個(gè)時(shí)候,他還是一個(gè)AI教父,也是一個(gè)純粹的研究者,怎么可能拉他一起創(chuàng)業(yè)呢?

結(jié)果,對(duì)話之后的第二周周一,謝賽寧跟Yann剛好有一個(gè)一對(duì)一會(huì)議。還沒等他說什么,Yann就說:「賽寧,你先不要告訴別人,但我已經(jīng)決定了。我現(xiàn)在想要做的事情,我覺得應(yīng)該在外面做,我想要去創(chuàng)業(yè)開一個(gè)公司?!?/p>

謝賽寧問他,你想做什么事情,背后的商業(yè)模式是什么?發(fā)現(xiàn):哇,這跟我想象的事情完全一致啊。

「在我們想做的這件事兒上,在現(xiàn)在世界上任何一個(gè)國(guó)家的公司,都做不了。包括在灣區(qū)也做不了?!?/p>

Yann跟他說的核心意思是:世界模型是真實(shí)世界需要的智能。

在硅谷之外,在LLM敘事之外,有一個(gè)隱形的世界。這個(gè)世界里有很多人,大家想要解決這個(gè)物理世界里的很多問題。他們可能是一個(gè)農(nóng)場(chǎng),可能是一家醫(yī)院,但他們拿著LLM不能直接解決這些問題。

LLM能解決一部分問題,但有很多涉及真實(shí)世界的物理理解的問題,LLM是解決不了的。大家都很焦慮,害怕AI的浪潮要來了,我是不是連上牌桌的機(jī)會(huì)都沒有?

「這一部分隱形的世界,在硅谷的敘事邏輯下不可見,但是是一個(gè)很大的市場(chǎng)。」

語言是「鴉片」

謝賽寧有個(gè)很尖銳的觀點(diǎn):語言是「毒藥」,或者說是一劑「鴉片」。

語言怎么就成毒藥了?我們不都是靠語言思考的嗎?

他的邏輯是這樣的:語言是人類幾千年文明演化的產(chǎn)物,是高度壓縮的抽象知識(shí)結(jié)構(gòu)。當(dāng)你用語言描述世界時(shí),你已經(jīng)做了大量的簡(jiǎn)化和取舍。

比如「杯子掉在地上碎了」。這句話里,你只在乎結(jié)果和狀態(tài),不在乎它怎么碎的、背后的物理定律、每一幀的運(yùn)動(dòng)軌跡。

「語言是交流工具,不是思考工具,更不是決策工具。」

所以LLM雖然能寫代碼、拿奧賽金牌,但它缺少對(duì)物理世界的理解。它不知道為什么蘋果會(huì)掉下來,不知道機(jī)器人轉(zhuǎn)身時(shí)可能會(huì)撞到人。這些看似簡(jiǎn)單的常識(shí),恰恰是LLM最大的盲區(qū)。

Kimi創(chuàng)始人楊植麟曾說,他不希望訓(xùn)出一個(gè)「傻的多模態(tài)」,希望訓(xùn)出一個(gè)「聰明的多模態(tài)」。謝賽寧的回應(yīng)很直接:「如果不加入視覺,你一定會(huì)很傻?!?/p>

「我非常擔(dān)心語言對(duì)于視覺的污染。這種污染已經(jīng)在發(fā)生了?!?/p>

楊立昆的說法是,現(xiàn)在大家只是拄著「語言模型」這根拐杖走路。你能走,但跑不起來,也沒法參加奧運(yùn)會(huì),因?yàn)槟恪敢曈X表征」這條腿還不夠好。

謝賽寧說:「語言其實(shí)是一個(gè)毒藥,或者說是一劑鴉片,你加多了語言總是會(huì)覺得更幸福的,它有用,但它是一個(gè)捷徑。」「如果你一直吸鴉片就廢了;如果你一直拄著拐杖,你就沒辦法訓(xùn)練大腿的肌肉。」

世界模型要做什么?

謝賽寧想做的,是一個(gè)能理解物理世界的「大腦」。這個(gè)大腦不需要記住維基百科所有條目,不需要解薛定諤方程。它需要的是通過理解能力去過濾和組織信息。就像人一樣。

人的感官輸入帶寬可能達(dá)到10億bits/秒,但說話、做事的帶寬只有10到100bits/秒。大腦把高帶寬信息轉(zhuǎn)化成低帶寬的行為模式,這就是世界模型本身。

世界模型(World Model)的定義其實(shí)很簡(jiǎn)單:你現(xiàn)在有一個(gè)系統(tǒng)或者一個(gè)環(huán)境,你有一個(gè)狀態(tài)。你有一個(gè)干預(yù)或動(dòng)作,在當(dāng)前時(shí)刻你對(duì)這個(gè)系統(tǒng)施加一個(gè)動(dòng)作。你現(xiàn)在希望能夠?qū)W到一個(gè)預(yù)測(cè)函數(shù),使得它能夠基于你的動(dòng)作和當(dāng)前的狀態(tài),去預(yù)測(cè)下一個(gè)時(shí)刻的狀態(tài)。

這是最基礎(chǔ)的通用世界模型的定義。這個(gè)定義本身無比直接,甚至有點(diǎn)平庸,因?yàn)樗皇且粋€(gè)新概念。其實(shí)1943年,有一個(gè)心理學(xué)家Kenneth Craik,他第一次提出了這個(gè)概念。他說人在腦子里有這樣一個(gè)世界模型,這個(gè)世界模型能夠告訴我們,當(dāng)我們?nèi)プ瞿骋粋€(gè)動(dòng)作的時(shí)候,接下來會(huì)發(fā)生什么樣的后果。

AMI Labs的技術(shù)路線也很清晰:第一步,從互聯(lián)網(wǎng)視頻數(shù)據(jù)開始訓(xùn)練;第二步,走進(jìn)真實(shí)世界「淘金」,獲取那些YouTube上不會(huì)有的數(shù)據(jù);第三步,通過全球合作伙伴,形成數(shù)據(jù)閉環(huán)。

兩次拒絕Ilya

2018年,謝賽寧面試過OpenAI。在小黑屋里關(guān)了五六個(gè)小時(shí)做題,拿到了offer,但他拒絕了。

Ilya Sutskever給他打電話,非常生氣:「你為什么不討論一下就把offer拒了?是我們給的錢不夠嗎?」謝賽寧什么都沒說,就是不去。

因?yàn)楹螑鹈?、Ross Girshick在Meta的FAIR,那里才是計(jì)算機(jī)視覺的圣地。他們不是那種很資深的大學(xué)教授,而是最頂尖的中青年研究員。他們?cè)谀抢铮龅木褪亲铐敿獾腃V(計(jì)算機(jī)視覺)研究,對(duì)謝賽寧來說沒什么好選的。

2024年7月,Ilya的SSI剛成立,又給他發(fā)郵件。這次謝賽寧問了一個(gè)問題:「你對(duì)多模態(tài)怎么看?」Ilya說,這件事已經(jīng)解決得很不錯(cuò)了。所以謝賽寧又拒絕了。

「因?yàn)樗麄冊(cè)诘讓泳陀蟹制纭降资且訪LM還是視覺為主要路線?!?/p>

LLM是反Bitter Lesson的

在AI圈,有個(gè)著名的理念叫「Bitter Lesson」(苦澀的教訓(xùn)),是強(qiáng)化學(xué)習(xí)之父Richard Sutton提出的。核心意思是:人類自以為聰明的領(lǐng)域知識(shí),經(jīng)常被「更簡(jiǎn)單、更通用、依賴大規(guī)模計(jì)算的算法」超越。

但謝賽寧有個(gè)觀點(diǎn):LLM完全不夠Bitter Lesson,某種程度上,LLM是反Bitter Lesson的。

為什么?因?yàn)锽itter Lesson說的是,你應(yīng)該盡可能減少人類知識(shí),把人類的傲慢、「聰明才智」以及這些精巧的結(jié)構(gòu)盡可能減少,盡可能多用搜索和學(xué)習(xí)的方式去找尋答案。而語言就是這樣一種人類極其聰明的產(chǎn)物,它有精巧的設(shè)計(jì)。

「語言模型其實(shí)不是一個(gè)自監(jiān)督學(xué)習(xí)過程,它是一個(gè)強(qiáng)監(jiān)督學(xué)習(xí)的過程?!怪x賽寧解釋說。

「語言太特例了,它是人類幾千年文明演化、處理了世界一切后,以標(biāo)記化方式存儲(chǔ)下來的知識(shí)。這些知識(shí)的上傳本身就是一個(gè)監(jiān)督信號(hào)構(gòu)建的過程。」

所以,語言模型始終停留在Y空間(監(jiān)督信息空間)。所有的機(jī)器學(xué)習(xí)都是X到Y(jié)的映射,Y通常是監(jiān)督信息。語言模型其實(shí)只在刻畫Y空間,這不足以代表世界全部,很多東西無法通過語言刻畫。

謝賽寧還有一個(gè)觀點(diǎn):語言模型的Scaling Law里面是有「水分」的。因?yàn)樗⒉恍枰嬲ㄟ^理解世界的方式去回答問題。

世界模型會(huì)有非常不一樣的Scaling Law。它的模型不需要記住世界里的所有細(xì)微細(xì)節(jié),它不需要通過解薛定諤方程的方式去判斷蘋果是不是落下來,它不需要人類最高級(jí)的智商。它需要通過理解能力去過濾和組織信息。

這跟人越來越像。

視覺vs語言:誰在污染誰?

ChatGPT誕生之前,CV(計(jì)算機(jī)視覺)在AI中占據(jù)很核心的位置。

但這幾年LLM興起,CV似乎退到一個(gè)邊緣位置。

這個(gè)過程中,以謝賽寧為代表的CV背景的研究者,會(huì)感到沮喪嗎?

"我完全不沮喪。我要感謝LLM。沒有LLM,Vision也沒辦法拓展到現(xiàn)在這種真正的多模態(tài)智能的大的范疇。"

視覺的發(fā)展史可以畫兩根軸:

在最早期階段,CV要處理的是最單一、具體、簡(jiǎn)單的任務(wù)。

比如MNIST的數(shù)字識(shí)別,到后面像CIFAR這種32×32像素上的十分類問題。

再到后面ImageNet出現(xiàn),變成了224×224的分類問題。

再往后有了目標(biāo)檢測(cè)和圖像分割這種更結(jié)構(gòu)化的認(rèn)知過程。

這根軸繼續(xù)往前推演,就到了多模態(tài)學(xué)習(xí)模型的興起。

因?yàn)槎嗄B(tài)的介入,我們可以很容易放棄固化的任務(wù)設(shè)計(jì),語言作為一個(gè)很好的界面,可以幫你解決很多問題。

這里面有兩個(gè)問題:

第一,語言介入帶給我們巨大好處,讓我們可以自由定義問題并得到答案。

第二,風(fēng)險(xiǎn)在于,對(duì)語言的依賴變多了,導(dǎo)致很多多模態(tài)任務(wù)其實(shí)跟視覺沒關(guān)系,純粹是語言問題。

從這個(gè)角度看,Vision好像變得邊緣化。

但謝賽寧覺得這是巨大機(jī)會(huì)。

雖然現(xiàn)在通過語言的統(tǒng)計(jì)信息能完成一些決策,但等到真的有一天,我們需要去處理真實(shí)世界里的真實(shí)任務(wù)去構(gòu)建某種真實(shí)的智能,現(xiàn)在這種不夠完美的視覺表征就會(huì)是重大的缺陷。

謝賽寧定義的"真實(shí)"是說要跟真實(shí)的世界發(fā)生交互。

LLM解決的問題大部分在數(shù)字空間發(fā)生。

LLM當(dāng)然是革命性的,但這跟從視覺視角出發(fā)要解決的問題完全不在同一個(gè)市場(chǎng)。

我們要處理的是連續(xù)空間、高維度、帶噪聲的領(lǐng)域。

這些信號(hào)很難被標(biāo)記化,它們脫離了虛擬空間。

這涉及到什么樣的任務(wù)呢?

比如工業(yè)過程控制,涉及到所有的傳感器建模信號(hào)。

你有很多傳感器感知世界,需要統(tǒng)一的算法去建模這個(gè)環(huán)境。

使得你在執(zhí)行動(dòng)作或者干預(yù)時(shí),能預(yù)測(cè)系統(tǒng)接下來的變化。

這是LLM很難做到的。

謝賽寧說:"我最想做到的事情是通過'不做機(jī)器人'的方式去解決機(jī)器人問題。"

機(jī)器人進(jìn)展太快了,春晚上的宇樹機(jī)器人,令人瞠目結(jié)舌。

但另一方面,還是要有人專注在預(yù)訓(xùn)練的部分,即所謂的"機(jī)器人大腦"到底是什么?

這個(gè)大腦包含了視覺系統(tǒng)。

在控制和硬件部分,大家可以各自努力。

真機(jī)驗(yàn)證和迭代作為評(píng)估方式自然很重要,但謝賽寧不需要過早介入硬件,軟件層面和大腦構(gòu)建上有根本性的研究問題沒有解決。

下載人類的時(shí)代

那么,這樣的世界模型怎么做訓(xùn)練?

大語言模型能夠訓(xùn)練是因?yàn)椋A康幕ヂ?lián)網(wǎng)文本就在那里,這是人類文明的現(xiàn)成數(shù)據(jù)。

世界模型的訓(xùn)練,從哪里下手?

謝賽寧說:"這是一個(gè)最大的賭注—— 以前是下載互聯(lián)網(wǎng)的時(shí)代,現(xiàn)在是下載人類的時(shí)代。 "

"我們要把人類下載下來。"

一個(gè)4歲小孩看過的視頻,量級(jí)比所有訓(xùn)練語言大模型的token還要大。

視頻是全村的希望。

世界模型的出口很多,短期內(nèi)有兩個(gè)。

一個(gè)是AI眼鏡。

一個(gè)真的個(gè)人智能助理需要一個(gè)世界模型。

它得是一個(gè)永遠(yuǎn)在線的設(shè)備。

就像現(xiàn)在Whoop、Oura類似的可穿戴設(shè)備一樣,一直在監(jiān)控你的體征。

它會(huì)進(jìn)行一個(gè)智能決策告訴你是不是壓力過大。

其實(shí)這些設(shè)備還蠻世界模型的,雖然目前它們獲取的信息太少,只有我們的心率、血氧等。

如果眼鏡能always on(一直開著),看到我們所能看到的一切,它能指導(dǎo)運(yùn)動(dòng)員的動(dòng)作,或者給養(yǎng)老院的老人提供智能健康建議,這是現(xiàn)有基于LLM的多模態(tài)做不到的。

另一個(gè)出口當(dāng)然是機(jī)器人。

機(jī)器人面臨的問題是本質(zhì)上還是"大腦"不夠。

機(jī)器人是一個(gè)很好的下游應(yīng)用,任何上游的演進(jìn)它都能從中受益。

比如LLM出來了就有VLA(視覺-語言-動(dòng)作模型)。

視頻生成模型出來了就有了所謂的WAM(世界-動(dòng)作模型),但已有的預(yù)訓(xùn)練范式,都沒辦法真正解決問題。

謝賽寧說:"我不是很喜歡世界模型這個(gè)詞。聽起來有點(diǎn)Hype(炒作)。"

"但我還蠻同意一位教授說的:他喜歡World Model是因?yàn)?,它告訴大家我做的是world(世界)模型,而不是word(單詞)模型。"

世界模型是所有人會(huì)抵達(dá)的終點(diǎn)。

自大的人類

訪談中,謝賽寧提到了一個(gè)觀點(diǎn):AGI是個(gè)偽命題。

這也是他很認(rèn)同楊立昆的一個(gè)觀點(diǎn)。

楊立昆之前跟DeepMind創(chuàng)始人Demis有過一個(gè)辯論,討論到底什么是通用智能,到底存不存在這件事。

楊立昆的邏輯很數(shù)學(xué):

人有200萬根視覺神經(jīng)纖維,可以用來建模函數(shù)。

雖然理論上所有可能的視覺函數(shù)是2^2^200這么大,但人能夠真正去處理、能夠看到的東西趨近于零。

我們受到意識(shí)和神經(jīng)帶寬的限制,看不到世界上發(fā)生的一切。

所以人的智能是一個(gè)非常特定化的智能,人只能認(rèn)知到自己能看到的東西。

謝賽寧推薦了一本書:《我們足以聰明到知道動(dòng)物有多聰明嗎?》

"我覺得我們應(yīng)該放棄人類的自大,"他說,"智能演進(jìn)是一個(gè)連續(xù)的過程,人不是獨(dú)一無二的。"

人會(huì)使用工具,動(dòng)物也會(huì)。

甚至我們引以為傲的自我意識(shí),比如鏡子實(shí)驗(yàn),很多動(dòng)物也能意識(shí)到鏡子里的是自己。

還有更加聰明的動(dòng)物,比如黑猩猩,德瓦爾寫過一本書叫《黑猩猩的政治》,講四只黑猩猩如何進(jìn)行權(quán)力博弈,很像《紙牌屋》,有拉幫結(jié)伙、有權(quán)謀上位。

這些動(dòng)物也有心智理論,它們有自己的世界模型。

比如一個(gè)實(shí)驗(yàn):

實(shí)驗(yàn)人員當(dāng)著黑猩猩的面在兩個(gè)盒子里分別放了香蕉和蘋果,扣上盒子。

把黑猩猩拉出去很長(zhǎng)時(shí)間再帶回來,如果它看到實(shí)驗(yàn)人員正在吃香蕉,它會(huì)徑直去打開裝蘋果的盒子,理都不理原先裝有香蕉的盒子。

這說明它有某種心智推理能力。

雖然語言是人類獨(dú)一無二的,但不代表其他動(dòng)物不會(huì)交流。

鯨魚也有自己的語言。

"打造出一只松鼠的智能,才是真正難的問題," 謝賽寧引用Richard Sutton的話說。

"一旦你能讓它在真實(shí)世界活下去,有自己的目標(biāo)、有內(nèi)在獎(jiǎng)勵(lì)、知道饑餓、有情感和社群活動(dòng),那么寫代碼、上月球這些事都是再容易不過的。"

如果拋下人類的自大,打造松鼠的智能其實(shí)是一個(gè)更難的問題。

在談?wù)揂GI或超人工智能之前,能不能先有一個(gè)足夠可靠、足夠通用的機(jī)器人?

一個(gè)12歲的孩子能承擔(dān)幾乎所有家務(wù),但現(xiàn)在沒有任何機(jī)器人能做到。

這件事需要"預(yù)訓(xùn)練的下半場(chǎng)"。(?? quote 姚順雨的下半場(chǎng)說法)

現(xiàn)在的機(jī)器人創(chuàng)業(yè)公司沒有精力做"大腦"的預(yù)訓(xùn)練,他們資源都投入到了硬件的規(guī)模定律上。

即買更多機(jī)器人、去部署它們,產(chǎn)生具體的商業(yè)價(jià)值。

我們是"草根聯(lián)盟"

張小珺提到,有個(gè)中國(guó)投資人曾經(jīng)說過:所有"含著金湯匙"出身的創(chuàng)業(yè)都沒有成功的,幾乎沒有。

但謝賽寧不覺得他們含著"金湯匙"。

"Yann不是草根,但他現(xiàn)在在整個(gè)AI的行業(yè),包括在投資人面前,很多時(shí)候是一半支持、一半反對(duì)的。"

"他不是眾星捧月的那種英雄。"

"他是一個(gè)堅(jiān)守自己、在永遠(yuǎn)嘗試做下一件事情,但這件事情還沒有完全做成的這么一個(gè)人。"

"我覺得這導(dǎo)致我們不是含著'金湯匙'。我們是一個(gè)不被看好者。我們其實(shí)是在某種行業(yè)的壓迫下生存的這樣一個(gè)公司。"

雖然融資有10.3億美元,但比起LLM現(xiàn)在撬動(dòng)的資源來看,差太遠(yuǎn)了。

"我非常享受這種不被看好者的身份,尤其作為一個(gè)創(chuàng)業(yè)者,"謝賽寧說。

很多投資人的反饋是:在硅谷里面大部分人不相信他們,在世界其他地方大部分人相信他們。

"但沒關(guān)系,你們可以不相信我們,那我們就走著瞧。這條路我現(xiàn)在已經(jīng)all-in了,你跟不跟?"

關(guān)于世界模型,其實(shí)現(xiàn)在的定義沒有收斂。

謝賽寧定義的世界模型和李飛飛團(tuán)隊(duì)(World Labs)定義的世界模型,差異是什么?

謝賽寧說,現(xiàn)在世界模型不好定義,是因?yàn)樗皇且粋€(gè)技術(shù)路線,它是一個(gè)目的。

不管你在做LLM還是視頻擴(kuò)散模型,所有人都在通往世界模型的道路上。

在他們看來大家并沒有直接競(jìng)爭(zhēng)關(guān)系。

對(duì)于視頻擴(kuò)散模型的公司,像Sora、字節(jié)的模型、Genie、Runway、Luma,他們這些生成派更聚焦在構(gòu)建一個(gè)世界模型的模擬器上,所謂的World Simulator。

他們的目標(biāo)是渲染出足夠好看的視頻,追求生成的一致性。

李飛飛老師那邊在World Labs里,更在意強(qiáng)3D的表征,是"空間的代碼",是交流、協(xié)作和創(chuàng)造的界面。

通過一個(gè)非常具象化的、顯式的3D的形式,這樣才能夠在空間里面去掌握空間智能,并且保證100%不會(huì)出錯(cuò)。

AMI Labs想要做的事情更像是,要去打造這樣一個(gè)預(yù)測(cè)大腦,核心還是怎么樣去提升智能本身。

命運(yùn)的答案是42

訪談接近尾聲時(shí),張小珺問了一個(gè)問題:"此時(shí)此刻,你感覺命運(yùn)正在把你往哪推?"

謝賽寧想了想:"命運(yùn)在推我嗎?好像也沒有。好像沒有被命運(yùn)推著走的感覺。只是在下一次需要做選擇的時(shí)候,希望上天保佑吧。"

"這個(gè)世界是一個(gè)巨大的世界模型嗎?"

"這個(gè)世界當(dāng)然是一個(gè)巨大世界模型。"

"那我們能預(yù)測(cè)命運(yùn)嗎?"

"我覺得不能。"

"為什么?"

"因?yàn)槲覀冑Y源不夠。你需要用地球這么大的一個(gè)計(jì)算機(jī),或者說你要有整個(gè)宇宙作為你的計(jì)算機(jī),才能告訴你一個(gè)關(guān)于生命、關(guān)于宇宙、關(guān)于任何事情的答案。"

"這個(gè)答案最后可能是42。"

一個(gè)"普通人"

張小珺發(fā)現(xiàn)謝賽寧很喜歡說一句話:"You are not the chosen one, you are just the normal one."(你不是被選中的人,你只是個(gè)普通人)

這句話來自他支持了二十多年的球隊(duì)——利物浦。

他最喜歡的教練Jürgen Klopp,曾經(jīng)這樣回應(yīng)穆里尼奧的"I am the special one(我是那個(gè)特別的人)":

"I'm not the special one, I'm the normal one."(我不是那個(gè)特別的人,我是那個(gè)普通的人。)

謝賽寧很喜歡這種態(tài)度。

克洛普本人非常朋克,很有搖滾氣質(zhì)。

但他經(jīng)常說,自己在團(tuán)隊(duì)里的定位更像是一塊電池——通過熱情和能量,給其他人發(fā)電。

"我也很希望自己能成為這樣的人。不管是在學(xué)校,還是在創(chuàng)業(yè)公司里,我都希望自己能夠成為團(tuán)隊(duì)里的那塊電池。"

"Yann就是這樣一個(gè)巨大的電池。他也深深地感召了我。"

"但我也希望,能夠通過我自己,把這份電力繼續(xù)傳遞下去。"

張小珺問:"你最近一次感到沮喪是為什么?"

"我天天都感到沮喪。這個(gè)已經(jīng)變成一個(gè)常態(tài)了。"

"這也是研究者的宿命——大家底色都挺悲涼的。"

研究的求索過程,本身就是在一個(gè)暗無天日的地方摸索。

當(dāng)你看不見光亮的時(shí)候,你總是會(huì)感到迷茫和沮喪。

大家真正感到快樂的時(shí)候,無非就是你真的把東西做出來的時(shí)候。

但這一部分時(shí)光其實(shí)非常短暫,可能只有5%或10%。

何愷明好像也說過類似的話。

長(zhǎng)此以往,大家的心理狀態(tài)挺堪憂。

不過現(xiàn)在這個(gè)時(shí)代,和原來不太一樣了。

現(xiàn)在會(huì)有更多討論。

這也是這一波AI帶來的一個(gè)好處:至少大家不覺得自己是在一個(gè)幽閉的空間里獨(dú)自探索。

Yann本身就很樂觀,非常非常樂觀。

可能因?yàn)樗?jīng)歷過悲涼,然后成功了吧。

他經(jīng)歷過AI的寒冬,然后最后可以告訴所有人:他是對(duì)的,你們是錯(cuò)的。

Yann經(jīng)常說:這件事情跟過去深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)發(fā)生的事情一模一樣。

總有一小群人,能夠清晰地看見這個(gè)世界發(fā)展的脈絡(luò),看見科技的進(jìn)程。

但他們只是一小撮人,大部分人其實(shí)是看不見的。

因?yàn)榇蟛糠秩硕荚诿χ銎渌氖虑椤?/p>

比如在深度學(xué)習(xí)之前,很多人可能就是在做傳統(tǒng)機(jī)器學(xué)習(xí)。

現(xiàn)在也一樣。

Yann有足夠的信心。

他會(huì)覺得:我能看到的事情是重要的事情,我能看到的路線是一條清晰的路線。

在這件事上,謝賽寧還蠻相信他的。

65歲的青春期少年

在很多人眼中,楊立昆都是一名斗士。

在謝賽寧眼中的楊立昆是一個(gè)怎樣的人?

"他真的是一個(gè)'斜杠青年',或者挺文藝的一個(gè)人。按一個(gè)朋友的說法,Yann是一個(gè)16歲青春期一直延續(xù)到65歲的這樣一個(gè)人。"

他經(jīng)常就很驕傲地跟大家說他有四大愛好:

第一個(gè)愛好是造模型飛機(jī)。

第二個(gè)愛好是拍天文攝影。

第三個(gè)興趣是搞電子樂和爵士樂。他的網(wǎng)頁(yè)是寶藏,他會(huì)講說在紐約有哪些Jazz Club比較好。

他還有一個(gè)愛好是帆船。

"我們要做世界模型,我希望大船的舵手是一個(gè)有格局、熱愛生活的人。"

謝賽寧講了一個(gè)小故事。

他們3月有另外一篇論文叫《Solaris》。

這是一個(gè)科幻小說,后來被塔可夫斯基改編成一個(gè)電影。

他們之所以取這個(gè)名字,是因?yàn)樵谧鲆粋€(gè)多角色視覺生成的模型。

電影講的事情是說,有一片海洋可以讀取人的潛意識(shí)里的記憶,最后把一些東西具象化生成出來。

有一天跟Yann說,我們這個(gè)論文叫這個(gè)名字怎么樣?謝賽寧想看他知不知道這個(gè)電影。

Yann說:"你知道這是一個(gè)電影的名字嗎?"

謝賽寧說:"對(duì),我就是因?yàn)檫@個(gè)取得名字。"

Yann問:"你看的是哪一部?是1972年的一部,還是2002年的一部?是塔可夫斯基拍的還是索德伯格拍的?"

謝賽寧說:"OK,我覺得我不光研究上服你,在電影上好像你也比我懂得多。"

"這對(duì)我個(gè)人來說蠻重要的一種人格魅力的體現(xiàn)。"

從Yann第一次告訴他要?jiǎng)?chuàng)業(yè),謝賽寧糾結(jié)了多久?

"我沒有糾結(jié)很久,Yann說話有點(diǎn)像施法,像哈利波特一樣給你施一些咒語——他說完一些話,你就不會(huì)想其他的了。"

真實(shí)的生活

張小珺問:在過去一兩年,你對(duì)生活在的這個(gè)真實(shí)世界的模型有哪些新的思考?

"我覺得,這件事情一定要超出研究的局限。一定要熱愛生活,到真實(shí)的生活里面去,要了解到這個(gè)真實(shí)世界發(fā)生的事情。不要在一個(gè)大的泡沫里面過完自己的一生。"

"我會(huì)很擔(dān)心在現(xiàn)在這個(gè)時(shí)代,大家的思維方式或者關(guān)注的東西,可能會(huì)有某種同質(zhì)化。但總之,如果一個(gè)東西已經(jīng)變成一個(gè)巨大的共識(shí),這件事情總會(huì)有更大的泡沫破滅的風(fēng)險(xiǎn)。"

"但我說的泡沫可能也不是經(jīng)濟(jì)上的泡沫,更像是在一個(gè)封閉的環(huán)境里,大家的這種——回音壁。"

謝賽寧其實(shí)也不是想吐槽灣區(qū)。

灣區(qū)挺好的。

他現(xiàn)在在紐約,非常懷念灣區(qū)的生活,總想回去,尤其在冬天下雪之后。

但是他覺得紐約很不一樣。

他每天上班,首先不用開車了,已經(jīng)從一個(gè)鎧甲脫離出來,進(jìn)入到真實(shí)的生活,開始步行。

從家到學(xué)校辦公室,有一個(gè)公園叫華盛頓廣場(chǎng)公園,里面形形色色的人都有:

有彈鋼琴的藝人,有跳舞的,有推著嬰兒車的媽媽們,有下象棋的老大爺,有坐在臺(tái)階上什么也不做發(fā)呆的年輕人,也有拿著電腦學(xué)習(xí)的NYU的學(xué)生。

每天最解壓的時(shí)光,就是這大概五到十分鐘的路程。

"我發(fā)現(xiàn)這個(gè)世界比我們想象的要大得多。"

他說,"不是所有人都關(guān)心什么叫AI。他們有自己的生活。"

這個(gè)世界很大。

但另一方面,也許AI在未來某一天會(huì)影響到他們的生活。

人生之書

張小珺問,每一位嘉賓都會(huì)給觀眾推薦一本"人生之書",希望它真的影響過你,改變過你。你的會(huì)是什么?

謝賽寧推薦兩本書。

一本書叫《哥德爾,埃舍爾和巴赫一集異璧之大成》

里面講了很多關(guān)于哲學(xué)、數(shù)理邏輯,還有這三個(gè)人——哥德爾、巴赫、艾舍爾。

一個(gè)數(shù)理學(xué)家、一個(gè)作曲家、一個(gè)畫家,他們之間到底有哪些哲學(xué)的共同點(diǎn)?

"我們本科的時(shí)候,是老師推薦,大家組團(tuán)學(xué)習(xí)。當(dāng)初大家看不懂,但是到后面,越來越覺得這件事有點(diǎn)道理。"

還有一本書,也是本科看的,叫《禪與摩托車維修藝術(shù)》。

這本書是一個(gè)內(nèi)心求索的過程。

"有些書、電影會(huì)把你裝滿,有些書、電影會(huì)把你掏空。我看完這本書的感覺是,它有點(diǎn)把我掏空。讓我感覺到了一些,這個(gè)世界到底什么重要?什么不重要?"

張小珺問:"對(duì)于你來說,什么重要?什么不重要?"

"人與人之間真誠(chéng)的交流是重要的,也許其他都不重要。"

"但在某一個(gè)時(shí)間點(diǎn)上,你要問我這個(gè)問題,我會(huì)說創(chuàng)業(yè)很重要,我會(huì)說研究很重要。但歸根結(jié)底,我還是相信人與人之間的交流,這件事很重要。"

張小珺說:"聽起來研究是你交流的一種媒介。"

"對(duì),我覺得是。而且研究本身也是一個(gè)更深的連接。"

這在他們?nèi)谫Y過程中還幫到了他們。

有一個(gè)投資人很愿意投他們,他的原因是,他認(rèn)識(shí)一個(gè)很強(qiáng)的創(chuàng)業(yè)者,也是一個(gè)研究員。

他說:"你們一定要投賽寧,我們不管以什么樣的方式都要幫到他。"

但謝賽寧跟這個(gè)人只在開會(huì)時(shí)見過一次,他是Stable Diffusion主要作者之一,創(chuàng)立了黑森林實(shí)驗(yàn)室。

這種信任關(guān)系是建立在學(xué)術(shù)工作之上。

這種信任關(guān)系甚至有時(shí)候會(huì)遠(yuǎn)超真正的私人關(guān)系。

大家通過一篇作品了解你,這件事情會(huì)傳承下去,甚至可以走得很遠(yuǎn)。

這個(gè)世界很大。

而AMI Labs要做的,是讓AI真正理解這個(gè)世界。

不是通過語言的抽象,而是通過物理世界的真實(shí)。

這條路會(huì)很難走。

但至少,他們選擇了自己相信的方向。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個(gè)明星也出了口惡氣

央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個(gè)明星也出了口惡氣

丁丁鯉史紀(jì)
2026-03-25 18:03:42
突發(fā) 廣州白云 番禺多家法務(wù)公司 法律咨詢公司被一鍋端,上百人被抓

突發(fā) 廣州白云 番禺多家法務(wù)公司 法律咨詢公司被一鍋端,上百人被抓

石辰搞笑日常
2026-03-26 17:28:25
張雪峰:如果你不好好學(xué)習(xí),一旦掉入社會(huì)底層,和一群沒有素質(zhì)的人混在一起.....

張雪峰:如果你不好好學(xué)習(xí),一旦掉入社會(huì)底層,和一群沒有素質(zhì)的人混在一起.....

山東教育
2026-01-27 11:38:18
周杰倫的INS被網(wǎng)友沖爆,新歌MV里手表調(diào)到“83”,疑用舊戀情炒作賣新唱片

周杰倫的INS被網(wǎng)友沖爆,新歌MV里手表調(diào)到“83”,疑用舊戀情炒作賣新唱片

回旋鏢
2026-03-25 20:38:44
50℃高溫鎖住國(guó)運(yùn)!電不夠水沒有,印度的未來,徹底沒希望了?

50℃高溫鎖住國(guó)運(yùn)!電不夠水沒有,印度的未來,徹底沒希望了?

Hi科普啦
2026-03-25 14:57:31
獨(dú)家:某運(yùn)營(yíng)商2025年?duì)I收幾乎0增長(zhǎng)! 好日子快到頭了! 其實(shí)三大運(yùn)營(yíng)商日子都那樣!

獨(dú)家:某運(yùn)營(yíng)商2025年?duì)I收幾乎0增長(zhǎng)! 好日子快到頭了! 其實(shí)三大運(yùn)營(yíng)商日子都那樣!

新浪財(cái)經(jīng)
2026-03-24 22:43:29
中央5臺(tái)直播乒乓球時(shí)間表:3月26日CCTV5+節(jié)目單!附國(guó)乒最新消息

中央5臺(tái)直播乒乓球時(shí)間表:3月26日CCTV5+節(jié)目單!附國(guó)乒最新消息

皮皮觀天下
2026-03-26 15:12:40
寫小說判十年,把生殖器放女孩嘴巴里判兩年九個(gè)月

寫小說判十年,把生殖器放女孩嘴巴里判兩年九個(gè)月

昊軒看世界
2026-03-24 19:56:42
《浪姐2026》陣容惹爭(zhēng)議,32位姐姐一半不認(rèn)識(shí),范瑋琪被抵制

《浪姐2026》陣容惹爭(zhēng)議,32位姐姐一半不認(rèn)識(shí),范瑋琪被抵制

啊呆吃瓜
2026-03-26 19:35:03
事情鬧大了,日本內(nèi)閣連發(fā)公告,中國(guó)的態(tài)度,告訴了世界一個(gè)事實(shí)

事情鬧大了,日本內(nèi)閣連發(fā)公告,中國(guó)的態(tài)度,告訴了世界一個(gè)事實(shí)

夢(mèng)史
2026-03-26 19:42:17
張雪峰離世1天后,才發(fā)現(xiàn)女兒名字取得暗藏深意,字字都有來頭

張雪峰離世1天后,才發(fā)現(xiàn)女兒名字取得暗藏深意,字字都有來頭

阿纂看事
2026-03-25 16:29:49
初代丑男何潤(rùn)東的突然爆火,狠狠抽了內(nèi)娛一巴掌

初代丑男何潤(rùn)東的突然爆火,狠狠抽了內(nèi)娛一巴掌

娛樂圈筆娛君
2026-03-24 16:08:36
晚間公告|3月26日這些公告有看頭

晚間公告|3月26日這些公告有看頭

第一財(cái)經(jīng)資訊
2026-03-26 18:29:17
別再說微胖的女生穿緊身牛仔褲顯胖了!這身材誰看了不迷糊

別再說微胖的女生穿緊身牛仔褲顯胖了!這身材誰看了不迷糊

牛彈琴123456
2026-03-22 13:59:13
國(guó)足VS庫(kù)拉索:留洋小將坐鎮(zhèn)中場(chǎng),韋世豪王鈺棟領(lǐng)銜,張玉寧沖鋒

國(guó)足VS庫(kù)拉索:留洋小將坐鎮(zhèn)中場(chǎng),韋世豪王鈺棟領(lǐng)銜,張玉寧沖鋒

零度眼看球
2026-03-26 07:23:48
國(guó)家規(guī)定可以配槍的十大執(zhí)法部門

國(guó)家規(guī)定可以配槍的十大執(zhí)法部門

微法官
2026-03-26 08:04:55
“我用房子貸的款卻進(jìn)了他們口袋”,佛山一男子稱遭遇套路貸;警方立案?jìng)刹椋?人被批捕后取保候?qū)?>
    </a>
        <h3>
      <a href=大風(fēng)新聞
2026-03-26 16:56:40
人情薄如紙!丈夫住院100天沒人探望,出院當(dāng)天大伯突然打來電話

人情薄如紙!丈夫住院100天沒人探望,出院當(dāng)天大伯突然打來電話

水泥土的搞笑
2026-03-26 17:37:27
一文算清長(zhǎng)護(hù)險(xiǎn)“費(fèi)率制”:月入5000交多少?財(cái)政如何補(bǔ)?

一文算清長(zhǎng)護(hù)險(xiǎn)“費(fèi)率制”:月入5000交多少?財(cái)政如何補(bǔ)?

第一財(cái)經(jīng)資訊
2026-03-26 15:40:07
出差遭上司猥褻后被調(diào)崗降薪,女子起訴獲賠,公司管理失職被判擔(dān)責(zé)

出差遭上司猥褻后被調(diào)崗降薪,女子起訴獲賠,公司管理失職被判擔(dān)責(zé)

紅星新聞
2026-03-26 18:23:16
2026-03-26 20:23:00
頂級(jí)大佬思維
頂級(jí)大佬思維
分享干貨,思維見解,砥礪學(xué)習(xí)
24文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

數(shù)碼
旅游
親子
家居
軍事航空

數(shù)碼要聞

1+4核,英特爾酷睿3 304處理器現(xiàn)身基準(zhǔn)測(cè)試

旅游要聞

魯冰花開啦!快來新鄉(xiāng)南太行八里溝 赴一場(chǎng)春日之約

親子要聞

這就是引導(dǎo)型老師的厲害嗎?

家居要聞

傍海而居 靜觀蝴蝶海

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版