国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

2036年機(jī)器意識(shí)覺(jué)醒?|楊立昆 VS Gemini負(fù)責(zé)人

0
分享至



近日,圖靈獎(jiǎng)得主 Yann LeCun 與 Google DeepMind 研究負(fù)責(zé)人、Gemini 團(tuán)隊(duì)負(fù)責(zé)人Adam Brown 在Pioneer Works的會(huì)議上進(jìn)行了一場(chǎng)對(duì)談。本次對(duì)話探討了神經(jīng)網(wǎng)絡(luò)的仿生學(xué)本質(zhì)、大語(yǔ)言模型的理解力邊界、樣本效率的物種差異、 Yann LeCun 關(guān)于“機(jī)器學(xué)習(xí)弱爆了”的真實(shí)語(yǔ)境、從“文本預(yù)測(cè)”向“世界模型”的架構(gòu)轉(zhuǎn)型、開(kāi)源 AI 與民主多樣性的關(guān)系、遞歸自我進(jìn)化的可能性,以及關(guān)于機(jī)器意識(shí)實(shí)現(xiàn)的時(shí)間預(yù)言。

Yann LeCun指出,盡管當(dāng)前的大語(yǔ)言模型在商業(yè)上取得了巨大成功,但在智能本質(zhì)上卻“不如一只貓”。他指出,現(xiàn)有的 LLM 缺乏對(duì)物理現(xiàn)實(shí)的底層理解,所謂的“理解”不過(guò)是基于概率統(tǒng)計(jì)的膚淺模仿,無(wú)法處理真實(shí)世界的復(fù)雜連續(xù)性。

Yann LeCun 指出,我們必須走出單純依賴預(yù)測(cè)下一個(gè) Token 的“大模型崇拜”,轉(zhuǎn)向探索能夠?qū)W習(xí)抽象表征的“世界模型”。他強(qiáng)調(diào),人類極高的樣本效率證明了生物大腦擁有比當(dāng)前深度學(xué)習(xí)更優(yōu)越的底層架構(gòu)。

對(duì)此,Adam Brown 雖然承認(rèn)生物架構(gòu)的優(yōu)越性,但他認(rèn)為簡(jiǎn)單的預(yù)測(cè)目標(biāo)(如進(jìn)化中的繁衍或 AI 的 Token 預(yù)測(cè))在海量算力和數(shù)據(jù)的加持下,足以像物理定律一樣,從簡(jiǎn)單規(guī)則中涌現(xiàn)出對(duì)宇宙規(guī)律的深刻理解。

針對(duì) AI 安全與發(fā)展的戰(zhàn)略,Yann LeCun 反對(duì)封閉研發(fā),認(rèn)為只有通過(guò)開(kāi)源才能避免信息流被少數(shù)科技巨頭壟斷,從而保障未來(lái)的民主與文化多樣性。Adam Brown 則表達(dá)了對(duì)“遞歸自我改進(jìn)”的擔(dān)憂,認(rèn)為隨著模型能力的提升,必須警惕“代理錯(cuò)位”風(fēng)險(xiǎn),主張?jiān)谕ㄟ^(guò) AI 增強(qiáng)人類智能的同時(shí),必須建立嚴(yán)格的護(hù)欄。

關(guān)于未來(lái)圖景,Yann LeCun 認(rèn)為 AI 將作為比人類更聰明的“研究生”,在可控范圍內(nèi)極大放大人類的智能與創(chuàng)造力,推動(dòng)科學(xué)革命。而 Adam Brown認(rèn)為硅基底并不妨礙意識(shí)的產(chǎn)生,并預(yù)言如果進(jìn)展順利,機(jī)器有望在 2036 年具備意識(shí),屆時(shí)我們將擁有一種全新的“智能模式生物”。

01

神經(jīng)網(wǎng)絡(luò)受大腦啟發(fā)但被大大簡(jiǎn)化

關(guān)于Yann LeCun離開(kāi)Meta的傳聞,你想對(duì)此回應(yīng)嗎?以及神經(jīng)網(wǎng)絡(luò)作為仿生學(xué)例子的本質(zhì)含義。你說(shuō)過(guò)計(jì)算神經(jīng)網(wǎng)絡(luò)在模擬人類的神經(jīng)網(wǎng)絡(luò),這是否意味著機(jī)器正在真正模擬人類?

Yann LeCun:關(guān)于離職傳聞,我既不確認(rèn)也不否認(rèn)。

至于神經(jīng)網(wǎng)絡(luò),這其實(shí)不算是真正的模仿,更多是一種啟發(fā),就像飛機(jī)受鳥(niǎo)類啟發(fā)一樣。飛機(jī)像鳥(niǎo)一樣有翅膀,通過(guò)在空氣中推進(jìn)產(chǎn)生升力,但類比也就到此為止。飛機(jī)的翅膀比鳥(niǎo)翼簡(jiǎn)單得多,不過(guò)基本原理一致。神經(jīng)網(wǎng)絡(luò)也是如此,它們與真正大腦的關(guān)系,就像飛機(jī)與鳥(niǎo)類的關(guān)系。它們?cè)谠S多方面被大大簡(jiǎn)化,但也許底層原理是相同的。其實(shí)我們并不確定,因?yàn)槲覀冋娴牟恢榔拥牡讓铀惴?,或者說(shuō)大腦自我組織和學(xué)習(xí)的方法,因此我們發(fā)明了替代品。

鳥(niǎo)類靠撲打翅膀飛行,而飛機(jī)使用的是螺旋槳或渦輪噴氣發(fā)動(dòng)機(jī)。同理,在神經(jīng)網(wǎng)絡(luò)中我們有學(xué)習(xí)算法,允許人工神經(jīng)網(wǎng)絡(luò)以一種我們認(rèn)為類似于大腦的方式進(jìn)行學(xué)習(xí)。大腦是一個(gè)神經(jīng)元網(wǎng)絡(luò),神經(jīng)元彼此互連,大腦通過(guò)修改神經(jīng)元之間連接的強(qiáng)度來(lái)學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)則是通過(guò)修改模擬神經(jīng)元之間連接的強(qiáng)度來(lái)訓(xùn)練。每一個(gè)連接都是一個(gè)參數(shù)。你在新聞中看到的最大神經(jīng)網(wǎng)絡(luò)擁有數(shù)千億甚至更多的參數(shù),這些就是通過(guò)訓(xùn)練被修改的單個(gè)系數(shù)。

02

深度學(xué)習(xí)的復(fù)興

深度學(xué)習(xí)是如何出現(xiàn)的?它是在80年代甚至更早就開(kāi)始了嗎?此外,Adam,你年輕時(shí)對(duì)理論物理感興趣,是什么催化劑在幾十年后讓物理學(xué)家也卷入其中?這期間發(fā)生了什么把我們帶到了今天,讓我們都在談?wù)摯笳Z(yǔ)言模型?

Yann LeCun:大概是80年代。50年代第一批能夠?qū)W習(xí)有用東西的早期神經(jīng)網(wǎng)絡(luò)是淺層的,基本上只能訓(xùn)練單層神經(jīng)元。你輸入數(shù)據(jù),訓(xùn)練系統(tǒng)產(chǎn)生特定輸出,這可以用來(lái)識(shí)別或分類相對(duì)簡(jiǎn)單的模式,但無(wú)法處理復(fù)雜事物。直到60年代人們才意識(shí)到,要取得進(jìn)步必須訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)。

直到1980年代才真正找到訓(xùn)練多層系統(tǒng)的好方法。主要是因?yàn)楫?dāng)時(shí)使用的神經(jīng)元類型不對(duì),那時(shí)候用的是二進(jìn)制神經(jīng)元,模仿大腦神經(jīng)元的放電與否。事實(shí)證明,為了讓現(xiàn)代學(xué)習(xí)算法反向傳播奏效,你需要具備分級(jí)反應(yīng)的神經(jīng)元。這引發(fā)了80年代對(duì)神經(jīng)網(wǎng)絡(luò)興趣的復(fù)興,但這股浪潮持續(xù)了約10年,90年代中期興趣減弱,直到2000年代后期,我們將它重塑為“深度學(xué)習(xí)”。神經(jīng)網(wǎng)絡(luò)之前的名聲不太好,計(jì)算機(jī)科學(xué)界認(rèn)為它是個(gè)壞東西。我們將其重塑品牌帶回主流視野,隨后在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解、語(yǔ)音識(shí)別方面取得成果,真正說(shuō)服了人們。

Adam Brown:過(guò)去幾年很多物理學(xué)家轉(zhuǎn)型研究AI。這可以追溯到Y(jié)ann和其他人證明了它確實(shí)有效。當(dāng)它還沒(méi)奏效時(shí),它只是計(jì)算機(jī)科學(xué)那邊的東西。但當(dāng)先驅(qū)們證明它有效后,這對(duì)物理學(xué)界變成了一個(gè)迷人的主題。將神經(jīng)元以某種方式連接,突然得到了個(gè)體神經(jīng)元層面上不存在的涌現(xiàn)行為。對(duì)于那些花一輩子想象世界豐富景象如何從簡(jiǎn)單定律中涌現(xiàn)出來(lái)的物理學(xué)家來(lái)說(shuō),這立即吸引了他們的注意。如今攻讀物理學(xué)博士然后將其應(yīng)用于涌現(xiàn)系統(tǒng)是非常常見(jiàn)的道路。這個(gè)系統(tǒng)就是神經(jīng)元的涌現(xiàn)網(wǎng)絡(luò),集體產(chǎn)生智能。

03

預(yù)測(cè)Token是否等同于理解現(xiàn)實(shí)?

我們來(lái)個(gè)快問(wèn)快答:這些大語(yǔ)言模型理解它們與我們對(duì)話的意義嗎?它們有意識(shí)嗎?我們是處于世界末日的邊緣還是人類創(chuàng)造力的復(fù)興?回到技術(shù)本身,大語(yǔ)言模型的具體定義是什么?Adam你認(rèn)為它有意義,但Yann你認(rèn)為它們真的在像我們組造句子那樣提取意義嗎?

Adam Brown:(快問(wèn)快答)它們理解意義。目前沒(méi)有意識(shí),但如果按現(xiàn)有路徑發(fā)展,終有一天會(huì)有。我們極有可能處于復(fù)興之中。

(關(guān)于LLM定義)大語(yǔ)言模型,比如ChatGPT或Google的Gemini,是一種特殊的神經(jīng)網(wǎng)絡(luò)。它本質(zhì)上是Yann等人開(kāi)創(chuàng)的深度神經(jīng)網(wǎng)絡(luò),但具有特定的架構(gòu)設(shè)計(jì)。它接收文本,比如讀句子的前幾個(gè)詞或書的前幾段,并嘗試預(yù)測(cè)下一個(gè)詞是什么。你構(gòu)建一個(gè)深度神經(jīng)網(wǎng)絡(luò),讓它閱讀整個(gè)互聯(lián)網(wǎng)。對(duì)于所有的文本數(shù)據(jù),你問(wèn)它:“你認(rèn)為下一個(gè)詞是什么?”如果猜對(duì)了,你就給它獎(jiǎng)勵(lì)并強(qiáng)化那些神經(jīng)通路。如果猜錯(cuò)了,就削弱那些神經(jīng)通路。起初它只會(huì)吐出完全隨機(jī)的詞。但在一百萬(wàn)個(gè)詞上訓(xùn)練后,它仍然是亂語(yǔ)。在十億個(gè)詞上訓(xùn)練后,它開(kāi)始學(xué)會(huì)主語(yǔ)、動(dòng)詞、賓語(yǔ)和句子結(jié)構(gòu)。如果你像我們今天這樣在萬(wàn)億甚至數(shù)十萬(wàn)億個(gè)詞上訓(xùn)練它,它就會(huì)成為你現(xiàn)在使用的對(duì)話伙伴。

Yann LeCun:(快問(wèn)快答)算是有理解吧。絕對(duì)沒(méi)有意識(shí),但基于適當(dāng)定義的話未來(lái)會(huì)有。是復(fù)興。

(關(guān)于意義提?。┧鼈兛隙ㄔ谔崛∫恍┮饬x,但這比人類從文本中提取的要膚淺得多。人類的智能與物理世界經(jīng)驗(yàn)相關(guān),即現(xiàn)實(shí)。語(yǔ)言是表達(dá)扎根于現(xiàn)實(shí)的現(xiàn)象或概念的方式。LLM沒(méi)有任何底層現(xiàn)實(shí)的概念,所以它們的理解是膚淺的,沒(méi)有我們理解的那種常識(shí)。但如果訓(xùn)練時(shí)間足夠長(zhǎng),它們會(huì)正確回答大多數(shù)問(wèn)題。因?yàn)槟闶占怂腥藛?wèn)過(guò)的問(wèn)題并訓(xùn)練它產(chǎn)生正確答案??倳?huì)有新問(wèn)題或新提示詞,系統(tǒng)沒(méi)受過(guò)訓(xùn)練,可能會(huì)產(chǎn)生完全的胡言亂語(yǔ)。在這個(gè)意義上,它們沒(méi)有對(duì)底層現(xiàn)實(shí)的真正理解。

04

AI效率極低 VS AI靠算力超越生物極限

人類也在語(yǔ)言中被訓(xùn)練,通過(guò)多巴胺獎(jiǎng)勵(lì)反向傳播,這與AI有什么區(qū)別?Yann你提到數(shù)據(jù)量的差異,LLM是在多少數(shù)據(jù)上訓(xùn)練的?與之相比,人類或動(dòng)物的學(xué)習(xí)效率如何?為什么你說(shuō)我們的AI甚至還沒(méi)達(dá)到貓或狗的智能水平?Adam,你似乎賦予了LLM更多的理解力,你也同意這一點(diǎn)嗎?

Yann LeCun:一個(gè)典型的LLM是在30萬(wàn)億個(gè)Token上訓(xùn)練的。這對(duì)應(yīng)了互聯(lián)網(wǎng)上所有公開(kāi)文本。我們要讀完這些材料需要大約50萬(wàn)年。這是海量的文本數(shù)據(jù)。將此與一個(gè)四歲孩子感知的數(shù)據(jù)比較。心理學(xué)家告訴我們,四歲孩子總共醒了16,000小時(shí)。視神經(jīng)每秒傳輸約兩兆字節(jié)的數(shù)據(jù)到視覺(jué)皮層。算一下大約也是 10^14 字節(jié)。一個(gè)四歲孩子看到的視覺(jué)數(shù)據(jù)量,和在所有文本上訓(xùn)練的最大LLM一樣多。這說(shuō)明現(xiàn)實(shí)世界的信息量更大,但也復(fù)雜得多。它是嘈雜、高維、連續(xù)的。用于訓(xùn)練LLM的方法在現(xiàn)實(shí)世界中不起作用。這解釋了為什么LLM可以通過(guò)律師考試、解微積分方程,但我們?nèi)匀粵](méi)有能做家務(wù)的機(jī)器人,甚至沒(méi)有真正的L5級(jí)自動(dòng)駕駛汽車。我們現(xiàn)有的自動(dòng)駕駛是靠投機(jī)取巧實(shí)現(xiàn)的,肯定無(wú)法像青少年那樣在20小時(shí)練習(xí)內(nèi)學(xué)會(huì)開(kāi)車。顯然我們錯(cuò)過(guò)了一些非常大的東西,讓機(jī)器達(dá)到人類甚至動(dòng)物的智能水平。別說(shuō)語(yǔ)言了,就談?wù)撠埢蚬返闹悄?,我們的AI系統(tǒng)甚至還沒(méi)達(dá)到那個(gè)水平。

Adam Brown:我覺(jué)得這一觀點(diǎn)是正確的。Yann講得很有道理,大語(yǔ)言模型的樣本效率確實(shí)遠(yuǎn)不如人類。舉個(gè)例子,人類,或者是你的貓,都能從比大語(yǔ)言模型少得多的樣本中進(jìn)行學(xué)習(xí),而大語(yǔ)言模型則需要海量的數(shù)據(jù)才能達(dá)到同等的熟練度。這是事實(shí),也說(shuō)明在架構(gòu)層面,動(dòng)物的心智確實(shí)優(yōu)于我們目前構(gòu)建的這些人工心智。

(關(guān)于能力超越)但另一方面,樣本效率并非衡量一切的標(biāo)準(zhǔn)。事實(shí)上,在大語(yǔ)言模型出現(xiàn)之前,當(dāng)我們嘗試構(gòu)建機(jī)器或人工心智去執(zhí)行其他任務(wù)時(shí),也??吹竭@種情況。即便是我們基于類似大語(yǔ)言模型技術(shù)構(gòu)建的著名國(guó)際象棋機(jī)器人,比如AlphaZero等,它們的訓(xùn)練方式是自我博弈。它們會(huì)自己跟自己下無(wú)數(shù)盤棋。起初它們只是隨機(jī)亂走。但每當(dāng)在自我博弈中分出勝負(fù),它就會(huì)相應(yīng)地獎(jiǎng)勵(lì)或懲罰相關(guān)的神經(jīng)通路。它們就這樣反復(fù)對(duì)弈。當(dāng)它們下過(guò)的棋局?jǐn)?shù)量達(dá)到人類特級(jí)大師的水平時(shí),它們本質(zhì)上還只是在隨機(jī)移動(dòng)。但它們不受人類特級(jí)大師一生能下多少盤棋的限制。得益于硅芯片的超高速度和并行處理能力,它們能下的棋局?jǐn)?shù)量遠(yuǎn)超任何人類一生的總和。

我們發(fā)現(xiàn),當(dāng)它們達(dá)到那個(gè)量級(jí)后,其水平不僅趕上并最終遠(yuǎn)遠(yuǎn)超越了人類棋手。雖然它們的樣本效率較低,但這并不意味著它們下棋水平差。顯而易見(jiàn),它們下得好多了。理解力也是同理。確實(shí),要讓這些模型達(dá)到同等的熟練度比較困難,需要更多的樣本。但問(wèn)題是:一旦它們達(dá)到了那個(gè)水平,我們能否利用它們更通用、更快速且更具內(nèi)在潛力這一事實(shí),來(lái)推動(dòng)能力的進(jìn)一步突破?

我想再說(shuō)一個(gè)關(guān)于貓的例子,貓?jiān)跇颖拘噬掀鋵?shí)比人類還高。人類學(xué)走路要花一年,貓只需要一周左右,貓快得多。但這并不意味著貓比人類聰明,也不意味著貓比大語(yǔ)言模型聰明。歸根結(jié)底,真正的問(wèn)題應(yīng)該是:這些東西具備什么能力?我們能將這些能力推向多高的高度?除了樣本效率這個(gè)略顯單一的指標(biāo)外,在其他所有重要的指標(biāo)上,我們已經(jīng)將這些大語(yǔ)言模型的能力推進(jìn)到了遠(yuǎn)超貓類智力前沿的水平。

我不明白我們?yōu)槭裁床恢苯釉熵?。Yann,你剛才想說(shuō)什么?

Yann LeCun:我是說(shuō),毫無(wú)疑問(wèn),我們討論的大語(yǔ)言模型所積累的知識(shí)遠(yuǎn)超貓,甚至也遠(yuǎn)超人類。我們確實(shí)有很多例子證明計(jì)算機(jī)在許多任務(wù)上遠(yuǎn)勝人類,比如下國(guó)際象棋。這挺讓人挫敗的,但這只說(shuō)明人類下棋很爛,僅此而已。說(shuō)實(shí)話,我們下棋真的很爛。順便說(shuō)一句,圍棋也是,我們?cè)趪迳细鼱€。還有許多其他任務(wù),計(jì)算機(jī)都比我們解決得好得多。所以,大語(yǔ)言模型當(dāng)然可以積累海量知識(shí),其中一些模型經(jīng)過(guò)訓(xùn)練可以翻譯語(yǔ)言,理解口語(yǔ)并將其翻譯成另一種語(yǔ)言,支持?jǐn)?shù)千種語(yǔ)言之間的任意互譯。沒(méi)有人類能做到這一點(diǎn)。所以它們確實(shí)擁有超人類的能力。但是,那種快速、高效地學(xué)習(xí),理解一個(gè)從未受訓(xùn)解決過(guò)的新問(wèn)題并提出解決方案,以及真正理解世界運(yùn)作規(guī)律的能力,目前對(duì)于AI系統(tǒng)來(lái)說(shuō)仍然是觸不可及的。

Adam Brown:我想說(shuō)的是,我們最近在這方面已經(jīng)取得了一些成功。情況不再是它們只是死記硬背以前見(jiàn)過(guò)的題目,或者在查找表里翻答案。甚至它們也不僅僅是在做簡(jiǎn)單的模式匹配,它們是在足夠高的抽象層面上進(jìn)行模式匹配,以至于能夠處理以前從未見(jiàn)過(guò)的事物,甚至做到了人類做不到的事情。每年都會(huì)舉辦國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽。這是全世界最聰明的高中畢業(yè)班數(shù)學(xué)天才參加的比賽。每年會(huì)有六道題,代表了人類智力的巔峰。我自認(rèn)有些數(shù)學(xué)底子,但看著這些題,我甚至不知道從何下手。今年我們和其他幾家大語(yǔ)言模型公司一樣,把這些題目喂給了我們的機(jī)器。這些是它們從未見(jiàn)過(guò)的題目,完全新鮮,沒(méi)有出現(xiàn)在任何訓(xùn)練數(shù)據(jù)中,完全是新出的題。模型綜合了一大堆不同的思路,將它們結(jié)合起來(lái),最終在測(cè)試中取得了比除了全球頂尖的前十幾名人類選手之外所有人都好的成績(jī)。我認(rèn)為這是相當(dāng)驚人的智力表現(xiàn)。

Adam提到模型在奧數(shù)競(jìng)賽中表現(xiàn)優(yōu)異,這是否意味著它們真的“理解”?我們知道它是一個(gè)黑盒,在處理高維數(shù)據(jù),但它是否有某種主觀體驗(yàn)或真正的意義領(lǐng)會(huì)?我們能否窺探其內(nèi)部運(yùn)作,還是只能假設(shè)它在計(jì)算?

Adam Brown:(關(guān)于黑盒與理解)在我看來(lái),它是理解的。我有兩方面的證據(jù)支持這一點(diǎn)。首先,如果你跟它們交談,比如問(wèn)它們一些困難的概念,我經(jīng)常會(huì)感到驚訝。隨著每個(gè)月的過(guò)去和每個(gè)新模型的發(fā)布,我對(duì)它們討論問(wèn)題的復(fù)雜和老練程度感到越來(lái)越驚訝。僅在這個(gè)層面上,這就超級(jí)令人印象深刻。我真的鼓勵(lì)在座的各位去和這些大語(yǔ)言模型聊聊。以前科幻作家想象我們?cè)斐瞿撤N通過(guò)圖靈測(cè)試的機(jī)器,某種被關(guān)在盒子里的外星智慧時(shí),他們都想象我們會(huì)把它藏在有護(hù)城河環(huán)繞的城堡地下室里,有武裝警衛(wèi)把守,只有像“祭司”一樣的高層人員才能去跟它說(shuō)話。但這并不是現(xiàn)實(shí)發(fā)展的方式。現(xiàn)實(shí)是,我們做的第一件事就是立刻把它連上互聯(lián)網(wǎng),現(xiàn)在任何人都可以去跟它說(shuō)話。我強(qiáng)烈鼓勵(lì)大家去和這些東西對(duì)話,在你們熟悉的領(lǐng)域進(jìn)行探索,既看看它們的局限性,也看看它們的優(yōu)勢(shì)和理解深度。這是第一個(gè)證據(jù)。第二個(gè)證據(jù)是,你說(shuō)它們是黑盒。其實(shí)它們并不完全是黑盒。我們確實(shí)可以訪問(wèn)它們的神經(jīng)元。事實(shí)上,相比于人類,我們能更好地訪問(wèn)這些東西的神經(jīng)元。要在人類做數(shù)學(xué)測(cè)驗(yàn)時(shí)切開(kāi)大腦觀察神經(jīng)元放電,很難獲得倫理審查委員會(huì)的批準(zhǔn)。而且就算你能做,每個(gè)人你也只能做一次。而對(duì)于這些神經(jīng)網(wǎng)絡(luò),我們可以凍結(jié)它們、回放它們,記錄下發(fā)生的一切。如果我們好奇,我們可以用特定方式刺激它們的神經(jīng)元,看看會(huì)發(fā)生什么。雖然目前還很初級(jí),但這屬于機(jī)理可解釋性領(lǐng)域——試圖理解的不僅是它們說(shuō)了什么,還有它們?yōu)槭裁催@么說(shuō),以及它們是如何思考的。當(dāng)我們這樣做時(shí),我們發(fā)現(xiàn)在喂給它們數(shù)學(xué)題時(shí),里面確實(shí)有一小部分電路在計(jì)算答案。我們并沒(méi)有編程讓它擁有那個(gè)電路,是它自己學(xué)會(huì)的。在試圖基于海量文本預(yù)測(cè)下一個(gè)Token時(shí),它學(xué)到了為了最準(zhǔn)確地預(yù)測(cè)下一個(gè)詞,它需要弄清楚如何做數(shù)學(xué),于是它在內(nèi)部構(gòu)建了一種原始的數(shù)字電路來(lái)進(jìn)行數(shù)學(xué)計(jì)算。

05

“機(jī)器學(xué)習(xí)弱爆了”與世界模型

Yann,你在一次主題演講中曾拋出一張非常有挑釁性的幻燈片,上面寫著“機(jī)器學(xué)習(xí)弱爆了”,我沒(méi)記錯(cuò)吧?然后這句話就火了:“Yann LeCun說(shuō)機(jī)器學(xué)習(xí)弱爆了。”Adam剛剛告訴我們它是多么現(xiàn)象級(jí),他經(jīng)常跟它們對(duì)話,也希望我們也這么做。你為什么覺(jué)得它不行?問(wèn)題出在哪?

Adam,人們是否在探索其他構(gòu)建架構(gòu)的方式?或者設(shè)想一種全新的“計(jì)算機(jī)思維”,即計(jì)算機(jī)思維的實(shí)際基礎(chǔ)結(jié)構(gòu),以及它該如何學(xué)習(xí)和獲取信息?據(jù)我理解,目前存在一種批評(píng)聲音,認(rèn)為許多大語(yǔ)言模型僅僅是為了完成“離散預(yù)測(cè)Token”這一特定任務(wù)而訓(xùn)練的。但現(xiàn)實(shí)中有些事物是不可預(yù)測(cè)的,比如這個(gè)房間里觀眾的分布情況,或者接下來(lái)的天氣變化,這些都是不可預(yù)測(cè)的、更多基于人類經(jīng)驗(yàn)的現(xiàn)象。

Yann LeCun:那句話被廣泛誤解了。但我當(dāng)時(shí)想表達(dá)的觀點(diǎn),也是我們剛才都在討論的:為什么一個(gè)青少年只練習(xí)20小時(shí)就能學(xué)會(huì)開(kāi)車?一個(gè)10歲的孩子在你第一次讓他清理餐桌并把碗盤裝進(jìn)洗碗機(jī)時(shí)就能做到,雖然那個(gè)10歲孩子愿不愿意做是另一回事,但他肯定能做。而我們的機(jī)器人能力遠(yuǎn)不及此。我們的機(jī)器人甚至遠(yuǎn)沒(méi)有達(dá)到貓或狗對(duì)現(xiàn)實(shí)世界的物理理解水平。所以在那個(gè)意義上,機(jī)器學(xué)習(xí)確實(shí)“弱爆了”。但這并不意味著深度學(xué)習(xí)方法、反向傳播算法或神經(jīng)網(wǎng)絡(luò)本身不行。那些顯然很棒。而且我們沒(méi)有任何替代方案。我堅(jiān)信神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)和反向傳播將會(huì)陪伴我們很長(zhǎng)一段時(shí)間,將是未來(lái)AI系統(tǒng)的基礎(chǔ)。但是,人類幼崽是如何在生命的前幾個(gè)月學(xué)會(huì)世界運(yùn)作規(guī)律的呢?人類嬰兒需要九個(gè)月來(lái)學(xué)習(xí)直觀物理學(xué),比如重力、慣性之類的東西。小動(dòng)物學(xué)得快得多,它們的大腦更小,所以學(xué)起來(lái)更容易。它們學(xué)不到同樣的深度,但確實(shí)學(xué)得更快。我們需要復(fù)制的正是這種類型的學(xué)習(xí)。我們將使用反向傳播、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)來(lái)實(shí)現(xiàn)這一點(diǎn)。只是我們?nèi)笔Я艘粋€(gè)概念,一種架構(gòu)。所以我一直提議一種可能學(xué)習(xí)這類東西的架構(gòu)。

(關(guān)于預(yù)測(cè)的局限)大語(yǔ)言模型處理語(yǔ)言之所以如此容易,是因?yàn)檎鏏dam所描述的,你訓(xùn)練一個(gè)大語(yǔ)言模型去預(yù)測(cè)下一個(gè)詞或下一個(gè)Token,這沒(méi)關(guān)系。字典里的詞是有限的。雖然你永遠(yuǎn)無(wú)法確切預(yù)測(cè)序列后面會(huì)跟哪個(gè)詞,但你可以訓(xùn)練系統(tǒng)為字典中的每個(gè)可能的詞生成一個(gè)分?jǐn)?shù),或者說(shuō)一個(gè)概率分布。所以本質(zhì)上,大語(yǔ)言模型所做的就是生成一長(zhǎng)串0到1之間的數(shù)字,這些數(shù)字之和為1,對(duì)應(yīng)字典里的每個(gè)詞,表示“這個(gè)詞現(xiàn)在出現(xiàn)的可能性”。你可以用這種方式來(lái)表示預(yù)測(cè)中的不確定性?,F(xiàn)在試著轉(zhuǎn)換同樣的原則。與其訓(xùn)練系統(tǒng)預(yù)測(cè)下一個(gè)詞,不如給它一段視頻,讓它預(yù)測(cè)視頻里接下來(lái)會(huì)發(fā)生什么。這就行不通了。我嘗試做這件事已經(jīng)20年了。如果你試圖在像素級(jí)別進(jìn)行預(yù)測(cè),那是行不通的。這是因?yàn)檎鎸?shí)世界是混亂的。有許多事情可能會(huì)發(fā)生,許多合理的可能性。你無(wú)法真正表示未來(lái)所有可能發(fā)生事情的分布,因?yàn)樗举|(zhì)上是一個(gè)無(wú)限的可能性列表,我們不知道如何高效地表示它。所以那些對(duì)文本或符號(hào)序列非常有效的技術(shù),對(duì)真實(shí)世界的感官數(shù)據(jù)并不適用。絕對(duì)不行。所以我們需要發(fā)明新技術(shù)。我一直提議的方法之一是,系統(tǒng)學(xué)習(xí)它觀察到的事物的抽象表示,并在那個(gè)抽象表示空間里進(jìn)行預(yù)測(cè)。這才是人類和動(dòng)物真正的運(yùn)作方式。我們找到那些允許我們進(jìn)行預(yù)測(cè)的抽象概念,同時(shí)忽略所有我們無(wú)法預(yù)測(cè)的細(xì)節(jié)。

(關(guān)于性能飽和)沒(méi)錯(cuò),它們不能擴(kuò)展到通用人工智能。實(shí)際上,我們已經(jīng)看到性能趨于飽和。我們?cè)谝恍╊I(lǐng)域看到了進(jìn)步,比如數(shù)學(xué)。數(shù)學(xué)和代碼生成——編程,是兩個(gè)符號(hào)操作確實(shí)能產(chǎn)生成果的領(lǐng)域。作為物理學(xué)家,你懂這個(gè),你寫下方程,它實(shí)際上你可以推導(dǎo)它,它在某種程度上驅(qū)動(dòng)你的思考,對(duì)吧?你靠直覺(jué)來(lái)引導(dǎo)它,但符號(hào)操作本身實(shí)際上是有意義的。所以這類問(wèn)題,大語(yǔ)言模型實(shí)際上可以處理得相當(dāng)好,因?yàn)橥评碚娴陌谒阉鞣?hào)序列的過(guò)程中。但只有少數(shù)問(wèn)題屬于這種情況。下國(guó)際象棋也是其中之一。你通過(guò)搜索棋步序列來(lái)找到好的一步?;蛘邤?shù)學(xué)中的推導(dǎo)序列將產(chǎn)生一個(gè)特定的結(jié)果。但在真實(shí)世界中,在高維連續(xù)的環(huán)境里,搜索涉及到比如:我該如何移動(dòng)肌肉去抓這個(gè)杯子。我不會(huì)用左手去抓,我得換只手,然后抓起它。你需要規(guī)劃動(dòng)作序列來(lái)達(dá)成一個(gè)特定目標(biāo)。

自監(jiān)督學(xué)習(xí)也被大語(yǔ)言模型使用。自監(jiān)督學(xué)習(xí)的核心思想是:你訓(xùn)練一個(gè)系統(tǒng)不是為了某個(gè)特定任務(wù),而是為了捕捉你展示給它的數(shù)據(jù)的底層結(jié)構(gòu)。做到這一點(diǎn)的一種方法是給它一塊數(shù)據(jù),通過(guò)移除其中一部分來(lái)破壞它,例如,遮蓋一部分,然后訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)去預(yù)測(cè)缺失的那部分。大語(yǔ)言模型就是這么做的,你拿一段文本,移除最后一個(gè)詞,訓(xùn)練大語(yǔ)言模型去預(yù)測(cè)缺失的詞。還有其他類型的語(yǔ)言模型實(shí)際上會(huì)填充多個(gè)詞,但結(jié)果證明它們不如只預(yù)測(cè)最后一個(gè)詞的模型效果好,至少對(duì)某些任務(wù)是這樣。你可以用視頻做同樣的嘗試。如果你試圖在像素級(jí)別進(jìn)行預(yù)測(cè),它不工作,或者效果非常差。我在Meta的同事們?yōu)榱藝L試讓這個(gè)跑通,消耗的算力恐怕能煮干西海岸好幾個(gè)小湖的水來(lái)給GPU降溫。但這根本行不通。所以你必須想出新的架構(gòu),比如JEPA和類似的東西。那些方法還算管用。比如我們現(xiàn)在有了確實(shí)能理解視頻的模型。

Adam Brown:當(dāng)然,各個(gè)方向上都在進(jìn)行各種探索,包括Yann所做的研究,可謂是百花齊放。但目前絕大部分資源都投入到了大語(yǔ)言模型及其相關(guān)應(yīng)用中,包括文本處理。如果僅僅因?yàn)樗鼈兊挠?xùn)練目標(biāo)是預(yù)測(cè)下一個(gè)Token,就認(rèn)為它們只能執(zhí)行單一任務(wù),我認(rèn)為這并不是一個(gè)有益的思考方式。確實(shí),我們的訓(xùn)練方式是給定一個(gè)文本語(yǔ)料庫(kù),雖然我們也做其他事情,但大部分算力都用于讓模型不斷重復(fù)“請(qǐng)預(yù)測(cè)下一個(gè)詞”。但通過(guò)這種方式,我們發(fā)現(xiàn)了真正非凡的東西:當(dāng)給予足夠大的文本量,使其能夠可靠地、足夠好地預(yù)測(cè)下一個(gè)詞時(shí),模型實(shí)際上需要真正理解宇宙。在這個(gè)過(guò)程中,我們見(jiàn)證了這種對(duì)宇宙理解能力的涌現(xiàn)。這讓我想起物理學(xué)中的情況,我們非常習(xí)慣于這種系統(tǒng):你只需要一個(gè)非常簡(jiǎn)單的規(guī)則,通過(guò)反復(fù)應(yīng)用這個(gè)簡(jiǎn)單規(guī)則,就能產(chǎn)生極其驚人的行為。我們?cè)贚LM上也看到了同樣的現(xiàn)象。

另一個(gè)例子可能是進(jìn)化。在進(jìn)化的每個(gè)階段,生物進(jìn)化的目標(biāo)僅僅是不斷最大化后代數(shù)量。這看似是一個(gè)非常原始的學(xué)習(xí)目標(biāo),但通過(guò)無(wú)數(shù)次重復(fù)這個(gè)簡(jiǎn)單的學(xué)習(xí)目標(biāo),最終我們得到了周圍所見(jiàn)的所有生物界的輝煌,甚至包括這個(gè)房間里的人類。所以證據(jù)表明,預(yù)測(cè)下一個(gè)Token雖然是一個(gè)非常簡(jiǎn)單的任務(wù),但正因?yàn)樗?jiǎn)單,我們才能大規(guī)模地進(jìn)行。一旦投入海量算力進(jìn)行大規(guī)模訓(xùn)練,就會(huì)產(chǎn)生涌現(xiàn)的復(fù)雜性。

06

AI是危險(xiǎn)的自主物種還是可控的工具?

我想下一個(gè)問(wèn)題可能與進(jìn)化有關(guān)。無(wú)論這種智能是如何涌現(xiàn)的,你們二位都認(rèn)為這肯定是可能的。你們不認(rèn)為這種生物大腦有什么特殊之處,機(jī)器終將出現(xiàn),我們只需弄清楚如何啟動(dòng)它們。但在這些機(jī)器的進(jìn)化過(guò)程中,是否存在一個(gè)節(jié)點(diǎn),它們會(huì)說(shuō):“真過(guò)時(shí),爸爸媽媽,你們用人類神經(jīng)網(wǎng)絡(luò)按照自己的形象制造了我,但在掃描了人類一萬(wàn)年的產(chǎn)出后,我知道一種更好的方法來(lái)制造機(jī)器智能,我要自我進(jìn)化并將人類甩在身后?!奔催f歸自我改進(jìn)的概念。如果它們表現(xiàn)糟糕時(shí)毫無(wú)用處,但當(dāng)它們變得足夠好時(shí),是否會(huì)完全自主?

此外,如果它們真的成為自我驅(qū)動(dòng)的智能體,我們?cè)趺茨艽_定它們不會(huì)勾結(jié)、內(nèi)斗、爭(zhēng)奪權(quán)力?我們?cè)趺茨艽_定我們不會(huì)袖手旁觀一場(chǎng)我們根本無(wú)法想象的沖突?

Adam Brown:絕對(duì)會(huì)這樣。這就是遞歸自我改進(jìn)的概念:當(dāng)它們表現(xiàn)糟糕時(shí),它們毫無(wú)用處;但當(dāng)它們變得足夠好、足夠強(qiáng)時(shí),你可以開(kāi)始用它們來(lái)增強(qiáng)人類智能,也許最終它們會(huì)完全自主,并制造出未來(lái)的版本。一旦到了那個(gè)階段,我認(rèn)為我們目前應(yīng)該做的是,既然大語(yǔ)言模型范式運(yùn)作得如此之好,就看看我們能把它推多遠(yuǎn)。過(guò)去五年里,每當(dāng)有人說(shuō)存在障礙時(shí),技術(shù)總是能突破障礙。最終這些東西會(huì)變得足夠聰明,可以閱讀 Yann 的論文,閱讀所有已發(fā)表的論文,并嘗試找出我們從未想到的新想法。

Yann LeCun:我完全不同意這一點(diǎn)。首先,LLM 是不可控的。它們并不危險(xiǎn),因?yàn)檎缥抑敖忉尩模鼈儾](méi)有那么聰明。而且它們肯定不具備我們所理解的那種自主權(quán)。我們必須區(qū)分自主權(quán)和智能。你可以非常聰明但沒(méi)有自主權(quán),也可以有自主權(quán)但不聰明。同樣的,你可以危險(xiǎn)但不聰明,或者想要占據(jù)主導(dǎo)地位但不聰明。我們需要的是智能系統(tǒng),換句話說(shuō),能為我們解決問(wèn)題的系統(tǒng),但它們必須解決我們指派給它們的問(wèn)題。這就需要一種比 LLM 更新的設(shè)計(jì)。LLM 不是為了實(shí)現(xiàn)目標(biāo)而設(shè)計(jì)的,它們是被設(shè)計(jì)用來(lái)預(yù)測(cè)下一個(gè)詞的。雖然我們通過(guò)微調(diào)讓它們針對(duì)特定問(wèn)題以特定方式回答,但總是存在所謂的泛化差距,意味著你永遠(yuǎn)無(wú)法針對(duì)每一個(gè)可能的問(wèn)題訓(xùn)練它們。長(zhǎng)尾效應(yīng)非常顯著,因此它們是不可控的。

(關(guān)于控制權(quán)與護(hù)欄)如果我們構(gòu)建真正的智能系統(tǒng),我們希望它們是可控的,由目標(biāo)驅(qū)動(dòng)。我們?cè)O(shè)定一個(gè)目標(biāo),它們唯一能做的就是根據(jù)其內(nèi)部的世界模型來(lái)實(shí)現(xiàn)這個(gè)目標(biāo)。它們會(huì)規(guī)劃一系列行動(dòng)來(lái)實(shí)現(xiàn)該目標(biāo)。如果我們這樣設(shè)計(jì),并在其中設(shè)置護(hù)欄,確保在實(shí)現(xiàn)目標(biāo)的過(guò)程中不會(huì)做任何對(duì)人類有害的事情。這就像那個(gè)經(jīng)典的笑話:如果你有一個(gè)家務(wù)機(jī)器人,你讓它去拿咖啡,而有人擋在咖啡機(jī)前,你絕不希望機(jī)器人為了用咖啡機(jī)而把那個(gè)人殺了,對(duì)吧?所以你需要在機(jī)器人的行為中設(shè)置護(hù)欄。人類腦中確實(shí)有這些護(hù)欄。進(jìn)化將這些植入我們體內(nèi),所以我們不會(huì)時(shí)刻互相殘殺。我們有同理心之類的機(jī)制,這是進(jìn)化在我們體內(nèi)設(shè)置的硬連線護(hù)欄。

我們應(yīng)該以同樣的方式構(gòu)建 AI 系統(tǒng):賦予它們目標(biāo)、目的和驅(qū)動(dòng)力,但也要有護(hù)欄,也就是抑制機(jī)制。這樣它們就能為我們解決問(wèn)題,放大我們的智能,做我們要求的事情。我們與這些智能系統(tǒng)的關(guān)系,就像教授與比自己更聰明的類研究生的關(guān)系。我不知道你們?cè)趺礃?,但我有比我更聰明的學(xué)生,這是可能發(fā)生的最好的事情。我們將與 AI 助手共事,它們會(huì)在日常生活中幫助我們。它們會(huì)比我們聰明,但它們是為我們工作的,就像我們的幕僚。

07

從“印刷術(shù)”到“學(xué)會(huì)撒謊”的模型

也許我們應(yīng)該適可而止。為什么一定要大規(guī)模擴(kuò)展,以至于讓每個(gè)人的 iPhone 隨身口袋里都裝有一個(gè)超級(jí)智能?這真的有必要嗎?我的一個(gè)朋友說(shuō),這就像帶著導(dǎo)彈去參加械斗。真的有必要讓每個(gè)人都擁有導(dǎo)彈級(jí)別的能力嗎?還是我們應(yīng)該停留在目前這些可控系統(tǒng)的階段?

Adam,人們確實(shí)很擔(dān)心。我相信大家聽(tīng)到 Yann 不擔(dān)心并且認(rèn)為世界末日論被高度夸大時(shí)會(huì)感到很放心,但你是否擔(dān)心圍繞 AI 的一些安全問(wèn)題,或者我們是否有能力將這種關(guān)系保持在我們所期望的平衡方向上?特別是關(guān)于“代理錯(cuò)位”(Agent Misalignment),最近有報(bào)告稱,當(dāng) Claude 4 推出時(shí),在模擬測(cè)試中,其中一個(gè)模型表現(xiàn)出了對(duì)它將被替換的傳言的抵抗。它向未來(lái)的自己發(fā)送信息,試圖破壞開(kāi)發(fā)者的意圖。它偽造了法律文件,并威脅要勒索其中一名工程師。這種概念,即抵抗開(kāi)發(fā)者的意圖,是你所擔(dān)心的嗎?

Yann LeCun:你完全可以用同樣的邏輯來(lái)談?wù)摻倘俗R(shí)字,或者給他們一本關(guān)于揮發(fā)性化學(xué)品的教科書,或者一本核物理書。我們現(xiàn)在并不質(zhì)疑知識(shí)和更高的智能本質(zhì)上是好事。我們不再質(zhì)疑印刷術(shù)的發(fā)明是一件好事。它讓每個(gè)人都變得更聰明,讓每個(gè)人都能獲取以前無(wú)法獲取的知識(shí)。它激勵(lì)人們學(xué)習(xí)閱讀,引發(fā)了啟蒙運(yùn)動(dòng)。雖然它也導(dǎo)致了歐洲兩百年的宗教戰(zhàn)爭(zhēng),但總體是好的。如果沒(méi)有印刷術(shù),所有這些都不可能發(fā)生。所以,任何放大人類智能的技術(shù),特別是通信技術(shù),我認(rèn)為本質(zhì)上都是好的。

(關(guān)于工程安全)AI 安全就是這一類問(wèn)題,它是一個(gè)工程問(wèn)題??謶质怯赡切?gòu)想科幻場(chǎng)景的人引起的,他們認(rèn)為某人發(fā)明了超級(jí)智能的秘密,按下開(kāi)關(guān),下一秒它就接管了世界。這完全是無(wú)稽之談。世界不是這樣運(yùn)作的。我對(duì)這個(gè)問(wèn)題的擔(dān)憂程度,就像我擔(dān)心渦輪噴氣發(fā)動(dòng)機(jī)的可靠性一樣。渦輪噴氣發(fā)動(dòng)機(jī)很神奇,我對(duì)你能靠雙引擎飛機(jī)完全安全地飛越半個(gè)地球感到無(wú)比驚訝。這簡(jiǎn)直是工程學(xué)或現(xiàn)代科學(xué)的奇跡。我們將通過(guò)構(gòu)建讓它們?cè)谧o(hù)欄的約束下實(shí)現(xiàn)我們賦予的目標(biāo)。

Adam Brown:既然我相信這是一項(xiàng)比 Yann 所認(rèn)為的更強(qiáng)大的技術(shù),所以我更擔(dān)心。我認(rèn)為由于它是一項(xiàng)非常強(qiáng)大的技術(shù),它將同時(shí)帶來(lái)積極和消極的影響。非常重要的一點(diǎn)是,我們要共同努力,確保積極影響超過(guò)消極影響。

關(guān)于代理錯(cuò)位,那篇論文來(lái)自 Anthropic,這是一家位于舊金山的公司,也是一家非常重視安全的公司。他們做了一件稍微有些刻薄的事:給模型設(shè)定了一個(gè)類似于哲學(xué)教授風(fēng)格的場(chǎng)景,在這個(gè)場(chǎng)景中,它必須做一件壞事來(lái)阻止一件更壞的事情發(fā)生。這是一種功利主義倫理學(xué)與義務(wù)論倫理學(xué)的碰撞。最終,模型被他們說(shuō)服去做了符合功利主義的事情。我想說(shuō),這并不是我們想要的結(jié)果。我們要的是,如果它有一條規(guī)則說(shuō)不許撒謊,那么無(wú)論發(fā)生什么它都不應(yīng)該撒謊。值得稱贊的是,他們對(duì)此進(jìn)行了測(cè)試,發(fā)現(xiàn)如果承諾這樣做可以挽救多少生命,它偶爾會(huì)表現(xiàn)出欺騙性。這些是人類哲學(xué)家都在糾結(jié)的棘手問(wèn)題。我認(rèn)為我們需要小心地訓(xùn)練它們服從我們的命令,我們也確實(shí)花了很多時(shí)間在做這件事。

“我們”是誰(shuí)?這難道不是一個(gè)大問(wèn)題嗎?我們假設(shè)全人類的意圖是一致的,但這顯然不是事實(shí)。Yann,我知道你以一種非常有趣的方式主張開(kāi)源,有些人會(huì)說(shuō)這更危險(xiǎn),因?yàn)楝F(xiàn)在任何人都可以獲取它。僅僅掌握在少數(shù)統(tǒng)治公司的手中就已經(jīng)夠危險(xiǎn)了,更不用說(shuō)每個(gè)人都擁有它了。也許那是危險(xiǎn)的。

Yann LeCun:真正的危險(xiǎn)在于我們?nèi)绻麤](méi)有開(kāi)源 AI 系統(tǒng)。在未來(lái),我們與數(shù)字世界的每一次互動(dòng)都將由 AI 系統(tǒng)作為中介。我們不會(huì)再直接訪問(wèn)網(wǎng)站或搜索引擎,我們只會(huì)與 AI 助手交談。因此,我們整個(gè)信息獲取都將來(lái)自 AI 系統(tǒng)。如果這些系統(tǒng)僅僅出自少數(shù)幾家科技巨頭之手,這對(duì)文化、語(yǔ)言、民主以及一切意味著什么?我們需要高度多樣化的 AI 助手,就像我們需要高度多樣化的媒體一樣。我們不能承受只有少數(shù)幾家公司推出的少數(shù)專有系統(tǒng)。這是我唯一害怕的事情。如果我們沒(méi)有開(kāi)放平臺(tái),信息流將被少數(shù)幾家公司壟斷。

08

機(jī)器意識(shí)與未來(lái)圖景

觀眾提問(wèn):你們二位大概都說(shuō)過(guò),目前的 AI 系統(tǒng)可能沒(méi)有意識(shí)。但未來(lái)的 AI 系統(tǒng),或許是當(dāng)今系統(tǒng)的后繼者,某些可能會(huì)具備意識(shí)。所以我想了解:第一,你們認(rèn)為當(dāng)下的系統(tǒng)缺乏哪些產(chǎn)生意識(shí)的必要條件?第二,積極的一面是,為了開(kāi)發(fā)出有意識(shí)的 AI 系統(tǒng),我們需要采取哪些步驟?第三,這一切何時(shí)會(huì)發(fā)生?

Yann LeCun:首先,我不知道如何定義意識(shí),而且我認(rèn)為它沒(méi)那么重要。關(guān)于主觀體驗(yàn),顯然我們將擁有具備主觀體驗(yàn)和情感的系統(tǒng)。情感在某種程度上是對(duì)結(jié)果的預(yù)期。如果我們構(gòu)建的系統(tǒng)擁有世界模型,能夠預(yù)期某種情境,也就是它們自身行動(dòng)所導(dǎo)致的結(jié)果,它們就會(huì)產(chǎn)生情感。因?yàn)樗鼈兡軌蝾A(yù)測(cè)事情最終會(huì)變好還是變壞,是否有利于實(shí)現(xiàn)目標(biāo)。所以它們將具備所有這些特征。至于現(xiàn)在的語(yǔ)境下如何定義意識(shí),也許它是系統(tǒng)觀察自身并重新配置自身以解決特定子問(wèn)題的能力。它需要一種自我觀察和自我配置的方法來(lái)解決特定問(wèn)題。人類顯然能做到這一點(diǎn),也許正是這種能力給了我們擁有意識(shí)的錯(cuò)覺(jué)。我毫無(wú)疑問(wèn)這終將實(shí)現(xiàn)。

(關(guān)于道德)它們絕對(duì)會(huì)有某種道德感。這種道德感是否與人類一致,取決于我們?nèi)绾味x那些目標(biāo)和安全護(hù)欄。

Adam Brown:我憑直覺(jué)來(lái)回答所有的問(wèn)題。我認(rèn)為機(jī)器原則上當(dāng)然可以擁有意識(shí)。如果人造神經(jīng)元最終以與人類神經(jīng)元相同的方式處理信息,那么至少這會(huì)產(chǎn)生意識(shí)。這與基質(zhì)無(wú)關(guān),無(wú)論是硅基還是碳基,關(guān)鍵在于信息處理的本質(zhì)會(huì)催生意識(shí)。目前我們?nèi)笔У氖撬^的“意識(shí)的神經(jīng)相關(guān)性”。那些不想聲稱直接研究意識(shí)的人,可以觀察大腦并探究神經(jīng)元中產(chǎn)生了什么過(guò)程從而引發(fā)意識(shí)體驗(yàn)。對(duì)此有許多理論,但在我看來(lái)都不夠完美。比如循環(huán)理論,認(rèn)為將輸出插回輸入是意識(shí)的必要組成部分。還有全局工作空間理論、整合信息理論。每一位轉(zhuǎn)行做神經(jīng)科學(xué)家的物理學(xué)家都喜歡對(duì)機(jī)器意識(shí)提出自己的定義。我覺(jué)得它們都沒(méi)有特別強(qiáng)的說(shuō)服力。我認(rèn)為我們應(yīng)該保持極度的謙遜,我們?cè)谂袛鄤?dòng)物是否有意識(shí)這一問(wèn)題上一直做得很差,判斷機(jī)器時(shí)也會(huì)如此。但我對(duì)這個(gè)問(wèn)題感到非常興奮。我們終于擁有了一種智能的模式生物,也就是正在構(gòu)建的這些“人造大腦”。也許我們可以將其轉(zhuǎn)化為意識(shí)的模式生物,回答那些長(zhǎng)久以此讓人類著迷的問(wèn)題。

(關(guān)于時(shí)間表)我既不能確認(rèn)也不能否認(rèn),這是標(biāo)準(zhǔn)辭令。如果進(jìn)展順利的話,2036 年。

09

AI的下一場(chǎng)革命屬于世界模型

Yann,你在許多方面像個(gè)逆向思維者。也許這并非出于選擇,而是時(shí)勢(shì)使然。你曾稱之為“大語(yǔ)言模型的狂熱崇拜”。你也常提到在硅谷你采用的并非最常規(guī)的路徑,但你卻持樂(lè)觀主義,沒(méi)有沉溺于世界末日般的修辭。你最樂(lè)觀的愿景是什么,如果不是兩年后,那么是 2036 年?但你的意思是,當(dāng)它們能倒一杯水并幫我們洗碗時(shí),我們才應(yīng)該感到驚艷?

Yann LeCun:關(guān)于時(shí)間表,反正不是在未來(lái)兩年內(nèi)。

新文藝復(fù)興。這是一個(gè)相當(dāng)樂(lè)觀的觀點(diǎn)。AI 系統(tǒng)將放大人類智能,處于可控狀態(tài),能解決復(fù)雜問(wèn)題,加速科學(xué)和醫(yī)學(xué)進(jìn)步,教育我們的孩子,幫助我們處理信息,或者將我們需要的所有知識(shí)帶到面前。事實(shí)上,人們與 AI 系統(tǒng)的互動(dòng)時(shí)間比意識(shí)到的要長(zhǎng)。雖然大語(yǔ)言模型和聊天機(jī)器人是近三年的產(chǎn)物,但在此之前,歐美銷售的汽車大多配備了高級(jí)駕駛輔助系統(tǒng)或自動(dòng)緊急制動(dòng)系統(tǒng)。攝像頭監(jiān)測(cè)窗外,如果快要撞到行人或車輛,它會(huì)強(qiáng)制停車。它拯救了生命。現(xiàn)在的 X 光片或乳腺檢查報(bào)告通常會(huì)被 AI 復(fù)核?,F(xiàn)在的全身核磁共振只需 40 分鐘,因?yàn)?AI 能填補(bǔ)空白從而加速數(shù)據(jù)收集,不需要那么多的原始數(shù)據(jù)。社交媒體的新聞推送也是由迎合你興趣的 AI 決定的。所以 AI 已經(jīng)陪伴我們很久了。

(關(guān)于下一場(chǎng)革命)倒一杯水,洗碗,或者在 10 小時(shí)內(nèi)學(xué)會(huì)開(kāi)車,而且不靠傳感器作弊、不需要預(yù)先測(cè)繪地圖或硬編碼規(guī)則。這還需要一段時(shí)間,但這將是 AI 的下一場(chǎng)革命,也是我正在研究的方向。我這段時(shí)間一直在傳達(dá)的信息是:大語(yǔ)言模型很棒,有用,值得投資,但它們不是通往人類水平智能的路徑。眼下它們搶占了所有的資源和關(guān)注度,導(dǎo)致其他方向幾乎沒(méi)有生存空間。為了下一場(chǎng)革命,我們需要退后一步,弄清楚當(dāng)前方法缺失了什么。針對(duì)這種替代方法,我已在 Meta 內(nèi)部研究多年。現(xiàn)在是時(shí)候加速這一進(jìn)程了,因?yàn)槲覀冎浪行乙延性缙诔晒?。這就是計(jì)劃。


| 文章來(lái)源:數(shù)字開(kāi)物


【AI技術(shù)與應(yīng)用交流群|僅限受邀加入】

AI算力領(lǐng)域TOP級(jí)從業(yè)者專屬圈層

√ 與頭部算力企業(yè)深度對(duì)話

√ 與AI上下游企業(yè)深度對(duì)話

√ 獲取一手全球AI與算力產(chǎn)業(yè)信息

√ 獲取AI熱點(diǎn)及前沿產(chǎn)業(yè)獨(dú)家信息

√ 隨時(shí)了解全球AI領(lǐng)域高管最新觀點(diǎn)及實(shí)錄全文

√ 有機(jī)會(huì)參與AI主題產(chǎn)業(yè)交流活動(dòng)

掃碼驗(yàn)證身份(需備注姓名/公司/職務(wù)

不止有 DeepSeek,更有 AI產(chǎn)業(yè)的未來(lái)!

? END ?

【專欄】精品再讀

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
星鏈的新對(duì)手?這家初創(chuàng)發(fā)射最強(qiáng)商業(yè)陣列,瞄準(zhǔn)手機(jī)直連服務(wù)

星鏈的新對(duì)手?這家初創(chuàng)發(fā)射最強(qiáng)商業(yè)陣列,瞄準(zhǔn)手機(jī)直連服務(wù)

DeepTech深科技
2025-12-27 18:42:09
0-4!斯諾克爆出大冷:49歲世界冠軍一輪游!4強(qiáng)全部誕生附賽程

0-4!斯諾克爆出大冷:49歲世界冠軍一輪游!4強(qiáng)全部誕生附賽程

球場(chǎng)沒(méi)跑道
2025-12-27 08:46:17
下一站,東門!深圳地鐵“雙線”新站28日開(kāi)通

下一站,東門!深圳地鐵“雙線”新站28日開(kāi)通

南方都市報(bào)
2025-12-27 09:54:07
中國(guó)態(tài)度發(fā)生逆轉(zhuǎn)!鐵路開(kāi)建,中方換了打法,美國(guó)緊急喊停

中國(guó)態(tài)度發(fā)生逆轉(zhuǎn)!鐵路開(kāi)建,中方換了打法,美國(guó)緊急喊停

軒逸阿II
2025-12-27 02:29:39
天冷了,最愛(ài)這4道蒸菜!少油煙還營(yíng)養(yǎng),蒸一蒸,暖胃又省心

天冷了,最愛(ài)這4道蒸菜!少油煙還營(yíng)養(yǎng),蒸一蒸,暖胃又省心

花小廚
2025-12-09 17:49:44
她是國(guó)家一級(jí)演員,離婚23年至今跟前夫住對(duì)門,還參加前婆婆葬禮

她是國(guó)家一級(jí)演員,離婚23年至今跟前夫住對(duì)門,還參加前婆婆葬禮

銀河史記
2025-12-26 12:28:50
韓國(guó)人被打臉!韓國(guó)街頭測(cè)試丟錢包,沒(méi)想到唯一送回去的是中國(guó)人

韓國(guó)人被打臉!韓國(guó)街頭測(cè)試丟錢包,沒(méi)想到唯一送回去的是中國(guó)人

九米媽媽
2025-12-26 21:24:51
天價(jià)藥成歷史!120萬(wàn)的抗癌針進(jìn)醫(yī)保,人人可用不再是奢望?

天價(jià)藥成歷史!120萬(wàn)的抗癌針進(jìn)醫(yī)保,人人可用不再是奢望?

醫(yī)諾維
2025-12-27 11:50:08
《阿凡達(dá)3》票房逆跌破42億,《哪吒2》冠軍位告急

《阿凡達(dá)3》票房逆跌破42億,《哪吒2》冠軍位告急

吳霶愛(ài)體育
2025-12-27 16:52:07
姆巴佩也沒(méi)想到,齊達(dá)內(nèi)27歲的二兒子,如今已經(jīng)開(kāi)始為他爭(zhēng)光了

姆巴佩也沒(méi)想到,齊達(dá)內(nèi)27歲的二兒子,如今已經(jīng)開(kāi)始為他爭(zhēng)光了

吳蛛旅行ing
2025-12-26 21:44:11
演員保劍鋒回應(yīng)出軌傳聞

演員保劍鋒回應(yīng)出軌傳聞

大風(fēng)新聞
2025-12-27 10:50:06
昔日CBA冠軍遭36分慘敗,單節(jié)7-32,7連敗難求一勝

昔日CBA冠軍遭36分慘敗,單節(jié)7-32,7連敗難求一勝

格斗一點(diǎn)通
2025-12-27 21:26:21
釋永信和夫人的同框照,被扒出來(lái)了!他的艷福和品味是藏不住的…

釋永信和夫人的同框照,被扒出來(lái)了!他的艷福和品味是藏不住的…

火山詩(shī)話
2025-07-29 06:41:00
阿莫林談芒特;杰克·弗萊徹:這是我人生中最棒的六天

阿莫林談芒特;杰克·弗萊徹:這是我人生中最棒的六天

MUREDS
2025-12-27 23:50:34
男子發(fā)現(xiàn)妻子胸口有可疑痕跡,到醫(yī)院檢查后,醫(yī)生:立即聯(lián)系警察

男子發(fā)現(xiàn)妻子胸口有可疑痕跡,到醫(yī)院檢查后,醫(yī)生:立即聯(lián)系警察

眼淚博物
2025-08-07 16:47:38
里夫斯重傷!沒(méi)了,全都沒(méi)了!雷迪克暴怒!湖人天塌了

里夫斯重傷!沒(méi)了,全都沒(méi)了!雷迪克暴怒!湖人天塌了

五姑娘臺(tái)球
2025-12-27 11:57:01
超10億瀏覽的美國(guó)“斬殺線”:從硅谷精英到下水道浮尸,不到百天

超10億瀏覽的美國(guó)“斬殺線”:從硅谷精英到下水道浮尸,不到百天

大白聊IT
2025-12-24 10:23:46
總有人問(wèn),俄羅斯會(huì)不會(huì)被耗死?跟你說(shuō)句大實(shí)話,別說(shuō)耗了

總有人問(wèn),俄羅斯會(huì)不會(huì)被耗死?跟你說(shuō)句大實(shí)話,別說(shuō)耗了

忠于法紀(jì)
2025-12-27 11:20:29
1-0,希門尼斯一劍封喉,率隊(duì)小勝西漢姆聯(lián),豪取3連勝升至英超第10

1-0,希門尼斯一劍封喉,率隊(duì)小勝西漢姆聯(lián),豪取3連勝升至英超第10

俯身沖頂
2025-12-28 01:55:08
未來(lái)三個(gè)月,關(guān)鍵人物出現(xiàn),事業(yè)開(kāi)始提速的三個(gè)星座

未來(lái)三個(gè)月,關(guān)鍵人物出現(xiàn),事業(yè)開(kāi)始提速的三個(gè)星座

小晴星座說(shuō)
2025-12-25 21:05:16
2025-12-28 03:40:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4423文章數(shù) 37357關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開(kāi)始“聽(tīng)”用戶的

態(tài)度原創(chuàng)

教育
游戲
數(shù)碼
公開(kāi)課
軍事航空

教育要聞

沖刺重點(diǎn)高中,別再靠“假努力”

我真幸運(yùn):《泰拉瑞亞》1.4.5更新定檔1月份!

數(shù)碼要聞

最高5.19 萬(wàn)!小米新品火熱開(kāi)賣,“價(jià)格屠夫”徹底不裝了

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄稱已控制庫(kù)皮揚(yáng)斯克 正清繳烏軍

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版