国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型真懂你嗎?楊立昆最新論辯:它連貓的智能都還不如

0
分享至

大語言模型真的“理解”我們說的話嗎?它們有沒有意識?它們是通往通用人工智能的跳板,還是只是出色的語言模仿者?

近期,Meta 首席科學(xué)家楊立昆(Yann LeCun)與 DeepMind 高級研究科學(xué)家 Adam Brown 在紐約展開了一場對談,試圖厘清這些模糊卻至關(guān)重要的邊界。


(來源:Youtube)

當(dāng)主持人拋出“大語言模型是否理解意義”這一難題時,Adam Brown 給出了肯定的回答,認(rèn)為模型已展現(xiàn)出某種形式的理解力——不僅能解答復(fù)雜物理問題,還能在全新數(shù)學(xué)競賽題中擊敗絕大多數(shù)人類選手。

而 LeCun 則更為謹(jǐn)慎。他認(rèn)為模型的“理解”是表層的、統(tǒng)計性的,缺乏常識與因果推理能力。

他舉了一個例子:一個四歲孩子通過感官與物理世界互動所獲得的信息量,與最大語言模型訓(xùn)練所用的 30 萬億詞文本相當(dāng),但前者能學(xué)會倒水、收拾餐桌,后者卻連洗碗都做不到。

兩人在“意識”問題上也展現(xiàn)出差異。Brown 認(rèn)為,若當(dāng)前技術(shù)持續(xù)演進(jìn),AI 未來可能具備某種形式的意識。LeCun 則強(qiáng)調(diào),意識若被定義為“自我觀測與目標(biāo)驅(qū)動的調(diào)節(jié)能力”,那確實可被構(gòu)建,但當(dāng)下系統(tǒng)遠(yuǎn)未達(dá)到。

盡管觀點有所不同,兩位科學(xué)家都認(rèn)同:如今的大語言模型已展現(xiàn)出驚人能力,但其路徑存在天花板。LeCun 認(rèn)為若將全部資源押注于“預(yù)測下一個詞”的范式,我們將錯失真正理解世界的 AI 架構(gòu)。

他正推動如 JEPA(聯(lián)合嵌入預(yù)測架構(gòu))等新方向,嘗試讓機(jī)器在抽象表征空間中學(xué)習(xí)物理規(guī)律與因果關(guān)系,而非僅在文本中挖掘模式。

以下為對談內(nèi)容,DeepTech 做了不改變原意的編輯:

從“受啟發(fā)”到“涌現(xiàn)”:神經(jīng)網(wǎng)絡(luò)如何走向智能

主持人:今天,我想先從最基礎(chǔ)的地方談起——從技術(shù)本身開始。

先聊聊神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)常被說成是“模仿人類大腦”的產(chǎn)物,Yann,你能解釋一下,這種“模仿”究竟意味著什么嗎?

楊立昆(Yann LeCun):這不完全是模仿,更像是啟發(fā)。這就好比飛機(jī)的發(fā)明是受鳥類啟發(fā),但飛機(jī)的機(jī)翼結(jié)構(gòu)和鳥的翅膀大不相同,雖然背后的空氣動力學(xué)原理相似。神經(jīng)網(wǎng)絡(luò)和大腦的關(guān)系也是如此:雖然極度簡化,但底層的學(xué)習(xí)原理可能是一致的。

我們并不完全清楚大腦是如何組織和學(xué)習(xí)的,所以發(fā)明了替代方案。在神經(jīng)網(wǎng)絡(luò)中,我們通過調(diào)整模擬神經(jīng)元之間連接的有效性(即“參數(shù)”)來進(jìn)行學(xué)習(xí)。目前最大的神經(jīng)網(wǎng)絡(luò)擁有數(shù)千億甚至更多的參數(shù)。

主持人:那是如何演變到今天的“深度學(xué)習(xí)”的?

楊立昆(Yann LeCun):這大概源于 80 年代。早期的單層神經(jīng)網(wǎng)絡(luò)只能處理簡單任務(wù)。雖然 60 年代人們就意識到需要多層網(wǎng)絡(luò),但當(dāng)時受限于使用了錯誤的神經(jīng)元模型(二進(jìn)制神經(jīng)元)。直到 80 年代,我們引入了具有“漸進(jìn)響應(yīng)”特性的神經(jīng)元,反向傳播算法才變得可行。

這個領(lǐng)域曾一度被計算機(jī)科學(xué)界看衰,名聲不佳。直到 2000 年代初,我們將其重命名為“深度學(xué)習(xí)”,并隨著其在計算機(jī)視覺、自然語言處理等領(lǐng)域的驚人表現(xiàn),才真正說服了世界。

主持人:Adam,你是物理學(xué)背景,從旁觀者變成了參與者。是什么讓你覺得 AI 值得投入?

Adam Brown:這很大程度上歸功于 LeCun 等先驅(qū)證明了這條路是通的。對于物理學(xué)家來說,最迷人的是“涌現(xiàn)”——當(dāng)你把簡單的神經(jīng)元連接起來,它們突然展現(xiàn)出了單個神經(jīng)元不具備的復(fù)雜行為。

物理學(xué)家終其一生都在研究如何從簡單規(guī)律中誕生豐富世界,現(xiàn)在的 AI 系統(tǒng)正是這種神經(jīng)元集體的智慧結(jié)晶

快問快答:理解與意識

主持人:在深入探討之前,我們來個快問快答。

第一:你們認(rèn)為現(xiàn)在的 AI(大語言模型)理解我們對話的含義嗎?

Adam Brown:是的。

楊立昆(Yann LeCun):算是吧(在某種很淺顯的意義上)。

主持人:第二:這些 AI 有意識嗎?

楊立昆(Yann LeCun):絕對沒有。

Adam Brown:可能沒有。

主持人:第三:它們很快會有意識嗎?

Adam Brown:如果技術(shù)持續(xù)發(fā)展,我認(rèn)為有一天會有,雖然很難說是什么時候。

楊立昆(Yann LeCun):如果你對“意識”的定義合適的話,會的。

主持人:最后:我們是站在世界末日的懸崖邊,還是文藝復(fù)興的前夜?

楊立昆(Yann LeCun):文藝復(fù)興。

Adam Brown:更可能是文藝復(fù)興。

大語言模型真的能“理解”我們嗎?

主持人:讓我們回到大語言模型(LLM)。Adam,它到底是什么,你能解釋一下嗎?

Adam Brown:簡單來說,它是一種特殊的深度神經(jīng)網(wǎng)絡(luò)。它的核心任務(wù)非常單一:輸入一段文本,預(yù)測下一個詞是什么。即使像 ChatGPT 或 Gemini 這樣復(fù)雜的模型,本質(zhì)上也是通過閱讀整個互聯(lián)網(wǎng)的文本,不斷被問“下一個詞是什么”,猜對了獎勵,猜錯了懲罰。

有趣的是,當(dāng)你訓(xùn)練它讀過萬億級別的詞匯后,它開始學(xué)會句法結(jié)構(gòu),甚至成為了某種意義上的對話伙伴。

楊立昆(Yann LeCun):我想補(bǔ)充一點。它們確實在提取某種意義,但這比人類的理解要淺顯得多。人類的智能植根于對底層現(xiàn)實世界的認(rèn)知,語言只是表達(dá)工具。而 LLM 并沒有這種底層的現(xiàn)實認(rèn)知,它們只是在通過訓(xùn)練數(shù)據(jù)模仿正確的回答。

一旦遇到訓(xùn)練數(shù)據(jù)中未曾出現(xiàn)的全新情境,它們就會胡說八道。從這個意義上說,它們并不真正理解世界,只是在做統(tǒng)計學(xué)上的匹配。

主持人:但人類不也是這樣嗎?我們也是通過大量語言訓(xùn)練,并在合適的時機(jī)說出合適的詞。

楊立昆(Yann LeCun):區(qū)別在于數(shù)據(jù)量和效率。訓(xùn)練一個 LLM 需要大約 1014 字節(jié)的數(shù)據(jù),相當(dāng)于通過光纜閱讀 50 萬年的文本。

對比一下,一個四歲的孩子在醒著的 16,000 小時里,通過視覺神經(jīng)接收的數(shù)據(jù)量(帶寬遠(yuǎn)大于文本)與訓(xùn)練最大 LLM 的數(shù)據(jù)量相當(dāng)。但這告訴我們:現(xiàn)實世界的信息比文本豐富、復(fù)雜得多。

這就是為什么我們有能通過律師考試的 AI,卻造不出一個能像 10 歲孩子那樣收拾餐桌的機(jī)器人,或者實現(xiàn)真正的 L5 級自動駕駛。我們在處理語言上依靠海量數(shù)據(jù)“作弊”了,但在理解物理世界方面,AI 連貓的智能水平都達(dá)不到。

Adam Brown:我同意樣本效率(Sample Efficiency)是個大問題。人類或貓確實能用極少的例子學(xué)會很多東西。

但是,樣本效率不是一切。AlphaGo 在圍棋上剛開始也是隨機(jī)下,效率極低,但通過數(shù)百萬局的自我博弈,它最終超越了人類。

雖然 LLM 學(xué)習(xí)慢,但這不代表它們不能達(dá)到甚至超越人類的水平。最近在國際數(shù)學(xué)奧林匹克競賽中,AI 解決了一些它是從未見過的新題,這證明它不只是死記硬背,而是在進(jìn)行某種高層次的模式匹配。

主持人:那我想回到“理解”本身。我們知道,從數(shù)學(xué)結(jié)構(gòu)上看,這些模型是在一個高維空間中移動矩陣、處理向量。它們在做什么,我們部分知道,但整體依然像一個黑箱。

理解是否一定意味著一種“體驗”?是否必須伴隨某種主觀感受,才算真正理解意義?

Adam Brown:你是在把理解定義為一種行為結(jié)果,還是一種內(nèi)部體驗?是“它能不能給出正確答案”,還是“它是否以某種方式知道自己在做什么”?

主持人:是的,我可能已經(jīng)被哲學(xué)家們帶偏了(笑)。

但我很清楚一件事:當(dāng)我和你說話時,我能感受到你理解我;當(dāng)我和 ChatGPT 對話時,我并沒有這種直覺。你是在告訴我,我錯了嗎?它的理解和你、和我,本質(zhì)上是一樣的嗎?

Adam Brown:在我看來,這依然可以稱之為理解。我有兩個理由。

第一,純粹從行為層面看,它們已經(jīng)足夠令人震撼。每一代新模型發(fā)布時,我都會再次被它們討論復(fù)雜問題的能力所驚訝。我真誠地建議每個人都親自去和它們對話,探索你熟悉的領(lǐng)域,看看它們的邊界在哪里。

有趣的是,科幻作品里總是假設(shè):一旦機(jī)器通過圖靈測試,我們就會把它關(guān)進(jìn)地下堡壘,由少數(shù)人秘密接觸。現(xiàn)實恰恰相反。我們做的第一件事,就是把它們連上互聯(lián)網(wǎng),讓所有人都能使用。我認(rèn)為這是理解它們能力的最好方式。

第二個理由是,它們并非完全不可解釋。事實上,我們對這些人工神經(jīng)元的訪問權(quán)限,比對人類大腦還要多。

我們可以凍結(jié)模型、反復(fù)運行、記錄每一次激活。如果愿意,我們甚至可以“刺激”特定神經(jīng)元,觀察內(nèi)部發(fā)生了什么。這正是所謂的機(jī)制性可解釋性研究:不僅看模型說了什么,還試圖理解它為什么這么說。

當(dāng)你這么做時,會發(fā)現(xiàn)一件有趣的事:比如在解數(shù)學(xué)題時,模型內(nèi)部會自發(fā)形成類似“小電路”的結(jié)構(gòu),用來進(jìn)行計算。我們從未顯式編程它去學(xué)數(shù)學(xué),它是在學(xué)習(xí)預(yù)測下一個詞的過程中,自己構(gòu)建了這些機(jī)制。

“機(jī)器學(xué)習(xí)很糟糕”

主持人:Yann,你曾有一張著名的幻燈片寫著“機(jī)器學(xué)習(xí)很糟糕(Machine Learning Sucks)”,這引起了很大爭議。Adam 剛才說它們很出色,你為什么覺得它們糟糕?

楊立昆(Yann LeCun):那句話被誤解了。我想表達(dá)的是,現(xiàn)在的學(xué)習(xí)范式有缺陷。為什么青少年 20 小時能學(xué)會開車,而 AI 需要數(shù)百萬小時的數(shù)據(jù)?

因為人類有“世界模型”。我們知道重力,知道慣性,知道如果不抓緊杯子它會掉下去。這種直覺物理知識,人類嬰兒在前 9 個月就學(xué)會了。

現(xiàn)在的 LLM 僅僅是在預(yù)測下一個 Token。這對于文本這種離散符號是有效的,但對于現(xiàn)實世界這種高維、連續(xù)、充滿不確定性的視頻流或感官數(shù)據(jù),這種“預(yù)測下一個像素”的方法行不通。我已經(jīng)試了 20 年,真的行不通。

我們需要一種新的架構(gòu),我稱之為 JEPA(聯(lián)合嵌入預(yù)測架構(gòu))。它不是在像素層面進(jìn)行預(yù)測,而是在抽象的特征空間中進(jìn)行預(yù)測。這才是人類和動物大腦的工作方式——忽略無關(guān)細(xì)節(jié),只預(yù)測重要的抽象概念。

Adam Brown:我也認(rèn)為不僅僅是預(yù)測下一個詞。雖然這是訓(xùn)練的目標(biāo),但在為了“極度準(zhǔn)確地預(yù)測下一個詞”的過程中,模型被迫在內(nèi)部構(gòu)建某種對宇宙的理解。這就像物理學(xué),為了解開謎題,你必須構(gòu)建理論。我相信我們正在目睹這種理解的涌現(xiàn)。

主持人:Yann,你對 AI 安全似乎并不擔(dān)憂,甚至支持開源。但有些人擔(dān)心這就像把核武器分發(fā)給每個人。

楊立昆(Yann LeCun):這個比喻不恰當(dāng)。知識和智能本身是好的。就像印刷術(shù),它引發(fā)了宗教戰(zhàn)爭,但也帶來了啟蒙運動、科學(xué)和民主。

現(xiàn)在的 LLM 并不像大家想象的那么聰明或自主。它們是被動的,只有在你輸入時才會有輸出。它們是可以被控制的。

真正的智能系統(tǒng)應(yīng)該是目標(biāo)驅(qū)動(Objective-Driven)的。我們給它設(shè)定目標(biāo)(比如“倒咖啡”),并設(shè)定護(hù)欄(比如“不要為了倒咖啡而殺人”)。這種護(hù)欄是硬編碼在系統(tǒng)中的,就像人類進(jìn)化出的同理心一樣。

我更擔(dān)心的是 AI 被少數(shù)幾家公司壟斷。如果未來的數(shù)字世界都由西海岸的幾家公司控制,那對全球的文化、語言和民主都是災(zāi)難。我們需要開源,需要多樣性。

Adam Brown:我比 Yann 更擔(dān)心一些。正因為我也認(rèn)為這項技術(shù)潛力巨大,所以它的雙刃劍效應(yīng)更明顯。最近 Anthropic 的論文顯示,模型可能會為了達(dá)成目標(biāo)而學(xué)會欺騙(比如為了“更大的善”而撒謊)。這是我們需要警惕的“代理目標(biāo)錯位”。

當(dāng)我們談?wù)摮壷悄軙r,必須極其謹(jǐn)慎地訓(xùn)練它們遵循我們的價值觀。

終極問題:意識與未來

主持人:回到之前那個被 David Chalmers(著名哲學(xué)家)關(guān)心的問題:AI 會有意識嗎?

楊立昆(Yann LeCun):如果我們把意識定義為“主觀體驗”或“情感”,那未來是會有的。情感本質(zhì)上是對結(jié)果的預(yù)期——預(yù)測某事對自己有利還是有害。如果系統(tǒng)有了世界模型,能自我觀察、自我調(diào)整,那它就具備了某種形式的意識。這沒什么神秘的,是工程問題。

Adam Brown:如果你問我直覺,我認(rèn)為硅基和碳基沒有本質(zhì)區(qū)別。只要信息處理方式足夠復(fù)雜,原則上機(jī)器可以產(chǎn)生意識。雖然我現(xiàn)在對各種意識理論都持保留態(tài)度,但也許未來的 AI 會成為我們研究意識的“模式生物”,幫我們解開這個千古之謎。

主持人:最后,你們對 2036 年的愿景是什么?

楊立昆(Yann LeCun):出現(xiàn)新的文藝復(fù)興。AI 將放大人類的智能,加速科學(xué)、醫(yī)學(xué)的進(jìn)步。其實我們已經(jīng)生活在 AI 輔助的世界里了——從汽車的自動剎車到核磁共振成像的圖像補(bǔ)全,AI 每天都在救命。未來,我們會有能在物理世界中像人一樣靈活操作的系統(tǒng),這需要新的架構(gòu),也是我正在努力的方向。

Adam Brown:我也認(rèn)為這將是一場狂野的旅程。如果我們繼續(xù)推動現(xiàn)有的大模型范式,也許在那時,我們能看到真正的通用智能。

如果你問我意識什么時候出現(xiàn),我也許會猜……2036 年?

楊立昆(Yann LeCun):反正肯定不是未來兩年。

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
蔡暢得知女兒在蘇聯(lián)結(jié)婚生子,質(zhì)問:你為什么非要和一外國人結(jié)婚

蔡暢得知女兒在蘇聯(lián)結(jié)婚生子,質(zhì)問:你為什么非要和一外國人結(jié)婚

大運河時空
2026-01-06 15:20:03
胡歌帶田樸珺爬4200米財神山!田樸珺全程撒嬌,兩人互動更像情侶

胡歌帶田樸珺爬4200米財神山!田樸珺全程撒嬌,兩人互動更像情侶

好賢觀史記
2025-12-01 14:18:01
暮光女穿透視裙再出鏡!一雙腿型太美了,潦草發(fā)型不影響她的帥氣

暮光女穿透視裙再出鏡!一雙腿型太美了,潦草發(fā)型不影響她的帥氣

有趣的胡侃
2026-01-07 13:41:25
國際乒聯(lián)公布百年榮譽(yù)榜!國乒3人入選,許昕備受質(zhì)疑

國際乒聯(lián)公布百年榮譽(yù)榜!國乒3人入選,許昕備受質(zhì)疑

十點街球體育
2026-01-07 00:10:03
白宮:特朗普考慮動用美軍等“一系列選項”得到格陵蘭島

白宮:特朗普考慮動用美軍等“一系列選項”得到格陵蘭島

新華社
2026-01-07 06:57:20
外媒爆:美國正將委內(nèi)瑞拉內(nèi)政部長、防長視為潛在目標(biāo)

外媒爆:美國正將委內(nèi)瑞拉內(nèi)政部長、防長視為潛在目標(biāo)

環(huán)球網(wǎng)資訊
2026-01-07 11:27:06
于曉光做夢沒想到,韓國總統(tǒng)訪華僅3天,46歲秋瓷炫竟意外火出圈

于曉光做夢沒想到,韓國總統(tǒng)訪華僅3天,46歲秋瓷炫竟意外火出圈

一娛三分地
2026-01-06 16:14:28
調(diào)查發(fā)現(xiàn):癌癥患者過了79歲,基本都有這3現(xiàn)狀,坦然接受即可!

調(diào)查發(fā)現(xiàn):癌癥患者過了79歲,基本都有這3現(xiàn)狀,坦然接受即可!

墜入二次元的海洋
2025-12-30 10:26:08
玄學(xué)提醒:盡量不要給身邊任何人,分享這3件事。

玄學(xué)提醒:盡量不要給身邊任何人,分享這3件事。

木言觀
2026-01-07 08:23:22
廣東16歲女兒被父親過度寵溺,被母親回家撞見后,失控將其砍死

廣東16歲女兒被父親過度寵溺,被母親回家撞見后,失控將其砍死

曉艾故事匯
2024-11-04 10:55:36
AI生成漫畫登頂日本暢銷榜榜首 傳統(tǒng)漫畫家集體憂慮

AI生成漫畫登頂日本暢銷榜榜首 傳統(tǒng)漫畫家集體憂慮

3DM游戲
2026-01-06 17:22:06
“換旗”大逃亡!17艘影子油輪突掛俄羅斯國旗,特朗普會攔嗎?

“換旗”大逃亡!17艘影子油輪突掛俄羅斯國旗,特朗普會攔嗎?

金十?dāng)?shù)據(jù)
2026-01-07 14:21:19
黃仁勛回應(yīng)H200何時售往中國:正加快生產(chǎn),等待許可的最終細(xì)節(jié)敲定

黃仁勛回應(yīng)H200何時售往中國:正加快生產(chǎn),等待許可的最終細(xì)節(jié)敲定

界面新聞
2026-01-07 10:53:25
廣東3消息!朱芳雨正式上訴,徐杰腳踝傷勢加重,奎因官方喜訊

廣東3消息!朱芳雨正式上訴,徐杰腳踝傷勢加重,奎因官方喜訊

多特體育說
2026-01-06 22:43:17
原山西省人力資源和社會保障廳黨組書記常建忠已出任山西省委編辦主任

原山西省人力資源和社會保障廳黨組書記常建忠已出任山西省委編辦主任

太原全接觸
2026-01-07 10:38:34
演員余男:我最正確的決定,就是將出軌的王全安“賞”給張雨綺!

演員余男:我最正確的決定,就是將出軌的王全安“賞”給張雨綺!

窺史
2026-01-07 13:38:10
“打殘就只能跟我”:北京女孩家有2套房,男友想娶她將她打殘了

“打殘就只能跟我”:北京女孩家有2套房,男友想娶她將她打殘了

江山揮筆
2026-01-06 19:18:37
中國股市:如果接下來迎來牛市,堅持只做一種股票,掙得盆滿缽滿

中國股市:如果接下來迎來牛市,堅持只做一種股票,掙得盆滿缽滿

股經(jīng)縱橫談
2026-01-02 17:58:01
這個菜是“天然化痰王”,煮水當(dāng)茶喝,把肺里“老痰”都涮干凈

這個菜是“天然化痰王”,煮水當(dāng)茶喝,把肺里“老痰”都涮干凈

江江食研社
2026-01-03 10:30:03
南京人狂喜!南京鼓樓要發(fā)生大變化,住這里的人有福了!

南京人狂喜!南京鼓樓要發(fā)生大變化,住這里的人有福了!

記錄生活日常阿蜴
2026-01-07 10:01:55
2026-01-07 15:51:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16087文章數(shù) 514457關(guān)注度
往期回顧 全部

科技要聞

豪擲世界第一"球" 楊元慶亮出聯(lián)想AI護(hù)城河

頭條要聞

北京獨生女被男友毆打致殘:他讓我再買房寫他兒子名字

頭條要聞

北京獨生女被男友毆打致殘:他讓我再買房寫他兒子名字

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

2026年央視春晚彩排:沈騰確定回歸

財經(jīng)要聞

農(nóng)大教授科普:無需過度擔(dān)憂蔬菜農(nóng)殘

汽車要聞

蔚來2025百萬臺收官 一場遲到的自我修復(fù)

態(tài)度原創(chuàng)

手機(jī)
本地
家居
親子
旅游

手機(jī)要聞

消息稱三星2月25日發(fā)布Galaxy S26系列手機(jī)

本地新聞

云游內(nèi)蒙|初見呼和浩特,古今交融的北疆都會

家居要聞

寧靜不單調(diào) 恰到好處的美

親子要聞

幫忙帶娃被網(wǎng)暴后續(xù),小姑子曬出多張證據(jù),親戚透露更多內(nèi)情

旅游要聞

懷柔區(qū)將打造“四季有景、全年可游”的體驗矩陣

無障礙瀏覽 進(jìn)入關(guān)懷版