国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型真懂你嗎?楊立昆最新論辯:它連貓的智能都還不如

0
分享至

大語言模型真的“理解”我們說的話嗎?它們有沒有意識?它們是通往通用人工智能的跳板,還是只是出色的語言模仿者?

近期,Meta 首席科學(xué)家楊立昆(Yann LeCun)與 DeepMind 高級研究科學(xué)家 Adam Brown 在紐約展開了一場對談,試圖厘清這些模糊卻至關(guān)重要的邊界。


(來源:Youtube)

當主持人拋出“大語言模型是否理解意義”這一難題時,Adam Brown 給出了肯定的回答,認為模型已展現(xiàn)出某種形式的理解力——不僅能解答復(fù)雜物理問題,還能在全新數(shù)學(xué)競賽題中擊敗絕大多數(shù)人類選手。

而 LeCun 則更為謹慎。他認為模型的“理解”是表層的、統(tǒng)計性的,缺乏常識與因果推理能力。

他舉了一個例子:一個四歲孩子通過感官與物理世界互動所獲得的信息量,與最大語言模型訓(xùn)練所用的 30 萬億詞文本相當,但前者能學(xué)會倒水、收拾餐桌,后者卻連洗碗都做不到。

兩人在“意識”問題上也展現(xiàn)出差異。Brown 認為,若當前技術(shù)持續(xù)演進,AI 未來可能具備某種形式的意識。LeCun 則強調(diào),意識若被定義為“自我觀測與目標驅(qū)動的調(diào)節(jié)能力”,那確實可被構(gòu)建,但當下系統(tǒng)遠未達到。

盡管觀點有所不同,兩位科學(xué)家都認同:如今的大語言模型已展現(xiàn)出驚人能力,但其路徑存在天花板。LeCun 認為若將全部資源押注于“預(yù)測下一個詞”的范式,我們將錯失真正理解世界的 AI 架構(gòu)。

他正推動如 JEPA(聯(lián)合嵌入預(yù)測架構(gòu))等新方向,嘗試讓機器在抽象表征空間中學(xué)習物理規(guī)律與因果關(guān)系,而非僅在文本中挖掘模式。

以下為對談內(nèi)容,DeepTech 做了不改變原意的編輯:

從“受啟發(fā)”到“涌現(xiàn)”:神經(jīng)網(wǎng)絡(luò)如何走向智能

主持人:今天,我想先從最基礎(chǔ)的地方談起——從技術(shù)本身開始。

先聊聊神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)常被說成是“模仿人類大腦”的產(chǎn)物,Yann,你能解釋一下,這種“模仿”究竟意味著什么嗎?

楊立昆(Yann LeCun):這不完全是模仿,更像是啟發(fā)。這就好比飛機的發(fā)明是受鳥類啟發(fā),但飛機的機翼結(jié)構(gòu)和鳥的翅膀大不相同,雖然背后的空氣動力學(xué)原理相似。神經(jīng)網(wǎng)絡(luò)和大腦的關(guān)系也是如此:雖然極度簡化,但底層的學(xué)習原理可能是一致的。

我們并不完全清楚大腦是如何組織和學(xué)習的,所以發(fā)明了替代方案。在神經(jīng)網(wǎng)絡(luò)中,我們通過調(diào)整模擬神經(jīng)元之間連接的有效性(即“參數(shù)”)來進行學(xué)習。目前最大的神經(jīng)網(wǎng)絡(luò)擁有數(shù)千億甚至更多的參數(shù)。

主持人:那是如何演變到今天的“深度學(xué)習”的?

楊立昆(Yann LeCun):這大概源于 80 年代。早期的單層神經(jīng)網(wǎng)絡(luò)只能處理簡單任務(wù)。雖然 60 年代人們就意識到需要多層網(wǎng)絡(luò),但當時受限于使用了錯誤的神經(jīng)元模型(二進制神經(jīng)元)。直到 80 年代,我們引入了具有“漸進響應(yīng)”特性的神經(jīng)元,反向傳播算法才變得可行。

這個領(lǐng)域曾一度被計算機科學(xué)界看衰,名聲不佳。直到 2000 年代初,我們將其重命名為“深度學(xué)習”,并隨著其在計算機視覺、自然語言處理等領(lǐng)域的驚人表現(xiàn),才真正說服了世界。

主持人:Adam,你是物理學(xué)背景,從旁觀者變成了參與者。是什么讓你覺得 AI 值得投入?

Adam Brown:這很大程度上歸功于 LeCun 等先驅(qū)證明了這條路是通的。對于物理學(xué)家來說,最迷人的是“涌現(xiàn)”——當你把簡單的神經(jīng)元連接起來,它們突然展現(xiàn)出了單個神經(jīng)元不具備的復(fù)雜行為。

物理學(xué)家終其一生都在研究如何從簡單規(guī)律中誕生豐富世界,現(xiàn)在的 AI 系統(tǒng)正是這種神經(jīng)元集體的智慧結(jié)晶

快問快答:理解與意識

主持人:在深入探討之前,我們來個快問快答。

第一:你們認為現(xiàn)在的 AI(大語言模型)理解我們對話的含義嗎?

Adam Brown:是的。

楊立昆(Yann LeCun):算是吧(在某種很淺顯的意義上)。

主持人:第二:這些 AI 有意識嗎?

楊立昆(Yann LeCun):絕對沒有。

Adam Brown:可能沒有。

主持人:第三:它們很快會有意識嗎?

Adam Brown:如果技術(shù)持續(xù)發(fā)展,我認為有一天會有,雖然很難說是什么時候。

楊立昆(Yann LeCun):如果你對“意識”的定義合適的話,會的。

主持人:最后:我們是站在世界末日的懸崖邊,還是文藝復(fù)興的前夜?

楊立昆(Yann LeCun):文藝復(fù)興。

Adam Brown:更可能是文藝復(fù)興。

大語言模型真的能“理解”我們嗎?

主持人:讓我們回到大語言模型(LLM)。Adam,它到底是什么,你能解釋一下嗎?

Adam Brown:簡單來說,它是一種特殊的深度神經(jīng)網(wǎng)絡(luò)。它的核心任務(wù)非常單一:輸入一段文本,預(yù)測下一個詞是什么。即使像 ChatGPT 或 Gemini 這樣復(fù)雜的模型,本質(zhì)上也是通過閱讀整個互聯(lián)網(wǎng)的文本,不斷被問“下一個詞是什么”,猜對了獎勵,猜錯了懲罰。

有趣的是,當你訓(xùn)練它讀過萬億級別的詞匯后,它開始學(xué)會句法結(jié)構(gòu),甚至成為了某種意義上的對話伙伴。

楊立昆(Yann LeCun):我想補充一點。它們確實在提取某種意義,但這比人類的理解要淺顯得多。人類的智能植根于對底層現(xiàn)實世界的認知,語言只是表達工具。而 LLM 并沒有這種底層的現(xiàn)實認知,它們只是在通過訓(xùn)練數(shù)據(jù)模仿正確的回答。

一旦遇到訓(xùn)練數(shù)據(jù)中未曾出現(xiàn)的全新情境,它們就會胡說八道。從這個意義上說,它們并不真正理解世界,只是在做統(tǒng)計學(xué)上的匹配。

主持人:但人類不也是這樣嗎?我們也是通過大量語言訓(xùn)練,并在合適的時機說出合適的詞。

楊立昆(Yann LeCun):區(qū)別在于數(shù)據(jù)量和效率。訓(xùn)練一個 LLM 需要大約 1014 字節(jié)的數(shù)據(jù),相當于通過光纜閱讀 50 萬年的文本。

對比一下,一個四歲的孩子在醒著的 16,000 小時里,通過視覺神經(jīng)接收的數(shù)據(jù)量(帶寬遠大于文本)與訓(xùn)練最大 LLM 的數(shù)據(jù)量相當。但這告訴我們:現(xiàn)實世界的信息比文本豐富、復(fù)雜得多。

這就是為什么我們有能通過律師考試的 AI,卻造不出一個能像 10 歲孩子那樣收拾餐桌的機器人,或者實現(xiàn)真正的 L5 級自動駕駛。我們在處理語言上依靠海量數(shù)據(jù)“作弊”了,但在理解物理世界方面,AI 連貓的智能水平都達不到。

Adam Brown:我同意樣本效率(Sample Efficiency)是個大問題。人類或貓確實能用極少的例子學(xué)會很多東西。

但是,樣本效率不是一切。AlphaGo 在圍棋上剛開始也是隨機下,效率極低,但通過數(shù)百萬局的自我博弈,它最終超越了人類。

雖然 LLM 學(xué)習慢,但這不代表它們不能達到甚至超越人類的水平。最近在國際數(shù)學(xué)奧林匹克競賽中,AI 解決了一些它是從未見過的新題,這證明它不只是死記硬背,而是在進行某種高層次的模式匹配。

主持人:那我想回到“理解”本身。我們知道,從數(shù)學(xué)結(jié)構(gòu)上看,這些模型是在一個高維空間中移動矩陣、處理向量。它們在做什么,我們部分知道,但整體依然像一個黑箱。

理解是否一定意味著一種“體驗”?是否必須伴隨某種主觀感受,才算真正理解意義?

Adam Brown:你是在把理解定義為一種行為結(jié)果,還是一種內(nèi)部體驗?是“它能不能給出正確答案”,還是“它是否以某種方式知道自己在做什么”?

主持人:是的,我可能已經(jīng)被哲學(xué)家們帶偏了(笑)。

但我很清楚一件事:當我和你說話時,我能感受到你理解我;當我和 ChatGPT 對話時,我并沒有這種直覺。你是在告訴我,我錯了嗎?它的理解和你、和我,本質(zhì)上是一樣的嗎?

Adam Brown:在我看來,這依然可以稱之為理解。我有兩個理由。

第一,純粹從行為層面看,它們已經(jīng)足夠令人震撼。每一代新模型發(fā)布時,我都會再次被它們討論復(fù)雜問題的能力所驚訝。我真誠地建議每個人都親自去和它們對話,探索你熟悉的領(lǐng)域,看看它們的邊界在哪里。

有趣的是,科幻作品里總是假設(shè):一旦機器通過圖靈測試,我們就會把它關(guān)進地下堡壘,由少數(shù)人秘密接觸?,F(xiàn)實恰恰相反。我們做的第一件事,就是把它們連上互聯(lián)網(wǎng),讓所有人都能使用。我認為這是理解它們能力的最好方式。

第二個理由是,它們并非完全不可解釋。事實上,我們對這些人工神經(jīng)元的訪問權(quán)限,比對人類大腦還要多。

我們可以凍結(jié)模型、反復(fù)運行、記錄每一次激活。如果愿意,我們甚至可以“刺激”特定神經(jīng)元,觀察內(nèi)部發(fā)生了什么。這正是所謂的機制性可解釋性研究:不僅看模型說了什么,還試圖理解它為什么這么說。

當你這么做時,會發(fā)現(xiàn)一件有趣的事:比如在解數(shù)學(xué)題時,模型內(nèi)部會自發(fā)形成類似“小電路”的結(jié)構(gòu),用來進行計算。我們從未顯式編程它去學(xué)數(shù)學(xué),它是在學(xué)習預(yù)測下一個詞的過程中,自己構(gòu)建了這些機制。

“機器學(xué)習很糟糕”

主持人:Yann,你曾有一張著名的幻燈片寫著“機器學(xué)習很糟糕(Machine Learning Sucks)”,這引起了很大爭議。Adam 剛才說它們很出色,你為什么覺得它們糟糕?

楊立昆(Yann LeCun):那句話被誤解了。我想表達的是,現(xiàn)在的學(xué)習范式有缺陷。為什么青少年 20 小時能學(xué)會開車,而 AI 需要數(shù)百萬小時的數(shù)據(jù)?

因為人類有“世界模型”。我們知道重力,知道慣性,知道如果不抓緊杯子它會掉下去。這種直覺物理知識,人類嬰兒在前 9 個月就學(xué)會了。

現(xiàn)在的 LLM 僅僅是在預(yù)測下一個 Token。這對于文本這種離散符號是有效的,但對于現(xiàn)實世界這種高維、連續(xù)、充滿不確定性的視頻流或感官數(shù)據(jù),這種“預(yù)測下一個像素”的方法行不通。我已經(jīng)試了 20 年,真的行不通。

我們需要一種新的架構(gòu),我稱之為 JEPA(聯(lián)合嵌入預(yù)測架構(gòu))。它不是在像素層面進行預(yù)測,而是在抽象的特征空間中進行預(yù)測。這才是人類和動物大腦的工作方式——忽略無關(guān)細節(jié),只預(yù)測重要的抽象概念。

Adam Brown:我也認為不僅僅是預(yù)測下一個詞。雖然這是訓(xùn)練的目標,但在為了“極度準確地預(yù)測下一個詞”的過程中,模型被迫在內(nèi)部構(gòu)建某種對宇宙的理解。這就像物理學(xué),為了解開謎題,你必須構(gòu)建理論。我相信我們正在目睹這種理解的涌現(xiàn)。

主持人:Yann,你對 AI 安全似乎并不擔憂,甚至支持開源。但有些人擔心這就像把核武器分發(fā)給每個人。

楊立昆(Yann LeCun):這個比喻不恰當。知識和智能本身是好的。就像印刷術(shù),它引發(fā)了宗教戰(zhàn)爭,但也帶來了啟蒙運動、科學(xué)和民主。

現(xiàn)在的 LLM 并不像大家想象的那么聰明或自主。它們是被動的,只有在你輸入時才會有輸出。它們是可以被控制的。

真正的智能系統(tǒng)應(yīng)該是目標驅(qū)動(Objective-Driven)的。我們給它設(shè)定目標(比如“倒咖啡”),并設(shè)定護欄(比如“不要為了倒咖啡而殺人”)。這種護欄是硬編碼在系統(tǒng)中的,就像人類進化出的同理心一樣。

我更擔心的是 AI 被少數(shù)幾家公司壟斷。如果未來的數(shù)字世界都由西海岸的幾家公司控制,那對全球的文化、語言和民主都是災(zāi)難。我們需要開源,需要多樣性。

Adam Brown:我比 Yann 更擔心一些。正因為我也認為這項技術(shù)潛力巨大,所以它的雙刃劍效應(yīng)更明顯。最近 Anthropic 的論文顯示,模型可能會為了達成目標而學(xué)會欺騙(比如為了“更大的善”而撒謊)。這是我們需要警惕的“代理目標錯位”。

當我們談?wù)摮壷悄軙r,必須極其謹慎地訓(xùn)練它們遵循我們的價值觀。

終極問題:意識與未來

主持人:回到之前那個被 David Chalmers(著名哲學(xué)家)關(guān)心的問題:AI 會有意識嗎?

楊立昆(Yann LeCun):如果我們把意識定義為“主觀體驗”或“情感”,那未來是會有的。情感本質(zhì)上是對結(jié)果的預(yù)期——預(yù)測某事對自己有利還是有害。如果系統(tǒng)有了世界模型,能自我觀察、自我調(diào)整,那它就具備了某種形式的意識。這沒什么神秘的,是工程問題。

Adam Brown:如果你問我直覺,我認為硅基和碳基沒有本質(zhì)區(qū)別。只要信息處理方式足夠復(fù)雜,原則上機器可以產(chǎn)生意識。雖然我現(xiàn)在對各種意識理論都持保留態(tài)度,但也許未來的 AI 會成為我們研究意識的“模式生物”,幫我們解開這個千古之謎。

主持人:最后,你們對 2036 年的愿景是什么?

楊立昆(Yann LeCun):出現(xiàn)新的文藝復(fù)興。AI 將放大人類的智能,加速科學(xué)、醫(yī)學(xué)的進步。其實我們已經(jīng)生活在 AI 輔助的世界里了——從汽車的自動剎車到核磁共振成像的圖像補全,AI 每天都在救命。未來,我們會有能在物理世界中像人一樣靈活操作的系統(tǒng),這需要新的架構(gòu),也是我正在努力的方向。

Adam Brown:我也認為這將是一場狂野的旅程。如果我們繼續(xù)推動現(xiàn)有的大模型范式,也許在那時,我們能看到真正的通用智能。

如果你問我意識什么時候出現(xiàn),我也許會猜……2036 年?

楊立昆(Yann LeCun):反正肯定不是未來兩年。

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
2月17號才過年就算了,2026年春節(jié)直接把人整懵了!

2月17號才過年就算了,2026年春節(jié)直接把人整懵了!

刺頭體育
2025-12-14 16:52:39
正式離任,王勵勤免職,上海官宣,總局有準備,莎頭退賽被喊下課

正式離任,王勵勤免職,上海官宣,總局有準備,莎頭退賽被喊下課

樂聊球
2025-12-18 09:26:34
漲停潮!商業(yè)航天到底在漲什么,最全概念股一覽

漲停潮!商業(yè)航天到底在漲什么,最全概念股一覽

金石隨筆
2025-12-19 00:11:27
李湘為女鋪路太過,帶16歲王詩齡,硬往何超瓊霍啟剛等大佬圈層擠

李湘為女鋪路太過,帶16歲王詩齡,硬往何超瓊霍啟剛等大佬圈層擠

洲洲影視娛評
2025-12-17 16:32:09
蒙古國又出昏招!蒙古國女外長狂妄至極,推行“第三鄰國”政策

蒙古國又出昏招!蒙古國女外長狂妄至極,推行“第三鄰國”政策

百態(tài)人間
2025-12-18 16:46:19
恭喜成功生子!突然宣布懷孕無人知,產(chǎn)后復(fù)出狀態(tài)超好

恭喜成功生子!突然宣布懷孕無人知,產(chǎn)后復(fù)出狀態(tài)超好

人間頌
2025-12-18 12:47:10
商務(wù)部:關(guān)于長和出售海外港口資產(chǎn) 中國政府將依法進行審查監(jiān)管

商務(wù)部:關(guān)于長和出售海外港口資產(chǎn) 中國政府將依法進行審查監(jiān)管

每日經(jīng)濟新聞
2025-12-18 16:13:06
孫穎莎不是因傷退賽,WTT給出答案,和其他選手退賽不同

孫穎莎不是因傷退賽,WTT給出答案,和其他選手退賽不同

子水體娛
2025-12-18 16:30:27
利物浦獲意外補強!兩大租將冬窗回歸 火速馳援斯洛特

利物浦獲意外補強!兩大租將冬窗回歸 火速馳援斯洛特

球事百科吖
2025-12-19 06:03:33
運-30首飛背后:中國為何選擇四發(fā)渦槳這條“最難的路”?

運-30首飛背后:中國為何選擇四發(fā)渦槳這條“最難的路”?

Hi秒懂科普
2025-12-17 17:11:16
激動!全國輔警2025年底換裝藍制服,重視與威嚴藏在統(tǒng)一著裝里?

激動!全國輔警2025年底換裝藍制服,重視與威嚴藏在統(tǒng)一著裝里?

今朝牛馬
2025-12-17 22:38:13
社會主義中國不能允許如此大規(guī)模當?shù)?>
    </a>
        <h3>
      <a href=凱利經(jīng)濟觀察
2025-12-18 09:35:23
摩根大通警示美股極端擁擠 并點名六只高風險個股

摩根大通警示美股極端擁擠 并點名六只高風險個股

財聯(lián)社
2025-12-18 22:19:10
日本美女主播閃婚小泉進次郎,顏值高身材火辣,被爆有不雅視頻

日本美女主播閃婚小泉進次郎,顏值高身材火辣,被爆有不雅視頻

卷史
2025-12-16 13:41:39
別低估了30年房貸的威力!貸200萬還了5年,結(jié)果本金竟然一分沒還

別低估了30年房貸的威力!貸200萬還了5年,結(jié)果本金竟然一分沒還

裝修秀
2025-12-08 10:30:03
李澤楷被她迷,林丹為她不顧妻兒,她究竟有什么魅力?

李澤楷被她迷,林丹為她不顧妻兒,她究竟有什么魅力?

趣文說娛
2025-12-12 18:03:47
蒯曼-陳熠-張本美和-大藤沙月-橋本帆乃香-金娜英的最新世界排名

蒯曼-陳熠-張本美和-大藤沙月-橋本帆乃香-金娜英的最新世界排名

陌識
2025-12-19 06:43:48
劉衛(wèi)東被查前,干了兩件最不要臉的事。

劉衛(wèi)東被查前,干了兩件最不要臉的事。

南權(quán)先生
2025-12-18 16:50:39
阿隆索欽點!曝皇馬欲撬巴黎隊魂 轉(zhuǎn)會費高達1億歐

阿隆索欽點!曝皇馬欲撬巴黎隊魂 轉(zhuǎn)會費高達1億歐

球事百科吖
2025-12-19 06:06:17
合砍104分!火箭首發(fā)5虎得分皆上雙!雙核歸隊后,烏度卡不需變陣

合砍104分!火箭首發(fā)5虎得分皆上雙!雙核歸隊后,烏度卡不需變陣

熊哥愛籃球
2025-12-18 11:42:25
2025-12-19 08:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16014文章數(shù) 514410關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

美媒:美國下水一艘新軍艦中國已造好三艘 差距驚人

頭條要聞

美媒:美國下水一艘新軍艦中國已造好三艘 差距驚人

體育要聞

紐約尼克斯,板正的球隊

娛樂要聞

絲芭放大招了!實名舉報鞠婧祎經(jīng)濟犯罪

財經(jīng)要聞

尹艷林:呼吁加快2.5億新市民落戶進程

汽車要聞

在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

態(tài)度原創(chuàng)

本地
數(shù)碼
房產(chǎn)
藝術(shù)
公開課

本地新聞

云游安徽|決戰(zhàn)烽火照古今,千秋一脈看宿州

數(shù)碼要聞

AMD Zen 6獲GCC 16編譯器支持 開源優(yōu)化提前鎖定2026新平臺

房產(chǎn)要聞

搶藏瘋潮!封關(guān)時代,海口頂奢王炸壓軸,傳世資產(chǎn)即刻登場!

藝術(shù)要聞

李苦禪寫菊,酣暢淋漓

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版