国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

李飛飛一年前究竟說了啥?怎么又火了

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

大語言模型的局限在哪里?

AI教母李飛飛這樣說:

大自然中是沒有語言存在的,你不會(huì)從天空中直接看到文字。
語言是一種純粹的生成的信號(hào)。



語言信號(hào)的輸出主要基于人類給的輸入信號(hào),可以說,語言是不獨(dú)立于人之外的。

然而,物理世界是客觀存在的。所以提取、理解、生成3D世界的數(shù)據(jù)、實(shí)現(xiàn)空間智能和處理語言問題時(shí)截然不同。



沒想到,李飛飛一年前的訪談被扒出來,又引發(fā)大量圍觀。

她這段話意味著,大語言模型或許還不是真正的智能。

真正的智能將是信號(hào)感知、物理以及和現(xiàn)實(shí)世界相結(jié)合的產(chǎn)物。



下面來看看大家還在熱議些啥吧。

空間智能可以借鑒語言模型,但仍存在本質(zhì)差異

這場(chǎng)討論的焦點(diǎn)在于,現(xiàn)在基于語言信號(hào)訓(xùn)練的模型到底懂不懂物理世界的常識(shí)

首先,回顧一下李飛飛的說法。

她認(rèn)為語言模型及當(dāng)今的多模態(tài)語言模型的底層表示是一維的。它們?cè)诟旧暇褪遣僮饔陔x散token的一維序列上,所以模型對(duì)于書面文本這種一維序列的表示是非常自然的。



然而,在處理空間智能問題時(shí),核心是世界的三維本質(zhì)。

雖然多模態(tài)大語言模型也能看圖像,但它是將其他模態(tài)硬塞進(jìn)這種一維token序列的底層表示中,這種一維且由人類生成的數(shù)據(jù),可能無法很好地表示物理世界,造成信息損失。

如果直接讓模型處理3D數(shù)據(jù),那么表示類型與模型旨在執(zhí)行的任務(wù)類型之間將會(huì)有更好的匹配。



而空間智能的挑戰(zhàn)就是在于從這個(gè)真實(shí)世界中提取、表示和生成信息。

除了這個(gè)維度上的差異,從更哲學(xué)的角度來說,她認(rèn)為語言是一種純粹由生成產(chǎn)生的信號(hào)。自然界中并不存在預(yù)設(shè)的語言形式,也就是說語言不能獨(dú)立于人類之外。

大模型能夠通過學(xué)習(xí)并反芻所輸入的數(shù)據(jù),無論輸入什么樣的數(shù)據(jù),模型都能用足夠的泛化能力處理語言任務(wù)。這是因?yàn)檎Z言,或者說文本的本質(zhì)允許模型在生成范式下表現(xiàn)得出色。



與語言不同,3D世界是真實(shí)存在于外部的。這個(gè)世界遵循著物理定律,并因材料等多種因素而具有其自身的結(jié)構(gòu)。

因此,要讓模型倒推出3D世界的信息,并能夠表示和生成它,在技術(shù)層面上,空間智能可以借鑒語言模型,但從哲學(xué)的范疇來看,這兩者仍存在本質(zhì)差異。



有人舉了一堆例子來證明李飛飛的觀點(diǎn),同時(shí)說明語言模型在理解物理世界時(shí)確實(shí)有局限。

基于語言信號(hào)訓(xùn)練的模型在物理世界任務(wù)中表現(xiàn)差

比如用一個(gè)小實(shí)驗(yàn)來測(cè)試Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三個(gè)多模態(tài)大模型的物理常識(shí),并與人類兒童表現(xiàn)做對(duì)比。



研究用Animal-AI這個(gè)用來測(cè)試動(dòng)物和人工智能體物理認(rèn)知的3D環(huán)境來測(cè)試大模型,讓大模型通過前進(jìn)/后退、左轉(zhuǎn)/右轉(zhuǎn)、環(huán)境描述與規(guī)劃控制三個(gè)指令控制一個(gè)小角色在虛擬環(huán)境中完成任務(wù)。



第一個(gè)實(shí)驗(yàn)是讓大模型完成一些簡(jiǎn)單的任務(wù),如直接找到小球,還有一些稍難的任務(wù),如躲開障礙物找到小球。

結(jié)果發(fā)現(xiàn)模型只能搞定最簡(jiǎn)單的任務(wù),稍難一點(diǎn)就不行了。

第二個(gè)實(shí)驗(yàn)是在第一個(gè)實(shí)驗(yàn)的基礎(chǔ)上增加教學(xué)案例,比如演示正確做法,結(jié)果模型表現(xiàn)也沒有明顯的提升。

對(duì)比之后再看,這些大模型的表現(xiàn)遠(yuǎn)不及人類兒童,也比不上專門為這個(gè)環(huán)境測(cè)試的機(jī)器人。



還有其他研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)名為ABench-Physics的工具,專門用來測(cè)試大語言模型在物理推理方面的能力,核心就是想搞清楚這些模型到底能不能真的理解物理、解決物理問題。



測(cè)試分兩部分,Phy A由400道競(jìng)賽級(jí)別的物理難題組成,先給大模型來個(gè)基礎(chǔ)測(cè)試。

Phy B屬于動(dòng)態(tài)部分:修改Phy A中題目的數(shù)字,但不改變物理原理,用來測(cè)試大模型能不能進(jìn)行靈活的物理推理。

結(jié)果顯示,最厲害的模型在Phy A上的正確率只有43%,而在Phy B中模型的平均準(zhǔn)確率下降了22.5%。

這說明模型并不是真懂物理。



還有團(tuán)隊(duì)用視覺任務(wù)測(cè)試大模型,比如讓模型判斷照片中哪些物體更近,或者匹配相同的事物。

人類對(duì)這些任務(wù)的正確率能達(dá)到95.7%,而幾個(gè)模型最高的正確率僅有51%。在視覺感知上,大模型還遠(yuǎn)不及人類。



這些結(jié)果都進(jìn)一步證明了李飛飛之前訪談中關(guān)于大模型理解真實(shí)物理世界局限性的觀點(diǎn)。

也得到了網(wǎng)友們的認(rèn)同。



模型的開發(fā)確實(shí)正在擴(kuò)展到將模型建立在物理與多模態(tài)理解的基礎(chǔ)上。



討論升級(jí)

當(dāng)然了,有正方就有反方。

有人先是反駁了關(guān)于語言的論述。



也有人認(rèn)為,在某些情況下,語言描述現(xiàn)實(shí)的能力可能會(huì)比感知更優(yōu)。



還有人說模型的語言不用局限于人類的語言、文本等,人工智能或許能創(chuàng)造出自己的語言來理解物理世界。



或者,我們?cè)撍伎?,用語言訓(xùn)練大模型取得現(xiàn)有成就的根本因素又是什么呢?



對(duì)于這場(chǎng)討論,你又有什么樣的看法呢?


[1]https://x.com/rohanpaul_ai/status/1965242567085490547
[2]https://www.youtube.com/watch?v=vIXfYFB7aBI

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
隨著一場(chǎng)奪冠 斯諾克最新排名:丁俊暉升第14 趙心童第5中國一哥

隨著一場(chǎng)奪冠 斯諾克最新排名:丁俊暉升第14 趙心童第5中國一哥

削桐作琴
2026-03-02 17:17:08
男子愛吃蒸蘋果3個(gè)月后去體檢,體檢結(jié)果出來后,納悶:吃的啥?

男子愛吃蒸蘋果3個(gè)月后去體檢,體檢結(jié)果出來后,納悶:吃的啥?

路醫(yī)生健康科普
2026-03-02 17:31:11
中方呼吁美以立即停止對(duì)伊軍事行動(dòng)

中方呼吁美以立即停止對(duì)伊軍事行動(dòng)

看看新聞Knews
2026-03-01 12:31:25
“整個(gè)寒假都不弄,開學(xué)了帶孩子整牙!”二百萬媽媽又火了!

“整個(gè)寒假都不弄,開學(xué)了帶孩子整牙!”二百萬媽媽又火了!

知曉科普
2026-02-28 20:17:30
430分生死戰(zhàn)!鄭欽文亮出隱藏殺招,新教練能否救贖23位危機(jī)?

430分生死戰(zhàn)!鄭欽文亮出隱藏殺招,新教練能否救贖23位危機(jī)?

卿子書
2026-03-02 09:48:37
美國對(duì)中國滲透沒白費(fèi),扶持的“內(nèi)鬼”,終于開始在中國露頭了

美國對(duì)中國滲透沒白費(fèi),扶持的“內(nèi)鬼”,終于開始在中國露頭了

歷史求知所
2025-12-01 11:30:06
原來他已去世9年,45歲離世留下年幼孩子,王寶強(qiáng)張譯葬禮上痛哭

原來他已去世9年,45歲離世留下年幼孩子,王寶強(qiáng)張譯葬禮上痛哭

白面書誏
2026-03-02 17:21:56
突發(fā)要聞!中國通告全球:王毅同伊朗外長(zhǎng)阿拉格齊通電話

突發(fā)要聞!中國通告全球:王毅同伊朗外長(zhǎng)阿拉格齊通電話

科技處長(zhǎng)
2026-03-02 22:17:02
美國中央司令部稱正持續(xù)空襲伊朗

美國中央司令部稱正持續(xù)空襲伊朗

每日經(jīng)濟(jì)新聞
2026-03-02 11:39:51
48小時(shí)送走哈梅內(nèi)伊:令人恐怖的技術(shù)代差,現(xiàn)代戰(zhàn)爭(zhēng)的形態(tài)變了

48小時(shí)送走哈梅內(nèi)伊:令人恐怖的技術(shù)代差,現(xiàn)代戰(zhàn)爭(zhēng)的形態(tài)變了

黑企鵝觀察
2026-03-01 14:40:34
清華大學(xué)副校長(zhǎng):要求大一至大三學(xué)生每學(xué)期至少完成24次課外鍛煉 不會(huì)游泳不能畢業(yè)

清華大學(xué)副校長(zhǎng):要求大一至大三學(xué)生每學(xué)期至少完成24次課外鍛煉 不會(huì)游泳不能畢業(yè)

紅星新聞
2026-02-27 16:40:25
伊朗越打越猛,14座美軍基地遇襲,數(shù)百名美軍死傷?特朗普急了

伊朗越打越猛,14座美軍基地遇襲,數(shù)百名美軍死傷?特朗普急了

墨羽怪談
2026-03-02 21:30:37
知名主持人暴瘦到認(rèn)不出,五年進(jìn)4次ICU,病重時(shí)前妻分走大半財(cái)產(chǎn)

知名主持人暴瘦到認(rèn)不出,五年進(jìn)4次ICU,病重時(shí)前妻分走大半財(cái)產(chǎn)

夢(mèng)錄的西方史話
2026-03-02 16:28:20
又有5國參戰(zhàn)!中東亂成一鍋粥,美媒再爆料:沙特欺騙了全世界

又有5國參戰(zhàn)!中東亂成一鍋粥,美媒再爆料:沙特欺騙了全世界

東極妙嚴(yán)
2026-03-02 15:50:51
一只蒼蠅困死整個(gè)大陸?無法種地不能養(yǎng)馬,這才是非洲的窮根!

一只蒼蠅困死整個(gè)大陸?無法種地不能養(yǎng)馬,這才是非洲的窮根!

你是我心中最美星空
2026-02-27 07:53:59
“戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

“戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

流史歲月
2026-01-26 10:58:30
“以為是六個(gè)博士,結(jié)果是六個(gè)送外賣的!”六個(gè)兒子征婚視頻火了

“以為是六個(gè)博士,結(jié)果是六個(gè)送外賣的!”六個(gè)兒子征婚視頻火了

阿凱銷售場(chǎng)
2026-03-01 01:46:42
MVP沒跑了!他又拿一個(gè)歷史第一!

MVP沒跑了!他又拿一個(gè)歷史第一!

柚子說球
2026-03-02 17:23:11
伊朗革命衛(wèi)隊(duì)宣布大規(guī)模軍事行動(dòng)

伊朗革命衛(wèi)隊(duì)宣布大規(guī)模軍事行動(dòng)

界面新聞
2026-02-28 18:18:55
戲子誤國!2026年剛開年,就有3位明星相繼塌房,個(gè)個(gè)荒唐

戲子誤國!2026年剛開年,就有3位明星相繼塌房,個(gè)個(gè)荒唐

不似少年游
2026-02-24 19:24:23
2026-03-02 23:07:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12213文章數(shù) 176399關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

美記者詢問就伊朗局勢(shì)中方會(huì)采取什么行動(dòng) 外交部回應(yīng)

頭條要聞

美記者詢問就伊朗局勢(shì)中方會(huì)采取什么行動(dòng) 外交部回應(yīng)

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

親子
教育
數(shù)碼
家居
軍事航空

親子要聞

12歲前給娃用手機(jī),竟是在親手“毀掉”他?看完這份萬名兒童追蹤研究,脊背發(fā)涼

教育要聞

石室小學(xué)育賢分校:騏驥少年馭“機(jī)”而上 科技體育點(diǎn)亮校園新程

數(shù)碼要聞

安克250W六口桌面充首發(fā)849元:4C+2A 配2.26寸LCD屏

家居要聞

萬物互聯(lián) 享科技福祉

軍事要聞

美國中央司令部透露對(duì)伊朗動(dòng)武全部武器裝備清單

無障礙瀏覽 進(jìn)入關(guān)懷版