国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

李飛飛一年前究竟說了啥?怎么又火了

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

大語言模型的局限在哪里?

AI教母李飛飛這樣說:

大自然中是沒有語言存在的,你不會從天空中直接看到文字。
語言是一種純粹的生成的信號。



語言信號的輸出主要基于人類給的輸入信號,可以說,語言是不獨立于人之外的。

然而,物理世界是客觀存在的。所以提取、理解、生成3D世界的數(shù)據(jù)、實現(xiàn)空間智能和處理語言問題時截然不同。



沒想到,李飛飛一年前的訪談被扒出來,又引發(fā)大量圍觀。

她這段話意味著,大語言模型或許還不是真正的智能。

真正的智能將是信號感知、物理以及和現(xiàn)實世界相結(jié)合的產(chǎn)物。



下面來看看大家還在熱議些啥吧。

空間智能可以借鑒語言模型,但仍存在本質(zhì)差異

這場討論的焦點在于,現(xiàn)在基于語言信號訓(xùn)練的模型到底懂不懂物理世界的常識

首先,回顧一下李飛飛的說法。

她認(rèn)為語言模型及當(dāng)今的多模態(tài)語言模型的底層表示是一維的。它們在根本上就是操作于離散token的一維序列上,所以模型對于書面文本這種一維序列的表示是非常自然的。



然而,在處理空間智能問題時,核心是世界的三維本質(zhì)。

雖然多模態(tài)大語言模型也能看圖像,但它是將其他模態(tài)硬塞進(jìn)這種一維token序列的底層表示中,這種一維且由人類生成的數(shù)據(jù),可能無法很好地表示物理世界,造成信息損失。

如果直接讓模型處理3D數(shù)據(jù),那么表示類型與模型旨在執(zhí)行的任務(wù)類型之間將會有更好的匹配。



而空間智能的挑戰(zhàn)就是在于從這個真實世界中提取、表示和生成信息。

除了這個維度上的差異,從更哲學(xué)的角度來說,她認(rèn)為語言是一種純粹由生成產(chǎn)生的信號。自然界中并不存在預(yù)設(shè)的語言形式,也就是說語言不能獨立于人類之外。

大模型能夠通過學(xué)習(xí)并反芻所輸入的數(shù)據(jù),無論輸入什么樣的數(shù)據(jù),模型都能用足夠的泛化能力處理語言任務(wù)。這是因為語言,或者說文本的本質(zhì)允許模型在生成范式下表現(xiàn)得出色。



與語言不同,3D世界是真實存在于外部的。這個世界遵循著物理定律,并因材料等多種因素而具有其自身的結(jié)構(gòu)。

因此,要讓模型倒推出3D世界的信息,并能夠表示和生成它,在技術(shù)層面上,空間智能可以借鑒語言模型,但從哲學(xué)的范疇來看,這兩者仍存在本質(zhì)差異。



有人舉了一堆例子來證明李飛飛的觀點,同時說明語言模型在理解物理世界時確實有局限。

基于語言信號訓(xùn)練的模型在物理世界任務(wù)中表現(xiàn)差

比如用一個小實驗來測試Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三個多模態(tài)大模型的物理常識,并與人類兒童表現(xiàn)做對比。



研究用Animal-AI這個用來測試動物和人工智能體物理認(rèn)知的3D環(huán)境來測試大模型,讓大模型通過前進(jìn)/后退、左轉(zhuǎn)/右轉(zhuǎn)、環(huán)境描述與規(guī)劃控制三個指令控制一個小角色在虛擬環(huán)境中完成任務(wù)。



第一個實驗是讓大模型完成一些簡單的任務(wù),如直接找到小球,還有一些稍難的任務(wù),如躲開障礙物找到小球。

結(jié)果發(fā)現(xiàn)模型只能搞定最簡單的任務(wù),稍難一點就不行了。

第二個實驗是在第一個實驗的基礎(chǔ)上增加教學(xué)案例,比如演示正確做法,結(jié)果模型表現(xiàn)也沒有明顯的提升。

對比之后再看,這些大模型的表現(xiàn)遠(yuǎn)不及人類兒童,也比不上專門為這個環(huán)境測試的機(jī)器人。



還有其他研究團(tuán)隊設(shè)計了一個名為ABench-Physics的工具,專門用來測試大語言模型在物理推理方面的能力,核心就是想搞清楚這些模型到底能不能真的理解物理、解決物理問題。



測試分兩部分,Phy A由400道競賽級別的物理難題組成,先給大模型來個基礎(chǔ)測試。

Phy B屬于動態(tài)部分:修改Phy A中題目的數(shù)字,但不改變物理原理,用來測試大模型能不能進(jìn)行靈活的物理推理。

結(jié)果顯示,最厲害的模型在Phy A上的正確率只有43%,而在Phy B中模型的平均準(zhǔn)確率下降了22.5%。

這說明模型并不是真懂物理。



還有團(tuán)隊用視覺任務(wù)測試大模型,比如讓模型判斷照片中哪些物體更近,或者匹配相同的事物。

人類對這些任務(wù)的正確率能達(dá)到95.7%,而幾個模型最高的正確率僅有51%。在視覺感知上,大模型還遠(yuǎn)不及人類。



這些結(jié)果都進(jìn)一步證明了李飛飛之前訪談中關(guān)于大模型理解真實物理世界局限性的觀點。

也得到了網(wǎng)友們的認(rèn)同。



模型的開發(fā)確實正在擴(kuò)展到將模型建立在物理與多模態(tài)理解的基礎(chǔ)上。



討論升級

當(dāng)然了,有正方就有反方。

有人先是反駁了關(guān)于語言的論述。



也有人認(rèn)為,在某些情況下,語言描述現(xiàn)實的能力可能會比感知更優(yōu)。



還有人說模型的語言不用局限于人類的語言、文本等,人工智能或許能創(chuàng)造出自己的語言來理解物理世界。



或者,我們該思考,用語言訓(xùn)練大模型取得現(xiàn)有成就的根本因素又是什么呢?



對于這場討論,你又有什么樣的看法呢?


[1]https://x.com/rohanpaul_ai/status/1965242567085490547
[2]https://www.youtube.com/watch?v=vIXfYFB7aBI

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
你見過最離譜的網(wǎng)購是什么?網(wǎng)友:倉庫是不會承認(rèn)自己發(fā)錯了的

你見過最離譜的網(wǎng)購是什么?網(wǎng)友:倉庫是不會承認(rèn)自己發(fā)錯了的

另子維愛讀史
2026-02-16 20:35:50
樸寶藍(lán)突猝逝「死因急性酒精中毒」 好友慶32歲冥誕:姐姐們來了

樸寶藍(lán)突猝逝「死因急性酒精中毒」 好友慶32歲冥誕:姐姐們來了

ETtoday星光云
2026-03-02 13:02:43
油市“末日時鐘”!若霍爾木茲海峽關(guān)閉25天 中東產(chǎn)油國將被迫停產(chǎn)?

油市“末日時鐘”!若霍爾木茲海峽關(guān)閉25天 中東產(chǎn)油國將被迫停產(chǎn)?

財聯(lián)社
2026-03-02 14:08:05
預(yù)計到了2030年,我們將全面進(jìn)入租房時代,房子會越來越難賣

預(yù)計到了2030年,我們將全面進(jìn)入租房時代,房子會越來越難賣

貓叔東山再起
2026-03-02 09:35:03
51死60傷!美以為何空襲伊朗小學(xué)?專家:或為全面威懾伊朗,或?qū)佟罢`傷”,未來幾天三方行動是關(guān)鍵

51死60傷!美以為何空襲伊朗小學(xué)?專家:或為全面威懾伊朗,或?qū)佟罢`傷”,未來幾天三方行動是關(guān)鍵

極目新聞
2026-02-28 22:09:29
西方媒體欠我們道歉!美國游客回國說實話:中國的強(qiáng)大,藏在凌晨兩點的便利店

西方媒體欠我們道歉!美國游客回國說實話:中國的強(qiáng)大,藏在凌晨兩點的便利店

吃貨的分享
2026-03-02 16:04:20
汪小菲窩里橫!直播說:我知道我媽對我好,她不會和我生氣的!

汪小菲窩里橫!直播說:我知道我媽對我好,她不會和我生氣的!

小娛樂悠悠
2026-03-02 13:39:43
又見證歷史了,三桶油歷史性漲停

又見證歷史了,三桶油歷史性漲停

金石隨筆
2026-03-02 16:29:29
世界杯突生變故,伊朗考慮退賽,遞補球隊浮現(xiàn),中國隊起死回生?

世界杯突生變故,伊朗考慮退賽,遞補球隊浮現(xiàn),中國隊起死回生?

綠茵舞著
2026-03-01 20:57:22
中國石油歷史上9次漲停

中國石油歷史上9次漲停

貝殼財經(jīng)
2026-03-02 15:43:25
哈梅內(nèi)伊一死,普京緊急召令全部高層,卻只說了幾個字

哈梅內(nèi)伊一死,普京緊急召令全部高層,卻只說了幾個字

書紀(jì)文譚
2026-03-02 16:26:02
誰能想到她已經(jīng)62了,說18都有人信,怎么做到這么好的狀態(tài)的

誰能想到她已經(jīng)62了,說18都有人信,怎么做到這么好的狀態(tài)的

白宸侃片
2026-02-11 11:56:19
趙本山近況曝光!68歲高齡現(xiàn)身美國加州,這狀態(tài)你敢信?

趙本山近況曝光!68歲高齡現(xiàn)身美國加州,這狀態(tài)你敢信?

手工制作阿殲
2026-03-01 16:51:57
哈梅內(nèi)伊神秘遺言公開,特朗普平添巨大風(fēng)險,伊朗或決心永遠(yuǎn)不跪

哈梅內(nèi)伊神秘遺言公開,特朗普平添巨大風(fēng)險,伊朗或決心永遠(yuǎn)不跪

三石記
2026-03-02 15:11:39
3打5!又兩國參戰(zhàn)中東,3國加入美以,關(guān)鍵時刻,普京對中承諾

3打5!又兩國參戰(zhàn)中東,3國加入美以,關(guān)鍵時刻,普京對中承諾

面包夾知識
2026-03-02 13:35:18
孫志浩肝癌晚期,將50億資產(chǎn)里的豪宅與股份盡數(shù)轉(zhuǎn)至女兒梧桐妹

孫志浩肝癌晚期,將50億資產(chǎn)里的豪宅與股份盡數(shù)轉(zhuǎn)至女兒梧桐妹

陳意小可愛
2026-03-01 10:33:40
王一博風(fēng)波升級!吐槽肖戰(zhàn)等十幾位明星,細(xì)節(jié)對上,爆料者被扒!

王一博風(fēng)波升級!吐槽肖戰(zhàn)等十幾位明星,細(xì)節(jié)對上,爆料者被扒!

阿廢冷眼觀察所
2026-03-02 07:15:35
埃及被打醒了,蘇35和殲10都不買:就要一種4000萬美元中國新軍機(jī)

埃及被打醒了,蘇35和殲10都不買:就要一種4000萬美元中國新軍機(jī)

近史談
2026-01-17 21:44:06
過去100年,美國搞垮了4個世界老二,第5個或?qū)⒎词指傻裘绹?>
    </a>
        <h3>
      <a href=蘇大強(qiáng)專欄
2024-07-20 13:22:14
周杰倫和田馥甄戀情,突沖熱搜第一!

周杰倫和田馥甄戀情,突沖熱搜第一!

人間頌
2026-03-01 12:25:17
2026-03-02 18:00:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12212文章數(shù) 176399關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

36歲副鎮(zhèn)長開會暈倒除夕當(dāng)天不幸離世 家中有3個孩子

頭條要聞

36歲副鎮(zhèn)長開會暈倒除夕當(dāng)天不幸離世 家中有3個孩子

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經(jīng)要聞

金銀大漲 市場仍在評估沖突會否長期化

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

時尚
教育
健康
藝術(shù)
軍事航空

從每天只睡4小時到8小時:一個失眠者的自救指南

教育要聞

2月28日雅思大作文示范寫作 | 違規(guī)駕駛成因與最優(yōu)對策分析

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

藝術(shù)要聞

香港展出王羲之書法,足有60篇、10多米長!

軍事要聞

美軍動用新型武器:山寨伊朗的

無障礙瀏覽 進(jìn)入關(guān)懷版