国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

李飛飛最新長文:AI很火,但方向可能偏了

0
分享至

AI很會說話,但還不會理解世界。

前幾天,Google的Gemini 3 Pro發(fā)布,朋友圈瞬間刷屏。很多人都在感嘆:谷歌一出手,就知有沒有。下一代模型,是不是參數(shù)更多?能支持更長的上下文?照這么發(fā)展下去,是不是真的要實現(xiàn)AGI(通用人工智能)了?

但是,著名計算機(jī)科學(xué)家、美國國家工程院院士、斯坦福大學(xué)教授李飛飛卻不這么認(rèn)為。11月10日,她就發(fā)布了一則長文,系統(tǒng)闡述了她對目前AI大模型的看法??偨Y(jié)一下,大概是:

目前AI卷參數(shù),卷算法的方向,可能跑偏了。模型不理解世界,就實現(xiàn)不了真正的智能。

為什么這么說?什么又叫“理解世界”?這和我又有什么關(guān)系?

系統(tǒng)整理了一下我的理解,和你分享。

01

大語言模型,就像讀了很多書,但沒出過門的秀才

你一定知道ChatGPT,或者谷歌的Gemini。你也一定用過DeepSeek、豆包。這些產(chǎn)品背后的核心技術(shù),都是大語言模型(LLM)。

大語言模型做的事情,簡單來說,是“預(yù)測下一個詞是什么”。你問它,“床前明月光”,它就能預(yù)測,后邊幾個詞大概率是“疑是地上霜”。

靠著這種看似簡單的“接茬”能力,在吃下了大量數(shù)據(jù)之后,大模型已經(jīng)進(jìn)化到了驚人的地步。它能通過律師資格考試,也能做復(fù)雜的奧數(shù)題。

那,這樣子下去,是不是很快就有能自主學(xué)習(xí)、完成任務(wù)的通用人工智能了?

不一定。雖然語言大模型看上去很厲害,但如果問它一些特別簡單的問題,比如,這輛車離那棵樹有幾米?這個箱子能塞進(jìn)后備箱嗎?它卻大概率會瞎蒙,還會出現(xiàn)“杯子松手后飛上天”的情況。

它們雖然懂物理公式,卻不懂物理常識。對此,李飛飛打了個比方。大概意思是,大語言模型,就像黑暗中的秀才(wordsmiths in the dark)。

想象一下。有一位秀才,在一間黑屋子里,讀過一萬本關(guān)于蘋果的書。他知道,蘋果通常和“紅”、“甜”、“圓”出現(xiàn)在一起,他知道,蘋果的化學(xué)分子式,牛頓被蘋果砸中的故事。如果讓他寫一篇關(guān)于蘋果的論文,他寫得不比專家差。但是,如果你把一個真的蘋果遞到他手里,他卻不知道這是什么。

今天,語言大模型的“智慧”,本質(zhì)上靠的是語言的統(tǒng)計規(guī)律,而并非扎根現(xiàn)實。

這也解釋了,為什么你的AI助手,動不動就會“胡說八道”。因為,如果AI只遵照語法通順,它完全可以認(rèn)為,太陽會從西邊升起。即便這在物理世界里,不可能發(fā)生。

它讀了萬卷書,卻從未行萬里路。

02

語言可以瞎編,但物理世界不會撒謊

那怎么辦?

李飛飛說,這就要讓AI,掌握“空間智能”了。

舉個例子。喝咖啡。

你的大腦在這一瞬間,會處理很多信息。你的眼睛,要判斷杯子和嘴邊的距離;你的手部肌肉,要根據(jù)杯子的重量,精確調(diào)整抓握的力度;你的皮膚,要感知杯壁的溫度,防止?fàn)C傷;你的手腕,要配合身體的傾斜,保持杯口的水平,防止咖啡灑出來。

在這個過程中,你用到語言了嗎?你有沒有在心里默念,把肱二頭肌收縮30%,手腕向左旋轉(zhuǎn)5度?沒有。整個過程,靠的是感知、想象、行動。

這種“不通過語言,理解物理世界,和物理世界互動的能力”,就是空間智能。

而李飛飛也認(rèn)為,有了空間智能加持的AI,才會通向真正的,智能。因為智能的本質(zhì),是能在不確定的世界中持續(xù)預(yù)測、行動、達(dá)成目標(biāo)。這不能靠大腦憑空產(chǎn)生。

舉個例子。嬰兒是怎么知道因果關(guān)系的?

他坐在地上,把積木推倒,積木嘩啦一下散落在了地上。他覺得好玩,又推了一次。又是嘩啦一聲。一次次的物理互動中,他逐漸建立了一條神經(jīng)連接:把積木推倒,必然導(dǎo)致“嘩啦”一聲。邏輯的雛形,因此開始。

再舉個例子。沃森和克里克,是怎么發(fā)現(xiàn)DNA雙螺旋結(jié)構(gòu)的?

要知道,當(dāng)時他們手里,只有一張像是模糊的“X”的照片。靠這張照片,推導(dǎo)不出DNA結(jié)構(gòu)。


沒辦法,他們只好像搭積木的小孩一樣,用金屬棒和鐵絲,試圖復(fù)現(xiàn)DNA的空間結(jié)構(gòu)。直到某個瞬間,他們把模型轉(zhuǎn)到雙螺旋的角度,咔嚓一聲,一切都對上了。那一刻,他們沒有說話,但他們看到了生命的真相。


偉大的發(fā)現(xiàn),往往先在空間中成型,才被翻譯成語言。

所以,李飛飛才會說:“看”和“動”,不是低級的本能,而是高級智能的基石。大自然花了 5 億年進(jìn)化“視覺”,只花了最后幾萬年進(jìn)化“語言”。因為感知世界,遠(yuǎn)比描述世界要難得多,也重要得多。

語言可以瞎編,但物理世界不會撒謊。

03

AI的未來,或許是從預(yù)測下一個詞,到預(yù)測下一幀世界

什么是,預(yù)測下一幀世界?舉個例子。

你手里拿著一個玻璃杯,然后松開了手。現(xiàn)在,你的腦子里是不是立刻就預(yù)測到了:杯子掉下去,砸在地上,摔碎了?你不需要等它真的碎,你的腦子已經(jīng)預(yù)測到了。

這就是“預(yù)測下一幀世界”。擁有了這個能力,AI不需要讀萬卷書來記住“火是燙的”,模擬與世界的互動,就能推導(dǎo)出“手伸進(jìn)火里->皮膚燒傷”的物理必然性

預(yù)測下一個詞,遵循的是“語法邏輯”;而預(yù)測下一幀世界,遵循的是“物理邏輯”。這就是李飛飛認(rèn)為,掌握空間智能的AI該做的事情。她把它稱為,世界模型。

之前,如果你讓AI畫一個“凌亂的房間”,它會生成一張像模像樣的圖片。但是,你沒辦法看看桌子底下有什么,把地上的臟衣服撿起來。但在世界模型生成的房間,你可以蹲下來看床底、拉開抽屜。因為房間里有重力、有光影,還有遮擋關(guān)系。

這和目前的AI視頻,也有本質(zhì)區(qū)別。因為AI視頻,只是“看上去理解了世界”,本質(zhì)上還是在黑屋子里,預(yù)測下一個像素。

比如,吃漢堡。雖然AI視頻可以預(yù)測到,當(dāng)人的嘴到了漢堡上,漢堡大概率會變形、會缺少一塊,但它并不理解,漢堡為什么是軟的,以及,人咬下一口之后,那一塊漢堡其實是到了人的嘴里。它也沒辦法換個位置,看看漢堡的面包底是不是焦了。

預(yù)測下一幀世界。理解了??墒?,這要怎么做到?

語言,說白了就是一個詞接著一個詞,是一維的序列信號。但世界是三維的,甚至還要加時間維度。重力決定了蘋果怎么掉,原子結(jié)構(gòu)決定了光線怎么反射。要預(yù)測下一幀世界,就得讓語義、幾何、物理規(guī)律保持一致,這比處理語言復(fù)雜太多了。

李飛飛也很坦率,聊了幾個他們團(tuán)隊還在死磕的方向。

比如,找公式。

大語言模型之所以成功,是因為找到了一個簡單的任務(wù)函數(shù):預(yù)測下一個詞。世界模型,也能找到這樣一個簡單優(yōu)雅的公式嗎?目前還需要努力。

比如,找數(shù)據(jù)。

要訓(xùn)練具有空間智能的世界模型,就得找到海量空間數(shù)據(jù)。去哪找?他們正在開發(fā)一種,從互聯(lián)網(wǎng)上的二維視頻里,提取空間信息的算法。

過去的AI,是在用概率“猜”下一個詞;未來的AI,或許能用物理“算”下一幀世界。

04

精確地把“想象”變成“真實”,也許是下個時代最大的機(jī)會之一

李飛飛的World Labs,已經(jīng)做出了一款叫Marble的產(chǎn)品。

具體網(wǎng)址:https://marble.worldlabs.ai/。

只要你提供一句描述,一張照片,它就可以生成一個可以探索的空間。

我試著上傳了一張我們新辦公室的照片,沒想到還真能行。


(圖片來自:Marble)

是不是還挺有意思的?幾秒鐘內(nèi),它不僅識別出了里面的桌子、椅子,還腦補(bǔ)出了空間位置。雖然還很粗糙??赡苁俏抑簧蟼髁艘粡堈掌脑颉?/p>

那么,如果未來的AI真的如李飛飛所說的那樣,有了空間智能,又意味著什么?

首先,對于普通人來說,是AI進(jìn)入現(xiàn)實社會,所帶來的極大便利。

一旦空間智能成熟,離機(jī)器人走入家庭,就真的不遠(yuǎn)了。它能理解“花瓶是易碎的,要繞著走”;能理解“地上有水,要先拖干”。讓機(jī)器人幫你疊衣服、整理雜亂的玩具房、甚至照顧老人起居,將變成現(xiàn)實。甚至再進(jìn)一步,讓納米機(jī)器人在血管里送藥。

而當(dāng)AI基于空間智能,掌握了從現(xiàn)實中抽象出規(guī)律的能力,它們或許,就能像牛頓和愛因斯坦一樣,擁有“科學(xué)家的直覺”。從而,真正發(fā)現(xiàn)規(guī)律、進(jìn)行創(chuàng)新。

接著,對于創(chuàng)業(yè)者來說,加持空間智能的AI,可能意味著一些新的機(jī)會。

比如,真正“可控”的視頻生成。

現(xiàn)在的視頻AI(比如 Sora),雖然厲害,但還是有點“抽盲盒”。它可以生成一只貓。但你很難控制貓的走位、光影的角度。這對商業(yè)廣告、電影制作來說,就有點難操作。甲方要求臉必須再轉(zhuǎn)15%,你不能說“AI 隨機(jī)生成的我改不了”。

李飛飛在訪談里就舉了一個例子。他們和索尼的一家虛擬制作公司合作,用了Marble搭建場景,可以自由地選擇拍攝角度,生產(chǎn)效率提升了40倍。

比如,做一些“想象成真”的ToC產(chǎn)品。

例如,裝修。拍一張毛坯房的照片,說改成北歐風(fēng),暖色調(diào)。幾秒鐘后,你就可以得到一個可以到處走,還能修改沙發(fā)位置的虛擬樣板間。例如,3D相冊,給一張老房子的照片,就能得到一個3D空間。你可以看看桌上的擺設(shè),看看墻上的掛歷,再次回到小時候。

李飛飛提到了一個讓我特別意外的場景:心理治療。有團(tuán)隊找上門,表示想用這個技術(shù),來治療“恐高癥”。通過瞬間生成的虛擬懸崖,就能幫病人一步步克服恐懼。

又比如,賣合成數(shù)據(jù),給做機(jī)器人的公司。

本質(zhì)上,這就是給機(jī)器人,開了一間學(xué)校。你不需要造機(jī)器人,你只需要生產(chǎn)特定領(lǐng)域的“教材”。比如,專門生產(chǎn)“怎么修汽車”的數(shù)據(jù),賣給修車機(jī)器人公司;專門生產(chǎn)“怎么做手術(shù)”的數(shù)據(jù),賣給醫(yī)療機(jī)器人公司。

精確地把“想象”變成看得見、摸得著的“真實”,也許是接下來最大的機(jī)會之一。

最后的話

好了??偨Y(jié)一下。

為什么AI現(xiàn)在這么厲害,但還是會犯一些低級錯誤?可能因為,它沒有真正理解世界,而只是在統(tǒng)計規(guī)律中找答案。所以未來,AI的發(fā)展方向,可能要拐一下,從預(yù)測下一個詞,到預(yù)測下一幀世界。也就是真正掌握,空間智能。

那,這個方向?qū)Σ粚Γ繒粫ㄏ蛘嬲闹悄埽?/p>

我不知道。但至少,這是一個值得嘗試的方向。因為目前的大語言模型,確實遇到了瓶頸。參數(shù)越來越大,算力越來越強(qiáng),但一致性,總也沒有特別好的解決方案。

而且,如果這個方向真的走通了,確實會帶來一些變化。機(jī)器人可能真的能進(jìn)入家庭。甚至,AI可能真的能像科學(xué)家一樣,從現(xiàn)實中發(fā)現(xiàn)規(guī)律,而不只是從數(shù)據(jù)中總結(jié)規(guī)律。

當(dāng)然,這一切都還很早。Marble,還很粗糙。世界模型的“公式”還沒找到,空間數(shù)據(jù)也還不夠。但至少,通往智能的那個未來,又多了幾分念想。

畢竟,科技進(jìn)步從來不是一條直線。

繞點遠(yuǎn)路,沒啥。

參考資料:

1、From Words to Worlds: Spatial Intelligence is AI’s Next Frontier

2、谷歌開發(fā)者指南:Introduction to Large Language Models | MachineLearning

觀點/ 劉潤主筆/ 景九編輯/ 歌平版面/ 黃 靜

這是劉潤公眾號第2783篇原創(chuàng)文章。未經(jīng)授權(quán),禁止任何機(jī)構(gòu)或個人抓取本文內(nèi)容,用于訓(xùn)練AI大模型等用途



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國“將無限期控制委內(nèi)瑞拉石油銷售”!俄確認(rèn)美軍登船,已與油輪失聯(lián),俄方譴責(zé)并要求美方不得阻礙油輪上俄羅斯人回家

美國“將無限期控制委內(nèi)瑞拉石油銷售”!俄確認(rèn)美軍登船,已與油輪失聯(lián),俄方譴責(zé)并要求美方不得阻礙油輪上俄羅斯人回家

每日經(jīng)濟(jì)新聞
2026-01-08 00:48:20
澤連斯基引發(fā)的鏈?zhǔn)椒磻?yīng):俄羅斯的盟友接連倒下

澤連斯基引發(fā)的鏈?zhǔn)椒磻?yīng):俄羅斯的盟友接連倒下

高博新視野
2026-01-07 18:42:18
柬政府確認(rèn)陳志6日已被遣返回中國,柬國王頒布王令撤銷其柬埔寨國籍

柬政府確認(rèn)陳志6日已被遣返回中國,柬國王頒布王令撤銷其柬埔寨國籍

紅星新聞
2026-01-07 23:38:19
貴州26歲男子跳橋身亡,貸款10萬結(jié)婚,女方一身惡習(xí),曝更多隱情

貴州26歲男子跳橋身亡,貸款10萬結(jié)婚,女方一身惡習(xí),曝更多隱情

李健政觀察
2026-01-07 18:31:22
日本梅毒泛濫、“神待少女” 叢生:百毒遍地,遙遙領(lǐng)先

日本梅毒泛濫、“神待少女” 叢生:百毒遍地,遙遙領(lǐng)先

半耳聆
2026-01-07 17:21:19
瘋傳!王石的瓜,好狗血!

瘋傳!王石的瓜,好狗血!

財經(jīng)要參
2026-01-05 22:13:08
美防長放話:采取前所未有的措施

美防長放話:采取前所未有的措施

環(huán)球時報國際
2026-01-07 00:08:45
巧立名目地從老百姓口袋里掏錢,真是不遺余力

巧立名目地從老百姓口袋里掏錢,真是不遺余力

胖胖說他不胖
2026-01-07 10:00:09
“美國斬殺線”:一則都市傳說如何被包裝成“真實美國”敘事

“美國斬殺線”:一則都市傳說如何被包裝成“真實美國”敘事

美國華人雜談
2026-01-07 08:04:45
廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

唐小糖說情感
2026-01-07 16:37:28
U23國足首戰(zhàn)就是生死戰(zhàn)!8年后再沖開門紅,或12年首次連勝

U23國足首戰(zhàn)就是生死戰(zhàn)!8年后再沖開門紅,或12年首次連勝

奧拜爾
2026-01-07 19:51:00
日網(wǎng)熱搜:日本政府決定拋售7萬億日元中國國債,打擊中國經(jīng)濟(jì)

日網(wǎng)熱搜:日本政府決定拋售7萬億日元中國國債,打擊中國經(jīng)濟(jì)

黑翼天使
2026-01-08 02:21:58
江蘇調(diào)查組在徐湖平別墅搜出啥?太離譜!

江蘇調(diào)查組在徐湖平別墅搜出啥?太離譜!

鶴羽說個事
2026-01-07 11:06:57
俄交通部確認(rèn)美軍登船 稱與“馬里涅拉號”失去聯(lián)系

俄交通部確認(rèn)美軍登船 稱與“馬里涅拉號”失去聯(lián)系

環(huán)球網(wǎng)資訊
2026-01-07 23:17:39
塌房的一級演員閆學(xué)晶,做錯了兩件事

塌房的一級演員閆學(xué)晶,做錯了兩件事

李月亮
2026-01-07 19:31:56
綁架馬杜羅的“原班人馬”,全部飛抵歐洲,美軍第二戰(zhàn)已確定目標(biāo)

綁架馬杜羅的“原班人馬”,全部飛抵歐洲,美軍第二戰(zhàn)已確定目標(biāo)

依偎在角落
2026-01-07 10:30:44
“剛買的新車,就要拆發(fā)動機(jī)大修!”知名大牌汽車,引發(fā)滬上消費者“集體維權(quán)”

“剛買的新車,就要拆發(fā)動機(jī)大修!”知名大牌汽車,引發(fā)滬上消費者“集體維權(quán)”

新民晚報
2026-01-07 20:30:39
胡明軒3分!隨著廣東險勝深圳,上海大勝青島,CBA最新積分榜出爐

胡明軒3分!隨著廣東險勝深圳,上海大勝青島,CBA最新積分榜出爐

侃球熊弟
2026-01-07 20:27:53
從斬首計劃,到擒賊先擒王,美以似乎在重新改寫現(xiàn)代戰(zhàn)爭的打法

從斬首計劃,到擒賊先擒王,美以似乎在重新改寫現(xiàn)代戰(zhàn)爭的打法

歷史擺渡
2026-01-05 17:20:03
河南三兄弟連續(xù)11年給家鄉(xiāng)老人發(fā)放救助金,村支書:每人每月發(fā)300元到1000元,累計發(fā)了600多萬元,有老人已經(jīng)領(lǐng)了七八萬元

河南三兄弟連續(xù)11年給家鄉(xiāng)老人發(fā)放救助金,村支書:每人每月發(fā)300元到1000元,累計發(fā)了600多萬元,有老人已經(jīng)領(lǐng)了七八萬元

極目新聞
2026-01-07 21:22:09
2026-01-08 08:08:49
劉潤 incentive-icons
劉潤
劉潤,潤米咨詢創(chuàng)始人,“5分鐘商學(xué)院”課程主理人,著名商業(yè)顧問
4701文章數(shù) 24688關(guān)注度
往期回顧 全部

科技要聞

雷軍:現(xiàn)在聽到營銷這兩個字都有點惡心

頭條要聞

魯比奧下周或與丹麥官員會面 討論"購買"格陵蘭島方案

頭條要聞

魯比奧下周或與丹麥官員會面 討論"購買"格陵蘭島方案

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

《馬背搖籃》首播,革命的樂觀主義故事

財經(jīng)要聞

農(nóng)大教授科普:無需過度擔(dān)憂蔬菜農(nóng)殘

汽車要聞

燃油駕趣+智能電感雙Buff 試駕全新奧迪Q5L

態(tài)度原創(chuàng)

本地
親子
房產(chǎn)
家居
公開課

本地新聞

“閩東利劍·惠民安商”高效執(zhí)行專項行動

親子要聞

寶媽吐槽每天被兩兒子“槍斃”1600次 !網(wǎng)友:生吧一生一個不吱聲

房產(chǎn)要聞

最新!??诙址?,漲價房源突然猛增30%

家居要聞

寧靜不單調(diào) 恰到好處的美

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版