国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

當(dāng)AI開始“理解”空間:世界模型能否重新定義AI的未來?

0
分享至

在位于斯坦福大學(xué)附近的World Labs實(shí)驗(yàn)室內(nèi),李飛飛團(tuán)隊(duì)展示了這個(gè)令人驚訝的演示!艾F(xiàn)在的AI系統(tǒng)能識(shí)別圖像、生成文本,但它們不理解世界是如何運(yùn)作的,”這位AI領(lǐng)域的先驅(qū)者解釋道,“如果一個(gè)機(jī)器人無法預(yù)測(cè)杯子從桌上掉下會(huì)發(fā)生什么,它就無法在真實(shí)世界中有效工作!



11月12日,李飛飛創(chuàng)立的World Labs公司正式推出了其首款商用產(chǎn)品——世界模型Marble,引發(fā)了AI界的地震。這是世界模型競(jìng)賽中的一次重大加速,也可能是通向更通用人工智能的關(guān)鍵一步。

從識(shí)別到理解:世界模型為何成為AI圣杯?

在世界模型的學(xué)術(shù)論文中,有一個(gè)經(jīng)典例子:當(dāng)一個(gè)人類孩子看到積木塔被推倒,他不僅能描述眼前發(fā)生的現(xiàn)象,還能預(yù)測(cè)類似情況在其他物體上的結(jié)果——比如沙堡被踢倒,或者多米諾骨牌被推倒。

這種將物理規(guī)則抽象化、泛化的能力,正是當(dāng)前AI系統(tǒng)所缺乏的。

深度學(xué)習(xí)在過去十年取得了驚人進(jìn)步,但大多數(shù)系統(tǒng)仍停留在‘模式識(shí)別’層面,”一位國內(nèi)AI實(shí)驗(yàn)室負(fù)責(zé)人評(píng)價(jià)道,“它們可以識(shí)別貓、生成圖片,但并不真正理解貓有體積、有重量,會(huì)受到重力影響!

世界模型的概念并非全新。早在2018年,DeepMind就提出了類似構(gòu)想,將其描述為“一種能夠理解環(huán)境動(dòng)態(tài)并預(yù)測(cè)未來的模型”。但直到最近,隨著算力增長和理論突破,這一概念才從學(xué)術(shù)論文走向商業(yè)應(yīng)用。

李飛飛在采訪中闡述了她的愿景:“人類通過內(nèi)心模擬來理解世界。當(dāng)你看到烏云密布,你會(huì)預(yù)測(cè)可能要下雨;當(dāng)你看到一個(gè)人朝你揮手,你會(huì)預(yù)測(cè)他是在打招呼。這種預(yù)測(cè)能力是人類智能的核心!



World Labs的創(chuàng)立正是為了將這一愿景變?yōu)楝F(xiàn)實(shí)。據(jù)TechCrunch報(bào)道,這家由李飛飛聯(lián)合創(chuàng)立的初創(chuàng)公司已籌集了大量資金,投資者包括硅谷頂級(jí)風(fēng)投和戰(zhàn)略技術(shù)公司。

Marble亮相:世界模型的首個(gè)商業(yè)產(chǎn)品有何不同?

Marble作為World Labs的首個(gè)商業(yè)產(chǎn)品,展示了世界模型技術(shù)的成熟度。與傳統(tǒng)的AI系統(tǒng)相比,Marble的核心突破在于其能夠從有限的視覺輸入中預(yù)測(cè)未來的場(chǎng)景狀態(tài)。



在技術(shù)演示中,Marble展示了幾種令人印象深刻的能力:

物理預(yù)測(cè):給定一個(gè)簡(jiǎn)單場(chǎng)景——如桌面上擺放的積木,Marble能夠準(zhǔn)確預(yù)測(cè)如果推動(dòng)其中一塊積木,整個(gè)結(jié)構(gòu)將如何反應(yīng)。更驚人的是,它能夠處理訓(xùn)練數(shù)據(jù)中未見過的新形狀物體。

不確定性量化:與給出單一預(yù)測(cè)的傳統(tǒng)模型不同,Marble能夠明確表示預(yù)測(cè)中的不確定性。當(dāng)場(chǎng)景模糊或結(jié)果具有多種可能性時(shí),模型會(huì)給出概率分布,而非武斷的單一答案。

多時(shí)間尺度推理:Marble能夠進(jìn)行從幾毫秒到幾分鐘不同時(shí)間跨度的預(yù)測(cè),適應(yīng)不同應(yīng)用場(chǎng)景的需求。

“Marble不是另一個(gè)生成漂亮視頻的工具,”World Labs CTO強(qiáng)調(diào),“它是理解世界因果結(jié)構(gòu)的嘗試。當(dāng)我們展示一個(gè)球從桌上滾落時(shí),Marble不僅預(yù)測(cè)球會(huì)掉下去,還理解這是因?yàn)橹亓ψ饔茫⑶夷軌驅(qū)⑦@一理解推廣到其他類似場(chǎng)景。”



從已公布的技術(shù)細(xì)節(jié)來看,Marble很可能建立在視覺-語言聯(lián)合表征的基礎(chǔ)上。這意味著它不僅僅處理像素?cái)?shù)據(jù),還構(gòu)建了關(guān)于物體屬性、物理規(guī)則和因果關(guān)系的內(nèi)部表示。

全球?qū)嶒?yàn)室的世界模型已經(jīng)開始布局

World Labs并非唯一覬覦世界模型這一圣杯的玩家。在全球范圍內(nèi),一場(chǎng)無聲的競(jìng)賽早已展開。

OpenAI早在GPT-4時(shí)期就開始探索世界模型的集成。據(jù)泄露信息顯示,他們正在開發(fā)名為“Project Stella”的世界模型項(xiàng)目,旨在為下一代AI系統(tǒng)提供物理推理能力。

DeepMind作為世界模型的早期探索者,其最新產(chǎn)品“Genie”已能夠從單張圖像生成交互式環(huán)境。雖然目前主要應(yīng)用于游戲領(lǐng)域,但其技術(shù)框架具有向通用世界模型擴(kuò)展的潛力。

Meta則選擇了不同的路徑——通過超大規(guī)模視頻訓(xùn)練構(gòu)建隱式世界模型。Yann LeCun團(tuán)隊(duì)一直倡導(dǎo)自監(jiān)督學(xué)習(xí)路徑,認(rèn)為通過觀察海量視頻數(shù)據(jù),AI可以自發(fā)學(xué)習(xí)世界運(yùn)作的基本原理。

在中國,字節(jié)跳動(dòng)、阿里巴巴百度等科技巨頭也紛紛布局相關(guān)研究。字節(jié)跳動(dòng)的AI Lab據(jù)傳正在開發(fā)專注于視頻預(yù)測(cè)的世界模型,而百度則更關(guān)注世界模型在自動(dòng)駕駛領(lǐng)域的應(yīng)用。蘑菇車聯(lián)將自己的MogoMind大模型,部署在了一套名為“AI網(wǎng)絡(luò)”的系統(tǒng)中。這個(gè)網(wǎng)絡(luò)并非存在于云端,而是像“神經(jīng)元”一樣,分布在城市道路的每一個(gè)智能基站、每一輛智能網(wǎng)聯(lián)汽車之中。MogoMind并非一個(gè)靜態(tài)的“地圖”,它是一個(gè)活的、會(huì)呼吸的“世界模型”。它實(shí)時(shí)吸收著每一輛車的行駛軌跡、每一條道路的擁堵狀況、每一個(gè)路口的信號(hào)燈狀態(tài),甚至每一滴雨、每一陣風(fēng)對(duì)路況的影響。它讓道路上的每一臺(tái)設(shè)備、每一輛車,都變成了一個(gè)能夠“理解”空間、參與協(xié)作的智能體。

世界模型已成為下一代AI競(jìng)爭(zhēng)的分水嶺,擁有強(qiáng)大世界模型的AI系統(tǒng),將可能在機(jī)器人、自動(dòng)駕駛、虛擬現(xiàn)實(shí)等需要與現(xiàn)實(shí)世界交互的領(lǐng)域建立決定性優(yōu)勢(shì)。

從實(shí)驗(yàn)室到市場(chǎng):世界模型能解決哪些實(shí)際問題?

世界模型看似抽象,但其商業(yè)應(yīng)用前景十分廣闊。Marble作為首款商用產(chǎn)品,瞄準(zhǔn)了幾個(gè)關(guān)鍵領(lǐng)域:

自動(dòng)駕駛:當(dāng)前自動(dòng)駕駛系統(tǒng)主要基于模式識(shí)別——識(shí)別車輛、行人、交通標(biāo)志。但如果遇到訓(xùn)練數(shù)據(jù)中未見過的情況,系統(tǒng)就容易失效。世界模型可以使自動(dòng)駕駛車輛理解物理規(guī)則,預(yù)測(cè)其他道路使用者的行為,從而提高在邊緣情況下的安全性。

機(jī)器人技術(shù):工業(yè)機(jī)器人在結(jié)構(gòu)化環(huán)境中表現(xiàn)出色,但 struggle 適應(yīng)動(dòng)態(tài)變化的環(huán)境。通過集成世界模型,機(jī)器人能夠預(yù)測(cè)自身動(dòng)作的后果,進(jìn)行更復(fù)雜的規(guī)劃和工作。

“想象一個(gè)家庭機(jī)器人看到水杯靠近桌邊,它應(yīng)該能預(yù)測(cè)水杯可能掉落,從而主動(dòng)將其推到安全位置,”一位機(jī)器人公司CEO描繪道,“這種預(yù)見性是目前機(jī)器人完全不具備的!

醫(yī)療診斷:世界模型在醫(yī)療影像分析中也有潛力。通過理解人體器官隨時(shí)間的變化規(guī)律,AI可以更準(zhǔn)確地預(yù)測(cè)疾病 progression,為個(gè)性化治療提供參考。

娛樂與內(nèi)容創(chuàng)作:在游戲和影視行業(yè),世界模型可以創(chuàng)建更加逼真的物理模擬,生成符合物理規(guī)律的動(dòng)畫效果,大幅降低內(nèi)容制作成本。

工業(yè)數(shù)字孿生:世界模型能夠創(chuàng)建更加準(zhǔn)確的工業(yè)過程模擬,幫助企業(yè)優(yōu)化生產(chǎn)流程,預(yù)測(cè)設(shè)備故障。

值得注意的是,World Labs選擇了企業(yè)市場(chǎng)作為Marble的首發(fā)陣地,而非消費(fèi)者應(yīng)用。這一策略既反映了當(dāng)前技術(shù)成熟度的限制,也顯示了其對(duì)商業(yè)化路徑的清晰思考。

世界模型面臨的三座大山

盡管前景誘人,世界模型的發(fā)展仍面臨重大技術(shù)挑戰(zhàn)。

復(fù)雜性挑戰(zhàn):真實(shí)世界的物理規(guī)則極其復(fù)雜。從剛性體動(dòng)力學(xué)到軟物質(zhì)物理,從流體力學(xué)到空氣動(dòng)力學(xué),構(gòu)建一個(gè)統(tǒng)一的世界模型需要整合大量物理知識(shí)。更不必說還要模擬人類行為的社會(huì)規(guī)則和心理動(dòng)機(jī)。

計(jì)算成本:世界模型的訓(xùn)練和推理需要巨大的計(jì)算資源。實(shí)時(shí)預(yù)測(cè)高保真度視覺場(chǎng)景的未來狀態(tài),對(duì)目前最先進(jìn)的硬件也是嚴(yán)峻挑戰(zhàn)。

評(píng)估難題:如何評(píng)估世界模型的性能?與圖像分類或?qū)ο髾z測(cè)不同,世界模型的預(yù)測(cè)質(zhì)量難以用簡(jiǎn)單指標(biāo)衡量。一個(gè)預(yù)測(cè)可能在像素級(jí)別準(zhǔn)確,但語義級(jí)別錯(cuò)誤,反之亦然。

李飛飛在采訪中承認(rèn)這些挑戰(zhàn)的存在:“我們正在攀登一座高山,目前可能只到達(dá)了山腳。但每一步進(jìn)步都會(huì)開啟新的可能性!

World Labs采用了一種務(wù)實(shí)策略——不追求一次性解決所有問題,而是聚焦特定領(lǐng)域的可行應(yīng)用,通過解決實(shí)際問題逐步改進(jìn)技術(shù)。

世界模型將把AI帶向何方?

世界模型的發(fā)展可能重新定義AI與人類的關(guān)系。

短期來看,世界模型將增強(qiáng)現(xiàn)有AI系統(tǒng)在復(fù)雜環(huán)境中的表現(xiàn)。從更可靠的自動(dòng)駕駛到更靈活的家庭機(jī)器人,這些進(jìn)步可能在3-5年內(nèi)改變多個(gè)行業(yè)。

中期來看,世界模型可能成為實(shí)現(xiàn)通用人工智能(AGI)的關(guān)鍵組件。理解世界運(yùn)作規(guī)律、能夠進(jìn)行因果推理的AI系統(tǒng),將更接近人類智能的核心特征。

長期而言,世界模型可能改變?nèi)祟愓J(rèn)識(shí)世界的方式。就像望遠(yuǎn)鏡擴(kuò)展了我們對(duì)宇宙的認(rèn)識(shí),顯微鏡揭示了微觀世界,世界模型可能成為人類理解復(fù)雜系統(tǒng)的新工具——從氣候變化到經(jīng)濟(jì)發(fā)展,從疾病傳播到社會(huì)動(dòng)態(tài)。

這或許正是世界模型最令人興奮的前景:AI不僅能在已知任務(wù)中表現(xiàn)出色,還能將理解遷移到未知領(lǐng)域,像人類一樣靈活地適應(yīng)新環(huán)境。

世界模型競(jìng)賽的發(fā)令槍已經(jīng)響起,而李飛飛和她的團(tuán)隊(duì)無疑是最先沖出起跑線的選手之一。無論最終誰率先沖線,這場(chǎng)比賽的結(jié)果都將深刻塑造AI——乃至人類社會(huì)的未來。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人不會(huì)無緣無故患癌癥!研究發(fā)現(xiàn):得癌癥的人,離不開這6點(diǎn)

人不會(huì)無緣無故患癌癥!研究發(fā)現(xiàn):得癌癥的人,離不開這6點(diǎn)

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-03-07 21:55:05
全網(wǎng)售罄、多地?cái)嘭!店鋪老板:以前堆成山都賣不掉

全網(wǎng)售罄、多地?cái)嘭!店鋪老板:以前堆成山都賣不掉

中國經(jīng)濟(jì)網(wǎng)
2026-03-12 14:51:03
美國現(xiàn)在徹底沒希望了,因?yàn)橐呀?jīng)遇到了,世界上最強(qiáng)大的大國崛起

美國現(xiàn)在徹底沒希望了,因?yàn)橐呀?jīng)遇到了,世界上最強(qiáng)大的大國崛起

林子說事
2026-03-12 20:19:23
A股最慘股票!43個(gè)跌停從106元跌到0.07元,股民被連根拔起

A股最慘股票!43個(gè)跌停從106元跌到0.07元,股民被連根拔起

財(cái)經(jīng)市界
2026-03-10 08:42:16
這是目前為止,我見過腰最細(xì)的女生,沒有之一

這是目前為止,我見過腰最細(xì)的女生,沒有之一

草莓解說體育
2026-03-03 19:15:05
林良鋒:不記吃更不記打,瓜迪奧拉,該!

林良鋒:不記吃更不記打,瓜迪奧拉,該!

體壇周報(bào)
2026-03-12 15:15:11
癢是大病預(yù)警!醫(yī)生提醒:2處發(fā)癢,或不是過敏,而是這4病

癢是大病預(yù)警!醫(yī)生提醒:2處發(fā)癢,或不是過敏,而是這4病

醫(yī)學(xué)科普匯
2026-03-05 21:20:03
國羽7勝2負(fù)!世界第1退賽,混雙保持不敗,男單00后爆冷2號(hào)種子!

國羽7勝2負(fù)!世界第1退賽,混雙保持不敗,男單00后爆冷2號(hào)種子!

劉姚堯的文字城堡
2026-03-12 07:29:34
官宣!中超本輪央視CCTV直播 沒上海雙雄 海港+申花

官宣!中超本輪央視CCTV直播 沒上海雙雄 海港+申花

80后體育大蜀黍
2026-03-12 23:32:13
出大事了,以軍調(diào)轉(zhuǎn)槍口空襲俄設(shè)施,普京立即表態(tài),中東要變天了

出大事了,以軍調(diào)轉(zhuǎn)槍口空襲俄設(shè)施,普京立即表態(tài),中東要變天了

林子說事
2026-03-11 14:46:46
他護(hù)送毛主席進(jìn)京,1958年被連降十級(jí),主席知道后:我要親自過問

他護(hù)送毛主席進(jìn)京,1958年被連降十級(jí),主席知道后:我要親自過問

浩渺青史
2026-03-12 17:27:22
山姆超市最值得買的10樣美食,基本都口碑封神,性價(jià)比拉滿

山姆超市最值得買的10樣美食,基本都口碑封神,性價(jià)比拉滿

市井覓食記
2026-03-09 00:59:33
秦嵐肯定想刪掉這組照片:20年前舊照火上熱搜!粉毛衣挑染劉海

秦嵐肯定想刪掉這組照片:20年前舊照火上熱搜!粉毛衣挑染劉海

錯(cuò)過美好
2026-03-13 03:21:52
“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

樂趣紀(jì)史
2026-02-04 13:45:32
劉亦菲內(nèi)衣廣告爆了!寶格麗截胡了

劉亦菲內(nèi)衣廣告爆了!寶格麗截胡了

李東陽朋友圈
2026-03-12 08:49:05
中國2000多個(gè)縣城的生存現(xiàn)狀:除了性生活就是打麻將!

中國2000多個(gè)縣城的生存現(xiàn)狀:除了性生活就是打麻將!

談史論天地
2026-03-03 18:02:29
“鐵飯碗”真香!湖北網(wǎng)友曬夫妻收入一年50萬,干20年能掙1000萬

“鐵飯碗”真香!湖北網(wǎng)友曬夫妻收入一年50萬,干20年能掙1000萬

火山詩話
2026-03-12 06:53:38
局勢(shì)已惡化,2514個(gè)赴日航班取消,王毅叫停一件事,不許日本翻案

局勢(shì)已惡化,2514個(gè)赴日航班取消,王毅叫停一件事,不許日本翻案

古史青云啊
2026-03-12 12:54:37
美國最擔(dān)心的事發(fā)生了,伊朗亮出中國“底牌”,中國或成最大贏家

美國最擔(dān)心的事發(fā)生了,伊朗亮出中國“底牌”,中國或成最大贏家

徐云流浪中國
2026-03-04 15:30:07
山東省政協(xié)副主席張新文已任省政協(xié)黨組副書記

山東省政協(xié)副主席張新文已任省政協(xié)黨組副書記

澎湃新聞
2026-03-12 19:46:30
2026-03-13 04:00:49
山自 incentive-icons
山自
寫點(diǎn)有趣的。關(guān)注自動(dòng)駕駛和AI商業(yè)變革。
120文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

當(dāng)養(yǎng)蝦人開始卸載,大廠的戰(zhàn)爭(zhēng)才真正開始

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭(zhēng)

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭(zhēng)

體育要聞

建議將“出球型門將”納入反詐app

娛樂要聞

貝克漢姆全家給27歲大布送生日祝福

財(cái)經(jīng)要聞

盧鋒:從特朗普?qǐng)F(tuán)隊(duì)群演看時(shí)代變局

汽車要聞

大眾2025財(cái)報(bào):轉(zhuǎn)型雖有陣痛 "大象"已然起跑

態(tài)度原創(chuàng)

家居
本地
藝術(shù)
親子
公開課

家居要聞

觸感本真 家的跡象

本地新聞

坐標(biāo)北京,過敏季反向遷徒

藝術(shù)要聞

深圳能源大廈,“看得我強(qiáng)迫癥都要犯了”

親子要聞

認(rèn)養(yǎng)一頭牛旗下“哞星人”聯(lián)名“超級(jí)飛俠”,發(fā)布兒童純牛奶新品

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版