国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

下一場人工智能革命可能始于世界模型

0
分享至


來源:科技世代千高原

作者:德尼·埃利斯·貝沙爾

編輯:埃里克·沙利文

為什么當(dāng)今的人工智能系統(tǒng)難以保持一致性,以及新興的世界模型如何旨在使機(jī)器能夠穩(wěn)定地理解空間和時(shí)間。


你可能見過人工智能系統(tǒng)出錯(cuò)的情況。你要求播放一段狗狗的視頻,當(dāng)狗狗跑到沙發(fā)后面時(shí),它的項(xiàng)圈消失了。然后,隨著鏡頭拉遠(yuǎn),沙發(fā)變成了三人沙發(fā)。

部分問題在于許多人工智能模型的預(yù)測特性。例如, ChatGPT所使用的模型經(jīng)過訓(xùn)練可以預(yù)測文本,而視頻生成模型則預(yù)測接下來最有可能出現(xiàn)的畫面。這兩種情況下,人工智能都沒有一個(gè)清晰定義的世界模型,也無法持續(xù)更新該模型以做出更明智的決策。

但隨著許多人工智能領(lǐng)域的研究人員致力于創(chuàng)建“世界模型”,這種情況正在發(fā)生改變。這些模型的影響范圍不僅限于視頻生成和聊天機(jī)器人的使用,還包括增強(qiáng)現(xiàn)實(shí)、機(jī)器人、自動(dòng)駕駛汽車,甚至類人智能——或通用人工智能(AGI)。

理解世界建模的一個(gè)簡單方法是通過四維模型(三維加上時(shí)間)。為了更好地理解這一點(diǎn),讓我們回顧一下2012年,《泰坦尼克號(hào)》在上映15年后被精心轉(zhuǎn)換成立體3D版本。如果你暫停任何一幀畫面,你就能感受到船上人物和物體之間的距離感。但如果萊昂納多·迪卡普里奧背對(duì)著鏡頭,你就無法繞到他身后看到他的臉。電影的3D幻覺是通過立體成像技術(shù)實(shí)現(xiàn)的——通??焖俳惶嫱渡鋬煞杂胁煌膱D像,一幅對(duì)應(yīng)左眼,一幅對(duì)應(yīng)右眼。影院里的每個(gè)人都能看到相同的圖像對(duì),因此擁有相似的視角。

然而,得益于過去十年的研究,多視角成像正變得越來越可行。試想一下,如果你意識(shí)到應(yīng)該從另一個(gè)角度拍攝一張照片,然后人工智能可以自動(dòng)調(diào)整角度,從而賦予同一場景全新的視角。自 2020 年起,NeRF(神經(jīng)輻射場)算法為創(chuàng)建“逼真的新視角”提供了一條途徑,但這需要將多張照片拼接起來,以便人工智能系統(tǒng)能夠生成 3D 模型。其他 3D 方法則利用人工智能預(yù)測性地填充缺失信息,但這種方法與現(xiàn)實(shí)的偏差更大。

現(xiàn)在,想象一下,《泰坦尼克號(hào)》的每一幀都以 3D 形式呈現(xiàn),這樣整部電影就以 4D 形式存在了。你可以滾動(dòng)時(shí)間線觀看不同的場景,也可以滾動(dòng)空間線從不同的視角觀看。你還可以生成新的版本。例如,最近一篇預(yù)印本論文《NeoVerse:利用自然場景單目視頻增強(qiáng) 4D 世界模型》描述了一種將視頻轉(zhuǎn)換為 4D 模型,從而從不同視角生成新視頻的方法。

但4D技術(shù)也能幫助生成新的視頻內(nèi)容。另一篇近期發(fā)表的預(yù)印本論文《TeleWorld:基于4D世界模型的動(dòng)態(tài)多模態(tài)合成》就適用于我們最初討論的場景:一只狗在沙發(fā)后面奔跑。作者認(rèn)為,當(dāng)持續(xù)更新的4D世界模型指導(dǎo)視頻生成時(shí),AI視頻系統(tǒng)的穩(wěn)定性會(huì)得到提升。該系統(tǒng)的4D模型可以防止沙發(fā)變成長椅,也能防止狗的項(xiàng)圈脫落。

這些只是初步結(jié)果,但它們預(yù)示著一個(gè)更廣泛的趨勢:模型會(huì)在生成過程中更新內(nèi)部場景地圖。然而,4D建模的應(yīng)用遠(yuǎn)不止于視頻生成。對(duì)于增強(qiáng)現(xiàn)實(shí)(AR)——例如Meta公司的Orion原型眼鏡——4D世界模型是用戶所處世界隨時(shí)間演變的地圖。它使AR系統(tǒng)能夠保持虛擬物體的穩(wěn)定性,使光照和透視效果逼真,并擁有對(duì)近期事件的空間記憶。它還支持遮擋效果——即數(shù)字物體被真實(shí)物體遮擋。一篇2023年的論文直截了當(dāng)?shù)刂赋觯骸耙獙?shí)現(xiàn)遮擋效果,需要一個(gè)物理環(huán)境的3D模型?!?/p>

快速將視頻轉(zhuǎn)換為 4D 格式,還能為訓(xùn)練機(jī)器人和自動(dòng)駕駛車輛了解真實(shí)世界的運(yùn)作方式提供豐富的數(shù)據(jù)。通過生成機(jī)器人所處空間的 4D 模型,它們可以更好地導(dǎo)航并預(yù)測接下來可能發(fā)生的事情。如今的通用視覺語言人工智能模型雖然能夠理解圖像和文本,但無法生成清晰定義的世界模型,因此經(jīng)常出錯(cuò);一篇在 2025 年會(huì)議上發(fā)表的基準(zhǔn)論文指出,這些模型在基本的世界建模能力方面存在“顯著局限性”,包括“在區(qū)分運(yùn)動(dòng)軌跡時(shí)準(zhǔn)確率接近隨機(jī)”。

關(guān)鍵在于:“世界模型”對(duì)于那些致力于通用人工智能(AGI)的人來說意義遠(yuǎn)不止于此。例如,目前領(lǐng)先的大型語言模型(LLM),例如ChatGPT所使用的模型,都從訓(xùn)練數(shù)據(jù)中隱含地感知著世界?!皬哪撤N意義上說,我認(rèn)為LLM已經(jīng)擁有一個(gè)非常好的世界模型;只是我們并不真正了解它是如何實(shí)現(xiàn)的,”加州大學(xué)伯克利分校電子工程與計(jì)算機(jī)科學(xué)系助理教授Angjoo Kanazawa說道。然而,這些概念模型并非對(duì)世界的實(shí)時(shí)物理理解,因?yàn)長LM無法實(shí)時(shí)更新其訓(xùn)練數(shù)據(jù)。甚至OpenAI的技術(shù)報(bào)告也指出,其模型GPT-4一旦部署,“就無法從經(jīng)驗(yàn)中學(xué)習(xí)”。

“如何開發(fā)一個(gè)能夠接收實(shí)時(shí)輸入、不斷更新對(duì)世界的理解并做出相應(yīng)反應(yīng)的智能LLM視覺系統(tǒng)?”金澤說,“這是一個(gè)尚未解決的重大難題。我認(rèn)為,如果不解決這個(gè)問題,通用人工智能(AGI)就不可能實(shí)現(xiàn)?!?/p>

盡管研究人員仍在爭論語言邏輯模型(LLM)是否能夠最終實(shí)現(xiàn)通用人工智能(AGI),但許多人認(rèn)為LLM是未來人工智能系統(tǒng)的重要組成部分。金澤表示,LLM將作為“語言和常識(shí)進(jìn)行交流”的橋梁;它將充當(dāng)“接口”,而一個(gè)更清晰定義的底層世界模型將提供當(dāng)前LLM所缺乏的“時(shí)空記憶”。

近年來,許多知名的人工智能研究人員開始關(guān)注世界模型。2024年,李飛飛創(chuàng)立了World Labs,該公司近期推出了Marble軟件,該軟件能夠根據(jù)“文本、圖像、視頻或粗略的3D布局”創(chuàng)建3D世界(據(jù)該公司宣傳資料所述)。去年11月,人工智能研究員Yann LeCun在LinkedIn上宣布離開Meta,創(chuàng)辦一家名為Advanced Machine Intelligence(AMI Labs)的初創(chuàng)公司,旨在構(gòu)建“能夠理解物理世界、擁有持久記憶、能夠推理并能夠規(guī)劃復(fù)雜動(dòng)作序列的系統(tǒng)”。他在2022年的一份立場文件中提出了這些想法,他在文件中探討了為什么人類能夠在從未遇到過的情況下表現(xiàn)良好,并認(rèn)為答案“可能在于……學(xué)習(xí)世界模型的能力,即學(xué)習(xí)世界運(yùn)作方式的內(nèi)部模型”。越來越多的研究證實(shí)了內(nèi)部模型的優(yōu)勢。2025年4月發(fā)表在《自然》雜志上的一篇論文報(bào)道了DreamerV3的研究成果,DreamerV3是一款人工智能代理,它通過學(xué)習(xí)世界模型,能夠通過“想象”未來場景來改進(jìn)自身的行為。

因此,在通用人工智能(AGI)的語境下,“世界模型”更側(cè)重于描述現(xiàn)實(shí)運(yùn)作方式的內(nèi)部模型,而不僅僅是4D重建。然而,4D建模技術(shù)的進(jìn)步可以提供一些組件,幫助我們理解視角、記憶,甚至進(jìn)行短期預(yù)測。同時(shí),在通往AGI的道路上,4D模型可以提供豐富的現(xiàn)實(shí)模擬環(huán)境,用于測試人工智能,確保當(dāng)我們讓它們在現(xiàn)實(shí)世界中運(yùn)行時(shí),它們知道如何在現(xiàn)實(shí)世界中生存。

https://www.scientificamerican.com/article/world-models-could-unlock-the-next-revolution-in-artificial-intelligence/

閱讀最新前沿科技趨勢報(bào)告,請?jiān)L問歐米伽研究所的“未來知識(shí)庫”

https://wx.zsxq.com/group/454854145828


未來知識(shí)庫是“ 歐米伽 未來研究所”建立的在線知識(shí)庫平臺(tái),收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美伊沖突再次升級(jí),全球股市失血,油價(jià)金價(jià)還能漲多久?|商業(yè)微史記

美伊沖突再次升級(jí),全球股市失血,油價(jià)金價(jià)還能漲多久?|商業(yè)微史記

界面新聞
2026-03-02 15:51:05
誰能想到她已經(jīng)62了,說18都有人信,怎么做到這么好的狀態(tài)的

誰能想到她已經(jīng)62了,說18都有人信,怎么做到這么好的狀態(tài)的

白宸侃片
2026-02-11 11:56:19
媒體人:不了解楊瀚森場下訓(xùn)練情況,但英語進(jìn)步速度讓人憂慮

媒體人:不了解楊瀚森場下訓(xùn)練情況,但英語進(jìn)步速度讓人憂慮

懂球帝
2026-03-02 13:29:16
2月車市,再給新能源汽車潑一大盆冷水,涼透了

2月車市,再給新能源汽車潑一大盆冷水,涼透了

互聯(lián)網(wǎng).亂侃秀
2026-03-02 10:06:29
醫(yī)生提醒:無論多壞的肺,只要常吃這5樣,肺一天比一天好

醫(yī)生提醒:無論多壞的肺,只要常吃這5樣,肺一天比一天好

路醫(yī)生健康科普
2026-02-28 23:20:03
一個(gè)美國人在網(wǎng)上發(fā)帖:為什么中國人覺得美國才是他們的家呢

一個(gè)美國人在網(wǎng)上發(fā)帖:為什么中國人覺得美國才是他們的家呢

賤議你讀史
2026-02-23 00:35:40
春節(jié)剛過完,茅臺(tái)價(jià)格又跌下來了

春節(jié)剛過完,茅臺(tái)價(jià)格又跌下來了

深水財(cái)經(jīng)社
2026-03-02 20:35:04
英國曾阻止美軍使用迪戈加西亞基地打擊伊朗,特朗普抱怨:斯塔默“花太長時(shí)間”改變主意

英國曾阻止美軍使用迪戈加西亞基地打擊伊朗,特朗普抱怨:斯塔默“花太長時(shí)間”改變主意

環(huán)球網(wǎng)資訊
2026-03-02 21:27:19
52中21!布朗尼真有本事!NBA最勵(lì)志的球二代

52中21!布朗尼真有本事!NBA最勵(lì)志的球二代

籃球?qū)崙?zhàn)寶典
2026-03-02 21:40:48
美軍用AI殺死了哈梅內(nèi)伊?很抱歉,大家都被營銷號(hào)騙了

美軍用AI殺死了哈梅內(nèi)伊?很抱歉,大家都被營銷號(hào)騙了

互聯(lián)網(wǎng)大觀
2026-03-01 19:29:49
美國十大領(lǐng)域全球領(lǐng)跑,差距還在拉大,正視實(shí)力才是真清醒!

美國十大領(lǐng)域全球領(lǐng)跑,差距還在拉大,正視實(shí)力才是真清醒!

保德全
2026-02-03 19:30:03
關(guān)窗!關(guān)窗!即將抵達(dá)江蘇

關(guān)窗!關(guān)窗!即將抵達(dá)江蘇

最江陰
2026-03-02 14:33:29
兩套房,我為何不賣房換大屋?一位婆婆的清醒賬本

兩套房,我為何不賣房換大屋?一位婆婆的清醒賬本

言言說
2026-03-01 20:46:04
中國藝人被困中東!黃渤驚險(xiǎn)逃離,玄子一家7000租車,周雨彤回京

中國藝人被困中東!黃渤驚險(xiǎn)逃離,玄子一家7000租車,周雨彤回京

潮鹿逐夢
2026-03-02 22:48:22
2026年竟還有60Hz手機(jī)!iPhone 17e引爭議 網(wǎng)友吐槽:除了處理器一無是處

2026年竟還有60Hz手機(jī)!iPhone 17e引爭議 網(wǎng)友吐槽:除了處理器一無是處

快科技
2026-03-03 00:14:05
CCTV5直播!中國男籃VS日本時(shí)間敲定,3大猛將回歸,雙殺希望大了

CCTV5直播!中國男籃VS日本時(shí)間敲定,3大猛將回歸,雙殺希望大了

何老師呀
2026-03-02 23:50:09
欠中國的錢,委內(nèi)瑞拉不還了?美財(cái)長:中國已無法繼續(xù)獲得委石油

欠中國的錢,委內(nèi)瑞拉不還了?美財(cái)長:中國已無法繼續(xù)獲得委石油

萌城少年強(qiáng)
2026-01-22 12:47:40
把頂級(jí)外線大閘白送給了騎士,真不知道國王到底在想些什么?

把頂級(jí)外線大閘白送給了騎士,真不知道國王到底在想些什么?

稻谷與小麥
2026-03-02 22:40:20
糖尿病人出現(xiàn)這6種情況,必須馬上住院,否則生命可能有危險(xiǎn)

糖尿病人出現(xiàn)這6種情況,必須馬上住院,否則生命可能有危險(xiǎn)

健康之光
2026-03-02 19:40:03
明明手上沒權(quán),為什么內(nèi)賈德還非死不可?真相遠(yuǎn)非復(fù)仇那么簡單

明明手上沒權(quán),為什么內(nèi)賈德還非死不可?真相遠(yuǎn)非復(fù)仇那么簡單

李健政觀察
2026-03-02 11:51:27
2026-03-03 02:32:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4555文章數(shù) 37413關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

數(shù)碼
時(shí)尚
教育
房產(chǎn)
手機(jī)

數(shù)碼要聞

高通MWC 2026發(fā)布多項(xiàng)通信技術(shù),定檔2029年開啟6G商用

今年春天一定要擁有的4件衣服,太好看了!

教育要聞

特別猛,但在留學(xué)生心中存在感很低的英國大學(xué)!

房產(chǎn)要聞

方案突然曝光!??诒睅煷蟾叫?,又有書包大盤殺出!

手機(jī)要聞

iPhone 17e發(fā)布:4499元起,e系列首次搭載靈動(dòng)島

無障礙瀏覽 進(jìn)入關(guān)懷版