国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

超越Sora,通往物理世界:賈奎詳解世界模型驅動的具身智能新范式

0
分享至

盡管當前學術界和產(chǎn)業(yè)界對人形機器人與具身智能投入巨大,但一個嚴峻的挑戰(zhàn)也隨之浮現(xiàn):為何當前的機器人AI,在語言能力上表現(xiàn)出色,但在物理行動上卻步履維艱?



▍人形機器人的局限性與理解缺失

人類真實世界是連續(xù)、高維且充滿動態(tài)變化的復雜系統(tǒng)。當人形機器人的任務復雜度提升——例如,讓它從“在桌上抓取蘋果”變?yōu)椤霸陔s亂廚房里找到容器并倒一杯牛奶”這類長序列任務,機器人的模型需要處理的變量和邏輯(如判斷瓶蓋是否需要擰開、杯子是否需要扶正)急劇增加。這導致所需的數(shù)據(jù)量呈指數(shù)級增長,而系統(tǒng)的成功率則大幅下降。

這種困境的根源在于,大多模型跳過了對世界本質(zhì)的理解,直接在數(shù)據(jù)層面進行模仿。從指令“請幫我切開這個蘋果”到機器人完成動作,中間缺失了對幾何、物理、因果關系等關鍵“中間知識”的理解。沒有這些知識,模型的泛化能力便無從談起,只能在高度受控的環(huán)境中運行,一旦進入真實、復雜的場景便會失效。

▍技術的迭代與全新度量衡

如何讓機器人在復雜的物理世界中進行有效交互,一直是具身智能領域的核心挑戰(zhàn)。

圖靈獎得主Yann LeCun提出了“世界模型”(World Model)的概念,他認為真正的智能必須建立在對世界運作方式的理解之上。這個模型的核心思想是讓智能體在行動前,能通過內(nèi)部模擬來預見“如果我這樣做,世界會發(fā)生什么?”,從而做出更優(yōu)的決策。今年,這一理念也獲得了業(yè)界的廣泛回響,涌現(xiàn)出眾多相關研究。



與此同時,以 Sora 為代表的視頻生成模型的驚人進展,似乎為構建世界模型帶來了曙光。如果AI能夠“看見”并“想象”出行動的視覺后果,它是否就能夠解決上述問題?然而,我們必須認識到,預測像素層面的視覺變化,與真正理解其背后的物理規(guī)律(如因果、物體恒存、重力等)之間,存在著巨大的鴻溝

當前的視頻生成模型更像是一個視覺連貫性生成器,而非精確的世界模擬器。它生成的視頻可能在視覺上看似合理,但其中的物理過程可能是失真的:一個球的彈跳可能違反能量守恒,一次碰撞可能不遵循動量定律。模型學會了“推動”與“移動”在視覺上的關聯(lián),卻沒有理解其背后的物理因果鏈條。這種缺失對于需要與物理世界精確交互的機器人是致命的。

如果說機器人在LLM時代,其核心是“規(guī)模定律”(Scaling Law)——更大的模型和更多數(shù)據(jù)帶來更強的能力,那么人形機器人與具身智能時代則迫切需要一個新的指導原則。

跨維在此提出了一種名為“效率法則”(Efficiency Law)的新思路。該法則的核心關注點不再是靜態(tài)的數(shù)據(jù)量,而是動態(tài)的數(shù)據(jù)生成效率。即:在給定的算力和時間預算下,一個智能體能以多快的速度,通過與環(huán)境的自主交互,自動化地生成高質(zhì)量、蘊含物理知識的經(jīng)驗數(shù)據(jù),并據(jù)此提升自身解決問題的能力?

“效率法則”揭示了具身智能的核心瓶頸:我們?nèi)钡牟皇撬懔?,而?strong>將算力高效轉化為有價值物理經(jīng)驗的機制。依賴人類示教或真實世界互動的方式,數(shù)據(jù)生成效率極低。要實現(xiàn)突破,必須構建一個能自動化、高效率生成高質(zhì)量數(shù)據(jù)的“學習飛輪”。

▍跨維智能的解決方案:GS-World生成式仿真世界模型

基于以上思考,跨維智能提出了一套全新的范式:GS-World(Generative Simulation World Model,生成式仿真世界模型)。



GS-World代表了一次根本性的思想轉變:與其預測世界的外在表象(像素),不如生成世界的內(nèi)在機理(物理)。它不是一個視頻生成器,而是一個可交互、懂物理、可微分的動態(tài)仿真引擎。

GS-World的核心能力,是以統(tǒng)一的生成式框架,直接產(chǎn)出驅動物理世界運轉的核心要素:

? 3D資產(chǎn)生成:自主生成剛體、軟體、流體等物體的幾何模型與外觀。

物理屬性生成:為資產(chǎn)賦予質(zhì)量、摩擦系數(shù)、彈性模量等真實物理參數(shù)。

? 動力學模型生成:理解并生成物體間的作用力、約束關系和運動方程。

簡而言之,當GS-World面對一個場景,它思考的不僅僅是“畫面會如何變化”,更是“構成世界的元素是什么?它們遵循哪些物理規(guī)律?施加一個力會引發(fā)怎樣的因果傳導?”。它生成的是一個可供機器人反復實驗和驗證的“物理沙盒”,而非一段被動的視頻。

實現(xiàn)路徑

要實現(xiàn)Physical AGI,我們設想了一條清晰的技術路徑:讓VLA模型學會與物理引擎“合作”,并最終讓機器人大腦成為一個“懂物理”的引擎本身。

具體而言,不再去猜測物體運動的軌跡,而是學習調(diào)用和理解一個內(nèi)置的、可微分的物理模擬器。當機器人觀察一個場景時,它會學習生成該場景的3D模型、物理屬性,并設定交互規(guī)則。這個過程是“可微分”的,意味著每一次模擬的成敗都能轉化為明確的數(shù)學信號(梯度),指導模型如何修正其內(nèi)部參數(shù)。通過這種方式,模型學習生成的是由物理規(guī)律驅動的、可交互的動態(tài)世界。

更進一步,機器人最終能超越人類編寫的固定規(guī)則。通過觀察真實世界,可以自主學習并歸納出難以用公式描述的復雜物理現(xiàn)象(如線束穿過小孔、粘性液體流動),從物理規(guī)則的“使用者”變?yōu)椤鞍l(fā)現(xiàn)者”和“建模者”。這極大地彌補了理想化模擬與復雜現(xiàn)實之間的鴻溝(Sim-to-Real Gap)。

▍技能學習的新范式:在內(nèi)部物理世界中規(guī)劃與演練

擁有GS-World后,機器人學習技能的方式將發(fā)生根本性改變。它可以在行動前,在內(nèi)部世界里進行數(shù)萬次零成本、超高速的虛擬演練。



1.基于“可供性鏈”的任務分解

以“倒咖啡”為例,任務需要被分解。這個分解過程基于機器人對物體物理用途的理解,我們稱之為“可供性鏈”(Chain of Affordance)推理。

? 物體可供性 (Object Affordance):機器人從內(nèi)部模型中知道杯子的位置、重量、材質(zhì)以及如何抓握。

? 操作可供性 (Manipulation Affordance):在模擬中驗證“按下”按鈕的可行性,“傾倒”咖啡所需的姿態(tài)和力度。

? 空間可供性 (Spatial Affordance):理解杯子應被放置的區(qū)域,以及移動路徑上是否有障礙。

通過這種推理,機器人能將復雜任務自主分解為一系列物理上可行、邏輯上連貫的子任務。

2.閉環(huán)的“演練-評分-反思”

對于每個子任務,機器人在GS-World中通過強化學習或運動規(guī)劃進行優(yōu)化。同時,它具“具身反思推理”(Reflective Embodied Reasoning)能力。如果在模擬中發(fā)現(xiàn)某一步反復失?。ɡ纭澳闷鸨印保?,它會回溯并探索其他任務分解或技能執(zhí)行策略,而不是盲目重試。這個“分解-演練-評分-反思”的閉環(huán),構成了一個強大的“技能生成引擎”。



▍從虛擬到現(xiàn)實:通往真正可用的機器人智能

GS-World的最終價值在于解決“從模擬到現(xiàn)實”(Sim-to-Real)的遷移難題。

跨維智能提出的新一代VLA模型架構,其高層規(guī)劃腦(System 2)與低層執(zhí)行腦(System 1)共享同一個源自GS-World的物理世界觀,確保了“思考”與“行動”在物理層面的統(tǒng)一。



最關鍵的是,GS-World通過學習物理本質(zhì)而非視覺表象,解決了當前生成視頻類世界模型距離落地應用的核心難題。當機器人進入現(xiàn)實世界,與物體的運動學參數(shù)、動力學參數(shù)相關的物理法則是不變的。GS-World學習的正是這些超越視覺、連接虛擬與現(xiàn)實的“領域不變”知識。因此,在GS-World中學成的技能,能夠以極少調(diào)整甚至“零樣本”的方式,直接遷移到真實機器人上。

這引領我們走向一種全新的“引擎驅動學習”(Engine-driven Learning)范式。具身智能體擁有了一個永不枯竭的數(shù)據(jù)源——GS-World,可按需生成無窮無盡的訓練場景,可以在持續(xù)的自主探索中實現(xiàn)自我進化。我們甚至可以利用這套框架,在模擬中評估并優(yōu)化機器人的硬件形態(tài)(如臂長、關節(jié)數(shù)量),實現(xiàn)軟硬件的一體化協(xié)同進化。

▍結語

我們正處在人形機器人與AI發(fā)展的關鍵路口:一條是繼續(xù)在數(shù)據(jù)與像素表象上進行模型訓練,追求在特定場景下的成功;另一條則是選擇更具挑戰(zhàn)但更穩(wěn)固的道路,教會AI真正理解并掌握世界運行的根本法則——物理。

GS-World所倡導的正是第二條道路。它構想的未來是,AI不再是僅僅模仿人類行為的系統(tǒng),而是能通過內(nèi)部世界的物理推演來理解、預測并與世界進行創(chuàng)造性互動的理性行動者。我們堅信,這條路將為通往真正穩(wěn)固、可解釋、可擴展的通用人工智能奠定堅實的基礎。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
連續(xù)6個交易日20cm漲停,今年最牛股明起停牌核查

連續(xù)6個交易日20cm漲停,今年最牛股明起停牌核查

財聯(lián)社
2026-01-12 19:58:06
伊朗外交部長宣布解除互聯(lián)網(wǎng)封鎖,前王儲呼吁推翻伊斯蘭共和國

伊朗外交部長宣布解除互聯(lián)網(wǎng)封鎖,前王儲呼吁推翻伊斯蘭共和國

一種觀點
2026-01-12 19:24:55
中戲新疆班畢業(yè)生出面證實,中戲2011級新疆班沒有林傲霏

中戲新疆班畢業(yè)生出面證實,中戲2011級新疆班沒有林傲霏

我就是個碼字的
2026-01-12 17:30:25
這條荒唐新聞,引起公憤了!

這條荒唐新聞,引起公憤了!

胖胖說他不胖
2026-01-11 10:00:11
西蒙尼:我向弗洛倫蒂諾和維尼修斯道歉,我承認我做得不對

西蒙尼:我向弗洛倫蒂諾和維尼修斯道歉,我承認我做得不對

懂球帝
2026-01-12 20:48:51
歷史性一幕發(fā)生:馬杜羅被抓后,世界分成3派,烏克蘭最令人氣憤

歷史性一幕發(fā)生:馬杜羅被抓后,世界分成3派,烏克蘭最令人氣憤

文史旺旺旺
2026-01-11 15:47:04
江蘇女子向北大才子炫耀50億家產(chǎn),被裝鐵桶沉長江,3天后撈出

江蘇女子向北大才子炫耀50億家產(chǎn),被裝鐵桶沉長江,3天后撈出

小哥很OK
2024-07-16 07:53:00
大結局!林昀儒4:0世界亞軍,斬獲男單冠軍,國乒男單女單0冠收官

大結局!林昀儒4:0世界亞軍,斬獲男單冠軍,國乒男單女單0冠收官

國乒二三事
2026-01-12 01:50:39
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
特朗普取打擊伊朗匯報,美國對伊朗的打擊可能隨時開始

特朗普取打擊伊朗匯報,美國對伊朗的打擊可能隨時開始

邵旭峰域
2026-01-12 17:57:06
蔣介石侍衛(wèi)長郝柏村晚年稱:蔣介石最大錯誤,就是接受雅爾塔協(xié)定

蔣介石侍衛(wèi)長郝柏村晚年稱:蔣介石最大錯誤,就是接受雅爾塔協(xié)定

嘆為觀止易
2026-01-10 10:00:47
中央戲劇學院通報“演員閆學晶兒子被舉報違規(guī)入學”:2012年未招收新疆班,網(wǎng)傳信息不屬實,該考生以戶籍地北京生源身份報考我院

中央戲劇學院通報“演員閆學晶兒子被舉報違規(guī)入學”:2012年未招收新疆班,網(wǎng)傳信息不屬實,該考生以戶籍地北京生源身份報考我院

揚子晚報
2026-01-11 20:20:10
一夜4個消息!中國女排朱婷再獲MVP,被曝將回國,或挖角莊宇珊

一夜4個消息!中國女排朱婷再獲MVP,被曝將回國,或挖角莊宇珊

吾愛女排
2026-01-12 13:56:54
36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

釋凡電影
2025-08-14 09:33:19
氣壞了!澳大利亞球迷:我們甚至輸給中國男足,這是最殘酷的現(xiàn)實

氣壞了!澳大利亞球迷:我們甚至輸給中國男足,這是最殘酷的現(xiàn)實

國足風云
2026-01-12 08:44:34
閆學晶事件持續(xù)發(fā)酵,馮鞏等5人被牽連,趙本山曾告誡她別忘本!

閆學晶事件持續(xù)發(fā)酵,馮鞏等5人被牽連,趙本山曾告誡她別忘本!

叨嘮
2026-01-10 03:42:17
中超轉會動態(tài):上賽季第十官宣10人離隊,賽季15球外援在列

中超轉會動態(tài):上賽季第十官宣10人離隊,賽季15球外援在列

中超偽球迷
2026-01-12 19:08:21
第15天:伊朗傷亡人數(shù)飆升,川普又開空頭支票

第15天:伊朗傷亡人數(shù)飆升,川普又開空頭支票

近距離
2026-01-12 10:59:39
王毅同索馬里外長電話會談:反對“索馬里蘭”勾結臺灣當局謀獨行徑

王毅同索馬里外長電話會談:反對“索馬里蘭”勾結臺灣當局謀獨行徑

新京報
2026-01-11 19:19:06
合川千人刨豬湯后續(xù):母親獨自打掃,本人哭求幫忙,粉絲擅自亂闖

合川千人刨豬湯后續(xù):母親獨自打掃,本人哭求幫忙,粉絲擅自亂闖

丁丁鯉史紀
2026-01-12 15:59:20
2026-01-12 21:44:49
人形機器人發(fā)布
人形機器人發(fā)布
最新發(fā)布人形機器人科技、產(chǎn)品、應用,引領人形機器人行業(yè)高質(zhì)量發(fā)展
178文章數(shù) 2關注度
往期回顧 全部

科技要聞

面對SpaceX瘋狂“下餃子” 中國正面接招

頭條要聞

知曉女子丈夫出差 男子跨城趕來將她約賓館猥褻拍裸照

頭條要聞

知曉女子丈夫出差 男子跨城趕來將她約賓館猥褻拍裸照

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

蔡少芬結婚18周年,與張晉過二人世界

財經(jīng)要聞

倍輕松信披迷霧 實控人占用資金金額存疑

汽車要聞

增配不加價 北京現(xiàn)代 第五代 勝達2026款上市

態(tài)度原創(chuàng)

旅游
本地
時尚
健康
教育

旅游要聞

冰上漁歌起 年味踏雪來 哈素海冬捕節(jié)解鎖青城跨年新玩法

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

今年冬天最美搭配:大衣+裙子,誰穿誰好看!

血常規(guī)3項異常,是身體警報!

教育要聞

頭頂上的爭論 | 新觀察

無障礙瀏覽 進入關懷版