国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

732M模型超越7B!機(jī)器人操控新范式:從視頻中「悟」物理

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】機(jī)器人操控的「數(shù)據(jù)困境」一直是行業(yè)痛點(diǎn):要讓機(jī)器人學(xué)會精細(xì)操作,傳統(tǒng)方法需要大量人工標(biāo)注的動作演示數(shù)據(jù),成本高昂、周期漫長。這個(gè)瓶頸能否被突破?

大型視頻生成模型在海量視頻上訓(xùn)練,已經(jīng)隱式地學(xué)會了物理世界的運(yùn)行規(guī)律:物體如何運(yùn)動、力如何傳遞、空間關(guān)系如何演化。

這些知識與機(jī)器人操控所需的物理直覺高度一致。

關(guān)鍵問題是能否把這些視頻模型已經(jīng)掌握的物理先驗(yàn),轉(zhuǎn)移到機(jī)器人控制上?

中山大學(xué)王廣潤教授給出了一個(gè)創(chuàng)新答案:不靠海量動作數(shù)據(jù),直接從視頻生成模型中「借」物理直覺。從PAR(物理自回歸模型)到其進(jìn)階版本PhysGen(從預(yù)訓(xùn)練視頻模型中學(xué)習(xí)物理),兩項(xiàng)工作一脈相承,共享同一套物理自回歸核心框架,并與英偉達(dá)今年2月發(fā)布的DreamDojo在核心思路上高度重合——當(dāng)兩條獨(dú)立探索的路線收斂到同一個(gè)方向,這或許意味著某種底層規(guī)律正在被揭示。


PAR論文鏈接:https://arxiv.org/abs/2508.09822

項(xiàng)目主頁:https://hcplab-sysu.github.io/PhysicalAutoregressiveModel

論文發(fā)表時(shí)間:2025年8月13日


PhysGen論文鏈接:https://arxiv.org/abs/2603.00110

論文發(fā)表時(shí)間:2026年2月18日

傳統(tǒng)方法把「看環(huán)境」和「做動作」分成兩個(gè)任務(wù)。

PAR反其道而行之:把視頻幀和機(jī)器人動作編碼成同一種「物理token」,讓模型在同一個(gè)自回歸過程中,既預(yù)測「世界接下來會變成什么樣」,也同步輸出「機(jī)器人該做什么動作」,這與人類「眼手協(xié)調(diào)」的直覺高度吻合。

這樣做的好處是:動作不再是孤立的指令序列,而是與環(huán)境演化深度綁定的聯(lián)合預(yù)測。


圖1:物理token自回歸的運(yùn)作方式:預(yù)測未來的幀與動作聯(lián)合體,與真實(shí)環(huán)境同步演化

三個(gè)技術(shù)要點(diǎn)

  1. 連續(xù)表示,不離散化:幀與動作都用連續(xù)向量表達(dá),避免離散量化帶來的精度損失

  2. 隱式逆運(yùn)動學(xué):通過特殊的因果掩碼設(shè)計(jì),讓模型在看到未來畫面后再決定當(dāng)前動作

  3. 高效推理:借鑒LLM的KV-Cache技術(shù),實(shí)現(xiàn)實(shí)時(shí)控制

效果如何?

在ManiSkill基準(zhǔn)測試中:

  • PushCube任務(wù)達(dá)到100%成功率

  • 總體平均成功率74%,居所有方法第二,僅次于需要大規(guī)模動作預(yù)訓(xùn)練的RDT(84%)

  • 在PickCube與StackCube任務(wù)上,同樣超過或接近需要動作預(yù)訓(xùn)練的強(qiáng)基準(zhǔn)方法

  • 額外引入?yún)?shù)僅30M


圖2:ManiSkill基準(zhǔn)成功率對比(零動作預(yù)訓(xùn)練,媲美SOTA)

PhysGen

對物理自回歸路線的深化

PhysGen在2026年2月公開發(fā)布,是PAR路線的延續(xù)。它完整保留了PAR的核心架構(gòu)(物理token、連續(xù)表示、因果掩碼),并在此基礎(chǔ)上做了三處關(guān)鍵改進(jìn)。

三項(xiàng)升級

① 前瞻規(guī)劃(Lookahead-MTP)讓模型每次預(yù)測時(shí)「多看幾步」——同時(shí)預(yù)測未來3個(gè)token,訓(xùn)練時(shí)全監(jiān)督,推理時(shí)只執(zhí)行第一個(gè)。這相當(dāng)于給機(jī)器人配了短期規(guī)劃能力。

② 高效訓(xùn)練(LoRA微調(diào))用參數(shù)高效的方式微調(diào)大模型,訓(xùn)練成本大幅降低——單張A100顯卡,60小時(shí)內(nèi)完成訓(xùn)練。

③ 真實(shí)世界驗(yàn)證不止在仿真環(huán)境,PhysGen在Franka Panda真實(shí)機(jī)械臂上完成了四項(xiàng)任務(wù)測試,包括抓取透明物體這種高難度場景。

效果有多強(qiáng)?

LIBERO仿真基準(zhǔn):


圖3:732M參數(shù)、在零大規(guī)模動作預(yù)訓(xùn)練的前提下,Physgen取得平均90.8%成功率

真實(shí)世界任務(wù):


圖4: 真實(shí)機(jī)器人實(shí)驗(yàn)性能對比

在最考驗(yàn)物理感知的透明物體抓取任務(wù)中,PhysGen反超了需要大規(guī)模預(yù)訓(xùn)練的π0模型——這說明從視頻學(xué)到的物理直覺,在處理視覺欺騙性強(qiáng)的場景時(shí)更有優(yōu)勢。

與英偉達(dá)DreamDojo的深度同源

今年2月,英偉達(dá)發(fā)布了DreamDojo——一個(gè)基于大規(guī)模視頻訓(xùn)練的通用機(jī)器人世界模型。對比PAR/PhysGen與DreamDojo,會發(fā)現(xiàn)兩條路線在核心技術(shù)理念上驚人一致。

兩個(gè)系統(tǒng)的本質(zhì)目標(biāo)完全一致:預(yù)測未來的「物理量」——也就是未來的動作和視頻的聯(lián)合體。

這個(gè)設(shè)計(jì)背后的哲學(xué)是:機(jī)器人操控不是「先看畫面,再決定動作」的串行過程,而是「世界如何演化」與「機(jī)器人如何行動」的聯(lián)合預(yù)測問題。動作和視頻不是兩個(gè)獨(dú)立變量,而是物理世界演化的共同結(jié)果。


架構(gòu)共識:自回歸建模

在如何預(yù)測這個(gè)「未來物理量」的問題上,兩個(gè)系統(tǒng)不約而同地選擇了自回歸架構(gòu)

為什么是自回歸?因?yàn)槲锢硎澜绲难莼?strong>序列性、因果性的——當(dāng)前時(shí)刻的狀態(tài)決定下一時(shí)刻的狀態(tài),下一時(shí)刻又影響再下一時(shí)刻。自回歸模型天然契合這種逐步展開的物理過程。


表示共識:連續(xù)空間建模

在如何表達(dá)「物理量」的問題上,兩個(gè)系統(tǒng)都選擇了連續(xù)表示,而非離散化。

這是一個(gè)關(guān)鍵決策:物理世界本質(zhì)上是連續(xù)的(位置、速度、力都是連續(xù)量),離散化會引入量化誤差,這些誤差在長時(shí)序預(yù)測中會累積放大。連續(xù)表示則能保持物理量的原生精度。


訓(xùn)練共識:零動作預(yù)訓(xùn)練

兩個(gè)系統(tǒng)都驗(yàn)證了同一個(gè)重要結(jié)論:不需要大規(guī)模機(jī)器人動作數(shù)據(jù)預(yù)訓(xùn)練,就能實(shí)現(xiàn)強(qiáng)大的操控能力。

這背后的邏輯是:視頻數(shù)據(jù)本身已經(jīng)包含了豐富的物理先驗(yàn)(物體運(yùn)動規(guī)律、力學(xué)關(guān)系、空間推理),這些先驗(yàn)可以直接遷移到機(jī)器人控制任務(wù)上。


時(shí)間線印證

中大團(tuán)隊(duì)的PAR在2025年8月公開,PhysGen在2026年3月公開,DreamDojo在2026年2月發(fā)布。

三者獨(dú)立推進(jìn),卻在四個(gè)核心決策上同步收斂:

① 預(yù)測目標(biāo):未來動作+視頻聯(lián)合體(物理量)② 架構(gòu)選擇:自回歸逐步展開(契合物理因果)③ 表示方法:連續(xù)空間建模(避免量化誤差)④ 訓(xùn)練范式:零動作預(yù)訓(xùn)練(視頻物理先驗(yàn)遷移)

這不是偶然的相似,而是對同一底層規(guī)律的共同發(fā)現(xiàn)。

其中最核心的洞察是:

世界模型不是為了「看起來好」,而是為了「指導(dǎo)動作」

這是PAR/PhysGen與傳統(tǒng)視頻生成模型的根本區(qū)別。

傳統(tǒng)視頻生成模型(如Sora、Runway)追求的是視覺保真度——生成的視頻要看起來真實(shí)、「美觀流暢。

但對于機(jī)器人操控而言,世界模型的根本目的不是生成一段視覺上美觀的未來視頻,而是希望生成的未來視頻能對下一步的物理動作起到實(shí)質(zhì)性的前瞻與指導(dǎo)作用。

核心哲學(xué)總結(jié)

對世界模型的理解,可以歸結(jié)為一句話:

世界模型的價(jià)值不在于生成「好看的視頻」,而在于生成「對動作有指導(dǎo)意義的物理預(yù)測」。視頻只是物理演化的可視化載體,真正重要的是其中蘊(yùn)含的物理因果關(guān)系——這些因果關(guān)系決定了「做什么動作會導(dǎo)致什么結(jié)果」,而這正是機(jī)器人決策的核心依據(jù)。

這也是為什么PhysGen能用732M參數(shù)超越7B級模型——它沒有把算力浪費(fèi)在「讓視頻更美」上,而是專注于「讓物理預(yù)測更準(zhǔn)」。

從PAR到PhysGen,正在驗(yàn)證一條清晰的技術(shù)路線:把機(jī)器人操控問題重新定義為「預(yù)測未來物理量」——未來的動作和視頻聯(lián)合體,并用自回歸模型在連續(xù)空間中逐步展開這個(gè)預(yù)測過程。

更重要的是,明確了世界模型的根本目的:不是生成視覺上美觀的未來視頻,而是生成對下一步物理動作有實(shí)質(zhì)指導(dǎo)作用的物理預(yù)測。這個(gè)理念體現(xiàn)在物理token聯(lián)合建模、因果掩碼逆運(yùn)動學(xué)、前瞻多步規(guī)劃、真實(shí)世界物理挑戰(zhàn)驗(yàn)證等一系列設(shè)計(jì)中,并通過732M參數(shù)超越7B級模型的效率,以及透明物體抓取超越π0的效果,得到了實(shí)踐檢驗(yàn)。

而英偉達(dá)DreamDojo在預(yù)測目標(biāo)、架構(gòu)選擇、表示方法、訓(xùn)練范式四個(gè)核心決策上的同步跟進(jìn),則從另一個(gè)側(cè)面印證了這一方向的潛力。

作者介紹

王廣潤系國家海外高層次青年人才基金及華為戰(zhàn)略人才基金獲得者,中山大學(xué)計(jì)算機(jī)學(xué)院青年研究員、博士生導(dǎo)師,拓元智慧首席科學(xué)家。華為「天才少年計(jì)劃」最高級別入選者;曾赴英國牛津大學(xué)擔(dān)任Research Fellow,師從英國皇家科學(xué)院院士、皇家工程院院士 Philip H.S. Torr 教授。

主要從事新一代AI架構(gòu)、大物理模型與世界模型、多模態(tài)生成式AI方向研究。獲吳文俊人工智能優(yōu)秀博士論文獎(全國僅9人)、《Pattern Recognition》全球當(dāng)年唯一最佳論文、全球AI華人新星榜(當(dāng)年機(jī)器學(xué)習(xí)領(lǐng)域全球僅25人);擔(dān)任多個(gè)CCF A類會議領(lǐng)域主席;在多項(xiàng)國際競賽中獲得金牌;研究成果被圖靈獎得主Yann LeCun引用。

參考資料:

https://arxiv.org/abs/2603.00110

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
奧運(yùn)會為什么發(fā)避孕套?難道運(yùn)動員都帶伴侶嗎?看完你就明白了!

奧運(yùn)會為什么發(fā)避孕套?難道運(yùn)動員都帶伴侶嗎?看完你就明白了!

南權(quán)先生
2026-02-13 15:17:51
壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個(gè)次數(shù)

壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個(gè)次數(shù)

DrX說
2025-10-24 14:15:19
筱梅曬滿月汪寶胖乎乎超萌,四月回北京,對箖玥的安排被網(wǎng)友夸爆

筱梅曬滿月汪寶胖乎乎超萌,四月回北京,對箖玥的安排被網(wǎng)友夸爆

樂悠悠娛樂
2026-03-28 13:47:27
603008,1億現(xiàn)金“消失”,監(jiān)管火速出手!下周多只牛股將面臨解禁(附股)

603008,1億現(xiàn)金“消失”,監(jiān)管火速出手!下周多只牛股將面臨解禁(附股)

數(shù)據(jù)寶
2026-03-28 17:54:12
70歲呂良偉香港半馬輕松拿下,引得周潤發(fā)調(diào)侃:“吃了防腐劑”

70歲呂良偉香港半馬輕松拿下,引得周潤發(fā)調(diào)侃:“吃了防腐劑”

韓小娛
2026-03-27 17:34:28
必須給中國個(gè)交代,解放軍重磅發(fā)聲,航母隨時(shí)前出,休想蒙混過關(guān)

必須給中國個(gè)交代,解放軍重磅發(fā)聲,航母隨時(shí)前出,休想蒙混過關(guān)

破鏡難圓
2026-03-27 23:02:22
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
吳京戳臉“一按一個(gè)坑”,網(wǎng)友勸其注意身體,本人回應(yīng):含水量高了些,身體還不錯,謝謝大家關(guān)心!

吳京戳臉“一按一個(gè)坑”,網(wǎng)友勸其注意身體,本人回應(yīng):含水量高了些,身體還不錯,謝謝大家關(guān)心!

極目新聞
2026-03-28 00:50:32
訂單已排到2030年!震驚歐美國家,中國趁此機(jī)會突圍上位

訂單已排到2030年!震驚歐美國家,中國趁此機(jī)會突圍上位

春風(fēng)笑語
2026-03-28 08:28:33
張本美和連贏早田希娜,率隊(duì)3-2絕殺奪冠,平野美宇自我救贖

張本美和連贏早田希娜,率隊(duì)3-2絕殺奪冠,平野美宇自我救贖

許礆很機(jī)智
2026-03-28 19:25:52
周總理一生中有哪些錯誤?

周總理一生中有哪些錯誤?

顧史
2026-03-19 14:58:48
多名院士研究發(fā)現(xiàn):吃一把花生,就等于吃了兩勺黃油,真的假的?

多名院士研究發(fā)現(xiàn):吃一把花生,就等于吃了兩勺黃油,真的假的?

健康科普365
2026-03-28 19:40:03
關(guān)鍵時(shí)刻美軍航母“炸了”:中國導(dǎo)彈沒辦到的事,美國廁紙干成了

關(guān)鍵時(shí)刻美軍航母“炸了”:中國導(dǎo)彈沒辦到的事,美國廁紙干成了

阿器談史
2026-03-28 19:13:04
在南寧開一年特斯拉Model Y,終于明白電動車的省,都是有前提的

在南寧開一年特斯拉Model Y,終于明白電動車的省,都是有前提的

音樂時(shí)光的娛樂
2026-03-28 16:38:46
鉀是蘋果的8倍,建議中老年人,春天多吃這“高鉀菜”,精神好!

鉀是蘋果的8倍,建議中老年人,春天多吃這“高鉀菜”,精神好!

阿龍美食記
2026-03-26 15:22:03
這4種魚,可能含有甲醛和重金屬,建議:還是少吃比較好!

這4種魚,可能含有甲醛和重金屬,建議:還是少吃比較好!

阿龍美食記
2026-03-24 21:52:23
烏克蘭:中國榨干蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們把1.0變成2.0

烏克蘭:中國榨干蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們把1.0變成2.0

標(biāo)體
2026-03-26 15:22:18
中方拒收道歉,日本自衛(wèi)官被轉(zhuǎn)移,小泉進(jìn)次郎沉默24小時(shí)后發(fā)聲

中方拒收道歉,日本自衛(wèi)官被轉(zhuǎn)移,小泉進(jìn)次郎沉默24小時(shí)后發(fā)聲

何氽簡史
2026-03-26 15:40:58
末節(jié)6+5+4統(tǒng)治比賽!約基奇33+15+12又迎里程碑:一戰(zhàn)創(chuàng)7紀(jì)錄

末節(jié)6+5+4統(tǒng)治比賽!約基奇33+15+12又迎里程碑:一戰(zhàn)創(chuàng)7紀(jì)錄

顏小白的籃球夢
2026-03-28 11:30:32
北京男籃確定裁掉貝利,廣廈內(nèi)線補(bǔ)強(qiáng),廣東球迷現(xiàn)場喊杜鋒下課

北京男籃確定裁掉貝利,廣廈內(nèi)線補(bǔ)強(qiáng),廣東球迷現(xiàn)場喊杜鋒下課

中國籃壇快訊
2026-03-28 17:52:03
2026-03-28 20:11:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14837文章數(shù) 66720關(guān)注度
往期回顧 全部

科技要聞

遭中國學(xué)界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

45歲男子駕車時(shí)突發(fā)心梗離世 2天前還在外地跑馬拉松

頭條要聞

45歲男子駕車時(shí)突發(fā)心梗離世 2天前還在外地跑馬拉松

體育要聞

“我是全家最差勁的運(yùn)動員”

娛樂要聞

王一博改名上熱搜!個(gè)人時(shí)代正式開啟!

財(cái)經(jīng)要聞

臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

汽車要聞

置換補(bǔ)貼價(jià)4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

游戲
旅游
親子
藝術(shù)
軍事航空

《Screamer》登陸Steam正式推出 動畫渲染爆裂賽車

旅游要聞

洛陽:早開牡丹已綻放 共赴春日之約

親子要聞

愛玩沙子是孩子的天性,這套#太空沙玩具 在家就能實(shí)現(xiàn)玩沙子的快樂,關(guān)鍵比去游樂場玩干凈衛(wèi)生。#兒童玩...

藝術(shù)要聞

中國油畫學(xué)會三十年藝術(shù)展 | 油畫選刊(一)

軍事要聞

美軍中東基地?fù)p失最新披露

無障礙瀏覽 進(jìn)入關(guān)懷版