国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

圖片生成仿真!這個(gè)AI讓3D資產(chǎn)「開箱即用」,直接賦能機(jī)器人訓(xùn)練

0
分享至

非羊 整理自 凹非寺
量子位 | 公眾號(hào) QbitAI

一張照片,就能生成可直接用于仿真的3D資產(chǎn)。

(沒錯(cuò),下圖中幾乎所有物體都是AI生成的)



隨著三維建模從傳統(tǒng)的靜態(tài)視覺效果,逐步邁向可用于仿真與交互的物理可動(dòng)資產(chǎn),如何直接生成具備物理屬性與關(guān)節(jié)結(jié)構(gòu)的3D對(duì)象,成為推動(dòng)具身智能(embodied AI)發(fā)展的關(guān)鍵。

然而,現(xiàn)有大多數(shù)3D生成方法往往忽視這些核心的物理與運(yùn)動(dòng)特性,嚴(yán)重限制了其在機(jī)器人等相關(guān)領(lǐng)域的應(yīng)用。

為此,來自南洋理工大學(xué)與上海人工智能實(shí)驗(yàn)室的合作研究團(tuán)隊(duì)提出PhysX-Anything——首個(gè)面向仿真、具備物理屬性的3D生成框架:僅需單張圖像,即可生成高質(zhì)量、可直接用于仿真的3D資產(chǎn),并同時(shí)具備顯式幾何結(jié)構(gòu)、關(guān)節(jié)運(yùn)動(dòng)以及物理參數(shù)

從「靜態(tài)模型」走向「物理仿真」

在機(jī)器人、具身智能和交互仿真等任務(wù)中,對(duì)能在物理引擎中直接運(yùn)行的高質(zhì)量3D資產(chǎn)需求日益增長。然而,當(dāng)前大多數(shù)3D生成方法仍側(cè)重于整體幾何與外觀,或僅關(guān)注部件結(jié)構(gòu),普遍缺失密度、絕對(duì)尺度、關(guān)節(jié)約束等關(guān)鍵物理信息,難以直接用于真實(shí)仿真與控制。

盡管已有少數(shù)研究開始探索可動(dòng)3D對(duì)象的生成,但由于高質(zhì)量3D物理標(biāo)注數(shù)據(jù)的稀缺,多采用“檢索現(xiàn)有模型+附加運(yùn)動(dòng)”的范式,難以從單張真實(shí)圖像泛化生成全新且物理一致的資產(chǎn)。此外,現(xiàn)有方法對(duì)形變行為的建模也常假設(shè)材料均勻或忽略部分物理屬性。即便是能夠生成物理3D資產(chǎn)的PhysXGen,其輸出也尚未支持在主流物理引擎中即插即用,限制了在控制任務(wù)中的實(shí)用性。

為彌合合成3D資產(chǎn)與真實(shí)下游應(yīng)用之間的差距,研究團(tuán)隊(duì)提出了PhysX-Anything——首個(gè)面向仿真的物理3D生成范式。該框架僅憑一張圖像,即可生成高質(zhì)量、可直接導(dǎo)入標(biāo)準(zhǔn)模擬器的sim-ready(仿真就緒)3D資產(chǎn)。該成果有望為3D生成、具身智能與機(jī)器人領(lǐng)域帶來新的可能性與研究范式。



如何通過一張圖,實(shí)現(xiàn)3D物理重建?

PhysX-Anything采用“由粗到細(xì)(coarse-to-fine)”的生成框架。給定一張真實(shí)場(chǎng)景圖像,系統(tǒng)通過多輪對(duì)話,依次生成整體物理描述與各部件幾何信息,通過對(duì)物理表征進(jìn)行解碼,最終解碼輸出六種常用格式的可仿真3D資產(chǎn)。



1. 實(shí)現(xiàn)193倍壓縮比!「體素」如何重構(gòu)3D表示?

在傳統(tǒng)視覺語言模型(VLM)中進(jìn)行3D生成時(shí),為壓縮原始網(wǎng)格的token長度,主流方法通常采用基于頂點(diǎn)量化的文本序列表示,但所得幾何token仍十分冗長。3D VQ-GAN雖可進(jìn)一步壓縮幾何token,卻需要在微調(diào)階段引入額外特殊token和自定義tokenizer,增加了訓(xùn)練與部署的復(fù)雜度。

為此,研究團(tuán)隊(duì)提出一種新型3D表征方式,在顯式保留幾何結(jié)構(gòu)的同時(shí)顯著縮短token序列,且無需任何額外token。該方法受體素(就是三維的像素)表征在精度與效率間良好折中的啟發(fā),基于體素構(gòu)建幾何表示:首先在323體素網(wǎng)格上由VLM建模粗略幾何,再由下游解碼器細(xì)化得到高保真形狀,從而保留體素顯式結(jié)構(gòu)優(yōu)勢(shì),同時(shí)避免過高token開銷。



在整體信息表征上,團(tuán)隊(duì)沿用樹狀、VLM友好的結(jié)構(gòu),并以JSON風(fēng)格格式替代標(biāo)準(zhǔn)URDF,使其包含更豐富的物理屬性與文本描述,便于VLM理解與推理。同時(shí),團(tuán)隊(duì)將關(guān)鍵運(yùn)動(dòng)學(xué)參數(shù)(如運(yùn)動(dòng)方向、關(guān)節(jié)軸位置、運(yùn)動(dòng)范圍等)統(tǒng)一映射到體素空間,以保證運(yùn)動(dòng)學(xué)與幾何結(jié)構(gòu)的一致性。

2. 從「全局藍(lán)圖」到「局部精修」

在上述物理3D資產(chǎn)表征的基礎(chǔ)上,研究團(tuán)隊(duì)采用Qwen2.5作為基礎(chǔ)模型,并在自建的物理3D數(shù)據(jù)集上對(duì)該VLM進(jìn)行微調(diào)。通過精心設(shè)計(jì)的多輪對(duì)話流程,PhysX-Anything能同時(shí)生成高質(zhì)量的全局描述(整體物理與結(jié)構(gòu)屬性)與局部信息(部件級(jí)幾何)。

為獲取更精細(xì)的幾何細(xì)節(jié),團(tuán)隊(duì)受ControlNet啟發(fā),設(shè)計(jì)了一個(gè)可控的flow transformer。該模塊將粗體素表示作為擴(kuò)散模型的引導(dǎo)信號(hào),控制細(xì)粒度體素幾何的生成。在得到細(xì)粒度體素表示后,系統(tǒng)采用預(yù)訓(xùn)練的結(jié)構(gòu)化潛在擴(kuò)散模型解碼出多種格式的3D資產(chǎn),包括網(wǎng)格表面、輻射場(chǎng)與3D高斯等。

隨后,基于體素分配結(jié)果,使用最近鄰算法將重建網(wǎng)格劃分為部件級(jí)組件。

最終,結(jié)合全局結(jié)構(gòu)信息與細(xì)粒度體素幾何,PhysX-Anything能夠生成用于仿真的URDF、XML及部件級(jí)網(wǎng)格,實(shí)現(xiàn)“仿真就緒”的物理3D生成。



效果如何?多項(xiàng)實(shí)測(cè)全面驗(yàn)證

1. 在PhysX-Mobility數(shù)據(jù)集上的評(píng)估

研究團(tuán)隊(duì)將PhysX-Anything與當(dāng)前最新方法URDFormer、Articulate-Anything和PhysXGen進(jìn)行對(duì)比。如下表所示,PhysX-Anything在幾何與物理兩類指標(biāo)上均取得最優(yōu)表現(xiàn)。得益于強(qiáng)大的VLM先驗(yàn),其在絕對(duì)尺度上的誤差大幅降低。此外,由于VLM結(jié)構(gòu)適合處理文本,PhysX-Anything在文本描述相關(guān)指標(biāo)上也取得最高得分,表明該方法方法不僅能夠生成物理上合理的屬性,還能產(chǎn)出連貫的、具備部件層級(jí)的文字描述,對(duì)物體結(jié)構(gòu)與功能具備較強(qiáng)理解能力。



除了定量結(jié)果,定性對(duì)比也清晰顯示,PhysX-Anything在泛化能力方面具有顯著優(yōu)勢(shì),尤其相較于檢索式方法更為突出。依托強(qiáng)大的VLM先驗(yàn)與高效表征設(shè)計(jì),該系統(tǒng)還能生成比PhysXGen更合理、可信的物理屬性。



2. 真實(shí)世界場(chǎng)景測(cè)試

基于VLM的評(píng)估:為評(píng)估方法的泛化能力,團(tuán)隊(duì)進(jìn)一步在真實(shí)世界圖像上測(cè)試其性能。這些圖像覆蓋了最常見的日常物體類別。為避免VLM在某些具體物理屬性上判斷不穩(wěn)定的問題,本次評(píng)估重點(diǎn)放在幾何與關(guān)節(jié)運(yùn)動(dòng)質(zhì)量上。結(jié)果表明,PhysX-Anything在幾何與運(yùn)動(dòng)學(xué)參數(shù)兩項(xiàng)指標(biāo)上均顯著優(yōu)于所有對(duì)比方法,顯示出對(duì)真實(shí)輸入的強(qiáng)泛化能力。



作為補(bǔ)充,團(tuán)隊(duì)還召集了一些人類志愿者為不同模型的生成結(jié)果打分,PhysX-Anything的生成結(jié)構(gòu)在幾何與物理屬性都獲得了最高分,表明其生成結(jié)果對(duì)比來看也更受人類認(rèn)可。



在真實(shí)場(chǎng)景上的可視化結(jié)果也可進(jìn)一步直觀展示該方法的優(yōu)勢(shì):PhysX-Anything能夠生成更加準(zhǔn)確的幾何結(jié)構(gòu)、關(guān)節(jié)運(yùn)動(dòng)以及物理屬性。



3. 「開箱即用」賦能具身智能訓(xùn)練

為驗(yàn)證生成資產(chǎn)對(duì)下游任務(wù)的支撐能力,團(tuán)隊(duì)在MuJoCo風(fēng)格的模擬器中進(jìn)行了實(shí)驗(yàn)。生成的sim-ready 3D資產(chǎn)——包括水龍頭、柜子、打火機(jī)、眼鏡等日常物體——可以直接導(dǎo)入模擬器,并用于接觸豐富的機(jī)器人策略學(xué)習(xí)。



該實(shí)驗(yàn)不僅展示了生成資產(chǎn)在物理行為與幾何結(jié)構(gòu)上的高度可信性,也突顯了它們?cè)谕苿?dòng)多種下游機(jī)器人與具身智能應(yīng)用方面的巨大潛力。

推動(dòng)3D重建從「形似」走向「神似」

研究團(tuán)隊(duì)提出首個(gè)面向仿真的物理3D生成范式PhysX-Anything,通過統(tǒng)一的VLM管線與定制3D表征,在顯式保留幾何結(jié)構(gòu)的前提下實(shí)現(xiàn)超過193倍的token壓縮,顯著提升了物理3D生成的效率與可擴(kuò)展性。

同時(shí),團(tuán)隊(duì)構(gòu)建了覆蓋47個(gè)常見真實(shí)類別、具備豐富物理標(biāo)注的PhysX-Mobility數(shù)據(jù)集,大幅拓展了現(xiàn)有物理3D資產(chǎn)的多樣性。基于該數(shù)據(jù)集及真實(shí)世界場(chǎng)景的實(shí)驗(yàn)表明,PhysX-Anything在sim-ready物理3D生成上具有優(yōu)異性能與穩(wěn)健泛化能力,仿真實(shí)驗(yàn)進(jìn)一步驗(yàn)證了其在下游機(jī)器人策略學(xué)習(xí)中的應(yīng)用潛力。

該框架有望為3D視覺、具身智能與機(jī)器人研究開辟新的方向,推動(dòng)從“視覺建?!钡健拔锢斫!钡姆妒睫D(zhuǎn)變



視頻鏈接:https://mp.weixin.qq.com/s/gUooZUSc1yWQlf4NpViZrA

原論文第一作者曹子昂,南洋理工大學(xué)博士二年級(jí),研究方向是計(jì)算機(jī)視覺、3D AIGC和具身智能。主要合作者為來自南洋理工大學(xué)洪方舟、陳昭熹和來自上海人工智能實(shí)驗(yàn)室的潘亮,通訊作者為南洋理工大學(xué)劉子緯教授。

論文鏈接:https://arxiv.org/abs/2511.13648
項(xiàng)目主頁:hthttps://physx-anything.github.io/
GitHub代碼:https://github.com/ziangcao0312/PhysX-Anything

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
據(jù)說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關(guān)系

據(jù)說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關(guān)系

忠于法紀(jì)
2025-12-04 11:25:07
隨著塞內(nèi)加爾3-0,尼日利亞2-1,非洲杯最新積分榜和射手榜出爐

隨著塞內(nèi)加爾3-0,尼日利亞2-1,非洲杯最新積分榜和射手榜出爐

側(cè)身凌空斬
2025-12-24 06:53:55
再有錢又怎樣?印度首富小兒子300斤生娃難,兩代人全靠高科技生

再有錢又怎樣?印度首富小兒子300斤生娃難,兩代人全靠高科技生

毒舌小紅帽
2025-12-16 19:06:34
2025,他們離我們遠(yuǎn)去

2025,他們離我們遠(yuǎn)去

新京報(bào)書評(píng)周刊
2025-12-23 10:00:37
Spears:追夢(mèng)對(duì)每晚都要防比他重20多公斤的中鋒感到郁悶

Spears:追夢(mèng)對(duì)每晚都要防比他重20多公斤的中鋒感到郁悶

北青網(wǎng)-北京青年報(bào)
2025-12-24 07:23:03
明年將對(duì)全國高速路服務(wù)區(qū)廁所改造,坐便位比例提至兩成以上

明年將對(duì)全國高速路服務(wù)區(qū)廁所改造,坐便位比例提至兩成以上

南方都市報(bào)
2025-12-23 17:34:05
妻子3人被發(fā)小殺害新進(jìn)展:刀被砍斷后,又用包上繩子將三人勒死

妻子3人被發(fā)小殺害新進(jìn)展:刀被砍斷后,又用包上繩子將三人勒死

江山揮筆
2025-12-23 17:51:09
5天僅4.7億!《阿凡達(dá)3》票房慘敗證明,中國觀眾要的是爽和快

5天僅4.7億!《阿凡達(dá)3》票房慘敗證明,中國觀眾要的是爽和快

動(dòng)物奇奇怪怪
2025-12-24 11:50:03
收藏家龐萊臣后人談南京博物館:“不能理解,不能接受”

收藏家龐萊臣后人談南京博物館:“不能理解,不能接受”

互聯(lián)網(wǎng)大觀
2025-12-23 12:03:00
南方黑芝麻糊被建議“改名米糊”!黑芝麻僅排配料表第四位……

南方黑芝麻糊被建議“改名米糊”!黑芝麻僅排配料表第四位……

國際金融報(bào)
2025-12-23 12:29:37
日本火箭失敗不到48小時(shí),長征十二回收失利,但卻帶來一個(gè)好消息

日本火箭失敗不到48小時(shí),長征十二回收失利,但卻帶來一個(gè)好消息

面包夾知識(shí)
2025-12-23 19:19:11
怎么才能知道單位同事有沒有后臺(tái)?老江湖的剖析讓人拓寬視野!精辟

怎么才能知道單位同事有沒有后臺(tái)?老江湖的剖析讓人拓寬視野!精辟

另子維愛讀史
2025-12-23 16:54:23
衛(wèi)報(bào):非足聯(lián)內(nèi)部對(duì)非洲杯改四年一屆表示擔(dān)憂,這會(huì)影響收入

衛(wèi)報(bào):非足聯(lián)內(nèi)部對(duì)非洲杯改四年一屆表示擔(dān)憂,這會(huì)影響收入

懂球帝
2025-12-24 10:30:19
中方:敦促美方立即撤銷

中方:敦促美方立即撤銷

觀察者網(wǎng)
2025-12-23 21:50:16
湖人大??!詹姆斯刷新歷史第一卻難舊主,里夫斯復(fù)出,狄龍轟25分

湖人大敗!詹姆斯刷新歷史第一卻難舊主,里夫斯復(fù)出,狄龍轟25分

老侃侃球
2025-12-24 12:50:39
牡丹花下死,做鬼也風(fēng)流!37歲“縱欲過度”的王思聰,再陷大丑聞

牡丹花下死,做鬼也風(fēng)流!37歲“縱欲過度”的王思聰,再陷大丑聞

瓜汁橘長Dr
2025-12-22 15:12:57
外蒙為何反華?如今寧可餓死也不向東大靠攏?

外蒙為何反華?如今寧可餓死也不向東大靠攏?

扶蘇聊歷史
2025-12-24 10:09:43
誰都沒想到!中日46條航線剛?cè)∠?,竟讓這些“妖魔鬼怪”現(xiàn)出原形

誰都沒想到!中日46條航線剛?cè)∠?,竟讓這些“妖魔鬼怪”現(xiàn)出原形

介知
2025-12-23 16:00:49
趙睿與王思雨被催婚!符合全部擇偶標(biāo)準(zhǔn)?藏著一個(gè)體壇“大秘密”

趙睿與王思雨被催婚!符合全部擇偶標(biāo)準(zhǔn)?藏著一個(gè)體壇“大秘密”

手工制作阿殲
2025-12-23 08:34:33
膽大!女子喝醉在車站大廳遭男子性侵無知覺,長達(dá)10分鐘無人報(bào)警

膽大!女子喝醉在車站大廳遭男子性侵無知覺,長達(dá)10分鐘無人報(bào)警

歷史偉人錄
2025-12-23 12:12:00
2025-12-24 13:48:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11907文章數(shù) 176341關(guān)注度
往期回顧 全部

科技要聞

馬斯克沒想到的"中國速度"!2026值得期待

頭條要聞

幼兒園園長載著多名幼兒落水致8死 疑用私家車當(dāng)校車

頭條要聞

幼兒園園長載著多名幼兒落水致8死 疑用私家車當(dāng)校車

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

財(cái)經(jīng)要聞

快手到底惹了誰?

汽車要聞

將于明年一季度上市 零跑D19內(nèi)飾官圖發(fā)布

態(tài)度原創(chuàng)

藝術(shù)
親子
教育
旅游
軍事航空

藝術(shù)要聞

2026第一福!孫曉云親筆“?!弊殖鰻t

親子要聞

冉瑩穎12歲兒打生長激素一年長高8厘米,父母均高1米63

教育要聞

避坑!這三組“雙胞胎”專業(yè)別選錯(cuò),高中生選專業(yè)先分清這些差異

旅游要聞

2025上海國際旅游度假區(qū)“夢(mèng)享券”公告

軍事要聞

俄烏沖突關(guān)鍵人物在莫斯科被炸死 烏方尚未公開認(rèn)領(lǐng)

無障礙瀏覽 進(jìn)入關(guān)懷版