国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

HSImul3R:給三維交互重建裝上物理大腦

0
分享至



在具身智能狂飆突進(jìn)的今天,讓機(jī)器人像人一樣在復(fù)雜場(chǎng)景中靈活交互,已成為學(xué)術(shù)界與工業(yè)界的共同愿景。其中的核心挑戰(zhàn)在于人體 - 場(chǎng)景交互建模,這需要深入理解人體運(yùn)動(dòng)、空間布局以及交互的穩(wěn)定性。從圖像或視頻中重建人體 - 場(chǎng)景交互(HSI),不僅能提供高保真的監(jiān)督信號(hào),還能幫助構(gòu)建可擴(kuò)展的、仿真就緒(Simulation-ready)的數(shù)據(jù)集。

然而,現(xiàn)有方法普遍存在 “感知 - 仿真鴻溝”(Perception–Simulation Gap):許多在視覺上極其逼真的人體交互重建結(jié)果,一旦丟進(jìn)物理仿真器,就會(huì)因?yàn)檫`背物理定律(如身體穿透物體、重心不穩(wěn)等)而瞬間崩塌。這一鴻溝很大程度上源于人體與環(huán)境建模的分離?,F(xiàn)有研究很少捕捉兩者間明確的物理耦合,而是分為三個(gè)獨(dú)立方向:1)3D 場(chǎng)景重建(如 NeRF, 3DGS),側(cè)重環(huán)境幾何而忽視人體動(dòng)力學(xué);2)人體動(dòng)作估計(jì),雖具魯棒性但在隔離狀態(tài)下重建,缺乏物理接觸或環(huán)境約束;3)交互建模,通常受限于規(guī)模和物理驗(yàn)證不足。盡管近期出現(xiàn)了一些統(tǒng)一框架,但仍主要在 2D 圖像空間優(yōu)化,優(yōu)先考慮視覺對(duì)齊而非幾何與物理的有效性。因此,重建結(jié)果缺乏尺度和接觸精度,無法用于仿真部署。

為了彌合這一鴻溝,來自南洋理工大學(xué) S-Lab,ACE Robotics,和上海人工智能實(shí)驗(yàn)室的研究團(tuán)隊(duì)推出了 HSImul3R—— 一個(gè)仿真就緒的人體 - 場(chǎng)景交互 3D 重建框架。該框架將重建表述為一個(gè)雙向物理感知優(yōu)化問題。物理仿真器充當(dāng) “主動(dòng)監(jiān)督者”,實(shí)現(xiàn)人體運(yùn)動(dòng)與場(chǎng)景幾何之間的閉環(huán)優(yōu)化。

  • 正向優(yōu)化:在固定場(chǎng)景幾何下細(xì)化人體運(yùn)動(dòng)。利用 3D 生成模型的結(jié)構(gòu)先驗(yàn)建立尺度一致的對(duì)齊后,他們將重建結(jié)果集成到模擬器中,進(jìn)行針對(duì)場(chǎng)景的強(qiáng)化學(xué)習(xí),利用物理信號(hào)(如關(guān)鍵點(diǎn)跟蹤一致性和幾何接觸約束)優(yōu)化運(yùn)動(dòng)穩(wěn)定性。
  • 反向優(yōu)化:在經(jīng)物理驗(yàn)證的動(dòng)作下細(xì)化場(chǎng)景幾何。針對(duì)結(jié)構(gòu)缺陷導(dǎo)致的穩(wěn)定性問題,他們提出了直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO),利用仿真器反饋的獎(jiǎng)勵(lì)來增強(qiáng)重力穩(wěn)定性和交互可行性。

此外,他們采集構(gòu)建了 HSIBench 數(shù)據(jù)集,包含 19 類物體、50 多個(gè)運(yùn)動(dòng)序列及 300 個(gè)獨(dú)特交互實(shí)例。



想深入了解 HSImul3R 的技術(shù)細(xì)節(jié)?我們已經(jīng)為你準(zhǔn)備好了完整的論文、項(xiàng)目主頁(yè)!



  • 論文標(biāo)題:HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions
  • arXiv: https://arxiv.org/abs/2603.15612
  • Project Page:https://yukangcao.github.io/HSImul3R/
  • GitHub:https://github.com/yukangcao/HSImul3R

方法



以日常采集到的視頻或圖片作為輸入,HSImul3R 通過 Physics-in-the-loop 的優(yōu)化管線實(shí)現(xiàn)了模擬就緒的人體 - 場(chǎng)景交互重建。本文以圖片輸入的情況作為講解。首先,他們提出了在重建管線中注入顯式 3D 生成先驗(yàn),以實(shí)現(xiàn)更優(yōu)的人體 - 場(chǎng)景對(duì)齊。隨后:(1)在正向優(yōu)化中,作者提出了場(chǎng)景針對(duì)性強(qiáng)化學(xué)習(xí),通過優(yōu)化人體運(yùn)動(dòng)來提高在仿真器中的交互穩(wěn)定性。(2)在反向優(yōu)化中,作者引入了直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO),利用仿真器關(guān)于穩(wěn)定性的反饋來精細(xì)化場(chǎng)景幾何。

具體而言,他們根據(jù)仿真的穩(wěn)定性反饋定義了四種結(jié)果類型:第一類:物體在重力作用下無法保持自穩(wěn);第二類:物體在人體交互過程中失去平衡;第三類:物體雖能達(dá)到穩(wěn)定狀態(tài),但不能和人體產(chǎn)生有意義的交互;第四類:物體和人體實(shí)現(xiàn)了穩(wěn)定的交互。

人體 - 場(chǎng)景交互重建與對(duì)齊



通過顯式 3D 結(jié)構(gòu)先驗(yàn)進(jìn)行對(duì)齊:盡管完成了上述初步對(duì)齊,兩個(gè)關(guān)鍵問題依然存在:

(1) 重建的場(chǎng)景幾何常包含結(jié)構(gòu)錯(cuò)誤,如組件斷開、表面缺失或非封閉拓?fù)洌?/p>

(2) 人體 - 場(chǎng)景對(duì)齊僅依賴于基于 2D 投影的監(jiān)督,缺乏 3D 幾何感知且易受遮擋影響。

這些缺陷不可避免地導(dǎo)致物理仿真器中的物理不穩(wěn)定和漂移。為解決這些挑戰(zhàn),作者利用預(yù)訓(xùn)練生成模型的 3D結(jié)構(gòu)先驗(yàn)來修正場(chǎng)景幾何,并施加更穩(wěn)健的交互約束。















正向優(yōu)化:基于場(chǎng)景的人體動(dòng)作優(yōu)化

在完成人體 - 場(chǎng)景交互的初始 3D 重建和對(duì)齊后,下一步是確保其在物理仿真器中具有穩(wěn)定的動(dòng)力學(xué)表現(xiàn)。一種直接的方法是采用運(yùn)動(dòng)跟蹤技術(shù)將重建的人體姿態(tài)重定向并放到仿真器中。然而,這樣直接仿真原始重建結(jié)果的做法往往無法產(chǎn)生穩(wěn)定的交互。在許多情況下,人形機(jī)器人會(huì)無意中碰撞附近的物體,導(dǎo)致物體與身體分離并獨(dú)立靜置于地面。這種不穩(wěn)定性是因?yàn)閭鹘y(tǒng)的 3D 重建未考慮重力與交互力,無法驗(yàn)證姿態(tài)與物體放置在物理上是否可實(shí)現(xiàn)。

為解決此問題,作者在基于強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)跟蹤中引入了針對(duì)場(chǎng)景的監(jiān)督信號(hào)。







反向優(yōu)化:仿真器引導(dǎo)的物體精細(xì)化

盡管帶有場(chǎng)景針對(duì)性強(qiáng)化學(xué)習(xí)的正向優(yōu)化增強(qiáng)了仿真穩(wěn)定性,作者仍觀察到穩(wěn)定性比例尚不理想。研究發(fā)現(xiàn),該問題很大程度上源于顯式 3D 生成先驗(yàn)的質(zhì)量不一,主要原因有二:(1) 生成的物體常包含結(jié)構(gòu)缺陷(尤其是細(xì)長(zhǎng)幾何體),例如桌椅缺失腿部,導(dǎo)致其在無交互的情況下也無法在仿真器中自穩(wěn);(2) 輸入圖像中人體造成的嚴(yán)重遮擋常導(dǎo)致生成的物體出現(xiàn)表面畸變或異常凸起。這些局限使得人形機(jī)器人在仿真中難以建立穩(wěn)定且符合物理規(guī)律的接觸。

直接仿真獎(jiǎng)勵(lì)優(yōu)化 (DSRO):受 DSO 啟發(fā),他們提出了直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO),這是一種利用物理仿真反饋?zhàn)鳛楸O(jiān)督信號(hào)來精細(xì)化 3D 顯式物體生成的創(chuàng)新方法。不同于依賴人工標(biāo)注或 3D 真值的方法,DSRO 直接利用仿真結(jié)果來評(píng)估生成物體及其與人體交互的物理合理性。

形式上,我們將 DSRO 目標(biāo)定義為:





穩(wěn)定性由三個(gè)標(biāo)準(zhǔn)判定:(1) 物體必須在模擬器重力作用下保持直立和物理穩(wěn)定;(2) 重建場(chǎng)景必須達(dá)到穩(wěn)定的最終狀態(tài);(3) 交互必須包含實(shí)際接觸,而非物體獨(dú)立靜置于地面。

HSIBench 數(shù)據(jù)集及仿真實(shí)驗(yàn)



為了支持本框架的訓(xùn)練與基準(zhǔn)測(cè)試,作者們構(gòu)建了一個(gè)專門針對(duì)人體 - 場(chǎng)景交互的數(shù)據(jù)集 ——HSIBench。該數(shù)據(jù)集通過系統(tǒng)性地采集交互場(chǎng)景構(gòu)建而成,邀請(qǐng)了三名志愿者(兩男一女)與多種物體進(jìn)行交互,包括 8 把椅子、3 張桌子和 3 個(gè)沙發(fā)。

HSIBench 共記錄了300 個(gè)獨(dú)特的 HSI 案例,每個(gè)案例均從16 個(gè)不同視角進(jìn)行拍攝,以提供豐富的多視圖監(jiān)督信號(hào)。上圖中,作者提供了部分?jǐn)?shù)據(jù)的示例圖和仿真結(jié)果。

真機(jī)實(shí)驗(yàn)



除了仿真模擬之外,作者們基于 HSImul3R 優(yōu)化的人體運(yùn)動(dòng)軌跡,實(shí)現(xiàn)了 sim-to-real 的真機(jī)實(shí)驗(yàn)。其中,他們首先利用 GMR 將人體動(dòng)作重定向至 宇樹 G1 人形機(jī)器人的形態(tài)。這些重定向后的動(dòng)作隨后被用作擴(kuò)散引導(dǎo)強(qiáng)化學(xué)習(xí)(Diffusion-guided RL)的先驗(yàn),在 IsaacGym 仿真器中訓(xùn)練全身控制策略。該框架允許智能體在強(qiáng)化學(xué)習(xí)訓(xùn)練階段利用擴(kuò)散模型的生成先驗(yàn)來學(xué)習(xí)穩(wěn)健的平衡能力。訓(xùn)練完成后,生成的控制策略通過 Unitree SDK 直接部署到 G1 人形機(jī)器人硬件上。

如上圖所示,該策略在 宇樹 G1 真機(jī)上的成功部署表明,HSImul3R 精細(xì)化后的動(dòng)作能夠?qū)崿F(xiàn)穩(wěn)定的機(jī)器人 - 場(chǎng)景交互。該框架為利用 YouTube 等平臺(tái)的海量低成本數(shù)據(jù)來增強(qiáng)大規(guī)模具身智能模型的訓(xùn)練數(shù)據(jù)提供了可擴(kuò)展的基礎(chǔ)。

總結(jié)

本文介紹了 HSImul3R,一個(gè)能夠從非校準(zhǔn)稀疏視角中重建仿真就緒人體 - 場(chǎng)景交互的框架。該方法方法集成了:(1)接觸感知交互模型,旨在緩解 3D 重建中的人與場(chǎng)景穿模的問題;(2)場(chǎng)景針對(duì)性強(qiáng)化學(xué)習(xí)策略,用以提升仿真器內(nèi)的交互穩(wěn)定性;(3)直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO)方案,利用仿真反饋微調(diào)圖生 3D 生成模型,從而提高仿真成功率。此外,作者們采集了 HSIBench 數(shù)據(jù)集以支持訓(xùn)練與評(píng)估。實(shí)驗(yàn)證明,HSImul3R 在穩(wěn)定仿真與高質(zhì)量 3D 重建方面均達(dá)到了高保真效果,性能顯著優(yōu)于現(xiàn)有最先進(jìn)方法。

盡管 HSImul3R 在仿真就緒重建領(lǐng)域邁出了第一步,但仍存在以下局限:

1.成功率仍有提升空間:尤其是在涉及復(fù)雜交互或多物體(超過三個(gè))的場(chǎng)景下;

2.交互深度不足:在部分失敗案例中,人體與物體趨向于各自獨(dú)立站立,而非產(chǎn)生有意義的實(shí)質(zhì)性交互;

3.模型偏見:微調(diào)后的圖生 3D 模型不可避免地繼承了原始 MIDI 數(shù)據(jù)集及 HSIBench 的偏見,這可能限制其在域外場(chǎng)景的泛化能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
勸退!“去客廳化”火了5年,為什么70%家庭最后都偷偷把沙發(fā)搬了回來?

勸退!“去客廳化”火了5年,為什么70%家庭最后都偷偷把沙發(fā)搬了回來?

繪本家居
2026-04-10 11:13:39
狠人劉強(qiáng)東,對(duì)網(wǎng)約車下手了

狠人劉強(qiáng)東,對(duì)網(wǎng)約車下手了

新浪財(cái)經(jīng)
2026-04-12 01:43:16
李想公布東風(fēng)日產(chǎn)水軍拉踩理想證?...

李想公布東風(fēng)日產(chǎn)水軍拉踩理想證?...

新浪財(cái)經(jīng)
2026-04-12 09:46:53
30分鐘直撲東北!美國(guó)派48架F-35兵臨城下,解放軍:敢動(dòng)就全殲!

30分鐘直撲東北!美國(guó)派48架F-35兵臨城下,解放軍:敢動(dòng)就全殲!

論事的老樞
2026-04-11 20:33:38
恒大集團(tuán)許家印坑的最慘的9位大佬

恒大集團(tuán)許家印坑的最慘的9位大佬

地產(chǎn)微資訊
2026-03-29 19:08:15
鄭麗文將返回,大陸發(fā)出通告,多名藍(lán)白要員發(fā)聲,傅崐萁前往接機(jī)

鄭麗文將返回,大陸發(fā)出通告,多名藍(lán)白要員發(fā)聲,傅崐萁前往接機(jī)

娛樂小可愛蛙
2026-04-12 13:26:39
怕遭中方報(bào)復(fù)?巴拿馬搶在賠款前,主動(dòng)放低姿態(tài),李嘉誠(chéng)全面清倉(cāng)

怕遭中方報(bào)復(fù)?巴拿馬搶在賠款前,主動(dòng)放低姿態(tài),李嘉誠(chéng)全面清倉(cāng)

小俎娛樂
2026-04-11 06:39:16
這個(gè)男士是郭延軍,他的鼻子的寬度、面積、體積為普通人2倍以上

這個(gè)男士是郭延軍,他的鼻子的寬度、面積、體積為普通人2倍以上

歲月有情1314
2026-04-01 11:25:58
人到中年,縱欲過度就是在玩火。

人到中年,縱欲過度就是在玩火。

老陸不老
2026-04-12 12:16:52
在剛剛,上午16家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個(gè)股

在剛剛,上午16家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個(gè)股

股市皆大事
2026-04-12 11:20:15
桑切斯帶著妻子逛北京鼓樓被偶遇!穿藍(lán)襯衫藍(lán)牛仔褲,活力感滿滿

桑切斯帶著妻子逛北京鼓樓被偶遇!穿藍(lán)襯衫藍(lán)牛仔褲,活力感滿滿

八八尚語
2026-04-12 08:28:05
伊美談崩了!戰(zhàn)爭(zhēng)第二階段隨時(shí)爆發(fā),巴鐵正把美軍從沙特?cái)D走

伊美談崩了!戰(zhàn)爭(zhēng)第二階段隨時(shí)爆發(fā),巴鐵正把美軍從沙特?cái)D走

一簌月光
2026-04-12 15:00:37
醫(yī)生告誡:每天睡前玩手機(jī)的人,不用半年時(shí)間,睡眠或有這6變化

醫(yī)生告誡:每天睡前玩手機(jī)的人,不用半年時(shí)間,睡眠或有這6變化

白話電影院
2026-04-05 15:34:47
老蔣得知毛岸英犧牲,半夜支開宋美齡,向兒子蔣經(jīng)國(guó)吐露心聲

老蔣得知毛岸英犧牲,半夜支開宋美齡,向兒子蔣經(jīng)國(guó)吐露心聲

歷史點(diǎn)行
2026-04-09 23:52:43
隨著申花1-0戰(zhàn)勝海港,泰山1-0,中超最新積分:榜首領(lǐng)先墊底20分

隨著申花1-0戰(zhàn)勝海港,泰山1-0,中超最新積分:榜首領(lǐng)先墊底20分

球場(chǎng)沒跑道
2026-04-11 21:36:16
炸裂!廣東隊(duì)有望引進(jìn)“加強(qiáng)版徐昕”,這才是杜鋒的內(nèi)線答案?

炸裂!廣東隊(duì)有望引進(jìn)“加強(qiáng)版徐昕”,這才是杜鋒的內(nèi)線答案?

緋雨兒
2026-04-12 14:42:07
火出國(guó)門的莫氏雞煲!埃及博主慕名而來,結(jié)局反差太逗啦

火出國(guó)門的莫氏雞煲!埃及博主慕名而來,結(jié)局反差太逗啦

椰青美食分享
2026-04-12 09:14:01
新華社快訊:伊朗代表團(tuán)離開巴基斯坦

新華社快訊:伊朗代表團(tuán)離開巴基斯坦

新華社
2026-04-12 11:55:14
以色列對(duì)歐洲譴責(zé)其襲擊黎巴嫩真主黨的反問

以色列對(duì)歐洲譴責(zé)其襲擊黎巴嫩真主黨的反問

名人茍或
2026-04-11 06:54:11
熱刺降級(jí)?真降不起啊

熱刺降級(jí)?真降不起啊

懂球帝
2026-04-12 12:00:40
2026-04-12 16:03:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12729文章數(shù) 142623關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

"賭王"何鴻燊女兒何超蕸去世 臨終前家人陪伴在側(cè)

頭條要聞

"賭王"何鴻燊女兒何超蕸去世 臨終前家人陪伴在側(cè)

體育要聞

五大聯(lián)賽首冠出爐?拜仁或提前4輪衛(wèi)冕德甲

娛樂要聞

46歲趙達(dá)官宣結(jié)婚!曾與殷桃談婚論嫁

財(cái)經(jīng)要聞

三輪磋商談至深夜 美伊談判三大議題仍待解

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

教育
時(shí)尚
健康
藝術(shù)
軍事航空

教育要聞

Q開頭的單詞!

伊姐周六熱推:電視劇《八千里路云和月》;綜藝《乘風(fēng)2026》......

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

日本建筑大師的中國(guó)首個(gè)住宅項(xiàng)目,被防盜網(wǎng)毀了?

軍事要聞

美國(guó)副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議

無障礙瀏覽 進(jìn)入關(guān)懷版