国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

HSImul3R:給三維交互重建裝上物理大腦

0
分享至



在具身智能狂飆突進(jìn)的今天,讓機(jī)器人像人一樣在復(fù)雜場(chǎng)景中靈活交互,已成為學(xué)術(shù)界與工業(yè)界的共同愿景。其中的核心挑戰(zhàn)在于人體 - 場(chǎng)景交互建模,這需要深入理解人體運(yùn)動(dòng)、空間布局以及交互的穩(wěn)定性。從圖像或視頻中重建人體 - 場(chǎng)景交互(HSI),不僅能提供高保真的監(jiān)督信號(hào),還能幫助構(gòu)建可擴(kuò)展的、仿真就緒(Simulation-ready)的數(shù)據(jù)集。

然而,現(xiàn)有方法普遍存在 “感知 - 仿真鴻溝”(Perception–Simulation Gap):許多在視覺(jué)上極其逼真的人體交互重建結(jié)果,一旦丟進(jìn)物理仿真器,就會(huì)因?yàn)檫`背物理定律(如身體穿透物體、重心不穩(wěn)等)而瞬間崩塌。這一鴻溝很大程度上源于人體與環(huán)境建模的分離?,F(xiàn)有研究很少捕捉兩者間明確的物理耦合,而是分為三個(gè)獨(dú)立方向:1)3D 場(chǎng)景重建(如 NeRF, 3DGS),側(cè)重環(huán)境幾何而忽視人體動(dòng)力學(xué);2)人體動(dòng)作估計(jì),雖具魯棒性但在隔離狀態(tài)下重建,缺乏物理接觸或環(huán)境約束;3)交互建模,通常受限于規(guī)模和物理驗(yàn)證不足。盡管近期出現(xiàn)了一些統(tǒng)一框架,但仍主要在 2D 圖像空間優(yōu)化,優(yōu)先考慮視覺(jué)對(duì)齊而非幾何與物理的有效性。因此,重建結(jié)果缺乏尺度和接觸精度,無(wú)法用于仿真部署。

為了彌合這一鴻溝,來(lái)自南洋理工大學(xué) S-Lab,ACE Robotics,和上海人工智能實(shí)驗(yàn)室的研究團(tuán)隊(duì)推出了 HSImul3R—— 一個(gè)仿真就緒的人體 - 場(chǎng)景交互 3D 重建框架。該框架將重建表述為一個(gè)雙向物理感知優(yōu)化問(wèn)題。物理仿真器充當(dāng) “主動(dòng)監(jiān)督者”,實(shí)現(xiàn)人體運(yùn)動(dòng)與場(chǎng)景幾何之間的閉環(huán)優(yōu)化。

  • 正向優(yōu)化:在固定場(chǎng)景幾何下細(xì)化人體運(yùn)動(dòng)。利用 3D 生成模型的結(jié)構(gòu)先驗(yàn)建立尺度一致的對(duì)齊后,他們將重建結(jié)果集成到模擬器中,進(jìn)行針對(duì)場(chǎng)景的強(qiáng)化學(xué)習(xí),利用物理信號(hào)(如關(guān)鍵點(diǎn)跟蹤一致性和幾何接觸約束)優(yōu)化運(yùn)動(dòng)穩(wěn)定性。
  • 反向優(yōu)化:在經(jīng)物理驗(yàn)證的動(dòng)作下細(xì)化場(chǎng)景幾何。針對(duì)結(jié)構(gòu)缺陷導(dǎo)致的穩(wěn)定性問(wèn)題,他們提出了直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO),利用仿真器反饋的獎(jiǎng)勵(lì)來(lái)增強(qiáng)重力穩(wěn)定性和交互可行性。

此外,他們采集構(gòu)建了 HSIBench 數(shù)據(jù)集,包含 19 類物體、50 多個(gè)運(yùn)動(dòng)序列及 300 個(gè)獨(dú)特交互實(shí)例。



想深入了解 HSImul3R 的技術(shù)細(xì)節(jié)?我們已經(jīng)為你準(zhǔn)備好了完整的論文、項(xiàng)目主頁(yè)!



  • 論文標(biāo)題:HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions
  • arXiv: https://arxiv.org/abs/2603.15612
  • Project Page:https://yukangcao.github.io/HSImul3R/
  • GitHub:https://github.com/yukangcao/HSImul3R

方法



以日常采集到的視頻或圖片作為輸入,HSImul3R 通過(guò) Physics-in-the-loop 的優(yōu)化管線實(shí)現(xiàn)了模擬就緒的人體 - 場(chǎng)景交互重建。本文以圖片輸入的情況作為講解。首先,他們提出了在重建管線中注入顯式 3D 生成先驗(yàn),以實(shí)現(xiàn)更優(yōu)的人體 - 場(chǎng)景對(duì)齊。隨后:(1)在正向優(yōu)化中,作者提出了場(chǎng)景針對(duì)性強(qiáng)化學(xué)習(xí),通過(guò)優(yōu)化人體運(yùn)動(dòng)來(lái)提高在仿真器中的交互穩(wěn)定性。(2)在反向優(yōu)化中,作者引入了直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO),利用仿真器關(guān)于穩(wěn)定性的反饋來(lái)精細(xì)化場(chǎng)景幾何。

具體而言,他們根據(jù)仿真的穩(wěn)定性反饋定義了四種結(jié)果類型:第一類:物體在重力作用下無(wú)法保持自穩(wěn);第二類:物體在人體交互過(guò)程中失去平衡;第三類:物體雖能達(dá)到穩(wěn)定狀態(tài),但不能和人體產(chǎn)生有意義的交互;第四類:物體和人體實(shí)現(xiàn)了穩(wěn)定的交互。

人體 - 場(chǎng)景交互重建與對(duì)齊



通過(guò)顯式 3D 結(jié)構(gòu)先驗(yàn)進(jìn)行對(duì)齊:盡管完成了上述初步對(duì)齊,兩個(gè)關(guān)鍵問(wèn)題依然存在:

(1) 重建的場(chǎng)景幾何常包含結(jié)構(gòu)錯(cuò)誤,如組件斷開(kāi)、表面缺失或非封閉拓?fù)洌?/p>

(2) 人體 - 場(chǎng)景對(duì)齊僅依賴于基于 2D 投影的監(jiān)督,缺乏 3D 幾何感知且易受遮擋影響。

這些缺陷不可避免地導(dǎo)致物理仿真器中的物理不穩(wěn)定和漂移。為解決這些挑戰(zhàn),作者利用預(yù)訓(xùn)練生成模型的 3D結(jié)構(gòu)先驗(yàn)來(lái)修正場(chǎng)景幾何,并施加更穩(wěn)健的交互約束。















正向優(yōu)化:基于場(chǎng)景的人體動(dòng)作優(yōu)化

在完成人體 - 場(chǎng)景交互的初始 3D 重建和對(duì)齊后,下一步是確保其在物理仿真器中具有穩(wěn)定的動(dòng)力學(xué)表現(xiàn)。一種直接的方法是采用運(yùn)動(dòng)跟蹤技術(shù)將重建的人體姿態(tài)重定向并放到仿真器中。然而,這樣直接仿真原始重建結(jié)果的做法往往無(wú)法產(chǎn)生穩(wěn)定的交互。在許多情況下,人形機(jī)器人會(huì)無(wú)意中碰撞附近的物體,導(dǎo)致物體與身體分離并獨(dú)立靜置于地面。這種不穩(wěn)定性是因?yàn)閭鹘y(tǒng)的 3D 重建未考慮重力與交互力,無(wú)法驗(yàn)證姿態(tài)與物體放置在物理上是否可實(shí)現(xiàn)。

為解決此問(wèn)題,作者在基于強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)跟蹤中引入了針對(duì)場(chǎng)景的監(jiān)督信號(hào)







反向優(yōu)化:仿真器引導(dǎo)的物體精細(xì)化

盡管帶有場(chǎng)景針對(duì)性強(qiáng)化學(xué)習(xí)的正向優(yōu)化增強(qiáng)了仿真穩(wěn)定性,作者仍觀察到穩(wěn)定性比例尚不理想。研究發(fā)現(xiàn),該問(wèn)題很大程度上源于顯式 3D 生成先驗(yàn)的質(zhì)量不一,主要原因有二:(1) 生成的物體常包含結(jié)構(gòu)缺陷(尤其是細(xì)長(zhǎng)幾何體),例如桌椅缺失腿部,導(dǎo)致其在無(wú)交互的情況下也無(wú)法在仿真器中自穩(wěn);(2) 輸入圖像中人體造成的嚴(yán)重遮擋常導(dǎo)致生成的物體出現(xiàn)表面畸變或異常凸起。這些局限使得人形機(jī)器人在仿真中難以建立穩(wěn)定且符合物理規(guī)律的接觸。

直接仿真獎(jiǎng)勵(lì)優(yōu)化 (DSRO):受 DSO 啟發(fā),他們提出了直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO),這是一種利用物理仿真反饋?zhàn)鳛楸O(jiān)督信號(hào)來(lái)精細(xì)化 3D 顯式物體生成的創(chuàng)新方法。不同于依賴人工標(biāo)注或 3D 真值的方法,DSRO 直接利用仿真結(jié)果來(lái)評(píng)估生成物體及其與人體交互的物理合理性。

形式上,我們將 DSRO 目標(biāo)定義為:





穩(wěn)定性由三個(gè)標(biāo)準(zhǔn)判定:(1) 物體必須在模擬器重力作用下保持直立和物理穩(wěn)定;(2) 重建場(chǎng)景必須達(dá)到穩(wěn)定的最終狀態(tài);(3) 交互必須包含實(shí)際接觸,而非物體獨(dú)立靜置于地面。

HSIBench 數(shù)據(jù)集及仿真實(shí)驗(yàn)



為了支持本框架的訓(xùn)練與基準(zhǔn)測(cè)試,作者們構(gòu)建了一個(gè)專門針對(duì)人體 - 場(chǎng)景交互的數(shù)據(jù)集 ——HSIBench。該數(shù)據(jù)集通過(guò)系統(tǒng)性地采集交互場(chǎng)景構(gòu)建而成,邀請(qǐng)了三名志愿者(兩男一女)與多種物體進(jìn)行交互,包括 8 把椅子、3 張桌子和 3 個(gè)沙發(fā)。

HSIBench 共記錄了300 個(gè)獨(dú)特的 HSI 案例,每個(gè)案例均從16 個(gè)不同視角進(jìn)行拍攝,以提供豐富的多視圖監(jiān)督信號(hào)。上圖中,作者提供了部分?jǐn)?shù)據(jù)的示例圖和仿真結(jié)果。

真機(jī)實(shí)驗(yàn)



除了仿真模擬之外,作者們基于 HSImul3R 優(yōu)化的人體運(yùn)動(dòng)軌跡,實(shí)現(xiàn)了 sim-to-real 的真機(jī)實(shí)驗(yàn)。其中,他們首先利用 GMR 將人體動(dòng)作重定向至 宇樹(shù) G1 人形機(jī)器人的形態(tài)。這些重定向后的動(dòng)作隨后被用作擴(kuò)散引導(dǎo)強(qiáng)化學(xué)習(xí)(Diffusion-guided RL)的先驗(yàn),在 IsaacGym 仿真器中訓(xùn)練全身控制策略。該框架允許智能體在強(qiáng)化學(xué)習(xí)訓(xùn)練階段利用擴(kuò)散模型的生成先驗(yàn)來(lái)學(xué)習(xí)穩(wěn)健的平衡能力。訓(xùn)練完成后,生成的控制策略通過(guò) Unitree SDK 直接部署到 G1 人形機(jī)器人硬件上。

如上圖所示,該策略在 宇樹(shù) G1 真機(jī)上的成功部署表明,HSImul3R 精細(xì)化后的動(dòng)作能夠?qū)崿F(xiàn)穩(wěn)定的機(jī)器人 - 場(chǎng)景交互。該框架為利用 YouTube 等平臺(tái)的海量低成本數(shù)據(jù)來(lái)增強(qiáng)大規(guī)模具身智能模型的訓(xùn)練數(shù)據(jù)提供了可擴(kuò)展的基礎(chǔ)。

總結(jié)

本文介紹了 HSImul3R,一個(gè)能夠從非校準(zhǔn)稀疏視角中重建仿真就緒人體 - 場(chǎng)景交互的框架。該方法方法集成了:(1)接觸感知交互模型,旨在緩解 3D 重建中的人與場(chǎng)景穿模的問(wèn)題;(2)場(chǎng)景針對(duì)性強(qiáng)化學(xué)習(xí)策略,用以提升仿真器內(nèi)的交互穩(wěn)定性;(3)直接仿真獎(jiǎng)勵(lì)優(yōu)化(DSRO)方案,利用仿真反饋微調(diào)圖生 3D 生成模型,從而提高仿真成功率。此外,作者們采集了 HSIBench 數(shù)據(jù)集以支持訓(xùn)練與評(píng)估。實(shí)驗(yàn)證明,HSImul3R 在穩(wěn)定仿真與高質(zhì)量 3D 重建方面均達(dá)到了高保真效果,性能顯著優(yōu)于現(xiàn)有最先進(jìn)方法。

盡管 HSImul3R 在仿真就緒重建領(lǐng)域邁出了第一步,但仍存在以下局限:

1.成功率仍有提升空間:尤其是在涉及復(fù)雜交互或多物體(超過(guò)三個(gè))的場(chǎng)景下;

2.交互深度不足:在部分失敗案例中,人體與物體趨向于各自獨(dú)立站立,而非產(chǎn)生有意義的實(shí)質(zhì)性交互;

3.模型偏見(jiàn):微調(diào)后的圖生 3D 模型不可避免地繼承了原始 MIDI 數(shù)據(jù)集及 HSIBench 的偏見(jiàn),這可能限制其在域外場(chǎng)景的泛化能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
破紀(jì)錄!超越日本只是開(kāi)始

破紀(jì)錄!超越日本只是開(kāi)始

中國(guó)新聞周刊
2026-04-04 16:15:41
北美觀察丨美F-15被擊落 伊朗戰(zhàn)爭(zhēng)的代價(jià)正在累積

北美觀察丨美F-15被擊落 伊朗戰(zhàn)爭(zhēng)的代價(jià)正在累積

國(guó)際在線
2026-04-04 10:53:03
今日油價(jià)|4月4日調(diào)整后92/95號(hào)汽油價(jià)格,下周油價(jià)將大漲!

今日油價(jià)|4月4日調(diào)整后92/95號(hào)汽油價(jià)格,下周油價(jià)將大漲!

豬友巴巴
2026-04-04 16:20:03
徹底反轉(zhuǎn)!澳洲品牌方發(fā)聲澄清,董宇輝直播間根本沒(méi)賣問(wèn)題款

徹底反轉(zhuǎn)!澳洲品牌方發(fā)聲澄清,董宇輝直播間根本沒(méi)賣問(wèn)題款

行者聊官
2026-04-04 16:43:42
食品快遞中途被血液污染,轉(zhuǎn)運(yùn)中心未聯(lián)系客戶私拆快遞換箱子?順豐速運(yùn)回應(yīng)

食品快遞中途被血液污染,轉(zhuǎn)運(yùn)中心未聯(lián)系客戶私拆快遞換箱子?順豐速運(yùn)回應(yīng)

瀟湘晨報(bào)
2026-04-04 19:21:23
別什么東西都往豆包上發(fā)了,男子發(fā)私照讓豆包評(píng)價(jià)身材,賬號(hào)遭封禁:會(huì)有人審核,別亂發(fā)亂聊天

別什么東西都往豆包上發(fā)了,男子發(fā)私照讓豆包評(píng)價(jià)身材,賬號(hào)遭封禁:會(huì)有人審核,別亂發(fā)亂聊天

觀威海
2026-04-04 16:15:03
簽完反華聲明,馬克龍離開(kāi)日本,臨走前一錘定音,減少對(duì)華依賴

簽完反華聲明,馬克龍離開(kāi)日本,臨走前一錘定音,減少對(duì)華依賴

書(shū)紀(jì)文譚
2026-04-04 17:07:31
150秒,3個(gè)孩子差點(diǎn)沒(méi)了爸!深圳男子踢球時(shí)心臟驟停被隊(duì)友成功搶救,自述刷屏:“上周還在轉(zhuǎn)發(fā)同行猝死消息”

150秒,3個(gè)孩子差點(diǎn)沒(méi)了爸!深圳男子踢球時(shí)心臟驟停被隊(duì)友成功搶救,自述刷屏:“上周還在轉(zhuǎn)發(fā)同行猝死消息”

大風(fēng)新聞
2026-04-04 11:09:03
一輩子關(guān)系最好的兩種人:小時(shí)候光腚一起玩,長(zhǎng)大后光腚一起玩

一輩子關(guān)系最好的兩種人:小時(shí)候光腚一起玩,長(zhǎng)大后光腚一起玩

青蘋果sht
2026-04-04 06:26:30
不邀請(qǐng)中國(guó)參加G7峰會(huì) 馬克龍為何改主意了?

不邀請(qǐng)中國(guó)參加G7峰會(huì) 馬克龍為何改主意了?

看看新聞Knews
2026-04-04 17:51:02
國(guó)乒女隊(duì)也淪落?孫穎莎險(xiǎn)勝,倆主力慘敗,教練組特殊安排被批評(píng)

國(guó)乒女隊(duì)也淪落?孫穎莎險(xiǎn)勝,倆主力慘敗,教練組特殊安排被批評(píng)

三十年萊斯特城球迷
2026-04-04 19:59:09
恩愛(ài)劇本不演了?奚夢(mèng)瑤提離婚,何猷君掀桌子 私生子傳聞?wù)嫦啻蟀?>
    </a>
        <h3>
      <a href=鄉(xiāng)野小珥
2026-04-04 09:46:29
出訪大陸前,鄭麗文拜訪吳伯雄,吳伯雄一句話,讓蔣萬(wàn)安無(wú)話可說(shuō)

出訪大陸前,鄭麗文拜訪吳伯雄,吳伯雄一句話,讓蔣萬(wàn)安無(wú)話可說(shuō)

DS北風(fēng)
2026-04-04 13:30:07
“美軍特種部隊(duì)已進(jìn)入伊朗”

“美軍特種部隊(duì)已進(jìn)入伊朗”

觀察者網(wǎng)
2026-04-04 20:03:27
賽季最具含金量大勝!20分掀翻廣廈,奎因一戰(zhàn)封神,廣東殺回前三

賽季最具含金量大勝!20分掀翻廣廈,奎因一戰(zhàn)封神,廣東殺回前三

后仰大風(fēng)車
2026-04-04 21:47:19
局勢(shì)失控?大橋被炸后,伊朗列出的報(bào)復(fù)清單震動(dòng)中東

局勢(shì)失控?大橋被炸后,伊朗列出的報(bào)復(fù)清單震動(dòng)中東

兵國(guó)大事
2026-04-03 22:20:22
張雪狠批哪吒汽車之死:五個(gè)億就為做個(gè)Logo!

張雪狠批哪吒汽車之死:五個(gè)億就為做個(gè)Logo!

新浪財(cái)經(jīng)
2026-04-04 20:30:57
廣東一女子被搶后開(kāi)車撞向劫匪,致一人死亡,終審被判正當(dāng)防衛(wèi)無(wú)罪

廣東一女子被搶后開(kāi)車撞向劫匪,致一人死亡,終審被判正當(dāng)防衛(wèi)無(wú)罪

臺(tái)州交通廣播
2026-04-04 10:17:55
重慶官方通報(bào)廣陽(yáng)島固定三角翼飛行器墜落,目擊者:從頭頂飛過(guò),發(fā)動(dòng)機(jī)聲音有些不對(duì),不到10秒就墜機(jī)了

重慶官方通報(bào)廣陽(yáng)島固定三角翼飛行器墜落,目擊者:從頭頂飛過(guò),發(fā)動(dòng)機(jī)聲音有些不對(duì),不到10秒就墜機(jī)了

極目新聞
2026-04-04 19:19:00
金昊,已被執(zhí)行死刑

金昊,已被執(zhí)行死刑

中國(guó)新聞周刊
2026-04-03 23:17:17
2026-04-04 23:35:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12681文章數(shù) 142612關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國(guó)產(chǎn)手機(jī)廠商集體漲價(jià)

頭條要聞

媒體:美軍上演現(xiàn)實(shí)版"拯救大兵" 特朗普"贏學(xué)"被打臉

頭條要聞

媒體:美軍上演現(xiàn)實(shí)版"拯救大兵" 特朗普"贏學(xué)"被打臉

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂(lè)要聞

Q女士反擊,否認(rèn)逼宋寧峰張婉婷離婚

財(cái)經(jīng)要聞

中微董事長(zhǎng),給半導(dǎo)體潑點(diǎn)冷水

汽車要聞

17萬(wàn)級(jí)海豹07EV 不僅續(xù)航長(zhǎng)還有9分鐘滿電的快樂(lè)

態(tài)度原創(chuàng)

家居
教育
時(shí)尚
本地
健康

家居要聞

溫馨多元 愛(ài)的具象化

教育要聞

讓孩子可以對(duì)誘騙侵犯說(shuō)不,是寶媽們的必修課!

別再穿大一碼了!遮肉根本不是靠寬松

本地新聞

跟著歌聲游安徽,聽(tīng)古村回響

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版