国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

零樣本 Sim-to-Real !實(shí)現(xiàn)五指靈巧手力控抓取與手內(nèi)操作

0
分享至



實(shí)現(xiàn)具備人類水平的靈巧操作能力,是機(jī)器人學(xué)領(lǐng)域長(zhǎng)期以來(lái)的核心挑戰(zhàn)之一。盡管多指靈巧手在硬件上具備了類似人類的潛力,但由于接觸豐富的物理特性和非理想的驅(qū)動(dòng)機(jī)制,訓(xùn)練能夠直接部署在真實(shí)硬件上的控制策略仍然非常困難。

ByteDance Seed 團(tuán)隊(duì)最新的研究論文《Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation》 [1],針對(duì)這一關(guān)鍵問題提出了實(shí)用的強(qiáng)化學(xué)習(xí)(RL) 框架。

該研究的核心貢獻(xiàn)在于提出了一套完整的 Sim-to-Real 解決方案,通過結(jié)合高密度的觸覺反饋和基于電機(jī)電流估算的關(guān)節(jié)力矩感知,顯式地調(diào)節(jié)物理交互過程。該框架不僅解決了高分辨率觸覺仿真的計(jì)算瓶頸,還通過數(shù)據(jù)驅(qū)動(dòng)的執(zhí)行器建模消除了對(duì)昂貴力矩傳感器的依賴,最終實(shí)現(xiàn)了在純仿真環(huán)境中訓(xùn)練的策略。在仿真或訓(xùn)練環(huán)境中完成訓(xùn)練后,模型能夠在真實(shí)的五指靈巧手上實(shí)現(xiàn)零樣本(Zero-Shot) 部署,即無(wú)需額外的真實(shí)數(shù)據(jù)進(jìn)行微調(diào),便可直接在真實(shí)機(jī)器人上運(yùn)行。



Figure 1 :融合觸覺感知與關(guān)節(jié)力矩的全狀態(tài)策略框架

一、三大核心技術(shù):

打通從仿真到現(xiàn)實(shí)的感知與驅(qū)動(dòng)鏈路

論文的核心問題在于如何克服仿真與現(xiàn)實(shí)之間在觸覺感知、接觸物理和執(zhí)行器動(dòng)力學(xué)方面的巨大差異(Reality Gap),從而訓(xùn)練出能夠進(jìn)行力控抓取和靈巧操作的全狀態(tài)策略。

該研究構(gòu)建了一個(gè)由三大核心技術(shù)組成的完整體系,實(shí)現(xiàn)了從仿真訓(xùn)練到真實(shí)部署的無(wú)縫銜接。

1. 計(jì)算高效的觸覺仿真:高分辨率 + 高幀率,魚與熊掌兼得

高保真度的觸覺仿真是學(xué)習(xí)接觸豐富技能的長(zhǎng)期障礙。傳統(tǒng)的有限元分析(FEM) 或軟體仿真計(jì)算成本過高,無(wú)法滿足強(qiáng)化學(xué)習(xí)對(duì)大規(guī)模并行和高幀率的需求。

該研究提出了一種基于距離場(chǎng)的快速觸覺仿真方法。通過并行正向運(yùn)動(dòng)學(xué),計(jì)算密集的虛擬觸覺單元陣列與物體表面之間的距離。這種方法不僅能夠提供強(qiáng)化學(xué)習(xí)所需的高頻信號(hào),還保留了關(guān)鍵的接觸信息(如接觸力大小和受力加權(quán)接觸中心)。這種設(shè)計(jì)在保證物理合理性的同時(shí),極大地提升了仿真效率,使得策略能夠在仿真中充分探索復(fù)雜的接觸動(dòng)力學(xué)。

Figure 2 :接觸點(diǎn)建模與材料屬性

通過對(duì)比仿真與真實(shí)世界中的接觸數(shù)據(jù)(如下圖所示),可以發(fā)現(xiàn)兩者在接觸點(diǎn)分布和接觸力大小上表現(xiàn)出高度的一致性,證明了該觸覺仿真方法的高保真度。

2. 電流-力矩校準(zhǔn):無(wú)需力矩傳感器,也能精準(zhǔn)力控

大多數(shù)商用靈巧手采用連桿或者腱繩等傳動(dòng)結(jié)構(gòu),缺乏關(guān)節(jié)級(jí)的力矩傳感器,只能提供電機(jī)電流測(cè)量值。仿真中的理想力矩控制與真實(shí)電機(jī)的非理想特性之間存在巨大的現(xiàn)實(shí)鴻溝。

為了解決這一問題,研究團(tuán)隊(duì)引入了電流-力矩校準(zhǔn)機(jī)制。通過在準(zhǔn)靜態(tài)條件下擬合電機(jī)電流與接觸力、仿真力矩與接觸力之間的線性關(guān)系,建立了一個(gè)可靠的「電流到力矩」映射。這種數(shù)據(jù)驅(qū)動(dòng)的校準(zhǔn)方法,使得策略在真實(shí)部署時(shí),能夠?qū)⒆x取到的歸一化電流信號(hào)作為「關(guān)節(jié)力矩」輸入,從而在無(wú)需物理力矩傳感器的情況下,實(shí)現(xiàn)了對(duì)交互力的顯式感知和控制。



Figure 3 :真實(shí)世界電流-力與仿真力矩-力的校準(zhǔn)與對(duì)齊

3. 執(zhí)行器動(dòng)力學(xué)建模與隨機(jī)化:顯著提高 Sim-to-Real 魯棒性

真實(shí)電機(jī)存在諸多非理想特性,如齒輪間隙(Backlash)、力矩-速度飽和(Torque-Speed Saturation) 以及摩擦力等。如果仿真中忽略這些特性,訓(xùn)練出的策略在真實(shí)硬件上往往會(huì)表現(xiàn)出脆弱性。

該研究在仿真中顯式地對(duì)這些執(zhí)行器動(dòng)力學(xué)進(jìn)行了建模,并對(duì)關(guān)鍵參數(shù)(如堵轉(zhuǎn)力矩、空載速度、齒輪間隙閾值等) 進(jìn)行了廣泛的域隨機(jī)化(Domain Randomization)。這種策略迫使控制策略適應(yīng)各種硬件缺陷和公差變化,顯著提高了 Sim-to-Real 轉(zhuǎn)移的魯棒性。

二、全狀態(tài)策略與創(chuàng)新訓(xùn)練范式:

實(shí)現(xiàn)力控自適應(yīng)抓取與手內(nèi)物體旋轉(zhuǎn)

基于上述 Sim-to-Real 框架,研究團(tuán)隊(duì)成功訓(xùn)練并部署了兩種關(guān)鍵的靈巧操作技能:力控自適應(yīng)抓?。‵orce-Adaptive Grasping) 和手內(nèi)物體旋轉(zhuǎn)(In-Hand Object Reorientation)。

1. 倒置「接物」訓(xùn)練范式:提升樣本效率與魯棒性

傳統(tǒng)的桌面抓取訓(xùn)練范式往往面臨樣本效率低、獎(jiǎng)勵(lì)工程復(fù)雜以及容易產(chǎn)生「獎(jiǎng)勵(lì)黑客」(Reward Hacking) 行為等問題。為此,研究團(tuán)隊(duì)提出了一種創(chuàng)新的倒置「接物」(Inverted Catching) 訓(xùn)練設(shè)置。

在這種設(shè)置下,靈巧手手心向上固定,物體從上方隨機(jī)掉落。這種利用重力自然將物體引入工作空間的方法,極大地簡(jiǎn)化了探索過程,使策略能夠?qū)W⒂趯W(xué)習(xí)手指協(xié)調(diào)和接觸后的力調(diào)節(jié)。同時(shí),這種動(dòng)態(tài)接物過程鼓勵(lì)形成包絡(luò)式、多點(diǎn)接觸的抓取姿態(tài),自然抑制了不穩(wěn)定的邊緣抓取策略,促使策略學(xué)習(xí)到更接近人類偏好的穩(wěn)定抓取方式。

2. 力自適應(yīng)抓?。壕珳?zhǔn)的力矩與接觸力控制

在力自適應(yīng)抓取任務(wù)中,策略需要根據(jù)用戶輸入的力指令(Force Command),動(dòng)態(tài)調(diào)節(jié)各個(gè)手指的抓取力。

研究表明,結(jié)合接觸力懲罰(R-force) 和關(guān)節(jié)力矩懲罰(R-torque) 的復(fù)合獎(jiǎng)勵(lì)函數(shù)是實(shí)現(xiàn)穩(wěn)健力控的關(guān)鍵。僅懲罰接觸力會(huì)導(dǎo)致關(guān)節(jié)力矩不足,抓取不穩(wěn);僅懲罰關(guān)節(jié)力矩則無(wú)法有效將力傳遞到指尖。兩者的結(jié)合使得策略能夠同時(shí)協(xié)調(diào)關(guān)節(jié)驅(qū)動(dòng)和指尖接觸,實(shí)現(xiàn)與指令高度線性相關(guān)的精準(zhǔn)力控。



Figure 4 :不同獎(jiǎng)勵(lì)設(shè)置下,關(guān)節(jié)力矩和接觸力隨力指令的變化

3. 手內(nèi)物體旋轉(zhuǎn):觸覺與本體感覺的深度融合

手內(nèi)旋轉(zhuǎn)任務(wù)要求策略通過協(xié)調(diào)的手指步態(tài)(Finger Gaits),在保持穩(wěn)定接觸的同時(shí),將物體繞指定軸旋轉(zhuǎn)。

消融實(shí)驗(yàn)(Ablation Study) 深刻揭示了不同感知模態(tài)的重要性。結(jié)果顯示,包含受力加權(quán)接觸中心、接觸力和 6D 姿態(tài)表示的完整觀測(cè)配置取得了最佳性能(平均連續(xù)成功 25.1 次)。移除任何一種觸覺信息(接觸中心或接觸力) 都會(huì)導(dǎo)致性能顯著下降,而完全沒有觸覺反饋的基線策略幾乎無(wú)法完成任務(wù)(平均成功 1.1 次)。這充分證明了高分辨率觸覺反饋在復(fù)雜手內(nèi)操作中的不可替代性。



Figure 5 :真實(shí)世界與仿真環(huán)境中的手內(nèi)操作任務(wù)可視化結(jié)果

三、星動(dòng)紀(jì)元五指靈巧手星動(dòng) XHAND1 :

DexManip 零樣本部署的硬件核心支撐

DexManip 框架之所以能夠?qū)崿F(xiàn)驚艷的零樣本(Zero-Shot) 部署,除了算法層面的創(chuàng)新,更離不開底層硬件——星動(dòng)紀(jì)元自研國(guó)內(nèi)首創(chuàng)全直驅(qū)五指靈巧手——星動(dòng) XHAND1的強(qiáng)大支撐。該框架與 XHAND1 的硬件特性形成了完美的「軟硬協(xié)同」,在實(shí)際應(yīng)用場(chǎng)景中展現(xiàn)出不可替代的落地優(yōu)勢(shì)。



Figure 6 :星動(dòng) XHAND1 靈巧手

1. 270° 環(huán)繞指端高分辨率觸覺陣列:捕捉精細(xì)接觸,破解手內(nèi)操作感知瓶頸

DexManip 論文的消融實(shí)驗(yàn)明確指出,高分辨率的觸覺反饋(接觸中心與接觸力) 是實(shí)現(xiàn)手內(nèi)物體旋轉(zhuǎn)等復(fù)雜操作的決定性因素。星動(dòng) XHAND1 在每個(gè)手指端配備了270° 環(huán)繞的高分辨率觸覺陣列傳感器(單指 > 100 個(gè)觸覺點(diǎn))。相比于傳統(tǒng)的壓阻類平板型傳感器,這種全包絡(luò)的曲面陣列能夠無(wú)死角地捕捉物體在指尖滾動(dòng)、滑動(dòng)時(shí)的微小接觸變化。結(jié)合高精度的力覺精度和三維力觸覺感知能力,星動(dòng) XHAND1 為 DexManip 策略提供了極其豐富且精準(zhǔn)的觀測(cè)輸入,使其在處理不規(guī)則物體或執(zhí)行精細(xì)的「指尖步態(tài)(Finger Gaits)」時(shí)游刃有余。

2. 高精度 URDF 與觸覺仿真模型的無(wú)縫對(duì)接:精準(zhǔn)對(duì)接仿真,縮小現(xiàn)實(shí)鴻溝

DexManip 框架的核心突破在于其計(jì)算高效的基于距離場(chǎng)的觸覺仿真。這一算法的成功高度依賴于仿真模型與真實(shí)物理世界的一致性。星動(dòng) XHAND1 官方提供了極高精度的 URDF 模型,不僅精確描述了運(yùn)動(dòng)學(xué)連桿和動(dòng)力學(xué)參數(shù),還完美映射了真實(shí)傳感器的空間分布。這種「數(shù)字孿生」級(jí)別的模型支持,使得 DexManip 在仿真中計(jì)算的虛擬觸覺單元(Virtual Tactile Cells) 能夠與真實(shí)星動(dòng) XHAND1 的傳感器陣列實(shí)現(xiàn) 1:1 的精準(zhǔn)對(duì)齊,從而大幅降低了 Sim-to-Real 的現(xiàn)實(shí)鴻溝,確保了純仿真訓(xùn)練策略在真實(shí)硬件上的「開箱即用」。

3. 全直驅(qū)架構(gòu)與電流-力矩校準(zhǔn)的完美契合:實(shí)現(xiàn)精準(zhǔn)力控,響應(yīng)更靈敏

在力自適應(yīng)抓取任務(wù)中,DexManip 提出通過「電流-力矩校準(zhǔn)」來(lái)替代昂貴的物理力矩傳感器。星動(dòng) XHAND1 采用的全直驅(qū)(Direct-Drive) 電機(jī)架構(gòu)為這一算法提供了最理想的硬件基礎(chǔ)。全直驅(qū)設(shè)計(jì)從根本上消除了傳統(tǒng)減速器帶來(lái)的巨大摩擦、遲滯和非線性干擾,使得電機(jī)的相電流與輸出力矩之間保持著極高的線性相關(guān)性。這不僅讓 DexManip 的電流-力矩校準(zhǔn)過程更加精確可靠,還賦予了靈巧手極高的力控帶寬和超靈敏的動(dòng)態(tài)響應(yīng)能力,使其能夠根據(jù) 10% 、50% 、100% 等不同指令,瞬間且精準(zhǔn)地調(diào)節(jié)抓取力度,安全地操作薯片、毛絨玩具等易碎或柔性物體。

Figure 7 :對(duì)訓(xùn)練中未見過的不規(guī)則形狀物體進(jìn)行力自適應(yīng)抓取

這一成果標(biāo)志著靈巧操作技術(shù)在克服 Sim-to-Real 鴻溝方面取得了關(guān)鍵突破。通過提供一套無(wú)需昂貴力矩傳感器和高計(jì)算成本觸覺仿真的實(shí)用方案,該研究大幅降低了基于力的靈巧操作研究的門檻,為多指靈巧手在柔性制造、服務(wù)機(jī)器人等真實(shí)復(fù)雜場(chǎng)景中的廣泛應(yīng)用鋪平了道路。

參考文獻(xiàn)

[1] ByteDance Seed. Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation. 2025.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
央視怒批!“絕望的文盲”丟臉到國(guó)外,馮遠(yuǎn)征的話終于有人信了

央視怒批!“絕望的文盲”丟臉到國(guó)外,馮遠(yuǎn)征的話終于有人信了

人間無(wú)味啊
2026-03-13 03:17:17
破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭(zhēng)什么?

破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭(zhēng)什么?

川渝視覺
2026-03-23 19:26:44
韓媒驚呼太過分!安洗瑩亞錦賽將PK3名中國(guó)球員 她迄今還沒奪過冠

韓媒驚呼太過分!安洗瑩亞錦賽將PK3名中國(guó)球員 她迄今還沒奪過冠

勁爆體壇
2026-03-25 18:58:16
工商銀行、建設(shè)銀行、農(nóng)業(yè)銀行、中國(guó)銀行、招商銀行、民生銀行,發(fā)布風(fēng)險(xiǎn)提示

工商銀行、建設(shè)銀行、農(nóng)業(yè)銀行、中國(guó)銀行、招商銀行、民生銀行,發(fā)布風(fēng)險(xiǎn)提示

每日經(jīng)濟(jì)新聞
2026-03-25 10:04:07
央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個(gè)明星也出了口惡氣

央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個(gè)明星也出了口惡氣

輝哥說動(dòng)漫
2026-03-25 12:20:14
女大學(xué)生住院做檢查,報(bào)告竟是假的!珠海中山五院等多方回應(yīng)

女大學(xué)生住院做檢查,報(bào)告竟是假的!珠海中山五院等多方回應(yīng)

南方都市報(bào)
2026-03-24 12:42:25
菏澤市政協(xié)教科衛(wèi)體委副主任宋自立被查

菏澤市政協(xié)教科衛(wèi)體委副主任宋自立被查

中國(guó)山東網(wǎng)
2026-03-25 18:35:39
剛剛確認(rèn):已抵達(dá)湖北!請(qǐng)?zhí)崆皽?zhǔn)備

剛剛確認(rèn):已抵達(dá)湖北!請(qǐng)?zhí)崆皽?zhǔn)備

新浪財(cái)經(jīng)
2026-03-25 09:04:29
官宣!33歲薩拉赫今夏離開利物浦:9年9冠4金靴 435場(chǎng)255球

官宣!33歲薩拉赫今夏離開利物浦:9年9冠4金靴 435場(chǎng)255球

念洲
2026-03-25 06:42:21
怪不得日本這么著急想跟咱們打一仗

怪不得日本這么著急想跟咱們打一仗

安安說
2026-03-15 10:55:01
山東多名區(qū)縣“一把手”調(diào)整

山東多名區(qū)縣“一把手”調(diào)整

濟(jì)寧人
2026-03-25 15:18:25
正式確定!CBA名將加盟浙江廣廈,重返老東家,全力衛(wèi)冕總冠軍

正式確定!CBA名將加盟浙江廣廈,重返老東家,全力衛(wèi)冕總冠軍

體壇瞎白話
2026-03-25 16:52:09
國(guó)民黨由盛轉(zhuǎn)衰五大關(guān)鍵推手,李登輝只能排第二,第一實(shí)至名歸!

國(guó)民黨由盛轉(zhuǎn)衰五大關(guān)鍵推手,李登輝只能排第二,第一實(shí)至名歸!

夢(mèng)史
2026-03-25 04:13:02
拖垮一個(gè)普通家庭,只需要一臺(tái)20萬(wàn)的車。

拖垮一個(gè)普通家庭,只需要一臺(tái)20萬(wàn)的車。

老陸不老
2026-03-24 20:20:23
張雪峰公司確認(rèn)其猝死!最后露面臉色疲憊,剛被馬拉松取消名額

張雪峰公司確認(rèn)其猝死!最后露面臉色疲憊,剛被馬拉松取消名額

萌神木木
2026-03-24 21:50:50
西方突然發(fā)現(xiàn):中國(guó)越來(lái)越像我們了

西方突然發(fā)現(xiàn):中國(guó)越來(lái)越像我們了

青木在德國(guó)
2026-03-24 20:24:58
48歲趙薇“女兒”因長(zhǎng)得太好看,被全網(wǎng)“禁止整容”,如今17歲變化大到不敢認(rèn)!

48歲趙薇“女兒”因長(zhǎng)得太好看,被全網(wǎng)“禁止整容”,如今17歲變化大到不敢認(rèn)!

背包旅行
2026-03-24 17:09:33
2026年開年,增程突然不香了?最大反轉(zhuǎn):油混正在悄悄翻盤!

2026年開年,增程突然不香了?最大反轉(zhuǎn):油混正在悄悄翻盤!

華庭講美食
2026-03-25 07:13:09
66歲大媽喜歡睡前泡腳,不久腦梗去世,專家怒斥:太無(wú)知了

66歲大媽喜歡睡前泡腳,不久腦梗去世,專家怒斥:太無(wú)知了

比利
2026-03-21 13:00:22
沒有薩達(dá)姆的伊拉克,現(xiàn)在到底怎么樣?真相來(lái)了!

沒有薩達(dá)姆的伊拉克,現(xiàn)在到底怎么樣?真相來(lái)了!

深度報(bào)
2026-03-24 21:57:20
2026-03-25 20:56:50
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12598文章數(shù) 142593關(guān)注度
往期回顧 全部

科技要聞

紅極一時(shí)卻草草收?qǐng)?,Sora宣布正式關(guān)停

頭條要聞

伊朗放話愿意與"主和派"萬(wàn)斯談 特朗普表態(tài)

頭條要聞

伊朗放話愿意與"主和派"萬(wàn)斯談 特朗普表態(tài)

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰經(jīng)搶救無(wú)效不幸去世 年僅41歲

財(cái)經(jīng)要聞

管濤:中東局勢(shì)如何影響人民幣匯率走勢(shì)?

汽車要聞

智己LS8放大招 30萬(wàn)內(nèi)8系旗艦+全線控底盤秀實(shí)力

態(tài)度原創(chuàng)

健康
教育
親子
數(shù)碼
時(shí)尚

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

理科女生如何選專業(yè)?工科專業(yè)有哪些選擇

親子要聞

幼兒園3年,家長(zhǎng)培養(yǎng)寶寶4個(gè)好習(xí)慣,孩子成績(jī)比同齡人優(yōu)秀

數(shù)碼要聞

外星人16X Aurora首發(fā)!RTX 5070 Ti+OLED屏,游戲黨直呼買不起?

今年春天最時(shí)髦的穿法:長(zhǎng)外套+長(zhǎng)裙、長(zhǎng)針織+長(zhǎng)褲,太高級(jí)了!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版