国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

模仿學(xué)習(xí)如何賦能靈巧操作?這有一份「2021-2025」全景技術(shù)圖譜

0
分享至



作者團隊涵蓋天津大學(xué)、山東大學(xué)、KTH、ETH、MIT、南方科技大學(xué)、北京通用人工智能研究院和中科院自動化所等機構(gòu),在機器人學(xué)習(xí)、靈巧操作、多模態(tài)感知等方向具有持續(xù)研究積累。

靈巧操作(Dexterous Manipulation)要求機器人通過多指末端執(zhí)行器完成抓取、旋擰、插拔等精細任務(wù),其核心挑戰(zhàn)在于高維動作空間、復(fù)雜接觸動力學(xué)與實時力控的耦合。傳統(tǒng)模型依賴方法難以泛化至未見過物體與場景,而純強化學(xué)習(xí)又面臨樣本效率低、獎勵設(shè)計難等瓶頸。

與強化學(xué)習(xí)通過試錯優(yōu)化獎勵信號不同,模仿學(xué)習(xí)(Imitation Learning, IL)通過直接從人類示范中捕獲細粒度協(xié)調(diào)行為,避免顯式建模復(fù)雜接觸動力學(xué)與設(shè)計稀疏獎勵函數(shù),為靈巧操作提供了一條數(shù)據(jù)驅(qū)動的新路徑。

然而,該領(lǐng)域研究長期分散于不同數(shù)據(jù)范式、算法框架與硬件平臺,缺乏系統(tǒng)性整合。近期,來自天津大學(xué)、山東大學(xué)、KTH、ETH、MIT、上海交通大學(xué)、南方科技大學(xué)、北京通用人工智能研究院和中科院自動化所的綜述論文《Dexterous Manipulation through Imitation Learning: A Survey》首次對這一方向進行了全景式梳理,涵蓋 2021–2025 年關(guān)鍵進展,旨在為研究人員提供模仿學(xué)習(xí)靈巧操作領(lǐng)域的全面視角。



  • 論文標題:Dexterous Manipulation Through Imitation Learning: A Survey
  • 論文鏈接:https://ieeexplore.ieee.org/document/11305224/

該綜述指出,模仿學(xué)習(xí)的核心價值在于避免顯式建模與大規(guī)模試錯,直接利用人類示范數(shù)據(jù)學(xué)習(xí)策略。但其有效應(yīng)用依賴高質(zhì)量數(shù)據(jù)、適配算法、可靠硬件與標準化評估的協(xié)同。

理論支撐

從認知科學(xué)到優(yōu)化理論的跨學(xué)科根基

模仿學(xué)習(xí)在靈巧操作中的有效性并非經(jīng)驗巧合,而是植根于多層級理論體系。在認知層面,Bandura 的社會學(xué)習(xí)理論為「觀察 - 模仿」范式提供了行為學(xué)依據(jù),而靈長類鏡像神經(jīng)元的發(fā)現(xiàn)則從神經(jīng)機制上解釋了動作觀察與執(zhí)行的表征共享現(xiàn)象。

在控制層面,內(nèi)部模型理論(internal model theory)與最優(yōu)反饋控制框架為策略的預(yù)測 - 校正閉環(huán)設(shè)計提供了數(shù)學(xué)工具,例如 DMP(Dynamic Movement Primitives)通過微分方程參數(shù)化運動基元,實現(xiàn)了對人類示范軌跡的緊湊表征與泛化生成。

在優(yōu)化層面,行為克隆的負對數(shù)似然目標、逆強化學(xué)習(xí)的特征計數(shù)匹配約束、以及對抗模仿的 Jensen-Shannon 散度最小化,均對應(yīng)明確的統(tǒng)計學(xué)習(xí)理論保證,這為算法收斂性與樣本復(fù)雜度分析奠定了基礎(chǔ)。

數(shù)據(jù)資源

從遙操作到互聯(lián)網(wǎng)規(guī)模弱監(jiān)督

高質(zhì)量示范數(shù)據(jù)是模仿學(xué)習(xí)的基礎(chǔ)。早期工作依賴遙操作或動作捕捉系統(tǒng),代表性數(shù)據(jù)集如 BridgeData V2、RH20T 提供 RGB-D 視覺、關(guān)節(jié)狀態(tài)、力 / 扭矩等多模態(tài)同步記錄。近年研究轉(zhuǎn)向更具可擴展性的范式:

  • 高保真幾何建模:ARCTIC 數(shù)據(jù)集通過手 - 物網(wǎng)格重建,實現(xiàn)復(fù)雜交互幾何的精確建模;
  • 雙手協(xié)同標注:OAKINK2 聚焦雙人操作,提供多視角 3D 姿態(tài)標注,支持對稱 / 非對稱任務(wù)學(xué)習(xí);
  • 合成與增強技術(shù):MimicGen 利用幾何 - 語義一致性約束從少量演示生成物理合理軌跡;RoboAgent 通過視頻語義擴展動作多樣性;
  • 弱監(jiān)督視頻學(xué)習(xí):VideoDex、NIL 等方法嘗試從互聯(lián)網(wǎng)未標注操作視頻中提取策略,推動靈巧操作向無監(jiān)督學(xué)習(xí)演進。



主流靈巧操作數(shù)據(jù)集對比



模仿學(xué)習(xí)數(shù)據(jù)集質(zhì)量評估規(guī)則

學(xué)習(xí)方法

行為克隆的演進與多模態(tài)融合

模仿學(xué)習(xí)范式持續(xù)多樣化,核心進展包括:

  • 行為克隆改進:Implicit Behavioral Cloning 通過能量模型捕獲多模態(tài)動作分布;Diffusion Policy 利用擴散模型生成高維連續(xù)動作,其迭代去噪機制可有效建模動作分布的多峰特性與時序依賴,在插拔、旋擰任務(wù)中展現(xiàn)優(yōu)越性能;
  • 對抗模仿魯棒性:GA-GAIL 引入任務(wù)目標引導(dǎo)判別器訓(xùn)練,提升對噪聲 / 次優(yōu)示范的魯棒性;
  • 視頻驅(qū)動學(xué)習(xí):按技術(shù)路線分為運動中心建模(DexMV)、合成視頻生成(Gen2Act)、表征學(xué)習(xí)(Ag2Manip)與任務(wù)定制架構(gòu)(Bi-KVIL)四類,后者通過顯式建模雙手協(xié)調(diào)關(guān)系提升復(fù)雜環(huán)境復(fù)現(xiàn)能力;
  • 觸覺 - 視覺融合:新一代觸覺傳感器(GelSight、TacTip)提供高分辨率接觸信息,與視覺形成互補。觸覺信號可檢測視覺遮擋下的微滑移與接觸力變化,為策略提供冗余感知通道;ViTacFormer、KineDex 等工作實現(xiàn)跨模態(tài)特征融合,使策略在低光照或遮擋條件下仍能穩(wěn)定執(zhí)行。



模仿學(xué)習(xí)方法分類體系



不同模仿學(xué)習(xí)方法的比較



基于視頻的靈巧操作模仿學(xué)習(xí)方法分類

硬件平臺

從靈巧手到人形本體

目前,靈巧手的設(shè)計正從高成本、封閉式工業(yè)系統(tǒng)向低成本、開源化、模塊化方向演進。

Shadow Dexterous Hand 以 24 自由度和高精度力控,長期作為高保真遙操作的黃金標準;LEAP Hand 憑借簡易制造工藝與良好運動性能,已成為大規(guī)模模仿學(xué)習(xí)實驗的常用平臺;Linker Hand L20 采用連桿驅(qū)動設(shè)計,每個手指配備 4 個電機,工作空間與指尖力接近人類手,在高靈巧性工業(yè)應(yīng)用與學(xué)術(shù)研究中廣泛使用;Allegro Hand 采用直接驅(qū)動,結(jié)構(gòu)緊湊且響應(yīng)迅速;BarrettHand 通過欠驅(qū)動實現(xiàn)自適應(yīng)抓取,在工業(yè)場景中廣泛應(yīng)用;而 DLR/HIT Hand II 等早期平臺則為多指力控與傳感集成提供了重要參考。這些硬件進步降低了研究門檻,也為算法與物理世界的緊密耦合創(chuàng)造條件。



三種末端執(zhí)行器在靈巧操作中的性能比較



代表性機器人手的關(guān)鍵特征

靈巧策略的部署效能高度依賴本體構(gòu)型,除靈巧手外,整體硬件平臺同樣不可忽視。論文指出,高自由度人形平臺(如配備 Shadow Hand 的雙臂系統(tǒng))雖能復(fù)現(xiàn)精細手指運動,但其動作空間維度激增會加劇模仿學(xué)習(xí)的分布偏移風(fēng)險;而輕量化本體(如 LEAP Hand+ 移動基座)通過結(jié)構(gòu)簡化降低策略學(xué)習(xí)難度,卻可能犧牲復(fù)雜任務(wù)的執(zhí)行能力。

更關(guān)鍵的是,本體動力學(xué)特性(如關(guān)節(jié)摩擦、傳動遲滯、質(zhì)量分布)會引入示范數(shù)據(jù)與實機執(zhí)行間的系統(tǒng)誤差,這要求策略設(shè)計必須考慮「感知 - 決策 - 執(zhí)行」鏈路的端到端魯棒性。近期工作如 Mobile ALOHA 通過 whole-body teleoperation 采集全身協(xié)同數(shù)據(jù),正是為了彌合「手部策略」與「全身運動」間的表征鴻溝。

靈巧操作操作系統(tǒng)

算法落地的工程接口

「操作系統(tǒng)」指支撐策略執(zhí)行的基礎(chǔ)軟件棧與任務(wù)調(diào)度框架。論文指出,分層模仿學(xué)習(xí)框架需通過高層任務(wù)分解與底層動作執(zhí)行的解耦,實現(xiàn)長時程任務(wù)的穩(wěn)定復(fù)現(xiàn);而遙操作數(shù)據(jù)采集系統(tǒng)則依賴 ROS-native 接口、多傳感器時間同步協(xié)議及低延遲通信中間件,確保示范軌跡的時空一致性。

此外,為解決跨平臺復(fù)現(xiàn)難題,綜述呼吁社區(qū)共建標準化部署環(huán)境,包括統(tǒng)一的仿真參數(shù)配置、硬件抽象層接口及評估指標注冊表,以降低「代碼可跑」與「結(jié)果可復(fù)現(xiàn)」之間的鴻溝。

評估協(xié)議

標準化 benchmark 的迫切需求

當前靈巧操作評估存在顯著瓶頸:多數(shù)研究在私有任務(wù)或特定平臺驗證,任務(wù)定義(如成功判定閾值)、評價指標(如軌跡誤差 / 任務(wù)完成率 / 能耗)、硬件依賴(如是否要求特定靈巧手型號)缺乏統(tǒng)一標準,難以實現(xiàn)跨方法、跨平臺的公平比較。

綜述呼吁社區(qū)共建標準化 benchmark,涵蓋插拔、旋擰、穿線、布料操作等典型任務(wù),并引入物理可行性、能耗、失敗恢復(fù)率等綜合指標。



靈巧操作關(guān)鍵挑戰(zhàn)的重要性與解決難度矩陣

總結(jié)與展望

本綜述不僅提供技術(shù)地圖,更指出未來方向:算法需降低對特定硬件 / 環(huán)境的依賴,提升跨平臺遷移能力;評估體系亟需標準化以支持公平比較;研究重心正從單次短時任務(wù)轉(zhuǎn)向長期交互與多技能組合,要求系統(tǒng)具備分層規(guī)劃、在線適應(yīng)與任務(wù)組合能力。

靈巧操作的價值在于賦能具身智能體完成復(fù)雜物理交互。從家庭服務(wù)到工業(yè)裝配,具備類人手部靈活性的機器人將拓展人工智能應(yīng)用邊界。本綜述為此領(lǐng)域研究者提供了一幅清晰、系統(tǒng)且面向未來的全景圖譜。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
申萬宏源:美伊沖突最大沖擊已過,市場底與成長風(fēng)格底同步確立

申萬宏源:美伊沖突最大沖擊已過,市場底與成長風(fēng)格底同步確立

每日經(jīng)濟新聞
2026-04-12 08:05:04
中紀委發(fā)話了!釋放一個重要信號,一個都不放過!

中紀委發(fā)話了!釋放一個重要信號,一個都不放過!

細說職場
2026-04-11 18:42:12
陰雨何時休?下周天氣趨勢來了!

陰雨何時休?下周天氣趨勢來了!

上海靜安
2026-04-12 18:35:00
68歲趙本山現(xiàn)身海南悠閑逛街,打扮很潮流!買好幾袋奢侈品好愜意

68歲趙本山現(xiàn)身海南悠閑逛街,打扮很潮流!買好幾袋奢侈品好愜意

娛樂團長
2026-04-11 15:28:06
000929,申請撤銷退市風(fēng)險警示!

000929,申請撤銷退市風(fēng)險警示!

證券時報e公司
2026-04-12 17:36:43
日媒:44%的訪日中國游客資產(chǎn)額超680萬元

日媒:44%的訪日中國游客資產(chǎn)額超680萬元

隨波蕩漾的漂流瓶
2026-04-11 17:16:26
曝U18男籃核心改名+改年齡參賽!連名帶姓全都改 疑似2次改小4歲

曝U18男籃核心改名+改年齡參賽!連名帶姓全都改 疑似2次改小4歲

念洲
2026-04-11 22:08:12
46號令來了!國企全面清查,所有人自查照著做就行

46號令來了!國企全面清查,所有人自查照著做就行

奇思妙想生活家
2026-04-12 04:55:26
湖南一男子自帶茅臺就餐,飲用時感覺味道不對懷疑被調(diào)包!民警發(fā)現(xiàn)當日服務(wù)員連工資都沒結(jié)就“消失”了

湖南一男子自帶茅臺就餐,飲用時感覺味道不對懷疑被調(diào)包!民警發(fā)現(xiàn)當日服務(wù)員連工資都沒結(jié)就“消失”了

大風(fēng)新聞
2026-04-11 16:08:07
反流量卻成了流量密碼,莫氏雞煲老莫:在60歲被迫開始拼命,生日愿望是“店子早點倒閉”

反流量卻成了流量密碼,莫氏雞煲老莫:在60歲被迫開始拼命,生日愿望是“店子早點倒閉”

極目新聞
2026-04-12 14:04:06
在剛剛,上午16家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個股

在剛剛,上午16家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個股

股市皆大事
2026-04-12 11:20:15
胡爾克談內(nèi)馬爾入選巴西隊:如果他配得上,就會代表巴西出戰(zhàn)

胡爾克談內(nèi)馬爾入選巴西隊:如果他配得上,就會代表巴西出戰(zhàn)

懂球帝
2026-04-12 15:42:03
朝鮮空姐,和想象中的不一樣

朝鮮空姐,和想象中的不一樣

微微熱評
2026-04-12 13:57:10
鄭麗文一行參訪小米汽車工廠,中國國民黨副主席: 對促進兩岸交流合作十項新政表示歡迎,呼吁當局不要阻攔,鄭麗文一行圓滿結(jié)束大陸參訪,離京返臺

鄭麗文一行參訪小米汽車工廠,中國國民黨副主席: 對促進兩岸交流合作十項新政表示歡迎,呼吁當局不要阻攔,鄭麗文一行圓滿結(jié)束大陸參訪,離京返臺

每日經(jīng)濟新聞
2026-04-12 15:42:14
李斌:自研芯片真省錢!

李斌:自研芯片真省錢!

EETOP半導(dǎo)體社區(qū)
2026-04-12 12:14:50
卡尼演講稱“每花1加元軍費就有70加分流向美國的日子已結(jié)束”,現(xiàn)場爆發(fā)熱烈掌聲

卡尼演講稱“每花1加元軍費就有70加分流向美國的日子已結(jié)束”,現(xiàn)場爆發(fā)熱烈掌聲

環(huán)球網(wǎng)資訊
2026-04-12 11:15:00
中央下令嚴查宅基地!2026年新規(guī)執(zhí)行,每家每戶都要注意

中央下令嚴查宅基地!2026年新規(guī)執(zhí)行,每家每戶都要注意

王嚾曉
2026-03-18 23:31:04
亞錦賽收官:國羽2金2銀印泰各1銀,石宇奇2-0奪生涯亞錦賽首金

亞錦賽收官:國羽2金2銀印泰各1銀,石宇奇2-0奪生涯亞錦賽首金

求球不落諦
2026-04-12 18:41:05
文章飯店開業(yè)大排長隊,網(wǎng)友直呼價格親民

文章飯店開業(yè)大排長隊,網(wǎng)友直呼價格親民

映射生活的身影
2026-04-12 15:36:07
外交部公開發(fā)聲,10字定性鄭麗文訪問大陸,白巖松的話果真沒說錯

外交部公開發(fā)聲,10字定性鄭麗文訪問大陸,白巖松的話果真沒說錯

阿纂看事
2026-04-11 15:53:22
2026-04-12 19:43:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12729文章數(shù) 142623關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

女子帶5歲女兒和未滿1歲兒子用餐 女兒墜亡餐廳賠74萬

頭條要聞

女子帶5歲女兒和未滿1歲兒子用餐 女兒墜亡餐廳賠74萬

體育要聞

見證歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

46歲趙達官宣結(jié)婚!曾與殷桃談婚論嫁

財經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

時尚
教育
數(shù)碼
家居
公開課

伊姐周六熱推:電視劇《八千里路云和月》;綜藝《乘風(fēng)2026》......

教育要聞

清灣、天外與廣中

數(shù)碼要聞

破壁機哪個牌子好?安全無毒材質(zhì)是重點,揭秘TOP10家用哪種好

家居要聞

復(fù)古風(fēng)格 自然簡約

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版