国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

豐田CUE機器人新進展:通過強化學習+Sim2Real,走路、運球新技能

0
分享至

人形機器人走向實用,最難的從來不是 “能走”,而是走得穩(wěn)、學得快、能從仿真順利落地現(xiàn)實。豐田未來創(chuàng)生中心,正用一套全新的強化學習 + Sim2Real 路線,讓旗下 CUE 籃球機器人實現(xiàn)行走、站立乃至運球。盡管CUE目前還不具備行走能力,但通過這套技術路線,有望把雙足控制與動態(tài)交互能力推到新高度。


左側:森田光典。右側:伊藤貴弘


近日,豐田官方采訪了 R-Frontier 部門的伊藤貴弘、森田光典兩位研發(fā)人員,披露了CUE人形機器人的最新進展。

伊藤貴弘現(xiàn)任豐田 R-Frontier 人形機器人團隊運動控制 / 全身動力學核心工程師、研究員,主攻雙足行走穩(wěn)定、力矩控制與 MPC 模型預測控制,參與 T-HR3 及下一代人形平臺研發(fā)。加入豐田僅一年多,便成為運動控制方向核心研究者。

森田光典同為該團隊研究員,主攻機器人學習、行為生成與模仿學習,擅長從人類示范和大規(guī)模數(shù)據(jù)中學習通用操作技能,聚焦人形機器人手眼協(xié)調與靈巧操作。

01.

強化學習+Sim2Real:豐田機器人的動作訓練底層邏輯

伊藤貴弘認為,人形機器人要自主掌握復雜動作,強化學習是當下最有效的路徑。

它和監(jiān)督學習不同,不需要大量標注好的完美軌跡,本質是讓 AI 在環(huán)境里不斷試錯,根據(jù)獎勵機制調整行為,最終收斂到最優(yōu)策略。



實驗中使用的測試機的模擬環(huán)境(左圖)用于虛擬仿真訓練。使用實際設備(右圖)進行評估。

而讓這套方案真正具備工程價值的,是 Sim2Real(仿真到現(xiàn)實)。先在虛擬環(huán)境里讓機器人跑完海量場景與極端工況,再把訓練好的模型遷移到實體機器人上。這能大幅減少真機損耗、縮短訓練周期,也是目前全球人形機器人落地的主流技術路線。

豐田的思路和國內頭部人形機器人企業(yè)基本一致:用仿真補足數(shù)據(jù)不足,再靠產(chǎn)品迭代解決仿真偏差問題。

02.

走路這件事:仿真1-2小時學會,真機磨了無數(shù)輪

行走是人形機器人的基本功,卻是工程上的老大難。豐田團隊把強化學習完整嵌入行走控制。

他們在仿真里設置了很簡單的獎勵規(guī)則:朝著目標速度走就加分,滑倒、失衡就扣分。為了加快訓練,團隊直接在仿真中并行跑上千個機器人實例,同步學習、同步迭代。

測試結果顯示,只用 1–2 小時,虛擬機器人就學會了前進、后退、轉彎,能維持基本平衡。

但模型一搬到真機上,問題就立刻暴露出來。

森田光典坦言,仿真和現(xiàn)實之間存在一道很難跨越的鴻溝:同樣的控制指令,虛擬里流暢自然,真機上卻會抖動、拖腳,甚至突然失穩(wěn)。這也是行業(yè)普遍頭疼的 “仿真-現(xiàn)實差距”。

為了填平差距,豐田研究團隊同時用了兩套技術方案。


Real2Sim:優(yōu)化模擬器的執(zhí)行器模型,使其與真實世界數(shù)據(jù)相匹配。


第一套是域隨機化:人為給編碼器、IMU 等傳感器加噪聲,隨機改變地面摩擦力,讓機器人在 “不完美環(huán)境” 里訓練,提升策略魯棒性。

第二套更硬核:Real2Sim 實物反哺仿真。用真機關節(jié)電機的實際運行數(shù)據(jù),反向校準仿真模型。靜摩擦、動摩擦、粘性摩擦、轉動慣量,全都通過黑箱優(yōu)化一一匹配,讓虛擬執(zhí)行器的行為無限貼近真實硬件。

即便這樣,真機驗證仍是漫長的循環(huán)。



每訓一個新模型,都必須上真機測試。走不穩(wěn),就分析問題、改獎勵、重訓,再放回真機驗證。一圈圈迭代下來,原型機才真正實現(xiàn)穩(wěn)定行走,甚至被推動時也能穩(wěn)住姿態(tài)不摔倒。

03.

比走路更難的運球:時機轉瞬即逝,獎勵根本沒法手工調

如果說行走只是控制機器人自身,運球還要同時兼顧動態(tài)球體,難度直接上了一個臺階。

研發(fā)這項技術,主要是為豐田的 AI 籃球機器人 CUE 做鋪墊。CUE 最早由豐田工程師志愿者發(fā)起,后來歸入 R?Frontier 部門,是一款專用投籃機器人,主打高精度投射技術驗證,并非通用服務型機器人。它和 T?HR3 及下一代人形平臺共用底層運動控制技術,但定位不同。項目始于 2017 年,靈感來自《灌籃高手》,現(xiàn)已迭代到 CUE6。



CUE 身高約 2.08 米,依靠全身動力學、力矩控制、MPC 模型預測控制和 AI 視覺感知,實現(xiàn)籃筐定位、彈道計算與實時姿態(tài)修正,能完成罰球、三分甚至超遠投籃。憑借穩(wěn)定的閉環(huán)控制,CUE 已拿下兩項吉尼斯紀錄:連續(xù)罰球 2020 次命中、24.55 米超遠投籃命中。



伊藤貴弘說,運球和行走的控制邏輯完全不一樣。行走時雙腳支撐的時機相對寬松,可運球時觸球只有一瞬間,時機稍差就失敗。球一直在動,不會等機器人,對感知、預判和控制精度要求極高。

團隊最先卡在獎勵函數(shù)設計上。森田光典表示,行走的獎勵機制有很多成熟參考,很好定義;但運球要控制球速、方向、持續(xù)接觸,手工設計獎勵不僅費勁,還容易讓動作僵硬不自然。人工反復調參,效率低、容錯也差。



他們最終放棄手工設計獎勵,改用模仿人類運動的思路。團隊用動作捕捉記錄人類自然運球的全過程,把關節(jié)角度、運動速度等數(shù)據(jù)映射到機器人的骨骼結構和運動范圍,以人類動作為參考目標。機器人動作越接近,獎勵越高。

這種方式不用設計復雜指標,還能直接從人體數(shù)據(jù)里拿到精準觸球時機,讓機器人在正確時間擊球。最終訓練出的運球動作流暢、接近人類,還能在真機上穩(wěn)定復現(xiàn)。

04.

Sim2Real 運球再遇坎:視覺識別誤差險些毀掉全部訓練

運球環(huán)節(jié),仿真到現(xiàn)實的遷移又遇到了新問題。

在仿真里,系統(tǒng)能直接拿到球的精準位置和速度;但現(xiàn)實中,機器人只能靠頭部攝像頭加識別算法去估算。誤差、延遲都會嚴重影響動作,導致仿真里完美的策略,一上真機就失靈。



團隊沒有死磕算法優(yōu)化,而是選擇把現(xiàn)實誤差直接搬進仿真。

他們用動作捕捉測出真實環(huán)境里視覺識別的誤差和延遲,把這些特性寫進仿真的觀測模型,讓虛擬訓練環(huán)境和現(xiàn)實保持一致。這一調整后,運球動作終于成功從仿真遷移到真機。

05.

未來規(guī)劃:先落地 CUE,再打造通用機器人框架

對于后續(xù)計劃,伊藤貴弘表示,近期目標就是把行走和運球能力遷移到 CUE 籃球機器人上。先把整套學習框架部署到 CUE,實現(xiàn)穩(wěn)定運球,再逐步提升動作的流暢度與觀賞性,接近人類籃球運動員的表現(xiàn)。

森田光典則看得更遠并表示:團隊會聚焦通用人形機器人控制框架,不只依賴強化學習,而是融合多種技術,打造能像人一樣應對多樣任務、適應復雜環(huán)境的通用平臺。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
福原愛官宣三胎僅3天,男方被扒底朝天,前夫江宏杰的做法太體面

福原愛官宣三胎僅3天,男方被扒底朝天,前夫江宏杰的做法太體面

阿纂看事
2026-04-20 14:51:18
嚴肅辟謠:小鵬 GX沒有抄襲路虎攬勝!

嚴肅辟謠:小鵬 GX沒有抄襲路虎攬勝!

車市博覽
2026-04-19 16:06:34
1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環(huán)提出:我想回家

1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環(huán)提出:我想回家

華人星光
2026-04-20 09:59:15
蘇聯(lián)背后的操控!蓄意擴大朝鮮戰(zhàn)爭,讓中美兩國苦不堪言

蘇聯(lián)背后的操控!蓄意擴大朝鮮戰(zhàn)爭,讓中美兩國苦不堪言

南極狼人
2026-04-17 20:18:46
楊毅爆猛料!復盤三年前假球真相 李楠可悲遠比李春江更唏噓?

楊毅爆猛料!復盤三年前假球真相 李楠可悲遠比李春江更唏噓?

你看球呢
2026-04-20 15:32:36
快訊!美國財長貝森特表態(tài)了!

快訊!美國財長貝森特表態(tài)了!

達文西看世界
2026-04-20 10:02:57
CBA一夜爆3門慘案!繼偉怒噴遼籃,廣東鎖定第5,季后賽剩4個懸念

CBA一夜爆3門慘案!繼偉怒噴遼籃,廣東鎖定第5,季后賽剩4個懸念

后仰大風車
2026-04-20 22:36:46
思考再三!伊朗決定繼續(xù)與美國進行談判

思考再三!伊朗決定繼續(xù)與美國進行談判

止戈軍是我
2026-04-20 21:00:56
大幅降薪?波爾津吉斯未承諾留在勇士效力:今夏將成完全自由球員

大幅降薪?波爾津吉斯未承諾留在勇士效力:今夏將成完全自由球員

羅說NBA
2026-04-20 04:46:16
1920年,一位俄羅斯醫(yī)生突發(fā)奇想,把猴子的睪丸,植入到老頭體內

1920年,一位俄羅斯醫(yī)生突發(fā)奇想,把猴子的睪丸,植入到老頭體內

歲月有情1314
2026-04-07 07:26:46
79年計劃生育,一家只準生一個,陳云:搞不好要被罵斷子絕孫!

79年計劃生育,一家只準生一個,陳云:搞不好要被罵斷子絕孫!

老范談史
2026-04-20 14:02:16
這個國家快被中國“買”下!美女遍地,10個移民中就有9個中國人

這個國家快被中國“買”下!美女遍地,10個移民中就有9個中國人

凡知
2026-04-20 15:39:02
女兒美國讀高中花掉110萬,單親媽媽向社會求助:求捐200萬讀大學

女兒美國讀高中花掉110萬,單親媽媽向社會求助:求捐200萬讀大學

談史論天地
2026-04-17 16:50:03
看到張云旗夫婦的下場,才知丁玉嬌為什么愿意忍受親人的背叛

看到張云旗夫婦的下場,才知丁玉嬌為什么愿意忍受親人的背叛

陳意小可愛
2026-04-20 20:54:03
黃宏現(xiàn)狀:住北京普通小區(qū),閑時照顧外孫女,65歲走路需要人攙扶

黃宏現(xiàn)狀:住北京普通小區(qū),閑時照顧外孫女,65歲走路需要人攙扶

素衣讀史
2026-04-14 18:53:02
都怪AI?利潤暴跌7成,字節(jié)到底在做什么

都怪AI?利潤暴跌7成,字節(jié)到底在做什么

花朵財經(jīng)
2026-04-20 17:55:23
我國歷史上,真正稱得上是“功高震主”的10大名將,分別都是誰?

我國歷史上,真正稱得上是“功高震主”的10大名將,分別都是誰?

咸説歷史
2026-04-20 19:25:18
原雷神山院長落馬,其“權色交易”的背后,坑害了多少女醫(yī)護家庭

原雷神山院長落馬,其“權色交易”的背后,坑害了多少女醫(yī)護家庭

長安一孤客
2026-04-20 18:58:28
11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

半糖甜而不膩
2026-04-06 12:09:15
首場下克上!魔術滅活塞總分1-0 坎寧安39+5+4班凱羅23+9

首場下克上!魔術滅活塞總分1-0 坎寧安39+5+4班凱羅23+9

醉臥浮生
2026-04-20 09:08:16
2026-04-20 22:59:00
機器人大講堂 incentive-icons
機器人大講堂
立德機器人平臺,是一個集媒體品牌、智庫咨詢、投資孵化、引智招商為一體的機器人垂直領域服務平臺
6476文章數(shù) 4583關注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

歐洲或再迎一位親俄領導人 曾與澤連斯基發(fā)生公開沖突

頭條要聞

歐洲或再迎一位親俄領導人 曾與澤連斯基發(fā)生公開沖突

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

時尚
房產(chǎn)
教育
健康
公開課

繼彎刀褲,闊腿褲之后,“圍裹式長褲”突然大火!

房產(chǎn)要聞

大規(guī)模商改住!海口西海岸,這波項目要贏麻了!

教育要聞

關注!海淀這所學校不再具備辦學資格

干細胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版