国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

哈工大CoWVLA:世界鏈思維訓(xùn)練實(shí)現(xiàn)機(jī)器人智能高效優(yōu)化

0
分享至


這項(xiàng)由哈爾濱工業(yè)大學(xué)領(lǐng)導(dǎo)、聯(lián)合理想汽車等多家機(jī)構(gòu)完成的研究發(fā)表于2026年3月,論文編號為arXiv:2603.03195v1,有興趣深入了解的讀者可以通過該編號查詢完整論文。

說起教會機(jī)器人做事,你可以把它想象成教一個孩子學(xué)本領(lǐng)。傳統(tǒng)的方法有兩種:一種是給孩子看完整的動作過程,就像放電影一樣一幀幀地展示;另一種是只教孩子記住關(guān)鍵動作,但不告訴他整個過程是怎么連貫起來的。第一種方法很全面,但太費(fèi)腦子了,就像要求孩子記住電影的每一個細(xì)節(jié);第二種方法省力,但孩子學(xué)不會動作的連貫性。

哈爾濱工業(yè)大學(xué)的研究團(tuán)隊(duì)想出了一個巧妙的解決方案,他們稱之為"世界鏈思維"。這就像教孩子學(xué)功夫時,不是讓他死記硬背每一個招式的細(xì)節(jié),而是教他理解動作的"內(nèi)功心法"——也就是動作背后的運(yùn)動規(guī)律。這樣,孩子既能掌握動作的精髓,又不會被繁瑣的細(xì)節(jié)拖累。

研究團(tuán)隊(duì)發(fā)現(xiàn)了現(xiàn)有方法的兩大問題。世界模型方法雖然能讓機(jī)器人預(yù)測未來會發(fā)生什么,但就像要求學(xué)生不僅要學(xué)會騎自行車,還要畫出路上每一顆石子的位置一樣,太浪費(fèi)精力了。而潛在動作方法雖然簡潔,但就像只學(xué)會了騎車的動作,卻不知道為什么要這樣做,缺乏對整個過程的理解。

為了解決這個矛盾,研究團(tuán)隊(duì)開發(fā)了一種叫做CoWVLA的新方法。這個名字聽起來很復(fù)雜,但原理很簡單:就像武俠小說中的"內(nèi)力修煉"一樣,先讓機(jī)器人學(xué)會分解和理解動作的本質(zhì),然后再學(xué)會如何應(yīng)用這些本質(zhì)規(guī)律。

具體來說,這套方法分為三個階段,就像學(xué)功夫的三個層次。第一個階段是"分筋錯骨"——用一個專門的"動作分解器"把復(fù)雜的視頻分解成兩個部分:靜態(tài)的場景結(jié)構(gòu)(比如桌子、椅子的位置)和動態(tài)的運(yùn)動信息(比如手臂是怎么移動的)。這就像把一部電影分解成背景布景和演員表演兩個部分。

研究團(tuán)隊(duì)使用了一種叫做視頻變分自編碼器的技術(shù)作為這個"動作分解器"。簡單來說,這就像一個非常聰明的視頻分析師,能夠準(zhǔn)確地識別出視頻中哪些是不變的背景,哪些是變化的動作。更厲害的是,它還能把這些動作信息壓縮成一種緊湊的"運(yùn)動密碼",就像把復(fù)雜的太極拳套路濃縮成簡單的心法口訣。

第二個階段是"內(nèi)功修煉"——機(jī)器人學(xué)習(xí)如何從指令和初始畫面推斷出應(yīng)該執(zhí)行什么樣的運(yùn)動。這個過程不需要機(jī)器人重現(xiàn)每一幀畫面,而是要求它理解"從A狀態(tài)到B狀態(tài)應(yīng)該如何運(yùn)動"這個核心問題。就像一個武功高手,看到起手式和結(jié)束式,就能推斷出中間應(yīng)該使用什么招式。

在這個階段,研究團(tuán)隊(duì)設(shè)計(jì)了一個巧妙的訓(xùn)練方法。他們給機(jī)器人展示一個任務(wù)的開始畫面和結(jié)束畫面,然后讓機(jī)器人猜測中間應(yīng)該發(fā)生什么樣的運(yùn)動。為了防止機(jī)器人"作弊"(直接從結(jié)束畫面推測),他們使用了特殊的"遮擋技術(shù)",確保機(jī)器人只能根據(jù)開始狀態(tài)和任務(wù)指令來推理。

第三個階段是"外功練習(xí)"——將之前學(xué)到的運(yùn)動理解能力與具體的動作執(zhí)行結(jié)合起來。這就像一個內(nèi)功高手開始練習(xí)具體的拳法,既要保持內(nèi)功的深厚基礎(chǔ),又要學(xué)會準(zhǔn)確的動作執(zhí)行。

在這個階段,研究團(tuán)隊(duì)采用了一種"稀疏關(guān)鍵幀"的訓(xùn)練方式。與其讓機(jī)器人記住整個動作的每一個細(xì)節(jié),不如只給它看幾個關(guān)鍵的時間點(diǎn),然后讓它利用之前學(xué)到的運(yùn)動理解能力來填補(bǔ)中間的過程。這就像學(xué)書法時,老師只給你看幾個關(guān)鍵筆畫,然后讓你根據(jù)運(yùn)筆規(guī)律來完成整個字。

整個訓(xùn)練過程的巧妙之處在于引入了一個"運(yùn)動查詢器"的概念。你可以把它想象成機(jī)器人大腦中的一個專門負(fù)責(zé)運(yùn)動規(guī)劃的區(qū)域,就像人腦中負(fù)責(zé)協(xié)調(diào)動作的小腦一樣。這個查詢器在整個訓(xùn)練過程中持續(xù)學(xué)習(xí)和總結(jié)運(yùn)動規(guī)律,成為連接理解和執(zhí)行的橋梁。

為了驗(yàn)證這種方法的效果,研究團(tuán)隊(duì)在多個機(jī)器人模擬平臺上進(jìn)行了廣泛的測試。LIBERO平臺專門測試機(jī)器人的知識遷移能力,包括空間推理、物體識別、程序?qū)W習(xí)和長期規(guī)劃等多個方面。SimplerEnv平臺則更注重測試機(jī)器人在接近真實(shí)環(huán)境中的表現(xiàn),使用七自由度的機(jī)器人手臂完成各種操作任務(wù)。

實(shí)驗(yàn)結(jié)果令人振奮。在LIBERO平臺的四個子任務(wù)中,CoWVLA方法平均達(dá)到了95.6%的成功率,明顯超越了之前的最佳方法。特別是在長期任務(wù)規(guī)劃方面,這種方法表現(xiàn)尤為出色,成功率達(dá)到92.8%。在SimplerEnv平臺上,該方法的平均成功率達(dá)到76.0%,同樣超過了其他競爭方法。

更重要的是,這種方法在計(jì)算效率方面也表現(xiàn)出色。傳統(tǒng)的世界模型方法就像要求計(jì)算機(jī)記住電影的每一幀畫面,需要大量的計(jì)算資源和存儲空間。而CoWVLA方法通過運(yùn)動本質(zhì)的抽象,大大減少了計(jì)算負(fù)擔(dān),就像用簡潔的數(shù)學(xué)公式代替了復(fù)雜的圖表。

研究團(tuán)隊(duì)還進(jìn)行了深入的分析,探究這種方法為什么如此有效。他們發(fā)現(xiàn),關(guān)鍵在于成功地將場景結(jié)構(gòu)和運(yùn)動信息分離開來。通過可視化分析,可以清楚地看到系統(tǒng)能夠準(zhǔn)確識別出視頻中的靜態(tài)背景和動態(tài)運(yùn)動區(qū)域。更有趣的是,系統(tǒng)學(xué)到的運(yùn)動表示具有很好的可解釋性——相似的運(yùn)動類型會被自動歸類到相同的群組中。

在對比不同方法時,研究團(tuán)隊(duì)發(fā)現(xiàn)了一個有趣的現(xiàn)象。純粹的動作模仿方法在簡單任務(wù)上表現(xiàn)不錯,但在復(fù)雜的長期規(guī)劃任務(wù)上明顯力不從心。而傳統(tǒng)的世界模型方法雖然理解能力強(qiáng),但計(jì)算開銷太大,實(shí)際應(yīng)用時效率低下。CoWVLA方法恰好在這兩個極端之間找到了最佳平衡點(diǎn)。

研究團(tuán)隊(duì)還測試了不同參數(shù)設(shè)置對性能的影響。他們發(fā)現(xiàn),使用2個稀疏關(guān)鍵幀和10個動作塊的設(shè)置效果最佳,對應(yīng)大約2秒的時間窗口。這個發(fā)現(xiàn)很有意思:太少的關(guān)鍵幀會讓系統(tǒng)缺乏足夠的約束,太多的關(guān)鍵幀又會讓系統(tǒng)過度依賴視覺匹配而忽略了運(yùn)動推理。

在實(shí)際的機(jī)器人硬件測試中,研究團(tuán)隊(duì)使用了一臺七自由度的Realman機(jī)器人進(jìn)行抓取任務(wù)驗(yàn)證。他們收集了127個操作序列,包含不同顏色杯子的抓取任務(wù)。令人印象深刻的是,即使在與訓(xùn)練環(huán)境不同的光照條件下,系統(tǒng)依然能夠成功執(zhí)行任務(wù),顯示了良好的泛化能力。

這項(xiàng)研究的意義遠(yuǎn)不止于技術(shù)創(chuàng)新。它為機(jī)器人學(xué)習(xí)領(lǐng)域提供了一種全新的思路:與其讓機(jī)器人死記硬背每一個動作細(xì)節(jié),不如教會它理解運(yùn)動的本質(zhì)規(guī)律。這種思路不僅提高了學(xué)習(xí)效率,還增強(qiáng)了機(jī)器人應(yīng)對新情況的適應(yīng)能力。

當(dāng)然,這種方法也有其局限性。研究團(tuán)隊(duì)坦誠地指出,系統(tǒng)的性能仍然受到預(yù)訓(xùn)練視頻編碼器質(zhì)量的影響,在全新的環(huán)境中可能存在領(lǐng)域適應(yīng)的問題。此外,當(dāng)前的方法還需要相當(dāng)大的計(jì)算資源和模型規(guī)模,距離真正的輕量化應(yīng)用還有距離。

展望未來,研究團(tuán)隊(duì)認(rèn)為這種"世界鏈思維"的方法有望在更廣泛的機(jī)器人應(yīng)用中發(fā)揮作用。隨著計(jì)算技術(shù)的進(jìn)步和算法的進(jìn)一步優(yōu)化,我們可能很快就能看到更加智能、高效的機(jī)器人助手出現(xiàn)在我們的日常生活中。

說到底,這項(xiàng)研究就像給機(jī)器人裝上了一套"智慧大腦",讓它既能深度理解任務(wù)的本質(zhì),又能高效地執(zhí)行具體動作。這種平衡智慧與效率的方法,可能正是未來智能機(jī)器人發(fā)展的關(guān)鍵方向。歸根結(jié)底,最好的學(xué)習(xí)方法往往不是死記硬背,而是抓住事物的本質(zhì)規(guī)律,這個道理對人類如此,對機(jī)器人也是如此。

Q&A

Q1:CoWVLA方法和傳統(tǒng)機(jī)器人訓(xùn)練方法有什么區(qū)別?

A:傳統(tǒng)方法要么讓機(jī)器人記住完整的動作視頻(太費(fèi)資源),要么只學(xué)孤立的動作片段(缺乏連貫性)。CoWVLA方法就像教功夫的內(nèi)功心法,先讓機(jī)器人理解動作的本質(zhì)規(guī)律,再學(xué)具體執(zhí)行,既節(jié)約資源又保持了動作的連貫理解。

Q2:這種訓(xùn)練方法在實(shí)際應(yīng)用中效果如何?

A:在多個測試平臺上,CoWVLA方法都表現(xiàn)出色。在LIBERO平臺達(dá)到95.6%成功率,在SimplerEnv平臺達(dá)到76.0%成功率,明顯超過其他方法。更重要的是計(jì)算效率大幅提升,實(shí)際機(jī)器人測試也驗(yàn)證了良好的適應(yīng)性。

Q3:CoWVLA方法適合哪些類型的機(jī)器人任務(wù)?

A:這種方法特別適合需要理解動作連貫性和長期規(guī)劃的任務(wù),比如抓取物體、操作工具、多步驟組裝等。由于它能很好地分離靜態(tài)場景和動態(tài)運(yùn)動,對于環(huán)境變化較大的任務(wù)也有不錯的適應(yīng)能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
6999元!新機(jī)官宣:3月20日,正式開售!

6999元!新機(jī)官宣:3月20日,正式開售!

科技堡壘
2026-03-14 11:48:32
伊朗軍方宣布打擊美國多處基地

伊朗軍方宣布打擊美國多處基地

參考消息
2026-03-13 21:22:35
“美軍紅線”哈爾克島:美伊合資打造的伊朗“王冠明珠”,關(guān)鍵、強(qiáng)韌,也脆弱

“美軍紅線”哈爾克島:美伊合資打造的伊朗“王冠明珠”,關(guān)鍵、強(qiáng)韌,也脆弱

紅星新聞
2026-03-14 15:58:37
順產(chǎn)分娩手術(shù)時直腸被切漏,女子:手術(shù)操作失誤引發(fā)直腸陰道瘺,醫(yī)院隱瞞術(shù)中損傷事實(shí),追責(zé)兩年無果,涉事醫(yī)院因未履行告知義務(wù)被處罰

順產(chǎn)分娩手術(shù)時直腸被切漏,女子:手術(shù)操作失誤引發(fā)直腸陰道瘺,醫(yī)院隱瞞術(shù)中損傷事實(shí),追責(zé)兩年無果,涉事醫(yī)院因未履行告知義務(wù)被處罰

極目新聞
2026-03-14 17:27:32
字節(jié)辟謠「武漢全部被裁」:超2000人base武漢,將加大對湖北投入

字節(jié)辟謠「武漢全部被裁」:超2000人base武漢,將加大對湖北投入

鞭牛士
2026-03-14 12:04:14
隨著上海申花1-1,山東泰山2-1,中超最新積分榜出爐:還有8隊(duì)負(fù)分

隨著上海申花1-1,山東泰山2-1,中超最新積分榜出爐:還有8隊(duì)負(fù)分

側(cè)身凌空斬
2026-03-14 17:48:06
伊朗稱哈爾克島局勢已得到控制

伊朗稱哈爾克島局勢已得到控制

界面新聞
2026-03-14 18:35:14
河南女子拍到大雁排成“ETC”陣型遷徙,場面震撼,當(dāng)事人:從來沒見過,大家都在歡呼

河南女子拍到大雁排成“ETC”陣型遷徙,場面震撼,當(dāng)事人:從來沒見過,大家都在歡呼

臺州交通廣播
2026-03-14 08:59:12
外地人去301醫(yī)院看病,水太深!這份避坑指南能幫你省下一半時間

外地人去301醫(yī)院看病,水太深!這份避坑指南能幫你省下一半時間

牛鍋巴小釩
2026-03-14 09:52:49
無錫至成都航班在地面滑行時,一旅客隨身充電寶突發(fā)自燃

無錫至成都航班在地面滑行時,一旅客隨身充電寶突發(fā)自燃

都市快報(bào)橙柿互動
2026-03-14 13:18:38
主動辭職女籃?宮魯鳴發(fā)聲,耐人尋味,籃協(xié)回應(yīng),媒體人怒了

主動辭職女籃?宮魯鳴發(fā)聲,耐人尋味,籃協(xié)回應(yīng),媒體人怒了

萌蘭聊個球
2026-03-14 14:28:11
其實(shí)人根本不用養(yǎng)老,為什么呢?看到此文,你就會豁然開朗

其實(shí)人根本不用養(yǎng)老,為什么呢?看到此文,你就會豁然開朗

暖風(fēng)吹過竹林
2026-03-14 10:23:30
日本大師在中國代表作,耗資30億的地標(biāo),怎么就成了“鬼城”?

日本大師在中國代表作,耗資30億的地標(biāo),怎么就成了“鬼城”?

GA環(huán)球建筑
2026-03-13 17:27:01
鎮(zhèn)江市委常委會召開會議 堅(jiān)決擁護(hù)省委對許文涉嫌嚴(yán)重違紀(jì)違法進(jìn)行紀(jì)律審查和監(jiān)察調(diào)查的決定

鎮(zhèn)江市委常委會召開會議 堅(jiān)決擁護(hù)省委對許文涉嫌嚴(yán)重違紀(jì)違法進(jìn)行紀(jì)律審查和監(jiān)察調(diào)查的決定

環(huán)球網(wǎng)資訊
2026-03-14 13:18:09
84比56大勝19分!女籃勁敵爆冷掀翻世界第9:中國晉級世界杯穩(wěn)了

84比56大勝19分!女籃勁敵爆冷掀翻世界第9:中國晉級世界杯穩(wěn)了

籃球快餐車
2026-03-14 16:48:34
中國女足為何戰(zhàn)勝中國臺北賽后王霜毫不客氣說出原因 說的很實(shí)在

中國女足為何戰(zhàn)勝中國臺北賽后王霜毫不客氣說出原因 說的很實(shí)在

籃球看比賽
2026-03-14 17:06:54
中超巨大爭議!楊皓宇染紅離場,媒體人集體開炮:主裁莫名其妙

中超巨大爭議!楊皓宇染紅離場,媒體人集體開炮:主裁莫名其妙

奧拜爾
2026-03-14 17:40:57
馬克龍:黎巴嫩稱愿與以色列直接對話,法國愿提供平臺,以方應(yīng)“抓住機(jī)會”

馬克龍:黎巴嫩稱愿與以色列直接對話,法國愿提供平臺,以方應(yīng)“抓住機(jī)會”

環(huán)球網(wǎng)資訊
2026-03-14 19:42:07
七旬翁直播間買了81箱酒,支付113筆花掉8.3萬,還收到7部手機(jī)認(rèn)為是“三無”產(chǎn)品,要求“退一賠三”

七旬翁直播間買了81箱酒,支付113筆花掉8.3萬,還收到7部手機(jī)認(rèn)為是“三無”產(chǎn)品,要求“退一賠三”

大風(fēng)新聞
2026-03-14 10:10:23
王霜停賽!中國女足3月17日18點(diǎn)對陣東道主澳大利亞 勝者將進(jìn)決賽

王霜停賽!中國女足3月17日18點(diǎn)對陣東道主澳大利亞 勝者將進(jìn)決賽

風(fēng)過鄉(xiāng)
2026-03-14 16:00:51
2026-03-14 20:04:50
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
7585文章數(shù) 555關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

霍爾木茲海峽上周末僅4艘船通過 繞行要多走5500公里

頭條要聞

霍爾木茲海峽上周末僅4艘船通過 繞行要多走5500公里

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂要聞

張藝興,犯了大忌

財(cái)經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實(shí)力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

房產(chǎn)
教育
旅游
時尚
本地

房產(chǎn)要聞

不容易啊!??诮K于又要賣地了!

教育要聞

“十五五”規(guī)劃綱要明確,有序推進(jìn)小班化教學(xué)

旅游要聞

濟(jì)南2026花期預(yù)報(bào)來了,帶你精準(zhǔn)打卡春日花海

審美提升|| 來和時髦尖子生學(xué)幾招

本地新聞

坐標(biāo)北京,過敏季反向遷徒

無障礙瀏覽 進(jìn)入關(guān)懷版