国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產VLA模型開源!35000小時訓練數(shù)據(jù),全球最大規(guī)模

0
分享至


機器人前瞻(公眾號:robot_pro)
作者 許麗思
編輯 漠影

機器人前瞻1月20日報道,今天, Being Beyond發(fā)布跨本體VLA模型Being-H0.5,并已在GitHub、HuggingFace上進行完整開源。

Being Beyond不僅公開了預訓練與后訓練的全部模型參數(shù),還提供完整的訓練與評估代碼,以及一套可復現(xiàn)1000+ GPU小時訓練的詳細配方。未來,其還將逐步開源真機部署代碼與接口。


Being-H0.5通過整合數(shù)萬小時人類視頻以及當前全球幾乎所有主流機器人構型的操作數(shù)據(jù),在視覺?語言?動作(VLA)任務中展現(xiàn)出較強的跨本體泛化能力——無論硬件形態(tài)如何差異,模型皆能快速適應、穩(wěn)定執(zhí)行。

Being-H0.5基于human-centric learning,涵蓋30種不同本體(是π0.5的5倍),能夠實現(xiàn)超強跨本體泛化,對同樣一批任務,只需訓練一次,就能部署在5個不同本體上。

性能方面,Being-H0.5在大規(guī)模預訓練加持下,即使只微調2%的模型參數(shù)也能達到90%以上的相對performance;其在LIBERO和RoboCasa達到SoTA,還實現(xiàn)了全球最快的端側部署速度,在Orin-NX上達到實時。

一、構建全球規(guī)模最大的訓練數(shù)據(jù)集,總時長超3.5萬小時

UniHand2.0數(shù)據(jù)集總時長超過3.5萬小時,囊括14,000 小時的機器人操作數(shù)據(jù), 16,000 小時的人類視頻數(shù)據(jù),以及5000小時通用多模態(tài)數(shù)據(jù),總訓練 token 數(shù)突破 1200 億。這是全球首次在機器人領域進行如此大規(guī)模、跨本體的數(shù)據(jù)整合嘗試。


與以往僅基于“輪式底盤 + 雙臂夾爪”范式的研究(如 π 系列工作)不同,UniHand2.0 首次實現(xiàn)了跨本體的大規(guī)模數(shù)據(jù)融合,匯集了超過30種不同硬件構型的多樣化數(shù)據(jù),涵蓋了從桌面機械臂到雙足機器人在內幾乎所有已知的機器人形態(tài)。


▲UniHand與現(xiàn)有VLA數(shù)據(jù)集規(guī)模對比:超3.5萬小時和30余本體,在規(guī)模和多樣性上提升了3倍以上

在Being?H0.5 之前,尚未有研究嘗試將如此多異構本體數(shù)據(jù)統(tǒng)一用于訓練——其核心挑戰(zhàn)在于,不同機器人的狀態(tài)空間與動作空間差異巨大,直接混合訓練極易引發(fā)“數(shù)據(jù)沖突”,導致模型難以收斂或泛化。

為解決上述難題,BeingBeyond 團隊提出了 統(tǒng)一動作空間框架,將雙足人形、輪式底盤、桌面機械臂、夾爪、靈巧手等形態(tài)各異的機器人,映射到同一特征表示空間中,從而有效支撐跨本體聯(lián)合訓練與知識遷移。

二、以人為中心的訓練范式

當前具身行業(yè),無論是機器人設計、數(shù)據(jù)采集方案(如 UMI、傳統(tǒng)遙操作),還是任務設計,本質上都在模仿人類,以人為中心。而人類本身,就可被視為所有下游機器人的“原型模板”。

針對人類視頻普遍缺乏高質量標注的痛點,團隊還設計了一套名為 UniCraftor 的便攜、可擴展、低成本的人類視頻采集系統(tǒng):


在統(tǒng)一動作空間的基礎上,Being?H0.5 提出了一套完整的以人為中心的預訓練范式。具體包括:

統(tǒng)一序列化建模:不再為人類演示、機器人軌跡和視覺文本數(shù)據(jù)設立獨立的訓練流水線,而是將它們轉化成統(tǒng)一的多模態(tài)token序列。在這個序列中,視覺和文本負責提供背景信息,而統(tǒng)一的“狀態(tài)/動作”Token 則承載物理交互信號。

混合監(jiān)督(多目標優(yōu)化):在同一個序列上根據(jù)數(shù)據(jù)特點應用不同的損失函數(shù)。如針對文本數(shù)據(jù)(如 VQA、運動描述)的Next-token Prediction;針對離散人類動作的Masked Token Prediction,針對連續(xù)人類和機器人數(shù)據(jù),則在統(tǒng)一空間內進行動作預測(Action Prediction)等。

這種融合的預訓練方式能讓模型能在從人類行為中提取高層級的、可遷移的交互邏輯(先驗)的同時,從機器人數(shù)據(jù)中提煉高精度的運動控制知識。


三、面向跨本體的模型架構升級

傳統(tǒng)的VLA,尤其是近期流行的基于flow-matching架構的模型,其模型容量由于參數(shù)大小存在限制,這導致VLA在混合異構數(shù)據(jù)進行預訓練時的性能下降,同時也阻礙了模型泛化到各種復雜下游任務的能力。為了克服這個問題, 團隊針對性地進行了一系列架構創(chuàng)新。

首先,受大模型 MoE 架構啟發(fā),團隊設計了 Mixture-of-Flow(MoF) 架構,將動作專家(action expert)解耦為負責學習通用的運動原語(如:物體如何運動)的共享專家,以及通過機器人感知路由,負責特定形態(tài)精準執(zhí)行的特化專家。


▲MPG和UAC模塊示意圖

此外,針對現(xiàn)實部署中的抖動和延遲問題,團隊引入了 流形保持門控(Manifold-Preserving Gating, MPG)以確保在感知模糊時模型能退回到魯棒的先驗分布;以及通用異步分塊(Universal Async Chunking, UAC)技術,使同一個模型能完美適配不同控制頻率和延遲的機器人硬件。

四、跨本體復雜任務執(zhí)行能力強,基準測試超越π0.5、GR00T

為驗證 Being?H0.5 的跨本體能力,研究團隊在 PND、G1、Franka 等不同構型的人形機器人、機械臂本體上進行了大量真機實驗。


▲Being-H0.5在不同構型本體上均進行了廣泛驗證實驗

在海量、多源數(shù)據(jù)的加持下,模型展現(xiàn)出較強的跨本體與復雜任務執(zhí)行能力,甚至能夠完成 “用按壓噴壺澆花” 這類以往夾爪式機器人難以實現(xiàn)的操作。


▲跨本體真機任務

在四組任務上展開的定量評測實驗中,Being-H0.5無論是generalist(多本體數(shù)據(jù)混合訓練,難度更大)還是specialist(單一本體數(shù)據(jù)分開訓練,較簡單),性能表現(xiàn)都遠優(yōu)于僅能依托單一本體訓練的 π-0.5模型。同時,Being-H0.5-generalist模型在平均性能表現(xiàn)上和specialist持平,展現(xiàn)出其跨本體維度上的強大泛化能力。


▲真機實驗性能對比

為定量評估模型性能,團隊在 LIBERO、RoboCasa 等廣泛使用的評測基準上進行了測試。在僅依賴模仿學習與純 RGB 視覺輸入的條件下,模型平均取得了 98.9% 與 54% 的成功率,不僅超越了 π0.5、GR00T 等所有已知 VLA 模型,甚至優(yōu)于部分借助強化學習與 3D 模態(tài)的方案,展現(xiàn)出較強的SOTA性能和競爭力。


▲RoboCasa對比結果,Being-H顯著超過π0.5、GR00T等先進VLA

結語:依托以人為中心的技術范式,降低具身智能研發(fā)門檻

Being-H0.5的推出,為具身智能領域提供了一種新的技術范式思路:高質量訓練數(shù)據(jù)并非必須源于自建的高成本機器人集群。針對“如何高效適配多元本體、低成本獲取優(yōu)質訓練數(shù)據(jù)”這一核心行業(yè)挑戰(zhàn),Being-H0.5將視角轉向人類本身這一最豐富、最自然的數(shù)據(jù)源泉。

這一技術路徑在一定程度上降低了具身智能技術的研發(fā)門檻,使得企業(yè)無需投入巨額資金構建數(shù)據(jù)“護城河”,便可依托以人為中心的學習范式(human-centric learning),開發(fā)適配多元本體的通用算法。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗4枚彈道導彈“突襲”美軍航母,卻變成一場“昂貴的煙花秀”

伊朗4枚彈道導彈“突襲”美軍航母,卻變成一場“昂貴的煙花秀”

矚望云霄
2026-03-02 10:49:12
中國石油歷史上9次漲停

中國石油歷史上9次漲停

貝殼財經(jīng)
2026-03-02 15:43:25
“伊朗德黑蘭飛烏魯木齊航班進入中國領空 機艙內傳來廣播”視頻熱傳 川航:未開通伊朗航線

“伊朗德黑蘭飛烏魯木齊航班進入中國領空 機艙內傳來廣播”視頻熱傳 川航:未開通伊朗航線

閃電新聞
2026-03-02 17:29:47
暴跌40%,關店4000家!曾創(chuàng)神話的“零食界愛馬仕”,賣不動了

暴跌40%,關店4000家!曾創(chuàng)神話的“零食界愛馬仕”,賣不動了

好賢觀史記
2026-03-02 20:17:10
海瀾之家被“全軍拉黑”!中標后拒簽合同,200億撐不起一單軍需

海瀾之家被“全軍拉黑”!中標后拒簽合同,200億撐不起一單軍需

新浪財經(jīng)
2026-03-02 16:03:13
哈梅內伊身亡現(xiàn)場照片曝光

哈梅內伊身亡現(xiàn)場照片曝光

名人茍或
2026-03-02 10:37:43
伊朗不值得同情!兩大國親手為他搭好擂臺,卻反手被賣

伊朗不值得同情!兩大國親手為他搭好擂臺,卻反手被賣

毛豆論道
2026-03-02 17:01:06
加水加糖加廢料,椰子水系統(tǒng)性摻假翻車!網(wǎng)友:真夠歹毒……

加水加糖加廢料,椰子水系統(tǒng)性摻假翻車!網(wǎng)友:真夠歹毒……

柴狗夫斯基
2026-03-02 10:46:05
三名美國士兵喪生,特朗普發(fā)誓要復仇,放話"何時停戰(zhàn)由伊方?jīng)Q定"

三名美國士兵喪生,特朗普發(fā)誓要復仇,放話"何時停戰(zhàn)由伊方?jīng)Q定"

派大星紀錄片
2026-03-02 10:34:38
真主黨表演“復仇”,以色列10分鐘將高層一鍋端

真主黨表演“復仇”,以色列10分鐘將高層一鍋端

難得君
2026-03-02 18:52:53
外媒:特朗普對伊朗發(fā)出新威脅

外媒:特朗普對伊朗發(fā)出新威脅

參考消息
2026-03-01 15:52:28
看完這三張底牌,你就知道伊朗“帶路黨”要“變天”有多難?

看完這三張底牌,你就知道伊朗“帶路黨”要“變天”有多難?

文昌每日談
2026-03-02 13:14:00
突發(fā):莫斯科遭襲擊

突發(fā):莫斯科遭襲擊

中國網(wǎng)
2026-03-02 16:38:20
復盤5次中東戰(zhàn)爭!別光盯著油價黃金,A 股這些機會已經(jīng)明牌了

復盤5次中東戰(zhàn)爭!別光盯著油價黃金,A 股這些機會已經(jīng)明牌了

風風順
2026-03-02 11:21:39
4位名人被困中東!轟炸聲中徹夜未眠,航班全取消,只能焦慮等待

4位名人被困中東!轟炸聲中徹夜未眠,航班全取消,只能焦慮等待

娛說瑜悅
2026-03-02 14:18:06
1971年伊朗花20億干這么愚蠢的事情,最終成為最昂貴的葬禮

1971年伊朗花20億干這么愚蠢的事情,最終成為最昂貴的葬禮

爆角追蹤
2026-03-01 15:28:53
川普活成自己最討厭的人,昔日數(shù)次預言奧巴馬打伊朗:為挽回顏面與支持率

川普活成自己最討厭的人,昔日數(shù)次預言奧巴馬打伊朗:為挽回顏面與支持率

不掉線電波
2026-03-02 11:07:35
為什么科學家說:如果宇宙中只有人類,比找到外星人更可怕?

為什么科學家說:如果宇宙中只有人類,比找到外星人更可怕?

觀察宇宙
2026-03-01 20:46:19
美國中央司令部:美軍三架F-15E戰(zhàn)機在科威特“明顯遭友軍誤擊”墜毀

美國中央司令部:美軍三架F-15E戰(zhàn)機在科威特“明顯遭友軍誤擊”墜毀

環(huán)球網(wǎng)資訊
2026-03-02 19:32:13
突發(fā)! 內賈德沒死? 親信稱: 他一切安好

突發(fā)! 內賈德沒死? 親信稱: 他一切安好

每日經(jīng)濟新聞
2026-03-02 12:32:06
2026-03-02 23:59:00
機器人前瞻
機器人前瞻
專注于機器人報道的媒體
378文章數(shù) 8關注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

媒體:拉里賈尼走向前臺 四大關鍵變量將決定伊朗命運

頭條要聞

媒體:拉里賈尼走向前臺 四大關鍵變量將決定伊朗命運

體育要聞

“想要我簽名嗎” 梅西逆轉后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

健康
教育
數(shù)碼
時尚
旅游

轉頭就暈的耳石癥,能開車上班嗎?

教育要聞

特別猛,但在留學生心中存在感很低的英國大學!

數(shù)碼要聞

英偉達發(fā)布595.71 WHQL驅動,修復顯卡風扇“翻車”問題

今年春天一定要擁有的4件衣服,太好看了!

旅游要聞

湄旅節(jié)后回血指南,用一場慢游,把復工焦慮留在21°C的春天里

無障礙瀏覽 進入關懷版