国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

具身數(shù)據(jù)戰(zhàn)開打!普通人都能上手,邊采邊篩,只喂機器人愛吃的

0
分享至

衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

現(xiàn)在,一部手機,加一個“夾爪”,就能隨時隨地完成具身智能數(shù)據(jù)采集了!



采出來的數(shù)據(jù)不臟也不廢,已經(jīng)在實際模型訓練中跑出了效果。

模型在多步連續(xù)任務中動作銜接更穩(wěn)定;

在真實場景中面對光照變化、環(huán)境雜亂、物體遮擋時也更不容易失手,執(zhí)行魯棒性顯著提升;

而當任務發(fā)生小幅變化,比如同類但不同順序的操作目標出現(xiàn)時,模型也更容易舉一反三,做出合理應對。

這套采集系統(tǒng),模型效果是純純地全肯定。



這套可搭載手機的數(shù)采終端及其配套應用程序,名叫RoboPocket,來自具身智能創(chuàng)企穹徹智能

它是新興采集設備UMI(Universal Manipulation Interface)的進階狀態(tài)。

和傳統(tǒng)UMI方案相比,RoboPocket保持便攜易用的基礎上,更加輕盈:手機+夾爪即是一個節(jié)點。

如此一來,每個人——哪怕是普通人,都可以從口袋里掏出RoboPocket,隨時隨地采集具身數(shù)據(jù)。

但這還算不上它最出彩的地方。

最妙的是,RoboPocket把模型需求前置到采集一線,讓你隨時接入模型的訓練閉環(huán)。

采集行為發(fā)生時,系統(tǒng)會同步判斷每一段數(shù)據(jù)的訓練價值,并即時給出反饋與引導,盡量讓采集行為本身就朝著模型真正需要的方向收斂。

每一次采集都直接服務于模型進化,浪費不了一點。



在數(shù)據(jù)還在生成的過程中,就對其完成了價值篩選。

最終采來交付給模型的數(shù)據(jù)從采集源頭就來得更加清晰,更加準確,對模型也更有用。

具身模型想scale up,卡在數(shù)據(jù)哪一步?

在具身智能領域,數(shù)據(jù)的重要性幾乎是共識性的。

具身模型們嗷嗷待哺,等待大量高質(zhì)量、多樣性的具身數(shù)據(jù)的投喂。

從2023年起,許多團隊投入大量資源建設數(shù)采廠,希望通過規(guī)模化生產(chǎn)來支撐模型訓練。

實踐很快暴露出一個現(xiàn)實問題,數(shù)采流水線建起來了,數(shù)據(jù)量上來了,模型能力卻并沒有穩(wěn)定持續(xù)地提升。

原因并不神秘。

數(shù)采廠依賴的是預設場景和標準化流程,這種方式在工業(yè)數(shù)據(jù)中行之有效,但在具身智能里,很難覆蓋真實世界中大量非標準、非重復的操作情境。

動作容易趨于模式化,任務分布集中,環(huán)境變化有限,數(shù)據(jù)之間高度相似,訓練收益很快出現(xiàn)邊際遞減。

有相關(guān)從業(yè)人員告訴我們,現(xiàn)在的具身數(shù)據(jù)一天比一天多了,結(jié)果訓練效率出現(xiàn)不升反降情況。



而具身模型真正需要的,恰恰是那些發(fā)生在真實環(huán)境中的、不那么規(guī)整的操作過程。

這也是UMI出現(xiàn)的背景。

UMI輕量便攜,更易使用,一方面減少了數(shù)采成本,更重要的是開始讓具身數(shù)據(jù)采集擺脫了固定場地的限制。

任何人,可以在室內(nèi)和戶外的任何真實世界場景里自然完成操作。

如此一來,采集的數(shù)據(jù)也是貼近現(xiàn)實分布的。這就彌補了數(shù)采廠和真實世界存在gap的問題。

但當UMI開始被業(yè)界認可和逐漸大規(guī)模使用后,新的問題也隨之顯現(xiàn)。

在真實場景中,采集更自由了,但質(zhì)量控制隨之變難了。

動作是否有效?軌跡是否合理?采集節(jié)奏是否適合訓練?這些問題往往只有數(shù)據(jù)回傳清洗,開始拿來訓模型的后處理階段才能發(fā)現(xiàn)。

大量低價值數(shù)據(jù)被一路送進管線,清洗與返工成本迅速抬升,訓練周期被不斷拉長。

所以關(guān)于UMI的“不可能三角”被抬到了臺前——

采集質(zhì)量、使用便捷性與后處理壓力三者難以同時優(yōu)化

如果追求采集質(zhì)量,就往往要犧牲便攜性;如果降低門檻提高便攜性,比如像傳統(tǒng)UMI僅靠腕部模組或“人-夾爪”采集,就又很難保證數(shù)據(jù)的可用性;如果希望用后處理階段兜底,就意味著要承受高昂的清洗、篩選與修復成本,訓練閉環(huán)被迫拉長。

現(xiàn)有的UMI方案并沒有解決“采得的數(shù)據(jù)能不能用”這個問題——這一點恰恰對模型訓練至關(guān)重要。

于是,穹徹團隊決定回到問題的原點,重新出發(fā)。

他們從第一性原理出發(fā),提出一個關(guān)鍵設想。

  • 如果模型訓練最終還是要根據(jù)數(shù)據(jù)結(jié)構(gòu)做判斷與篩選,那么為什么這件事不能在數(shù)據(jù)采集階段就發(fā)生?

這個問題其實是行業(yè)遲遲沒直面解決的。因為一旦著手解決,就意味著采集邏輯、平臺架構(gòu)、成本結(jié)構(gòu)、人才組織……都得變。

而RoboPocket第一次把它變成了現(xiàn)實。



內(nèi)置一套實時運行的“數(shù)據(jù)價值中樞系統(tǒng)”

相比于過往的UMI設備,RoboPocket的關(guān)鍵改變集中體現(xiàn)在采集目標本身的定義上。

傳統(tǒng)UMI的普遍默認采集目標是“記錄人類操作行為”。

也就是通過腕部模組、夾爪、軌跡重建等方式,盡可能完整地還原人類執(zhí)行任務的過程。

在訓練初期,這確實能為模型提供基本行為模板。

隨著模型走向更高維度、更長時序、更復雜場景,記錄動作本身已不足以滿足訓練所需。

RoboPocket開始嘗試把采集的目標轉(zhuǎn)向模型的能力缺口。

模型還不會的,才是最值得采的數(shù)據(jù)。

基于這個理念,RoboPocket系統(tǒng)內(nèi)置了一套實時運行的“數(shù)據(jù)價值中樞系統(tǒng)”。

這套系統(tǒng)不再等數(shù)據(jù)采完后才去篩選、分類、評估,而是在采集發(fā)生的當下,就開始實時進行判斷。

不難想象,一旦沒有模型視角,采集很容易在堆量的過程中滑向重復、失真和低價值。

只有知道模型此刻真正需要什么樣的數(shù)據(jù),才有能力搭建好這個中樞系統(tǒng)。

穹徹和上交大盧策吾團隊敢攬這個瓷器活,人家是真有公認的金剛鉆。

團隊長期從事具身模型訓練與數(shù)據(jù)閉環(huán)研究,既懂單點采集工具(此前推出過多款具身數(shù)據(jù)采集硬件),也懂圍繞具身模型訓練、評估與數(shù)據(jù)回流的完整閉環(huán)研究。

他們最清楚哪些軌跡會變成有效訓練信號,哪些看起來熱鬧但只會拖慢訓練,也更清楚模型在不同任務維度上的短板通常出在哪里,應該用什么樣的樣本去補。

這種能力依賴的不只是工程實現(xiàn),而是對模型的長期理解與持續(xù)驗證,所以很難被復制。



采集數(shù)據(jù)的過程中,RoboPocket同時在推進并完成三件事——

第一是實時評估。

在每一幀數(shù)據(jù)生成時,系統(tǒng)都會判斷采集到的數(shù)據(jù)是否具備有效的訓練信號,比如操作是否完整、動作是否在預期軌跡內(nèi)、場景是否具備信息量。

第二是即時引導。

如果系統(tǒng)檢測到采集者的操作可能低效或錯誤,比如動作過快、夾爪超出操作區(qū)域、多樣性不足等,就會實時發(fā)出提醒,引導采集者進行調(diào)整,避免采到低價值甚至廢棄的數(shù)據(jù)。



第三是動態(tài)調(diào)度

這一環(huán)節(jié)則直接接入當前模型的能力評估結(jié)果。

系統(tǒng)會根據(jù)模型在不同任務維度上的表現(xiàn),識別出當前訓練最需要補齊的樣本類型,并實時分發(fā)相應的高優(yōu)先級采集任務給采集者。

說句更好理解的話,RoboPocket就是個24小時stand by的數(shù)據(jù)采集主理人

它即時診斷每一幀數(shù)據(jù)的質(zhì)量,智能指導甚至糾正采集員動作,實時互動動態(tài)評估數(shù)據(jù)價值,為后處理提供篩選依據(jù)。

這樣一來,在采集階段,數(shù)據(jù)就和訓練目標保持貼合,顯著減少冗余,訓練信號更加集中。

穹徹團隊介紹,RoboPocket采集的數(shù)據(jù)在訓練中展現(xiàn)出顯著優(yōu)勢。

尤其是在開放復雜環(huán)境中的多步驟任務中,模型執(zhí)行的穩(wěn)定性更強,不容易因光照變化、背景變化或任務干擾而出錯,準確識別每一步的上下文意圖,在不確定情境下仍保持清晰的目標推進邏輯。

無論是精準完成零食分揀裝袋,還是毛巾折疊整理,模型可以保持穩(wěn)定、高效的協(xié)同作業(yè),展現(xiàn)了卓越的雙臂協(xié)同與長序列操作能力。



此外,在環(huán)境復雜度提升、干擾增多的場景下,也能維持較高的成功率和一致性。

這顯現(xiàn)出一個重要趨勢

得益于采集過程更貼近真實任務,采集體系增強了訓練匹配能力,模型開始從“能夠粗糙地完成任務”向“能在非理想條件下可靠完成任務”演進。

而數(shù)據(jù)采集開始成為面向模型能力補齊的持續(xù)行為,這讓數(shù)據(jù)采集開始具備閉環(huán)屬性。

一旦采集與模型訓練形成聯(lián)動,整個數(shù)據(jù)系統(tǒng)的運行效率將得到顯著提升。



從堆量走向邊采邊篩,數(shù)據(jù)采集的分水嶺來了

如果放進更長的時間尺度來看,RoboPocket就不能視為一次孤立的產(chǎn)品更新。

機器人學習的發(fā)展,本質(zhì)上是一部數(shù)據(jù)采集方式不斷演進的歷史。

最初,機器人只能在實驗室中完成標準任務,數(shù)據(jù)由少數(shù)研究人員在封閉環(huán)境中錄制。

隨著具身智能的發(fā)展,數(shù)據(jù)開始走向規(guī)?;杉瘓?/strong>,遙操作與人機協(xié)作帶來大規(guī)模機器人數(shù)據(jù)。

2023年,穹徹智能聯(lián)合上海交通大學盧策吾團隊共同發(fā)布RH20T,機器人操作數(shù)據(jù)在中國首次實現(xiàn)系統(tǒng)性的規(guī)模化采集。但截至這一時期,機器人數(shù)據(jù)采集依然主要依賴預設場景。

2024年,斯坦福大學推出的UMI讓采集設備更加輕量和簡單,數(shù)據(jù)采集開始轉(zhuǎn)向“自然發(fā)生”。

2025年,穹徹智能推出CoMiner伴隨式數(shù)據(jù)采集系統(tǒng),機器人開始走出采集場,進入真實世界,在開放環(huán)境中獲取更加多樣、復雜的操作數(shù)據(jù)

梳理這個過程可以看到,具身數(shù)據(jù)一步步走出搭建的實驗場景,愈來愈貼近現(xiàn)實。

2026年,RoboPocket的出現(xiàn),將機器人數(shù)據(jù)采集,從特定場所與專業(yè)系統(tǒng)徹底釋放到整個社會中



手機成為節(jié)點,每個普通人可以參與采集。

無可否認,這是一次采集范式從“專業(yè)體系”走向“社會化網(wǎng)絡”的轉(zhuǎn)變。

當然啦,采什么、怎么采、優(yōu)先級如何,這些都不是由人隨意決定的。

這時候,前端連接真實世界的分散場景,后端連接任務庫、模型訓練與評估系統(tǒng)的RoboPocket,就起到了數(shù)據(jù)入口與調(diào)度中樞的雙角色作用。



正因為有這套持續(xù)在線的判斷與調(diào)度機制,數(shù)據(jù)采集才第一次具備了真正社會化的前提條件。

數(shù)采員可以是每一個普通人,但采集行為始終根據(jù)模型需求由數(shù)據(jù)中樞系統(tǒng)統(tǒng)一牽引調(diào)度。

長期來看,會推動具身數(shù)據(jù)從工具競爭邁向體系競爭。

誰的數(shù)據(jù)采集流程更早地接入模型反饋、誰的任務設計天然適配訓練目標,誰就能更快積累泛化能力與落地魯棒性。

行業(yè)普遍認為具身智能還在上半場,期待著這個領域和大模型一樣,能夠用暴力美學帶來能力涌現(xiàn)。



所有人都在往具身模型里扔更多數(shù)據(jù),但真正贏的人,一定率先解決了其它更深層次的問題。

既然如此,對想要持續(xù)scale up的具身智能行業(yè)來說,數(shù)據(jù)采集從源頭就對齊目標就是一場遲早會發(fā)生的機制變動。

因為未來模型之間的差距,很可能就源于數(shù)據(jù)閉環(huán)的建設深度。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
說封就封!美國4月13日鎖死伊朗港口,伊朗傻眼

說封就封!美國4月13日鎖死伊朗港口,伊朗傻眼

老馬拉車莫少裝
2026-04-13 10:02:14
8.03億歐!若熱刺降級將打破英超降級球隊最高德轉(zhuǎn)身價紀錄

8.03億歐!若熱刺降級將打破英超降級球隊最高德轉(zhuǎn)身價紀錄

懂球帝
2026-04-13 19:39:06
“8小時紅線,天塌了”:網(wǎng)約車司機的新規(guī)焦慮,到底該怎么解?

“8小時紅線,天塌了”:網(wǎng)約車司機的新規(guī)焦慮,到底該怎么解?

一絲不茍的法律人
2026-04-12 16:18:58
中美俄同時力挺也沒用,匈牙利強人歐爾班為何大???

碼頭青年
2026-04-13 12:32:33

曲樂恒現(xiàn)狀:坐輪椅26年,49歲無人嫁靠父母照顧,和張玉寧沒和解

曲樂恒現(xiàn)狀:坐輪椅26年,49歲無人嫁靠父母照顧,和張玉寧沒和解

攬星河的筆記
2026-04-13 15:41:13
深觀察 | 美方為何祭出霍爾木茲海峽“封鎖牌”?專家:既不想開戰(zhàn),也不愿接受僵局

深觀察 | 美方為何祭出霍爾木茲海峽“封鎖牌”?專家:既不想開戰(zhàn),也不愿接受僵局

國際在線
2026-04-13 19:57:02
拿到了!恭喜東契奇!25-26賽季首個大獎

拿到了!恭喜東契奇!25-26賽季首個大獎

籃球?qū)崙?zhàn)寶典
2026-04-13 21:27:20
一線記者傳回中東戰(zhàn)報,伊朗國內(nèi)的慘烈程度,遠比想象中大得多

一線記者傳回中東戰(zhàn)報,伊朗國內(nèi)的慘烈程度,遠比想象中大得多

滄海旅行家
2026-04-13 14:41:54
深圳一樓盤遭哄搶,保安向人群噴辣椒水!開發(fā)商致歉

深圳一樓盤遭哄搶,保安向人群噴辣椒水!開發(fā)商致歉

南方都市報
2026-04-13 17:00:47
撕破臉!阿聯(lián)酋翻臉逼債35億,巴基斯坦:這錢還你,但朋友不交了

撕破臉!阿聯(lián)酋翻臉逼債35億,巴基斯坦:這錢還你,但朋友不交了

壹知眠羊
2026-04-13 07:11:52
著名音樂學家、中央音樂學院教授安平病逝,享年65歲

著名音樂學家、中央音樂學院教授安平病逝,享年65歲

澎湃新聞
2026-04-13 15:54:26
中國風風火火的造船業(yè),本質(zhì)上其實只是低端產(chǎn)業(yè),賺的是組裝費

中國風風火火的造船業(yè),本質(zhì)上其實只是低端產(chǎn)業(yè),賺的是組裝費

三言四拍
2026-04-13 21:31:23
美軍對伊朗港口“封鎖令”生效時間已到

美軍對伊朗港口“封鎖令”生效時間已到

界面新聞
2026-04-13 22:02:49
上海地鐵9號線上,男子攜帶拉桿箱咋有“血”滲出來? 地鐵回應:裝有冷凍食品鴨血,時間長融化了

上海地鐵9號線上,男子攜帶拉桿箱咋有“血”滲出來? 地鐵回應:裝有冷凍食品鴨血,時間長融化了

大風新聞
2026-04-13 19:00:06
只對伊朗封鎖海峽:錯誤時間的錯誤戰(zhàn)爭里,特朗普做的正確選擇

只對伊朗封鎖海峽:錯誤時間的錯誤戰(zhàn)爭里,特朗普做的正確選擇

鷹眼Defence
2026-04-13 13:14:12
黃奇帆:如果現(xiàn)在還有人認為房地產(chǎn)會反彈上漲,那他對經(jīng)濟肯定是沒什么認知的

黃奇帆:如果現(xiàn)在還有人認為房地產(chǎn)會反彈上漲,那他對經(jīng)濟肯定是沒什么認知的

跨界標桿研習社
2026-04-13 20:39:54
大冷!浙江丟絕殺遭福建逆轉(zhuǎn)終結(jié)7連勝 李悅州23分吃T生涯新高

大冷!浙江丟絕殺遭福建逆轉(zhuǎn)終結(jié)7連勝 李悅州23分吃T生涯新高

醉臥浮生
2026-04-13 21:49:00
世界上最大操作系統(tǒng)Linux創(chuàng)始人:AI生成代碼能用,但必須寫明代碼是否由AI生成

世界上最大操作系統(tǒng)Linux創(chuàng)始人:AI生成代碼能用,但必須寫明代碼是否由AI生成

IT之家
2026-04-12 23:26:21
美媒:美軍公布海上封鎖伊朗計劃細節(jié)

美媒:美軍公布海上封鎖伊朗計劃細節(jié)

參考消息
2026-04-13 14:32:07
李少芬入選中國籃球名人堂,丈夫鐘南山為她穿上名人西裝

李少芬入選中國籃球名人堂,丈夫鐘南山為她穿上名人西裝

大象新聞
2026-04-13 13:01:11
2026-04-13 23:03:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12466文章數(shù) 176449關(guān)注度
往期回顧 全部

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

初代“跑男團”合體,鄧超、鹿晗缺席

財經(jīng)要聞

談判未完全關(guān)閉?3國力促美伊重啟談判

汽車要聞

不止命名更純粹 領克10/10+要做純電操控新王

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
家居
健康
數(shù)碼

藝術(shù)要聞

22位中國當代名家油畫作品

房產(chǎn)要聞

6000億投資盛宴,全球巨頭齊聚,海南又要干件大事!

家居要聞

復古風格 自然簡約

干細胞抗衰4大誤區(qū),90%的人都中招

數(shù)碼要聞

中興逍遙20 AI平板發(fā)布:支持5G蜂窩網(wǎng)絡、可切換云電腦模式

無障礙瀏覽 進入關(guān)懷版