国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

中國具身大模型該怎么走?自變量找了條可復(fù)制的路

0
分享至



作者:彭堃方

編輯:呂鑫燚

出品:具身研習(xí)社

近日,在全球首個(gè)大規(guī)模、多任務(wù)的,在真實(shí)物理環(huán)境中由真實(shí)機(jī)器人執(zhí)行操作任務(wù)的基準(zhǔn)測試RoboChallenge榜單新鮮出爐??偟梅峙判械谝粸镻hyscial Intelligence的開源模型pi0.5,第二為自變量的開源模型WALL-OSS,第三為PI的另一開源模型pi0。其中,WALL-OSS總分?jǐn)?shù)為54.69,加上成功率35.33%。



這是一份非常有意思的榜單,首先自變量的表現(xiàn)說明具身智能大模型領(lǐng)域的“中美差距“正在像LLM(大語言模型)一樣,迅速填平差距。其次,所有評(píng)測模型皆為開源模型,從而讓所有模型在公眾的視野下接受評(píng)測,打開了具身智能神秘的黑盒。

可以說RoboChallenge為具身智能大模型找到了一條基準(zhǔn)線,也為外界窺探具身智能大腦的真實(shí)能力進(jìn)展打開了窗口。

以自變量為例,去年9月,自變量開源了其具身基礎(chǔ)模型WALL-OSS。對(duì)于生態(tài)來說,自變量選擇開源WALL-OSS,本質(zhì)上是重塑了產(chǎn)業(yè)的協(xié)同邏輯,它將“重復(fù)造輪子”的內(nèi)耗,轉(zhuǎn)化為“聚沙成塔”的合力。提供了一個(gè)高可靠性的通用底座,讓全球開發(fā)者可以在此基礎(chǔ)上貢獻(xiàn)長尾場景數(shù)據(jù),共同喂養(yǎng)出一個(gè)真正理解物理法則的“超級(jí)大腦”。

對(duì)于產(chǎn)業(yè)來說,自變量此舉讓成百上千的中小機(jī)器人企業(yè)能夠基于WALL-OSS快速生長出垂直領(lǐng)域的應(yīng)用,從而讓機(jī)器人用更聰明的大腦引爆整個(gè)產(chǎn)業(yè)的商業(yè)化臨界點(diǎn)。

值得注意的是,WALL-OSS開源是更為稀缺的“真開源”,和其他開源為“閹割代碼”不同,它開放一整套完整、可復(fù)現(xiàn)的具身大模型解決方案,包括預(yù)訓(xùn)練模型權(quán)重、訓(xùn)練代碼、數(shù)據(jù)集接口,甚至附上詳細(xì)部署文檔。讓開發(fā)者能更好微調(diào)或者復(fù)現(xiàn)能力。

可以說,在具身智能這片長坡厚雪的賽道上,開源不僅是在跑自己的馬拉松,更是在為整個(gè)行業(yè)鏟雪修路。因?yàn)橹挥挟?dāng)“大腦”不再成為稀缺品時(shí),通用機(jī)器人的黃金時(shí)代才會(huì)真正到來。



RoboChallenge是由Dexmal原力靈機(jī)與Hugging Face共同發(fā)起的全球首個(gè)大規(guī)模、多任務(wù)的真機(jī)基準(zhǔn)測試平臺(tái)。它旨在為VLA在視覺-語言-動(dòng)作模型在機(jī)器人上的應(yīng)用提供一個(gè)開放、公正、可復(fù)現(xiàn)的評(píng)估標(biāo)準(zhǔn),以解決機(jī)器人行業(yè)長期缺乏統(tǒng)一評(píng)測基準(zhǔn)的痛點(diǎn),推動(dòng)具身智能從實(shí)驗(yàn)室研究走向現(xiàn)實(shí)世界應(yīng)用。

其核心測試集Table30作為RoboChallenge平臺(tái)首發(fā)的桌面操作基準(zhǔn)測試集,構(gòu)建了一個(gè)涵蓋30項(xiàng)真實(shí)生活情境的“全科考場”。從擦桌子、折疊洗碗布等基礎(chǔ)家務(wù),到插花、插網(wǎng)線等精細(xì)操作,再到打開水龍頭、制作三明治等復(fù)雜交互,細(xì)致全面的考察了模型的智能邊界。

雖然RoboChallenge一定程度上打破了具身模型的“自唱自說”,但其并不是完全的“一錘定音”。畢竟,具身模型與大語言模型的測評(píng)存在本質(zhì)區(qū)別,具身模型采用提前公開任務(wù)的“類開卷”考試范式,核心評(píng)價(jià)指標(biāo)為視頻化的實(shí)際動(dòng)作執(zhí)行效果,和大語言模型“裸考”有著本質(zhì)區(qū)別。

在此背景下,具身模型測評(píng)的另一條信號(hào)在于,公開代碼的開源模型更具技術(shù)真實(shí)性與產(chǎn)業(yè)價(jià)值,不僅支持全流程復(fù)現(xiàn),還能賦能行業(yè)生態(tài)。

以自變量的WALL-OSS表現(xiàn)為例,在put_opener_in_drawer(開瓶器入抽屜)、hang_toothbrush_cup(掛牙刷杯)、move_objects_into_box(移動(dòng)目標(biāo)物入箱)等高難度任務(wù)上,WALL-OSS單項(xiàng)得分位列前茅,甚至超過總分第一的pi0.5,展現(xiàn)了模型頂尖的執(zhí)行效率和穩(wěn)定性。



在“開瓶器入抽屜”的實(shí)戰(zhàn)中,模型需要從咖啡機(jī)、盆栽等干擾項(xiàng)中精準(zhǔn)識(shí)別目標(biāo),然后依循執(zhí)行邏輯,率先完成精確的“捏拉”動(dòng)作打開抽屜,最后憑借對(duì)空間位置的深入理解,拿放開瓶器,實(shí)現(xiàn)閉環(huán)操作。

透過上述任務(wù)執(zhí)行可見,WALL-OSS在復(fù)雜長指令任務(wù)中的穩(wěn)定發(fā)揮,意味著其已經(jīng)進(jìn)化為一個(gè)具備出色邏輯推理與空間感知能力的“聰明大腦”。換句話說,WALL-OSS的出色表現(xiàn),完全基于其對(duì)物理世界的本質(zhì)理解與多模態(tài)指令的深度對(duì)齊,而非針對(duì)已知考題進(jìn)行的特殊訓(xùn)練。

此外,WALL-OSS作為一款完全開源的模型,代碼邏輯與模型參數(shù)均公開透明,其測評(píng)表現(xiàn)是真實(shí)且可復(fù)驗(yàn)的。(開發(fā)者最快一周就能在自有機(jī)器人上完成適配)

可見,WALL-OSS的表現(xiàn),不僅僅是一個(gè)具身大模型的成績,而是其開源后能實(shí)打?qū)嵸x能開發(fā)者的真實(shí)底氣。



正如開文所述,RoboChallenge榜單前七名均為開源模型,其參賽主體分別為Pi0.5Pi0WALL-OSSpi05_generalistCogACTpi0_generalistopenvla-oft。(主要模型為Pi0.5Pi0WALL-OSSCogACTopenvla)。

其中,Pi0、pi0.5背后的公司Physical Intelligence主要團(tuán)隊(duì)成員來自伯克利、斯坦福等高校和谷歌專家等。由?前Google DeepMind機(jī)器人科學(xué)家,斯坦福大學(xué)兼職教授Karol Hausman?擔(dān)任CEO。聯(lián)合創(chuàng)始人Sergey Levine?為加州大學(xué)伯克利分校(UC Berkeley)副教授,深度強(qiáng)化學(xué)習(xí)領(lǐng)域的奠基人之一,致力于通用機(jī)器人模型開發(fā)。

WALL-OSS背后的自變量機(jī)器人,創(chuàng)始人王潛為南加州大學(xué)博士學(xué)位,曾于美國頂級(jí)機(jī)器人實(shí)驗(yàn)室從事機(jī)器人學(xué)習(xí)與人機(jī)交互研究,是全球最早在神經(jīng)網(wǎng)絡(luò)中提出Attention機(jī)制的研究者之一,其成果與谷歌同期發(fā)表于國際會(huì)議。CTO王昊為北京大學(xué)計(jì)算物理博士,曾任職于粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(IDEA研究院),主導(dǎo)開發(fā)國內(nèi)首個(gè)多模態(tài)開源大模型“太乙”、百億級(jí)大語言模型“燃燈”及千億級(jí)模型“姜子牙”,累計(jì)下載量超百萬次。

?CogACT的研究團(tuán)隊(duì)來自清華大學(xué)、微軟亞研院等機(jī)構(gòu);OpenVLA模型由斯坦福大學(xué)、加州大學(xué)伯克利分校、谷歌DeepMind等機(jī)構(gòu)的研究團(tuán)隊(duì)聯(lián)合開發(fā)。

開源模型齊聚榜單為具身大模型的未來發(fā)展釋放了一個(gè)清晰的信號(hào),開源模型更具有含金量,也更能賦能行業(yè)成長。這一點(diǎn)從不同主體基于同一個(gè)開源模型調(diào)整參賽就能看出。

時(shí)至今日,沒有人會(huì)再爭議“開源”和“閉源”孰優(yōu)孰劣,但一定會(huì)有人好奇:開源能帶來什么?

回答這個(gè)問題,可以從AI大模型找到答案。

開源不是因?yàn)椤熬聿贿^”,而是為了“贏下未來”。DeepSeek、Qwen的成功不在于它是否永遠(yuǎn)霸榜,而在于它把大模型的價(jià)格打了下來,把技術(shù)門檻拆了下來,讓萬千開發(fā)者能用上“握在自己手里”的模型。 如果你還記得,你會(huì)想起年初各大國企接入DeepSeek,到了年末,甚至連美國企業(yè)反倒用起了中國的AI模型。

自變量開源WALL-OSS的意義如出一轍: 國內(nèi)無數(shù)本體機(jī)器人公司和中小具身廠商,原本都在各自為戰(zhàn)、重復(fù)造輪子。

此前在《硅谷101》博客中,談及開源的初心時(shí),自變量曾表示主要出于兩點(diǎn)考慮。其一,是技術(shù)成熟度,其二是行業(yè)需要的程度。從技術(shù)成熟度來講,類似于VLA的結(jié)構(gòu),經(jīng)過了很長時(shí)間的論證,大家在訓(xùn)練方法上有很多探索,相當(dāng)于有一定的應(yīng)用上的共識(shí)以及經(jīng)驗(yàn)。所以從技術(shù)成熟來講,此時(shí)具有這樣結(jié)構(gòu)的模型對(duì)產(chǎn)業(yè)來講是個(gè)很需要的事情。

從需要程度來看,國內(nèi)產(chǎn)業(yè)里(開源時(shí)間為2025年9月)沒有在一個(gè)框架下的國產(chǎn)自研統(tǒng)一模型,但行業(yè)迫切需要的強(qiáng)大的開放基座模型,來助推行業(yè)成長。

自變量把“大腦”開源,相當(dāng)于為全行業(yè)提供了一個(gè)高性能的通用底座。只有底座開源,國內(nèi)的具身智能應(yīng)用才會(huì)像當(dāng)初的AI應(yīng)用一樣“百花齊放”,加速中國具身智能“聚沙成塔”的過程。

畢竟,真正的核心競爭力,不在于實(shí)驗(yàn)室中的參數(shù)高低,而在于真實(shí)世界中的作業(yè)能力;真正的產(chǎn)業(yè)價(jià)值,不在于技術(shù)的孤芳自賞,而在于通過開源與協(xié)同,推動(dòng)整個(gè)行業(yè)的升級(jí)與進(jìn)步。

對(duì)于產(chǎn)業(yè)來說,具身智能是一場馬拉松,是“長坡厚雪”、“眾人拾柴”的賽道。自變量機(jī)器人的開源,本質(zhì)上是一種利他主義的競爭策略。而且放眼整個(gè)具身智能的競爭,最終不是比誰的實(shí)驗(yàn)室模型更漂亮,而是比誰能最快讓千萬臺(tái)機(jī)器人走入現(xiàn)實(shí)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
爆料瘋傳!中南醫(yī)院“王護(hù)士長”被扒,她到底有沒有問題?

爆料瘋傳!中南醫(yī)院“王護(hù)士長”被扒,她到底有沒有問題?

千言娛樂記
2026-04-22 13:31:23
威脅對(duì)中國加征50%關(guān)稅!用對(duì)臺(tái)售武交換中國軍售伊朗  否則免談

威脅對(duì)中國加征50%關(guān)稅!用對(duì)臺(tái)售武交換中國軍售伊朗 否則免談

軍評(píng)陳光文
2026-04-24 22:27:35
實(shí)力藏不住了!中國尖端科技重磅問世,美媒感嘆:先進(jìn)得不像國產(chǎn)

實(shí)力藏不住了!中國尖端科技重磅問世,美媒感嘆:先進(jìn)得不像國產(chǎn)

瞻史
2026-04-22 19:38:16
2次毀約拒絕賠償,墨西哥再次找中國建高鐵,中國這次不再慣著

2次毀約拒絕賠償,墨西哥再次找中國建高鐵,中國這次不再慣著

小蘭聊歷史
2026-04-24 15:54:29
國家一級(jí)女演員陳麗云被逮捕!

國家一級(jí)女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
馬蹄露迎來尊重,如今獲3位明星力挺,霍汶希毀掉英皇多年口碑

馬蹄露迎來尊重,如今獲3位明星力挺,霍汶希毀掉英皇多年口碑

娛貝勒
2026-04-24 21:57:58
五地迎來新任公安局長

五地迎來新任公安局長

上觀新聞
2026-04-24 16:31:04
只有秦昊能治孫楊,直男暴擊起來沒輕沒重

只有秦昊能治孫楊,直男暴擊起來沒輕沒重

陳意小可愛
2026-04-24 17:46:42
施明離世留市值千萬房產(chǎn),長子全家獨(dú)占,還怪父親弟弟沒出喪禮錢

施明離世留市值千萬房產(chǎn),長子全家獨(dú)占,還怪父親弟弟沒出喪禮錢

臨云史策
2026-04-24 14:13:09
天空體育預(yù)測英超34輪:阿森納1-0,曼聯(lián)2-1,利物浦2-1,熱刺1-2

天空體育預(yù)測英超34輪:阿森納1-0,曼聯(lián)2-1,利物浦2-1,熱刺1-2

郝小小看體育
2026-04-24 15:37:55
劉德華官宣!網(wǎng)友沸了

劉德華官宣!網(wǎng)友沸了

中國新聞周刊
2026-04-23 12:35:02
拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

今朝牛馬
2026-04-07 22:43:23
八寶山有一座無名墓,高層一直保密,40多年后才公開身份

八寶山有一座無名墓,高層一直保密,40多年后才公開身份

談古論今歷史有道
2026-04-23 17:15:03
斯佳輝成笑柄,唯一出局種子輸?shù)锰C囊!最強(qiáng)16強(qiáng)陣容歷史第三次

斯佳輝成笑柄,唯一出局種子輸?shù)锰C囊!最強(qiáng)16強(qiáng)陣容歷史第三次

叮咚體壇
2026-04-24 09:49:05
我知道那兩名保安為啥不讓退伍老兵上廁所的原因

我知道那兩名保安為啥不讓退伍老兵上廁所的原因

筆桿論道
2026-04-23 01:25:03
個(gè)人收款被查了!2026年個(gè)人收款高于這個(gè)數(shù),要小心!

個(gè)人收款被查了!2026年個(gè)人收款高于這個(gè)數(shù),要小心!

新浪財(cái)經(jīng)
2026-04-21 22:04:32
如果在家突發(fā)心梗,黃金6分鐘自救法,快了解,關(guān)鍵時(shí)刻可自救

如果在家突發(fā)心梗,黃金6分鐘自救法,快了解,關(guān)鍵時(shí)刻可自救

健康科普365
2026-01-20 16:05:03
重磅出臺(tái)!《武漢市城市更新條例》全文來了

重磅出臺(tái)!《武漢市城市更新條例》全文來了

越喬
2026-04-22 22:31:27
博主:韓佳奇、何宇鵬、吳少聰、楊立瑜現(xiàn)身基地進(jìn)行康復(fù)訓(xùn)練

博主:韓佳奇、何宇鵬、吳少聰、楊立瑜現(xiàn)身基地進(jìn)行康復(fù)訓(xùn)練

懂球帝
2026-04-24 19:19:21
騎士為何慘敗猛龍?賽后哈登毫不避諱說出真實(shí)原因,說的非常實(shí)在

騎士為何慘敗猛龍?賽后哈登毫不避諱說出真實(shí)原因,說的非常實(shí)在

翰飛觀事
2026-04-24 16:57:35
2026-04-24 23:16:49
具身研習(xí)社
具身研習(xí)社
記錄具身智能浪潮迭代。
145文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價(jià)格依然"屠夫級(jí)"

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強(qiáng)一季

娛樂要聞

停工16個(gè)月!趙露思證實(shí)接拍新劇

財(cái)經(jīng)要聞

LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

房產(chǎn)
健康
教育
數(shù)碼
時(shí)尚

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!???,開始瘋狂建學(xué)校!

干細(xì)胞如何讓燒燙傷皮膚"再生"?

教育要聞

公辦高校:著力提升研究生“抬頭率”

數(shù)碼要聞

RGB-Mini LED電視普及風(fēng)暴,海信正式發(fā)布小墨E5S Pro

春天穿衣千萬別老氣橫秋!短長搭配、多穿裙子,優(yōu)雅舒適顯高

無障礙瀏覽 進(jìn)入關(guān)懷版