国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

把具身智能拉回真實(shí)世界:EAIDC與一場“真機(jī)評測”的開始|甲子光年

0
分享至



EAIDC助力具身智能從技術(shù)演示邁向工程落地。

作者|拾月

編輯|栗子

如果說具身智能的浪潮由AI帶動,那其發(fā)展脈絡(luò),也在不可避免地沿著AI的既有范式展開。

尤其是在模型評測上,這種慣性已經(jīng)十分明顯。過去一段時間,具身模型的能力驗(yàn)證,很大程度上延續(xù)了大語言模型的路徑——在虛擬環(huán)境中進(jìn)行評測,在標(biāo)準(zhǔn)化任務(wù)中進(jìn)行橫向?qū)Ρ取?/p>

但問題也正在這里逐漸顯現(xiàn)。

仿真環(huán)境可以加速迭代,卻難以還原真實(shí)世界的復(fù)雜性。sim2real的GAP始終存在,使得模型在“仿真中成立”,并不等同于在現(xiàn)實(shí)中可用。正如業(yè)內(nèi)多位從業(yè)者所指出的,具身智能不同于純數(shù)字智能,它的能力必須在物理世界中被反復(fù)驗(yàn)證,而非通過大規(guī)模虛擬試錯完成收斂。

自變量聯(lián)合創(chuàng)始人兼CTO王昊也曾提到,長期依賴仿真評測,不可避免會掩蓋模型能力的真實(shí)邊界。放眼國內(nèi)外,頭部模型廠商已經(jīng)逐漸形成共識:評測,正在成為具身智能發(fā)展的關(guān)鍵瓶頸,而行業(yè)迫切需要一個“真機(jī)演武場”。

在剛剛落幕的EAIDC 2026上,這樣一個“演武場”,第一次被系統(tǒng)性地搭建出來。


1.一個“懂模型”的團(tuán)隊,做了一場不一樣的比賽

如果僅從形式上看,EAIDC是一場開發(fā)者大賽。但從賽制設(shè)計來看,它更像是一場由“模型視角”反推出來的能力測試。

這種差異,體現(xiàn)在幾個關(guān)鍵層面。

首先,是對模型路徑的開放。比賽并沒有限定模型,參賽者可以自由選擇不同的開源具身模型,包括各類國內(nèi)外VLA 。這一設(shè)定的背后,并不是“降低門檻”,而是盡可能提升開發(fā)者的創(chuàng)新性和分辨能力。

其次,是對數(shù)據(jù)范式的重新處理。比賽時自變量提供真機(jī)數(shù)據(jù)、無本體數(shù)據(jù)參與訓(xùn)練,讓開發(fā)者基于自身思考和研究方向,選擇數(shù)據(jù)配比。此時,開發(fā)者不再是主觀判斷哪種數(shù)據(jù)更好,而是透過數(shù)據(jù)訓(xùn)練后的模型能力得出結(jié)論。真正被檢驗(yàn)的,不是數(shù)據(jù)路線對不對,而是數(shù)據(jù)是否能夠在真實(shí)環(huán)境中支撐模型閉環(huán)。

再往下,是對能力邊界的刻意放大。任務(wù)設(shè)計并非簡單拼接,而是圍繞抓取、語言理解、精細(xì)操作與長時序決策等核心能力展開,不同任務(wù)設(shè)置了不同權(quán)重,最終成績不僅看步驟得分,也綜合考量成功率和泛化表現(xiàn),這種結(jié)構(gòu),使得比賽不只是考察“能不能做”,而是直接指向模型能力的上限“能不能落地”,如何跟產(chǎn)業(yè)應(yīng)用結(jié)合。

相比于普通的“抓取拿放”,現(xiàn)在業(yè)內(nèi)正缺乏這種復(fù)雜交互行為。據(jù)自變量機(jī)器人合伙人兼算法負(fù)責(zé)人甘如怡回憶稱:選手在比賽最初面對“將環(huán)套在柱子上”任務(wù)成功率只有20-30%,后逐漸提升至60-70%,“拼寫單詞”任務(wù)也從極低成功率提升至40-50%。正是在這種高難度任務(wù)的“折磨”中,模型能力邊界顯然已不斷外擴(kuò)。

更關(guān)鍵的是泛化機(jī)制的引入。通過類似AB卷、隨機(jī)環(huán)境切換等設(shè)計,考驗(yàn)泛化性。比賽的B卷在制度層面限制“刷題式優(yōu)化”,迫使模型面對未知條件。這種機(jī)制,本質(zhì)上是在把“泛化能力”從附加項(xiàng),變成核心指標(biāo)。如果說以往比賽更多是在驗(yàn)證“已知能力”,那么EAIDC更接近在測試“未知邊界”。


值得一提的是,為了解決選手的后顧之憂,本次比賽使用的機(jī)械臂為自變量機(jī)器人自主研發(fā)的高性能六軸機(jī)械臂,此外自變量還提供算力支持。其中,機(jī)械臂專為AI而生,具備高精度、高響應(yīng)的硬件性能,能更好復(fù)現(xiàn)模型能力。三天每天24小時的現(xiàn)場高強(qiáng)度運(yùn)行。無論是大規(guī)模數(shù)據(jù)采集,還是模型推理部署,這套機(jī)械臂硬件系統(tǒng)都展現(xiàn)出穩(wěn)定的承壓能力,為參賽團(tuán)隊提供了可靠、一致的硬件保障,讓選手能夠?qū)W⒂谒惴▋?yōu)化與任務(wù)實(shí)現(xiàn)。

這種設(shè)計和全套設(shè)施的提供并非偶然。只有真正理解模型在真實(shí)世界中的失效方式的具身智能企業(yè),才會有這類具有導(dǎo)向性的賽制設(shè)計,才會刻意把這些不確定性寫進(jìn)規(guī)則,并且懂得開發(fā)者在模型訓(xùn)練中,哪些受制于硬件、數(shù)據(jù)的窘境。

2.當(dāng)模型搭上“真機(jī)”,一切都會被放大

相比賽制上的巧思,這場比賽更本質(zhì)的變化,其實(shí)只有一個:具身智能所有能力,必須在真機(jī)上成立。

這聽起來像是一個直觀的設(shè)定,但在具身智能領(lǐng)域,卻是一個遲遲未被大規(guī)模實(shí)現(xiàn)的前提。

在EAIDC現(xiàn)場,上百條機(jī)械臂同時運(yùn)行,所有任務(wù)均在真實(shí)物理環(huán)境中完成。從數(shù)據(jù)采集、模型訓(xùn)練到部署與評測,形成一個完整閉環(huán),并在短時間內(nèi)完成高頻迭代。


在這樣的環(huán)境下,一些長期被“仿真掩蓋”的問題被迅速放大。例如,在抓取任務(wù)中,細(xì)微的位置偏差與接觸不確定性,會直接影響成功率;在語言理解與操作結(jié)合的任務(wù)中,指令歧義與視覺誤差疊加,會迅速放大系統(tǒng)不穩(wěn)定性;而在長時序任務(wù)中,誤差的累積效應(yīng),則往往成為決定成敗的關(guān)鍵。

當(dāng)前國內(nèi)外頂級模型廠商都認(rèn)可模型評測正成為重要瓶頸。就如同Physical Intelligence創(chuàng)始人兼CEO Karol Hausman在最近的采訪中所強(qiáng)調(diào)的:“機(jī)器人的所有行為都需要在現(xiàn)實(shí)世界中完成,無法像大語言模型那樣,通過數(shù)百萬次的快速試錯完成模型更新。這一過程耗時過長。因此,我們必須攻克機(jī)器人的評估難題”。

而自變量聯(lián)合創(chuàng)始人兼CTO王昊觀點(diǎn)更直接,具身智能的核心是交互學(xué)習(xí),只有通過持續(xù)測試、觀察與反饋,讓機(jī)器在真實(shí)物理世界中解決復(fù)雜性問題。

與其說是自變量和其他單位一起辦了場真機(jī)比賽,不如說具身智能苦仿真評測久矣。仿真評測雖便捷,卻難以捕捉真實(shí)世界的力學(xué)反饋、遮擋、材質(zhì)差異等變量;而真機(jī)評測讓模型直接面對這些挑戰(zhàn),推動從Demo級“炫酷”向生產(chǎn)力級可靠性的轉(zhuǎn)變。

從這個角度看,“真機(jī)評測”并不是比賽形式的升級,而是評價體系的轉(zhuǎn)向:從可控環(huán)境中的性能比較,轉(zhuǎn)向真實(shí)世界中的能力驗(yàn)證。

這也是具身智能從“技術(shù)展示”走向“工程能力”的分水嶺。

3.兩場圓桌為行業(yè)畫像,

具身智能需要“賽產(chǎn)學(xué)研”協(xié)同

如果說比賽本身提供的是一個“觀察窗口”,那么兩場圓桌討論,則給出了更直接的行業(yè)切片。

在第一場圓桌中,嘉賓圍繞數(shù)據(jù)、模型與商業(yè)化路徑進(jìn)行了討論,雖然并沒有形成統(tǒng)一答案,但一些共識正在逐漸浮現(xiàn)。


首先,是對最火熱的“數(shù)據(jù)”的再認(rèn)識。與大模型不同,具身智能的數(shù)據(jù)獲取成本高、閉環(huán)難度大,這使得“數(shù)據(jù)規(guī)模”不再是唯一指標(biāo)。多位嘉賓提到,未來的數(shù)據(jù)路徑將是分層的:低成本數(shù)據(jù)用于預(yù)訓(xùn)練,高質(zhì)量真機(jī)數(shù)據(jù)用于微調(diào),而如何在效率與效果之間取得平衡,將成為核心競爭力。換句話說,當(dāng)前數(shù)據(jù)使用上絕對不是“非此即彼”,而是強(qiáng)調(diào)一種“合理配比”。

自變量王昊在群訪中表示,“我們一直在堅持真實(shí)世界的數(shù)據(jù)采集,所有交互式學(xué)習(xí)和強(qiáng)化學(xué)習(xí),最重要的數(shù)據(jù)來自于真機(jī),我們會持續(xù)堅持。另外像穿戴式的、靈巧手的手套,我們很早就開始做,只是在整個規(guī)劃當(dāng)中,這幾類數(shù)據(jù)要形成非常好的配比。2026年會有一個很大的變化,我們會越來越依賴于人的穿戴式或者Ego-Centric的方式采集數(shù)據(jù),這是一個大趨勢。但是永遠(yuǎn)要和真實(shí)機(jī)器人形成很好的配比,這個數(shù)據(jù)策略會決定以后模型的上限。”

其次,是對模型路徑的現(xiàn)實(shí)判斷。盡管VLA仍是主流,但其局限性也在逐漸顯現(xiàn),包括算力消耗、物理建模不足等問題。行業(yè)開始探索多模態(tài)融合、世界模型等路徑,但整體來看,模型結(jié)構(gòu)尚未收斂。

相比具體路線,自變量更強(qiáng)調(diào)一點(diǎn):所有模型路徑,最終都需要通過真實(shí)評測來決定方向。這也是其推動真機(jī)比賽的重要原因——評測本身,正在成為模型演進(jìn)的“指揮棒”。

如果說以上討論仍停留在“技術(shù)與產(chǎn)業(yè)”的層面,那么更深層的問題,其實(shí)出現(xiàn)在結(jié)構(gòu)上——產(chǎn)學(xué)研的協(xié)同,正在成為具身智能的隱性瓶頸。

在第二場產(chǎn)學(xué)研圓桌中,一個關(guān)鍵詞被反復(fù)提及:“割裂”。


學(xué)術(shù)界擁有模型與算法創(chuàng)新能力,但缺乏真機(jī)系統(tǒng)與數(shù)據(jù)閉環(huán);產(chǎn)業(yè)界掌握場景與工程能力,卻往往需要在效率壓力下快速推進(jìn),難以進(jìn)行長期探索;而開發(fā)者與開源社區(qū),則處在兩者之間,既缺少完整工具鏈,也難以復(fù)現(xiàn)真實(shí)系統(tǒng)。

這種錯位帶來的直接結(jié)果,是重復(fù)造輪子與創(chuàng)新效率的下降——學(xué)術(shù)成果難以落地,工程經(jīng)驗(yàn)難以沉淀為通用方法,開源也往往停留在“可見但不可用”的狀態(tài)。

可以說,具身智能已經(jīng)從單點(diǎn)技術(shù)問題,演變?yōu)橐粋典型的系統(tǒng)工程問題,而系統(tǒng)工程,天然要求深度協(xié)同。

也正是在這一背景下,自變量的角色開始變得更加清晰。無論是通過比賽提供統(tǒng)一的真機(jī)環(huán)境與評測體系,還是開放數(shù)據(jù)、模型與工具鏈,本質(zhì)上都在嘗試解決同一個問題:讓不同角色在同一個閉環(huán)中協(xié)作。

換句話說,這場比賽不僅是在評測模型,也是在測試一種新的協(xié)同方式。當(dāng)學(xué)術(shù)、產(chǎn)業(yè)與開發(fā)者被放入同一個真實(shí)環(huán)境中,能力不再孤立存在,而開始相互放大。而這才是具身智能真正走向規(guī);,必須補(bǔ)上的那一塊拼圖。

也正是在這樣的邏輯下,EAIDC的意義變得更加清晰——“具身智能平權(quán)時刻”。正如自變量創(chuàng)始人兼CEO王潛所說,具身智能門檻極高,必須依賴大規(guī)模開發(fā)者共同參與,才能形成真正有效的生態(tài)。而比賽所提供的,正是一套讓開發(fā)者快速進(jìn)入、在真實(shí)約束中驗(yàn)證并持續(xù)迭代的基礎(chǔ)設(shè)施。

從這個意義上看,EAIDC不只是一次賽事,而是具身智能走向規(guī);埃粋重要的起始點(diǎn)。

(封面圖來源:自變量)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
珠海樓市:已經(jīng)砸不動了

珠海樓市:已經(jīng)砸不動了

林子說事
2026-04-18 10:51:24
40年前的床單設(shè)計,憑什么讓成年人瘋狂搶購?

40年前的床單設(shè)計,憑什么讓成年人瘋狂搶購?

娛圈觀察員
2026-04-16 09:20:12
暴跌百億的“相機(jī)圈蘋果”,為輕視中國付出代價

暴跌百億的“相機(jī)圈蘋果”,為輕視中國付出代價

金錯刀
2026-04-16 12:10:16
超710億!廣東這條“堵王”高速,即將全面改擴(kuò)建,最寬12車道!

超710億!廣東這條“堵王”高速,即將全面改擴(kuò)建,最寬12車道!

娛樂圈見解說
2026-04-18 14:54:03
太尷尬了!雷軍又被吐槽:山東地名有多“費(fèi)”學(xué)歷,連雷軍都讀錯

太尷尬了!雷軍又被吐槽:山東地名有多“費(fèi)”學(xué)歷,連雷軍都讀錯

火山詩話
2026-04-18 08:11:07
5-4!趙心童兩連鞭斬獲晉級先機(jī),世錦賽16強(qiáng)席位爭奪存懸念!

5-4!趙心童兩連鞭斬獲晉級先機(jī),世錦賽16強(qiáng)席位爭奪存懸念!

世界體壇觀察家
2026-04-18 21:00:55
馬關(guān)條約簽約131年同日,日艦闖入臺灣海峽,高市早苗上臺后首次

馬關(guān)條約簽約131年同日,日艦闖入臺灣海峽,高市早苗上臺后首次

軍機(jī)Talk
2026-04-17 20:54:52
終于等到你!重慶銅梁龍花錢從魯能挖走的強(qiáng)援,本輪終于首秀登場

終于等到你!重慶銅梁龍花錢從魯能挖走的強(qiáng)援,本輪終于首秀登場

振剛說足球
2026-04-18 15:37:42
存儲芯片封測:長電科技、太極實(shí)業(yè)、通富微電、華天科技潛力誰大

存儲芯片封測:長電科技、太極實(shí)業(yè)、通富微電、華天科技潛力誰大

長風(fēng)價值掘金
2026-04-18 22:10:57
朱芳雨:很遺憾沒能用勝利答謝球迷,希望季后賽能得到大家支持

朱芳雨:很遺憾沒能用勝利答謝球迷,希望季后賽能得到大家支持

懂球帝
2026-04-18 23:29:08
廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點(diǎn)才收工,發(fā)文吐槽:這個雞你們是非吃不可嗎

廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點(diǎn)才收工,發(fā)文吐槽:這個雞你們是非吃不可嗎

大象新聞
2026-04-15 12:57:04
世錦賽戰(zhàn)報:趙心童完全沒睡醒,張安達(dá)5-3領(lǐng)先艾倫晉級下一輪

世錦賽戰(zhàn)報:趙心童完全沒睡醒,張安達(dá)5-3領(lǐng)先艾倫晉級下一輪

工從昊懂球阿靖
2026-04-18 23:00:30
當(dāng)年無人問津的6大爛片,如今都逆風(fēng)翻盤成為了經(jīng)典

當(dāng)年無人問津的6大爛片,如今都逆風(fēng)翻盤成為了經(jīng)典

小Q侃電影
2026-03-02 19:55:20
狂攬凈利2800億,員工年薪人均113萬!互聯(lián)網(wǎng)領(lǐng)軍者再創(chuàng)巔峰!

狂攬凈利2800億,員工年薪人均113萬!互聯(lián)網(wǎng)領(lǐng)軍者再創(chuàng)巔峰!

青眼財經(jīng)
2026-04-16 21:39:31
得知范漢杰每月只有60元生活費(fèi),周恩來親自解決:還按200元發(fā)放

得知范漢杰每月只有60元生活費(fèi),周恩來親自解決:還按200元發(fā)放

大運(yùn)河時空
2026-04-16 10:30:03
雌激素旺盛!萊昂諾爾公主姐妹脂肪集中在大腿臀部,不像少女身材

雌激素旺盛!萊昂諾爾公主姐妹脂肪集中在大腿臀部,不像少女身材

夜深愛雜談
2026-04-18 19:16:34
新型出軌,真的越來越流行了

新型出軌,真的越來越流行了

洞讀君
2026-03-29 21:10:03
學(xué)生的瓜能有多炸裂,網(wǎng)友的分享一個比一個逆天!

學(xué)生的瓜能有多炸裂,網(wǎng)友的分享一個比一個逆天!

黯泉
2026-04-18 13:31:58
“生娃率”持續(xù)走低,廈門教授給出建議:不生孩子就下調(diào)養(yǎng)老金

“生娃率”持續(xù)走低,廈門教授給出建議:不生孩子就下調(diào)養(yǎng)老金

大果小果媽媽
2026-04-02 13:16:39
觀眾口碑大爆,票房劍指20億,陳思誠將打敗餃子成第一導(dǎo)演

觀眾口碑大爆,票房劍指20億,陳思誠將打敗餃子成第一導(dǎo)演

影視高原說
2026-04-18 08:06:39
2026-04-19 03:52:49
甲子光年
甲子光年
中國科技產(chǎn)業(yè)化前沿智庫
3415文章數(shù) 9263關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

親子
家居
教育
手機(jī)
游戲

親子要聞

退燒藥怎么用?90%家長都搞錯了

家居要聞

法式線條 時光靜淌

教育要聞

親愛的老己,歡迎在二十六歲,邁入人生的夏季|中山大學(xué)國際新聞420分經(jīng)驗(yàn)貼

手機(jī)要聞

榮耀600系列參數(shù)、外觀全曝光

讓老粥批直呼“計劃有變”的歲獸代理人,到底是什么東西?

無障礙瀏覽 進(jìn)入關(guān)懷版