国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不要只盯著宇樹翻跟頭了,這些工作才是具身智能的春晚

0
分享至


作者 | 郭海惟
郵箱 | guohaiwei@pingwest.com

當(dāng)十幾臺(tái)G1在舞臺(tái)“下腰”打醉拳的時(shí)候,你會(huì)覺得宇樹好像真的已經(jīng)把表演這件事情卷到頭了。

真的很難想象,羊年還能有什么比馬年更能震撼人心的表演。哪怕是讓機(jī)器人在舞臺(tái)上跳芭蕾(一個(gè)比后空翻難無數(shù)倍的動(dòng)作),難道就能給普通人比今天更強(qiáng)的視覺震撼了嗎?恐怕也很難說。

如果說今天具身存在一個(gè)“結(jié)構(gòu)性”的矛盾,大概有就是“日益增長的姿態(tài)控制能力與硬件水平”和“落地場景不平衡、不充分”的發(fā)展之間的矛盾。前者帶來了人民對具身日益增長的期待,而后者則讓人民感到困惑。

對于很多人來說,機(jī)器人的“技能樹”好像點(diǎn)錯(cuò)了——它明明該幫我們家務(wù),卻代替我們詩詞歌賦、載歌載舞。

而這種技能樹錯(cuò)配背后,其實(shí)有第二個(gè)“結(jié)構(gòu)性”的矛盾:即“日益增長的AI智能訴求”與“智能泛化能力不平衡、不充分”的發(fā)展之間的矛盾。前者讓行業(yè)的所有從業(yè)者都對AGI的明天充滿光明信心,而后者則讓從業(yè)者感到現(xiàn)金流的貧窮。

而所謂一切場景與智能的問題,其實(shí)本質(zhì)都是數(shù)據(jù)與智能的關(guān)系。

在具身領(lǐng)域尤其如此。

而具身的數(shù)據(jù)問題又可以分成兩種:

一個(gè)是數(shù)據(jù)規(guī)模帶來智能難以scaling;一個(gè)是現(xiàn)有智能情況下,樣本的學(xué)習(xí)和泛化能力。

多位具身行業(yè)資深人士曾對硅星人表示,具身數(shù)據(jù)問題屬于“可解”的,但解決方案本質(zhì)大概率都會(huì)是“線性”的,可能會(huì)隨著投入的增加獲得更多的加速,但“指數(shù)型”爆炸的可能性不高。

究其原因,如果想要通過仿真數(shù)據(jù)實(shí)現(xiàn)高度的通用泛化,生產(chǎn)超高質(zhì)量仿真數(shù)據(jù)背后的難度,可能反而高于具身大腦泛化的難度,有點(diǎn)“雞生蛋、蛋生雞”悖論的味道。而互聯(lián)網(wǎng)數(shù)據(jù)理論上可行,但不夠精準(zhǔn),“畫馬難畫骨”,對齊難度大。

目前行業(yè)里普遍構(gòu)想的一個(gè)技術(shù)循環(huán)是:

數(shù)據(jù)采集→數(shù)據(jù)訓(xùn)練模型→模型進(jìn)入場景→場景生成數(shù)據(jù)→更好的數(shù)據(jù)→更強(qiáng)的模型→更多的場景和數(shù)據(jù)

這樣慢慢可以把數(shù)據(jù)轉(zhuǎn)起來,等數(shù)據(jù)多了,具身就可以進(jìn)入GPT時(shí)刻了,盡管實(shí)際過程可能很緩慢。但即便如此,很多模型依然會(huì)卡死在第三步,導(dǎo)致數(shù)據(jù)飛輪遲遲無法轉(zhuǎn)起來。導(dǎo)致一些實(shí)際的技術(shù)循環(huán)其實(shí)是:

數(shù)據(jù)采集→數(shù)據(jù)訓(xùn)練模型→泛化能力卡死在sim to real上→等待更多的數(shù)據(jù)

不過最近兩個(gè)月來,開始陸續(xù)有更多的團(tuán)隊(duì)加入少樣本甚至零樣本的泛化能力的路線探索上來,通過不同的路徑去解決的智能突破和泛化能力的問題,堪比具身的馬年學(xué)術(shù)春晚:

χ0是香港科技大學(xué)團(tuán)隊(duì)在2月10日正式發(fā)布的技術(shù)成果。

此前這個(gè)團(tuán)隊(duì)在12月份的時(shí)候曾經(jīng)拿χ0做了24個(gè)小時(shí)的“家務(wù)直播”,主要是抓取、疊、掛衣服,展現(xiàn)了很強(qiáng)大的柔性物體處理能力。

根據(jù)后來發(fā)布的技術(shù)報(bào)告顯示,χ0可以在很少樣本(20小時(shí)人類視頻)、低算力(8張A100)的情況下做出很好的泛化能力。而且根據(jù)他們自己的說法,相比于π0.5,χ0的成功率能提升250%。

正如如這篇論文的標(biāo)題,“通過化解分布不一致性,實(shí)現(xiàn)資源受限下的魯棒操控”。

χ0展現(xiàn)的是柔性物體能力,但其實(shí)想要解決的是模型學(xué)習(xí)的魯棒性難題。而它的解決方案其實(shí)就是通過解決在不同模塊的數(shù)據(jù)分布對齊問題。

比如,過去訓(xùn)練出來的模型內(nèi)參數(shù)分布和環(huán)境反饋的分布是不同的,就會(huì)導(dǎo)致智能的魯棒性受損。而他們就希望在各個(gè)環(huán)節(jié)上找到這些分布差異,然后對齊它——他們最后選擇從訓(xùn)練分布(Ptrain)、模型分布(Qmodel)以及部署分布(Ptest)三個(gè)角度出發(fā),從而讓流程的各個(gè)不同階段都能實(shí)現(xiàn)高效對齊。


https://arxiv.org/pdf/2602.09021

LingBot-VA是螞蟻靈波在1月30日官宣的技術(shù)成果,官方將它稱為具身世界模型,首創(chuàng)了自回歸視頻-動(dòng)作世界建??蚣?。也是第一個(gè)將世界模型直接控制真機(jī)操作的研究成果。

而在此之前,螞蟻靈波還發(fā)布了LingBot-World開源視頻生成世界模型,做到了將近 10 分鐘的無損穩(wěn)定生成。

與χ0一樣,LingBot-VA展現(xiàn)了更好的魯棒性

在 LIBERO 和 RoboTwin 等主流基準(zhǔn)測試中,分別以 98.5% 和 92%+ 的成功率大幅領(lǐng)先π0.5等現(xiàn)有模型。在針對具身控制中常見的“長時(shí)漂移”難題,復(fù)雜任務(wù)成功率超過 98%。

同時(shí)也能實(shí)現(xiàn)較少樣本下的泛化能力

一個(gè)場景僅需 30~50 條演示數(shù)據(jù)即可完成適配。

但與χ0不同的是,LingBot-VA團(tuán)隊(duì)一開始就選擇了一個(gè)在語義層面具備較高魯棒性的自回歸世界模型策略。他們的邏輯有點(diǎn)像在模型內(nèi)置了一個(gè)預(yù)測未來的大腦。本質(zhì)就是用一段視頻去預(yù)測下一段視頻的狀態(tài)。而當(dāng)模型知道下一段視頻流中的狀態(tài)時(shí),便可以反推并解碼成具體的執(zhí)行動(dòng)作。

這樣一來,由于視頻與動(dòng)作之間存在明確的時(shí)間和邏輯關(guān)系,便自然就構(gòu)成了很明確的物理現(xiàn)實(shí)世界中的因果關(guān)系。所以這個(gè)技術(shù)成果被命名為:“面向機(jī)器人控制的因果世界建?!?。

這套方案繞過了VLA常出現(xiàn)的表征糾纏問題,將動(dòng)作、視頻預(yù)測、場景執(zhí)行情況,直接形成了相互映射的關(guān)系。而且在視頻生成模型中,天然會(huì)具備一定的世界模型知識,因此獲得了更好的執(zhí)行效果。


https://github.com/Robbyant/lingbot-va/blob/main/LingBot_VA_paper.pdf

DreamZero是英偉達(dá)團(tuán)隊(duì)在2月份發(fā)布的技術(shù)論文,定位世界動(dòng)作模型(WAM)。

DreamZero比LingBot-VA晚發(fā)了十天左右,但思路上與LingBot-VA同為世界模型落地真機(jī)的路線,因此在一些技術(shù)思路上也很相似。而且Lingbo-VAt搭配LingBot-World一起發(fā)布,而與DreamZero同期發(fā)布的還有DreamDojo的通用機(jī)器人世界模型。

這兩個(gè)團(tuán)隊(duì)在技術(shù)審美和產(chǎn)品發(fā)布的邏輯節(jié)奏上如此相似,可以說目前在世界模型的探索上,分別都是東西半球的先行者,也相當(dāng)程度上確認(rèn)了這條技術(shù)路線的可行性。

他們都強(qiáng)調(diào)世界模型在運(yùn)動(dòng)控制中的作用,強(qiáng)調(diào)通過世界模型預(yù)測而非簡單堆砌數(shù)據(jù)的重要性,以及受益于世界模型的技術(shù)路線,DreamZero也呈現(xiàn)了較好的泛化性。

官方表示,DreamZero甚至在一些模型從來沒有見過的場景中,DreamZero也已經(jīng)可以實(shí)現(xiàn)0樣本泛化。而為了著重強(qiáng)調(diào)這一點(diǎn),他們甚至把自己的技術(shù)報(bào)告直接叫做,“世界動(dòng)作模型就是0樣本泛化的策略”(World Action Models are Zero-shot Policies )

最核心區(qū)別在于,LingBot采用了自回歸為主干的策略,而DreamZero則采用了以擴(kuò)散模型直接作為主干的策略。此外,作為各自模型未來的基礎(chǔ)設(shè)施,DreamDojo的核心是閉源的,而LingBot-World則是完全開源的。


https://dreamzero0.github.io/

1

押注“非線性”增長的物理世界

過去的具身技術(shù)路線正在受到越來越多的挑戰(zhàn)。

一方面,如本文開頭所說,LLM成功的路徑依賴讓具身產(chǎn)業(yè)長期患有數(shù)據(jù)饑渴癥。而數(shù)據(jù)規(guī)模短時(shí)間難以爆發(fā)式增長,就導(dǎo)致具身的智能缺乏像LLM那樣指數(shù)級增長的手段;

另一方面,其實(shí)以VLA為代表的技術(shù)路線,本身也在面臨更多的質(zhì)疑。越來越多人開始質(zhì)疑VLA是否可以很好的完成動(dòng)作操控,是否有能力更好地泛化并突破Sim to real gap的魔咒。

而面對這種困局,不同的人想到的解決方案是不同的,也很難在短期達(dá)成共識。

以χ0這類研究更像是通過不斷升級過去的架構(gòu)能力,從而在原有的路徑上解決問題;而LingBot-VA、DreamZero這樣的產(chǎn)品,則是尋求一種革命性的范式創(chuàng)新。

今天一個(gè)行業(yè)內(nèi)逐步清晰的共識是:如果具身大腦的能力要擺脫數(shù)據(jù)貧血和泛化瓶頸的地心引力,從而復(fù)刻LLM的傳奇,那就必須有一些新的技術(shù)創(chuàng)新。要么,我們在數(shù)據(jù)層面上大幅突破;要么在架構(gòu)上另辟蹊徑。

而像VA、DreamZero這樣的工作顯然是后者,而他們能給我們的啟事是:

如果要在具身復(fù)刻LLM的scaling law奇跡,它未必是要通過平移scaling law的方式實(shí)現(xiàn)的,也可能是借一個(gè)更好的架構(gòu)來獲得原本在LLM就已經(jīng)具備的知識能力。

螞蟻靈波首席科學(xué)家沈宇軍在接受采訪時(shí)表示:

LingBot-VA和LingBot-World的思考其實(shí)是“一套技術(shù)體系的不同側(cè)重”,雙方會(huì)耦合地非常深,底層的數(shù)據(jù)引擎、代碼框架和優(yōu)化方法,都高度共通。

所以,沈宇軍的思路可能就是要繞過具身的scaling瓶頸,重新去審視和依托新的大模型能力,建設(shè)新的具身底層的智能基礎(chǔ)設(shè)施。

從這個(gè)角度來說,螞蟻靈波和英偉達(dá)可謂具身世界模型中“拓荒者”的角色,未來也不排除會(huì)有更多的像英偉達(dá)和螞蟻這樣的超級玩家加入。但隨著中美AI進(jìn)展生態(tài)的不同,未來英偉達(dá)會(huì)逐漸形成自己的生態(tài),而螞蟻靈波則會(huì)積極引領(lǐng)全球的開源世界模型生態(tài)。

但他們的目標(biāo)都是一致的:

具身不一定就必須要按部就班,物理AI也值得一次爆炸式增長的嘗試。


點(diǎn)個(gè)愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
53歲李冰冰在巴黎殺瘋了!白到發(fā)光隱現(xiàn)腹肌,這狀態(tài)真不是人類?

53歲李冰冰在巴黎殺瘋了!白到發(fā)光隱現(xiàn)腹肌,這狀態(tài)真不是人類?

草莓解說體育
2026-02-06 05:59:56
比特幣反彈7.64%,市場恐懼指數(shù)仍然為10

比特幣反彈7.64%,市場恐懼指數(shù)仍然為10

財(cái)聞
2026-03-01 10:23:12
新華社快訊:伊朗媒體稱伊朗最高領(lǐng)袖哈梅內(nèi)伊遇害

新華社快訊:伊朗媒體稱伊朗最高領(lǐng)袖哈梅內(nèi)伊遇害

新華社
2026-03-01 09:33:15
河南籍在伊華人逃離德黑蘭:接到大使館通知當(dāng)日乘飛機(jī)離開,合伙人準(zhǔn)備撤離時(shí)購票網(wǎng)站已無法登錄

河南籍在伊華人逃離德黑蘭:接到大使館通知當(dāng)日乘飛機(jī)離開,合伙人準(zhǔn)備撤離時(shí)購票網(wǎng)站已無法登錄

大象新聞
2026-02-28 21:46:49
美國指責(zé)中國開展核爆炸試驗(yàn),外交部:美國為逃避國際軍控義務(wù),不惜栽贓抹黑別國

美國指責(zé)中國開展核爆炸試驗(yàn),外交部:美國為逃避國際軍控義務(wù),不惜栽贓抹黑別國

每日經(jīng)濟(jì)新聞
2026-02-25 16:40:30
小區(qū)樓上天天晚上都有女的大聲叫。。。

小區(qū)樓上天天晚上都有女的大聲叫。。。

微微熱評
2025-12-24 00:26:04
美政府“第三國遣返”政策被裁定違法

美政府“第三國遣返”政策被裁定違法

參考消息
2026-03-01 14:57:04
下午4點(diǎn),中國男籃vs中國臺(tái)北!傳來1壞消息,爆冷輸球=淪為墊底

下午4點(diǎn),中國男籃vs中國臺(tái)北!傳來1壞消息,爆冷輸球=淪為墊底

侃球熊弟
2026-03-01 00:07:19
中東局勢對A股有何影響?短期回調(diào)也是上車機(jī)會(huì),關(guān)注這些板塊

中東局勢對A股有何影響?短期回調(diào)也是上車機(jī)會(huì),關(guān)注這些板塊

徐sir財(cái)經(jīng)
2026-03-01 12:55:35
普拉蒂尼:現(xiàn)在沒有特別突出的球員,上一個(gè)真正杰出的是梅西

普拉蒂尼:現(xiàn)在沒有特別突出的球員,上一個(gè)真正杰出的是梅西

懂球帝
2026-03-01 01:18:21
又一衛(wèi)健委主任被抓!

又一衛(wèi)健委主任被抓!

梅斯醫(yī)學(xué)
2026-02-28 07:53:41
林彪主持會(huì)議時(shí),輪到陳賡發(fā)言,他卻笑著說道:我摸過林彪的腦殼

林彪主持會(huì)議時(shí),輪到陳賡發(fā)言,他卻笑著說道:我摸過林彪的腦殼

文史明鑒
2026-01-17 23:55:16
OPPO誕生新卷王,7200mAh+100W+IP69防水,國補(bǔ)后有“真香價(jià)”

OPPO誕生新卷王,7200mAh+100W+IP69防水,國補(bǔ)后有“真香價(jià)”

小愚測評
2026-03-01 15:04:11
伊朗失守的一個(gè)側(cè)面:匯率雙軌,特權(quán)分蛋糕,普通人買單

伊朗失守的一個(gè)側(cè)面:匯率雙軌,特權(quán)分蛋糕,普通人買單

蛙蛙和洼
2026-01-18 09:25:01
山西婚鬧致死案:新郎被4個(gè)伴郎暴打致死,婚禮結(jié)束直接辦喪事

山西婚鬧致死案:新郎被4個(gè)伴郎暴打致死,婚禮結(jié)束直接辦喪事

明智家庭教育
2025-12-02 11:20:34
49歲的特朗普95年來香港,懷中抱著一位神秘中國女孩,她是誰?

49歲的特朗普95年來香港,懷中抱著一位神秘中國女孩,她是誰?

板栗說事
2025-02-17 07:54:14
伊朗終于發(fā)狠了,打擊力度升級,關(guān)鍵時(shí)刻,掏出中國一王牌武器

伊朗終于發(fā)狠了,打擊力度升級,關(guān)鍵時(shí)刻,掏出中國一王牌武器

史智文道
2026-02-28 16:27:37
阿爾茨海默病者逐漸增多,醫(yī)生提醒:50歲后,盡量改掉5個(gè)壞習(xí)慣

阿爾茨海默病者逐漸增多,醫(yī)生提醒:50歲后,盡量改掉5個(gè)壞習(xí)慣

奇妙的本草
2026-03-01 12:01:16
我們瞧不起漂亮國也不是一天兩天了

我們瞧不起漂亮國也不是一天兩天了

霹靂炮
2026-02-08 22:17:59
隨著41歲C羅離譜失點(diǎn)+率隊(duì)3-1,沙特聯(lián)榜首易主:利雅得勝利登頂

隨著41歲C羅離譜失點(diǎn)+率隊(duì)3-1,沙特聯(lián)榜首易主:利雅得勝利登頂

側(cè)身凌空斬
2026-03-01 05:16:08
2026-03-01 15:43:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個(gè)星球。
2896文章數(shù) 10458關(guān)注度
往期回顧 全部

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂部

頭條要聞

專家:伊朗局勢可參考委內(nèi)瑞拉 反美力量將進(jìn)一步削弱

頭條要聞

專家:伊朗局勢可參考委內(nèi)瑞拉 反美力量將進(jìn)一步削弱

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

《江山為聘》:吳謹(jǐn)言陳哲遠(yuǎn)燃炸朝堂

財(cái)經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

小米汽車2月交付超20000臺(tái) 雷軍:為新SU7量產(chǎn)作準(zhǔn)備

態(tài)度原創(chuàng)

房產(chǎn)
家居
游戲
教育
數(shù)碼

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

家居要聞

素色肌理 品意式格調(diào)

黑客大哥又發(fā)力了!《真女神5》發(fā)售近兩年終被破解

教育要聞

五年級求面積,會(huì)者不難

數(shù)碼要聞

DDR4價(jià)格已連續(xù)11個(gè)月上漲

無障礙瀏覽 進(jìn)入關(guān)懷版