国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

目標(biāo)更重要?國(guó)內(nèi)公司超越Generalist,進(jìn)化到動(dòng)作中心世界模型

0
分享至



機(jī)器之心發(fā)布

最近,具身智能圈被 Generalist CEO 的一篇長(zhǎng)文《Going Beyond World Models & VLAs》刷屏。文章拋出了一個(gè)看似振聾發(fā)聵的觀點(diǎn):目標(biāo)遠(yuǎn)比工具標(biāo)簽更重要。與其陷入 “我們到底是在做 VLA(視覺 - 語言 - 動(dòng)作模型)還是世界模型(World Model)” 的教條之爭(zhēng),不如回歸本源:讓機(jī)器高效、準(zhǔn)確地作用于物理世界。

目標(biāo)固然重要,但這只說對(duì)了一半。喊出 “回歸目標(biāo)” 的口號(hào)很容易,但如果僅僅停留在 “目標(biāo)驅(qū)動(dòng)” 的思維層面上,而沒有在底層架構(gòu)上做出與之匹配的決斷與取舍,那所謂的 “突破邊界” 也不過是空中樓閣。Generalist 試圖用 “完全掌控基礎(chǔ)模型、從零訓(xùn)練” 來解決一切問題,這是一種大力出奇跡的粗暴解法。但在算力與數(shù)據(jù)均受限的真實(shí)物理世界里,我們需要的不僅是宏大的目標(biāo),更是極具穿透力的架構(gòu)設(shè)計(jì)。

巧合的是,在這場(chǎng)關(guān)于 “目標(biāo)驅(qū)動(dòng)(Goal-Driven)” 與 “理念驅(qū)動(dòng)(Idea-Driven)” 的探討中,國(guó)內(nèi)最早布局世界模型的公司極佳視界,他們沒有停留在概念的爭(zhēng)辯上,而是直接切中物理世界的約束,提出并開源了 “以動(dòng)作為中心的世界模型” GigaWorld-Policy。這不僅僅是一次架構(gòu)的微調(diào),而是對(duì)具身智能底層邏輯的重構(gòu)。



  • 項(xiàng)目主頁:https://gigaai-research.github.io/GigaWorld-Policy/

目標(biāo)的本質(zhì)

從 “理解世界” 到 “作用于世界”

在探討 GigaWorld-Policy 之前,我們必須先理清當(dāng)前世界模型在機(jī)器人領(lǐng)域的尷尬處境。過去一年,讓機(jī)器人 “先想象,再行動(dòng)” 幾乎成了世界模型標(biāo)配思路:模型在推理時(shí)同步生成未來的視頻幀,再從這些高維視覺表征中提取或規(guī)劃動(dòng)作。

這種做法在直覺上很美妙,但在工程實(shí)踐中卻暴露出了兩個(gè)致命缺陷:

  1. 目標(biāo)錯(cuò)位:視頻生成是手段,而高頻、精準(zhǔn)的動(dòng)作輸出才是目的。將手段當(dāng)成目標(biāo),不可避免地會(huì)導(dǎo)致模型架構(gòu)的臃腫和計(jì)算資源的錯(cuò)配。
  2. 現(xiàn)實(shí)約束:渲染高維像素的計(jì)算開銷極大,不僅帶來了難以忍受的推理延遲,視頻預(yù)測(cè)的誤差還會(huì)沿著時(shí)間步傳遞給動(dòng)作序列,最終導(dǎo)致物理交互的崩潰。

極佳視界的判斷是:如果一個(gè)設(shè)計(jì)在推理時(shí)必須做大量與最終目標(biāo)無關(guān)的計(jì)算,那它一定不是最優(yōu)解。真正的具身智能,需要的不是一個(gè)能在腦海中完美回放 4K 視頻的 “幻想家”,而是一個(gè)對(duì)物理規(guī)律擁有 “潛意識(shí)” 般直覺反應(yīng)的 “實(shí)干家”。

就像頂尖的乒乓球運(yùn)動(dòng)員,在擊球的瞬間絕不需要在腦海中渲染出球的完整運(yùn)動(dòng)軌跡,而是依靠肌肉記憶和物理直覺直接做出最優(yōu)動(dòng)作。

GigaWorld-Policy

讓視頻生成從 “場(chǎng)上選手” 轉(zhuǎn)為 “幕后教練”

基于對(duì) “目標(biāo)” 和 “現(xiàn)實(shí)約束” 的重新思考,GigaWorld-Policy 在架構(gòu)層面做出了一個(gè)極具顛覆性的改變:讓視頻生成在推理時(shí)變?yōu)榭蛇x項(xiàng)。



在這個(gè)架構(gòu)中,視頻生成模塊的角色發(fā)生了根本性的轉(zhuǎn)變:

  1. 訓(xùn)練時(shí)的 “嚴(yán)師”: 模型在訓(xùn)練階段同時(shí)接受 “動(dòng)作預(yù)測(cè)” 和 “視頻生成” 的雙重監(jiān)督。海量的互聯(lián)網(wǎng)視頻數(shù)據(jù)在這里發(fā)揮了巨大的價(jià)值,視頻生成作為一個(gè)嚴(yán)苛的輔助任務(wù),強(qiáng)迫模型深入學(xué)習(xí)并內(nèi)化符合真實(shí)物理規(guī)律的動(dòng)態(tài)表征(Dynamics Representation)。
  2. 推理時(shí)的 “Action-Only” 模式: 一旦部署到物理世界,視頻生成模塊便徹底退居幕后。模型可以一鍵切換至純動(dòng)作輸出模式,直接下發(fā)高頻控制指令。

這種設(shè)計(jì)甩掉了渲染高維像素的算力包袱。理解物理規(guī)律,不再等同于必須渲染出物理畫面。只有當(dāng)架構(gòu)本身與目標(biāo)實(shí)現(xiàn)完全對(duì)齊時(shí),“目標(biāo)驅(qū)動(dòng)” 才不再是一句空話。

數(shù)據(jù)效率

在現(xiàn)實(shí)約束下尋找最優(yōu)解

Generalist 在文章中提到,面對(duì)機(jī)器人領(lǐng)域數(shù)據(jù)稀缺的問題,他們的選擇是 “從零訓(xùn)練”,并堅(jiān)信當(dāng)數(shù)據(jù)足夠充足時(shí),完全掌控基礎(chǔ)模型能更快突破邊界。這是一個(gè)典型的 “富人思維” 陷阱,也違背了機(jī)器學(xué)習(xí)的基本規(guī)律。在產(chǎn)業(yè)落地的現(xiàn)實(shí)中,“缺乏 web-scale 的機(jī)器人動(dòng)作數(shù)據(jù)” 是一道繞不過去的坎。指望靠海量真機(jī)數(shù)據(jù)硬生生喂出一個(gè) “從零訓(xùn)練” 的基礎(chǔ)模型,在經(jīng)濟(jì)性和時(shí)間成本上都是不可接受的。

要真正解決數(shù)據(jù)效率問題,必須回歸第一性原理。OpenAI 提出的 Transfer Scaling Law(遷移縮放定律) 為我們指明了方向:它揭示了預(yù)訓(xùn)練模型在目標(biāo)任務(wù)上的性能,并不只取決于模型大小,更取決于預(yù)訓(xùn)練數(shù)據(jù)(源域)與目標(biāo)任務(wù)數(shù)據(jù)(目標(biāo)域)之間的分布對(duì)齊程度。簡(jiǎn)而言之,你喂給模型再多的通用數(shù)據(jù),如果它的表征結(jié)構(gòu)不適合直接輸出 “動(dòng)作”,這種知識(shí)遷移的損耗將是極其驚人的。

極佳視界的解法,正是對(duì) Transfer Scaling Law 的一次教科書級(jí)別的工程實(shí)踐。因?yàn)?GigaWorld-Policy 從底層架構(gòu)上就確立了 “以動(dòng)作為中心”,這使得模型在預(yù)訓(xùn)練階段提取的物理表征,天然地與最終的 “動(dòng)作輸出” 任務(wù)高度對(duì)齊。這就大大降低了知識(shí)遷移的損耗(Transfer Penalty)。

在第一性原理的指導(dǎo)下,GigaWorld-Policy 跑通了 “三段式高效訓(xùn)練 Pipeline”:

  1. 建立物理常識(shí)(源域預(yù)訓(xùn)練):利用海量互聯(lián)網(wǎng)視頻,讓基座模型學(xué)習(xí)廣泛的通用物理常識(shí)和視覺表征。
  2. 聚焦時(shí)空演變(跨域適配):引入涵蓋第一人稱視角、真實(shí)機(jī)器人操作及仿真環(huán)境的多源視頻,專攻具身場(chǎng)景下的時(shí)空動(dòng)態(tài)演變,拉近源域與目標(biāo)域的分布距離。
  3. 精準(zhǔn)對(duì)齊(目標(biāo)域微調(diào)):僅需少量的帶標(biāo)簽真機(jī)動(dòng)作數(shù)據(jù),即可完成最終的控制策略對(duì)齊。



實(shí)驗(yàn)數(shù)據(jù)極具說服力:GigaWorld-Policy 僅用 10% 的真實(shí)機(jī)器人數(shù)據(jù),就能達(dá)到傳統(tǒng) VLA 方案使用 100% 數(shù)據(jù)的效果。 這種分層范式,相比傳統(tǒng) VLA 實(shí)現(xiàn)了高達(dá) 10 倍的訓(xùn)練效率提升。

推理延遲

物理世界的硬約束

在物理世界中,時(shí)間就是生命。毫秒級(jí)的延遲差異,往往就是 “穩(wěn)穩(wěn)抓住” 與 “打翻水杯” 的區(qū)別?!奥掏獭?的端到端大模型,在真實(shí)的物理交互中毫無用武之地。

  • 拋棄了視頻生成的包袱后,GigaWorld-Policy 在推理效率上迎來了質(zhì)的飛躍。在 A100 GPU 上,其推理速度達(dá)到了驚人的360 毫秒 / 步。相比之下,相較 Motus,GigaWorld-Policy 實(shí)現(xiàn)了更少的推理顯存占用以及 10 倍推理速度提升。
  • 更關(guān)鍵的是,這種速度的提升直接轉(zhuǎn)化為了控制性能的躍升。在真實(shí)世界的任務(wù)評(píng)測(cè)中,GigaWorld-Policy 的平均成功率達(dá)到了 83%,不僅比 Motus 快 9 倍,成功率更是高出 7 個(gè)百分點(diǎn)。



開源精神與產(chǎn)業(yè)的未來

與其在概念的迷宮中打轉(zhuǎn),或是空談 “目標(biāo)驅(qū)動(dòng)”,不如用代碼和落地效果說話。就在前段時(shí)間,極佳視界宣布 GigaWorld-Policy 全面開源:

  • 項(xiàng)目主頁:https://gigaai-research.github.io/GigaWorld-Policy/
  • 代碼:https://github.com/open-gigaai/giga-world-policy
  • 論文:https://arxiv.org/pdf/2603.17240

在此之前,他們的 GigaWorld-1 不僅在世界模型權(quán)威基準(zhǔn) WorldArena 中登頂全球第一(綜合得分突破 60 分,超越谷歌、英偉達(dá)、阿里等國(guó)際頂尖團(tuán)隊(duì)),其開源代碼和數(shù)據(jù)集在 Huggingface 上的下載量也已突破 2.4 萬次:

  • 代碼:https://github.com/open-gigaai/CVPR-2026-Workshop-WM-Track
  • 數(shù)據(jù):https://huggingface.co/datasets/open-gigaai/CVPR-2026-WorldModel-Track-Dataset

無論是 Generalist 的深思,還是極佳視界的破局,都在向整個(gè)行業(yè)傳遞一個(gè)明確的信號(hào):具身智能已經(jīng)走過了 “概念驗(yàn)證” 的階段。未來的主戰(zhàn)場(chǎng),屬于那些真正理解物理約束、敢于在架構(gòu)上斷舍離的實(shí)干者。而 “以動(dòng)作為中心” 的世界模型,或許是通往物理 AGI 之路上,一座極具里程碑意義的進(jìn)步。

世界模型無疑是 2026 年至今整個(gè)科技圈最熱議題之一。它正推動(dòng) AI 從“感知當(dāng)下”,走向?qū)r(shí)空和動(dòng)態(tài)變化的“預(yù)測(cè)與推演”。在這條充滿想象力卻又極具挑戰(zhàn)的賽道上,技術(shù)突破與實(shí)踐應(yīng)用走到了哪一步?

4 月 15 日 19:00-21:00,機(jī)器之心將聯(lián)手黃大年茶思屋,邀請(qǐng) 5 位產(chǎn)學(xué)研頂尖專家,從技術(shù)突破到產(chǎn)業(yè)實(shí)踐,深度解析世界模型的最前沿。

歡迎關(guān)注機(jī)器之心視頻號(hào)預(yù)約直播

*如有疑問,歡迎添加小助手微信,搜索:jiqizhixinsh



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國(guó)內(nèi)套現(xiàn)7個(gè)億后,她露出了身后的美國(guó)國(guó)旗,整個(gè)家族共套現(xiàn)20億

國(guó)內(nèi)套現(xiàn)7個(gè)億后,她露出了身后的美國(guó)國(guó)旗,整個(gè)家族共套現(xiàn)20億

素衣讀史
2026-04-13 17:57:51
教科書式耍賴案十余年后新進(jìn)展:受害方稱發(fā)現(xiàn)可供執(zhí)行新線索

教科書式耍賴案十余年后新進(jìn)展:受害方稱發(fā)現(xiàn)可供執(zhí)行新線索

南方都市報(bào)
2026-04-14 10:20:08
就在今天!4月14日,劉國(guó)梁哥哥發(fā)聲,正式帶隊(duì)出征,新動(dòng)態(tài)曝光

就在今天!4月14日,劉國(guó)梁哥哥發(fā)聲,正式帶隊(duì)出征,新動(dòng)態(tài)曝光

夕落秋山
2026-04-14 18:08:20
特朗普給了中國(guó)兩條路,王毅外長(zhǎng)二話不說,馬上給俄發(fā)邀請(qǐng)

特朗普給了中國(guó)兩條路,王毅外長(zhǎng)二話不說,馬上給俄發(fā)邀請(qǐng)

玲兒愛唱歌
2026-04-14 19:16:40
事關(guān)伊朗,特朗普給了中國(guó)兩條路,王毅二話不說,馬上給俄發(fā)邀請(qǐng)

事關(guān)伊朗,特朗普給了中國(guó)兩條路,王毅二話不說,馬上給俄發(fā)邀請(qǐng)

面包夾知識(shí)
2026-04-14 14:06:45
噩耗!廣東男籃核心傷情加重,廣州龍獅或買斷徐昕,奎因擺脫罵名

噩耗!廣東男籃核心傷情加重,廣州龍獅或買斷徐昕,奎因擺脫罵名

北緯的咖啡豆
2026-04-14 19:48:33
中東五國(guó)天塌了,美國(guó)的敲詐還懸在頭頂,伊朗又開出巨額賬單

中東五國(guó)天塌了,美國(guó)的敲詐還懸在頭頂,伊朗又開出巨額賬單

壹只灰鴿子
2026-04-14 18:27:42
歐盟為馬扎爾設(shè)立27項(xiàng)條件,以換取歐盟對(duì)匈牙利的350億歐元補(bǔ)貼

歐盟為馬扎爾設(shè)立27項(xiàng)條件,以換取歐盟對(duì)匈牙利的350億歐元補(bǔ)貼

山河路口
2026-04-14 10:45:55
警惕!公安部“4·2行動(dòng)”重拳出擊,嚴(yán)打犯罪絕不手軟

警惕!公安部“4·2行動(dòng)”重拳出擊,嚴(yán)打犯罪絕不手軟

寶哥精彩賽事
2026-04-14 17:04:56
克萊:我知道自己的職業(yè)生涯所剩無幾 每當(dāng)上場(chǎng)我都會(huì)全力以赴

克萊:我知道自己的職業(yè)生涯所剩無幾 每當(dāng)上場(chǎng)我都會(huì)全力以赴

北青網(wǎng)-北京青年報(bào)
2026-04-14 20:00:02
美國(guó)華裔州長(zhǎng)駱家輝:在任時(shí)拿華為開刀,卸任后到中國(guó)瘋狂撈金

美國(guó)華裔州長(zhǎng)駱家輝:在任時(shí)拿華為開刀,卸任后到中國(guó)瘋狂撈金

一篇枯寂
2026-04-13 17:27:33
無戲可拍的文章開飯店,爆火不到3天,擔(dān)心的事發(fā)生,還不止一件

無戲可拍的文章開飯店,爆火不到3天,擔(dān)心的事發(fā)生,還不止一件

八斗小先生
2026-04-14 14:26:29
歐冠4強(qiáng)將誕生2席!巴薩+利物浦都面臨0-2絕境,有1隊(duì)有望3-0逆轉(zhuǎn)

歐冠4強(qiáng)將誕生2席!巴薩+利物浦都面臨0-2絕境,有1隊(duì)有望3-0逆轉(zhuǎn)

球場(chǎng)沒跑道
2026-04-14 10:15:36
CBA罰單:寧波總經(jīng)理劉家成批評(píng)裁判罰4萬 外援杰克遜摔水瓶罰2萬

CBA罰單:寧波總經(jīng)理劉家成批評(píng)裁判罰4萬 外援杰克遜摔水瓶罰2萬

醉臥浮生
2026-04-13 22:47:15
普京按下停火鍵!美國(guó)3年算計(jì)一夜歸零,這一天他們?cè)缭摿系?>
    </a>
        <h3>
      <a href=風(fēng)信子的花
2026-04-14 18:56:54
事關(guān)伊朗,特朗普給了中國(guó)兩條路,王毅二話不說,馬上給俄發(fā)邀請(qǐng)

事關(guān)伊朗,特朗普給了中國(guó)兩條路,王毅二話不說,馬上給俄發(fā)邀請(qǐng)

生活魔術(shù)專家
2026-04-14 18:26:52
越來越多的人查出腸癌!醫(yī)生含淚苦勸:冰箱久置的這4物是幫兇

越來越多的人查出腸癌!醫(yī)生含淚苦勸:冰箱久置的這4物是幫兇

岐黃傳人孫大夫
2026-03-17 23:25:03
日網(wǎng)瘋傳“日本買石油,用人民幣結(jié)算”,網(wǎng)民反應(yīng)太好玩

日網(wǎng)瘋傳“日本買石油,用人民幣結(jié)算”,網(wǎng)民反應(yīng)太好玩

這里是東京
2026-04-13 19:13:51
回臺(tái)后,島內(nèi)民調(diào)結(jié)果驚人,蕭旭岑:國(guó)民黨“鄭麗文路線”已確立

回臺(tái)后,島內(nèi)民調(diào)結(jié)果驚人,蕭旭岑:國(guó)民黨“鄭麗文路線”已確立

藍(lán)色海邊
2026-04-14 18:20:52
大快人心!國(guó)家出手擒下3名華人首富,他們干的事,根本不能饒恕

大快人心!國(guó)家出手擒下3名華人首富,他們干的事,根本不能饒恕

墨印齋
2026-03-24 21:34:56
2026-04-14 20:48:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12762文章數(shù) 142628關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

女子喪偶后和上海婆婆反目 婆婆出錢買的房打官司輸了

頭條要聞

女子喪偶后和上海婆婆反目 婆婆出錢買的房打官司輸了

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊(duì)道歉”

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財(cái)經(jīng)要聞

許家印認(rèn)罪,他和恒大還有多少欠債?

汽車要聞

售12.99萬起/續(xù)航2000km 風(fēng)云T9L上市

態(tài)度原創(chuàng)

教育
游戲
親子
時(shí)尚
軍事航空

教育要聞

AI漫劇還能不能做?

EWC電競(jìng)世界杯:IG橫掃TES!TES將重點(diǎn)放在聯(lián)賽上?

親子要聞

相愛十年最好的人生禮物來啦!

全網(wǎng)走紅的「爆改老媽」,審美霸凌了多少中年女性?

軍事要聞

伊朗要求五個(gè)中東國(guó)家賠償戰(zhàn)爭(zhēng)損失

無障礙瀏覽 進(jìn)入關(guān)懷版