国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

具身智能奇點已至!超越π*0.6,極佳視界自我進化VLA大模型拿下世界第一

0
分享至


新智元報道

編輯:艾倫

【新智元導讀】極佳視界具身大模型 GigaBrain-0.5M*,以世界模型預測未來狀態(tài)驅(qū)動機器人決策,并實現(xiàn)了持續(xù)自我進化,超越π*0.6實現(xiàn) SOTA!該模型在疊衣、沖咖啡、折紙盒等真實任務中實現(xiàn)接近 100% 成功率;相比主流基線方法任務成功率提升近 30%;基于超萬小時數(shù)據(jù)訓練,其中六成由自研世界模型高保真合成。

具身世界模型新一代原生范式重磅登場!

繼具身基礎模型 GigaBrain-0.1 斬獲 RoboChallenge 全球第一后,性能更強大的 GigaBrain-0.5M* 又來了。


作為依托世界模型實現(xiàn)自我進化的 VLA 大模型,GigaBrain-0.5M* 在家庭疊衣、服務沖煮咖啡、工業(yè)折紙盒等多個真實機器人任務中,均實現(xiàn)零失誤、可持續(xù)穩(wěn)定運轉(zhuǎn)

GigaBrain-0.5M* 作為一款基于世界模型條件驅(qū)動(World Model-Conditioned)的 VLA 大模型,以世界模型對未來狀態(tài)與價值的預測結(jié)果作為條件輸入,可顯著提升模型在長時程任務中的魯棒性。

在此基礎上,GigaBrain-0.5M* 創(chuàng)新引入人在回路(Human-in-the-Loop)持續(xù)學習機制,系統(tǒng)依托經(jīng)人工篩選與校正的模型推演軌跡開展迭代訓練,基于真實環(huán)境交互反饋持續(xù)優(yōu)化決策策略,最終實現(xiàn)「行動 — 反思 — 進化」的閉環(huán)式持續(xù)學習與自主迭代升級


論文鏈接:https://arxiv.org/pdf/2602.12099

項目鏈接:https://gigabrain05m.github.io/

基于世界模型的強化學習的訓練范式

在 GigaBrain-0.5M* 的研發(fā)中,極佳視界提出基于世界模型的強化學習范式,并采用迭代式四階段閉環(huán)訓練流程

  • 基于大規(guī)模機器人操作數(shù)據(jù)完成世界模型預訓練,實現(xiàn)對未來狀態(tài)及對應價值的精準預測;

  • 以世界模型輸出的未來狀態(tài)預測與價值評估為條件,對策略網(wǎng)絡進行微調(diào),以指引動作決策;

  • 將條件化策略部署至真實物理環(huán)境,依托人在環(huán)干預機制,采集模型自主推演軌跡數(shù)據(jù);

  • 利用經(jīng)篩選后的有效軌跡數(shù)據(jù)集,聯(lián)合優(yōu)化世界模型與決策策略,實現(xiàn)模型持續(xù)學習與自主進化。


連續(xù)零失誤執(zhí)行

在與 AWR、RECAP 等主流模仿學習與強化學習基線方法的系統(tǒng)對比中,GigaBrain-0.5M* 展現(xiàn)出顯著優(yōu)勢,在相同任務設定下,相較于由 π*0.6所提出的 RECAP 基線,任務成功率提升近 30%,并實現(xiàn)了穩(wěn)定可靠的模型效果。

尤其在高難度長時程任務中,面對折紙盒、咖啡制備、衣物折疊等包含多階段操作、精細感知與持續(xù)決策的復雜場景,GigaBrain?0.5M* 均實現(xiàn)接近 100% 的任務成功率,并可穩(wěn)定復現(xiàn)成功執(zhí)行軌跡,充分彰顯出卓越的策略魯棒性。


折紙盒

咖啡制備??

衣物折疊

高效且準確的價值預測

實驗結(jié)果表明,基于世界模型的價值預測方案在執(zhí)行效率與預測精度上,均優(yōu)于 π*0.6提出的 VLM 方案。

該方案的核心優(yōu)勢源自對未來狀態(tài)的顯式建模與世界模型單步降噪機制,可為價值函數(shù)提供關鍵的時序上下文支撐,讓價值估計實現(xiàn)更高效、更精準、更穩(wěn)定的輸出。

以疊衣服任務為例:

任務初期,機械臂反復調(diào)整衣物姿態(tài)時,預測價值呈現(xiàn)合理波動;

當衣物擺正、進入穩(wěn)定疊放階段,價值曲線穩(wěn)步上升;

若中途出現(xiàn)干擾物,價值驟降以反映任務受阻;

待干擾物被移除后,價值迅速恢復增長趨勢。

這種與任務物理進程高度對齊的價值演化,正是世界模型提供「認知先驗」的直接體現(xiàn)。


上萬小時的訓練數(shù)據(jù)

GigaBrain-0.5M* 的基座模型 GigaBrain-0.5 基于總計 10931 小時的多樣化機器人操作數(shù)據(jù)進行預訓練,其中 61%(6653 小時)由自研具身世界模型 GigaWorld 高保真合成,覆蓋紋理遷移、視角變換、人手到機械臂映射等豐富場景;

剩余 39%(4278 小時)源自真實機器人采集,確保策略在物理世界中的可執(zhí)行性。

海量數(shù)據(jù)的引入顯著拓展了模型的任務覆蓋廣度與策略魯棒性,使其在面對復雜、長時程操作任務時具備更強的泛化能力;

而 GigaWorld 生成的合成數(shù)據(jù)則有效突破了真實采集的長尾瓶頸。

通過可控地生成新紋理、新物體位姿與新觀測視角下的訓練樣本,增強了模型在分布外場景中的適應性,為具身智能走向開放世界奠定了數(shù)據(jù)基石。


關于極佳視界

極佳視界是一家具身智能和通用機器人公司,圍繞「基模— 本體 —場景」三位一體,為工業(yè)、商業(yè)、家庭等場景提供軟硬一體的具身智能機器人解決方案,推動通用機器人服務千行百業(yè)、走進千家萬戶。

公司核心團隊包括清華、北大、中科院、中科大、WashU、CMU 等全球知名院校頂尖研究人員,以及來自微軟、三星、地平線、百度、博世等全球知名企業(yè)高管,核心團隊在物理 AI 方向兼具業(yè)內(nèi)領先的研究能力和大規(guī)模的產(chǎn)業(yè)落地經(jīng)驗。

極佳視界是國內(nèi)第一家布局世界模型的科技公司,以世界模型平臺 GigaWorld、通用具身大腦 GigaBrain、原生本體 Maker 構建閉環(huán)生態(tài),致力實現(xiàn) 10-100 倍以上的數(shù)據(jù)、訓練、測試全鏈路效率提升,推動通用具身智能機器人、通用自動駕駛等物理 AGI 大規(guī)模爆發(fā)。

參考資料:斬獲全球第一后,更強大的GigaBrain-0.5M*來了,世界模型原生的新一代范式登場!

論文鏈接:https://arxiv.org/pdf/2602.12099

項目鏈接:https://gigabrain05m.github.io/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
開始嚴查,公職人員評標了

開始嚴查,公職人員評標了

巢客HOME
2026-02-25 19:49:38
曾經(jīng)年薪200萬元的地產(chǎn)人,改行做陪診師,每單收費兩三百:“我看的是10年、20年,不在乎短期收入低”

曾經(jīng)年薪200萬元的地產(chǎn)人,改行做陪診師,每單收費兩三百:“我看的是10年、20年,不在乎短期收入低”

每日經(jīng)濟新聞
2026-02-26 17:15:06
當?shù)厝艘脖辉?,蓬萊酒樓屢教不改連夜被摘牌,老板透露身份還掙扎

當?shù)厝艘脖辉祝钊R酒樓屢教不改連夜被摘牌,老板透露身份還掙扎

社會日日鮮
2026-02-24 09:27:23
成本2億,日票房僅1100萬,71歲成龍懵了:內(nèi)地觀眾憑啥不買賬?

成本2億,日票房僅1100萬,71歲成龍懵了:內(nèi)地觀眾憑啥不買賬?

糊咖娛樂
2026-02-25 18:38:49
戲子誤國!春節(jié)剛過就有4位明星相繼塌房,走到這一步不值得同情

戲子誤國!春節(jié)剛過就有4位明星相繼塌房,走到這一步不值得同情

墨印齋
2026-02-26 06:21:37
演員于某被抓

演員于某被抓

微法官
2026-02-26 14:29:04
新加坡住了一年才敢說:被吹上天的居者有其屋,其實是一地雞毛

新加坡住了一年才敢說:被吹上天的居者有其屋,其實是一地雞毛

天下霸奇
2026-02-24 08:09:25
女孩當小姐,一晚要提供4到5次上門服務,2015年被親人點到不赴約

女孩當小姐,一晚要提供4到5次上門服務,2015年被親人點到不赴約

漢史趣聞
2025-11-08 09:27:32
重磅!李大霄:第三次大轉(zhuǎn)移已啟動,馬年股市將迎“黃金三年”!

重磅!李大霄:第三次大轉(zhuǎn)移已啟動,馬年股市將迎“黃金三年”!

徐sir財經(jīng)
2026-02-26 09:33:12
女航天員王亞平,因工作常年沒回家,和丈夫的關系一句話道出真相

女航天員王亞平,因工作常年沒回家,和丈夫的關系一句話道出真相

掉了顆大白兔糖
2026-02-25 07:07:28
前中天主播吳中純淋巴癌猝逝!蔡正元:非常不舍

前中天主播吳中純淋巴癌猝逝!蔡正元:非常不舍

新時光點滴
2026-02-26 00:02:00
公立醫(yī)院買不著進口藥?不是消失,是換地方了!

公立醫(yī)院買不著進口藥?不是消失,是換地方了!

今日養(yǎng)生之道
2026-02-26 17:26:32
唐尚珺也沒想到,他經(jīng)歷16次高考35歲才上岸,卻在直播間完成自救

唐尚珺也沒想到,他經(jīng)歷16次高考35歲才上岸,卻在直播間完成自救

法老不說教
2026-02-26 19:14:53
新加坡大滿貫:陳幸同3-0日本第一美女,靜待陳熠大戰(zhàn)最強削球手

新加坡大滿貫:陳幸同3-0日本第一美女,靜待陳熠大戰(zhàn)最強削球手

釘釘陌上花開
2026-02-26 20:35:54
你搶不到的RTX5090,還在廚子、電工和鐵匠手里?

你搶不到的RTX5090,還在廚子、電工和鐵匠手里?

藍鯨新聞
2026-02-25 14:46:26
楊溶,斬獲大獎

楊溶,斬獲大獎

極目新聞
2026-02-26 21:32:14
“茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

“茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

室內(nèi)設計師有料兒
2026-02-19 11:17:18
《太平年》在越南吵翻:同一段亂世,吳越選擇納土,越南選擇獨立

《太平年》在越南吵翻:同一段亂世,吳越選擇納土,越南選擇獨立

狐貍先森講升學規(guī)劃
2026-02-25 10:10:42
瑞幸咖啡:2025全年總凈收入492.88億元人民幣 同比增長43.0%

瑞幸咖啡:2025全年總凈收入492.88億元人民幣 同比增長43.0%

財聯(lián)社
2026-02-26 20:09:17
二手房拋售狂潮愈演愈烈,一個房價危險信號,已經(jīng)出現(xiàn)4個跡象

二手房拋售狂潮愈演愈烈,一個房價危險信號,已經(jīng)出現(xiàn)4個跡象

貓叔東山再起
2026-02-26 11:50:03
2026-02-26 22:56:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領航智能+時代
14596文章數(shù) 66643關注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

頭條要聞

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

藝術
數(shù)碼
房產(chǎn)
手機
軍事航空

藝術要聞

2025第三屆全國水粉畫大展 | 入選作品選刊

數(shù)碼要聞

英特爾Arc顯卡32.0.101.8531驅(qū)動發(fā)布

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

手機要聞

不止魅族,曝還有廠商暫停下一代旗艦研發(fā)

軍事要聞

美政府給新伊核協(xié)議設限內(nèi)容遭披露

無障礙瀏覽 進入關懷版