国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

世界模型WoW發(fā)布,200萬次真實交互讓AI真正懂物理

0
分享至


始智AI wisemodel.cn社區(qū)是源自中國的中立開放的AI開源社區(qū)。正在,歡迎加入共同成長。

人類對世界的認知,源于親手觸摸、嘗試與探索,而非被動觀察。但當前主流視頻生成模型如 Sora,僅靠海量視頻數(shù)據(jù)學習,缺乏真實世界交互體驗,常常出現(xiàn)違背物理常識的 “幻覺”。近日,由北京人形機器人創(chuàng)新中心與香港科技大學等機構(gòu)聯(lián)合推出的 WoW 世界模型,憑借 200 萬條真實機器人交互數(shù)據(jù),打通 “感知 - 想象 - 反思 - 行動” 閉環(huán),讓 AI 真正具備物理直覺,為 embodied intelligence 發(fā)展奠定關(guān)鍵基礎(chǔ)!已上線始智AI-wisemodel開源社區(qū),歡迎體驗。


模型地址

https://wisemodel.cn/models/WoWworldmodel/WoW-1-Wan-14B-2M/intro

https://wisemodel.cn/models/WoWworldmodel/WoW-1-Wan-1.3B-2M

01.

行業(yè)痛點:

傳統(tǒng)世界模型的三大致命缺陷


現(xiàn)有世界模型雖能生成逼真視頻,卻難以適配真實世界交互需求:

  1. 物理認知薄弱:僅通過被動觀察學習,缺乏因果關(guān)聯(lián)理解,生成內(nèi)容常出現(xiàn)物體穿透、重力異常等物理謬誤;
  2. 想象與行動脫節(jié):能 “想象” 未來場景,卻無法將其轉(zhuǎn)化為可執(zhí)行的機器人動作,難以落地應(yīng)用;
  3. 泛化能力不足:在未見過的場景、機器人形態(tài)或任務(wù)中表現(xiàn)糟糕,難以適應(yīng)真實世界的多樣性。

這些問題導(dǎo)致 AI 始終無法真正 “理解” 世界,只能做表面的模式復(fù)刻。

02.

技術(shù)革新:

WoW的四大核心突破

WoW以 “真實交互數(shù)據(jù) + 閉環(huán)優(yōu)化框架” 為核心,實現(xiàn)四大關(guān)鍵創(chuàng)新,讓 AI 從 “看世界” 升級為 “懂世界、控世界”:


1. 200 萬次真實交互:筑牢物理直覺根基

摒棄互聯(lián)網(wǎng)視頻數(shù)據(jù),WoW 采用 203 萬條真實機器人交互軌跡訓(xùn)練,涵蓋 5275 個任務(wù)、12 種不同機器人形態(tài),累計時長超 7300 小時。數(shù)據(jù)經(jīng)過嚴格篩選,剔除無效交互,保留高質(zhì)量、因果關(guān)系明確的操作記錄,包括單臂 / 雙臂 manipulation、剛性 / 柔性物體交互等場景,讓模型在真實物理反饋中學習規(guī)律,而非死記硬背視頻模式。

2. SOPHIA 閉環(huán)框架:讓 AI 學會 “反思優(yōu)化”

創(chuàng)新提出 SOPHIA 自優(yōu)化框架,模擬人類 “嘗試 - 反饋 - 修正” 的認知過程:

  • 生成器(Solver):基于擴散 Transformer(DiT)生成符合物理規(guī)律的未來視頻,融合 3D 小波變換與 RoPE 位置編碼,保證時空一致性;
  • 評論家(Critic):由視覺語言模型(VLM)組成動態(tài)評估團隊,從任務(wù)完成度、物理合理性、運動流暢度等維度打分;
  • 優(yōu)化器(Refiner):根據(jù)評估反饋迭代優(yōu)化文本指令,引導(dǎo)生成器修正錯誤,逐步提升物理一致性。

這種 “生成 - 評估 - 優(yōu)化” 的閉環(huán),讓模型不斷反思改進,避免單一生成的局限性。

3. Flow-Mask 逆動力學模型:打通 “想象到行動” 最后一公里

設(shè)計 FM-IDM 模塊,能將生成的視頻軌跡轉(zhuǎn)化為 7 自由度機械臂可執(zhí)行的動作指令。通過分析相鄰幀的光流變化與場景掩碼,精準推斷機器人末端執(zhí)行器的平移、旋轉(zhuǎn)及夾爪控制信號,實現(xiàn) “想象場景→動作落地” 的完整閉環(huán)。在真實機器人測試中,該模塊在簡單任務(wù)上成功率達 94.5%,中等難度任務(wù)達 75.2%,大幅超越傳統(tǒng)方法。

4. WoWBench 基準:量化物理與因果推理能力

構(gòu)建首個聚焦物理一致性的評估基準 WoWBench,包含 606 個樣本、20 個子任務(wù),從四大維度全面測試模型:

  • 感知理解(物體識別、空間關(guān)系等)

  • 預(yù)測推理(碰撞動力學、物體恒存性等)

  • 決策規(guī)劃(長時任務(wù)分解、因果依賴等)

  • 泛化執(zhí)行(未見場景、機器人形態(tài)等)

采用多維度評估指標,既包括視頻質(zhì)量、軌跡一致性等量化指標,也涵蓋人類主觀評分,全面衡量模型的真實世界適配能力。


03.

性能驗證:

多項指標刷新紀錄,真實場景表現(xiàn)亮眼

WoW 在實驗中展現(xiàn)出遠超傳統(tǒng)模型的綜合能力:

  • 基準測試霸榜:在 WoWBench 上實現(xiàn) 96.53% 的指令理解準確率和 80.16% 的物理規(guī)律符合率,人類評估與自動評估均排名第一;
  • 物理一致性卓越:能準確模擬碰撞、形變、流體等復(fù)雜物理現(xiàn)象,在剛性物體交互、柔性材料操作等場景中無明顯物理謬誤;
  • 泛化能力突出:無需微調(diào)即可適配 12 種不同機器人形態(tài),在素描、油畫等風格化場景,以及 “物體超重”“重力偏移” 等反事實場景中,仍能生成合理結(jié)果;
  • 真實落地可行:成功控制物理機器人完成取放面包、關(guān)閉抽屜、按鈕按壓等任務(wù),動作流暢且精準。

04.

適用場景:

賦能多領(lǐng)域智能升級

WoW 的技術(shù)特性使其在多個場景具備極高應(yīng)用價值:

  • 機器人操控:為工業(yè)機械臂、服務(wù)機器人提供高精度動作規(guī)劃,適配多樣化任務(wù)與環(huán)境;
  • 物理模擬:替代傳統(tǒng)物理引擎,高效生成復(fù)雜場景模擬視頻,助力游戲開發(fā)、仿真測試;
  • 多視圖生成:支持從有限視角重建完整 3D 場景,生成幾何一致的新穎視圖;
  • VLM 能力增強:作為認知沙盒,幫助視覺語言模型調(diào)試規(guī)劃邏輯,將復(fù)雜任務(wù)成功率從 30% 提升至 89%。


無論是工業(yè)自動化、智能家居,還是虛擬仿真、AI 助手升級,WoW 都能憑借其強大的物理理解與行動能力提供核心支撐。

WoW 的推出,打破了傳統(tǒng)世界模型 “只懂想象、不會行動” 的局限,證明了 “真實交互是 AI 習得物理直覺的關(guān)鍵”。其 200 萬條真實交互數(shù)據(jù)、SOPHIA 閉環(huán)優(yōu)化框架與 FM-IDM 動作轉(zhuǎn)化模塊的有機結(jié)合,讓 AI 首次實現(xiàn) “感知世界 - 想象未來 - 反思優(yōu)化 - 操控物理” 的完整閉環(huán)。

隨著技術(shù)的進一步迭代,未來的 AI 將具備更強的環(huán)境適應(yīng)能力與自主決策能力,在工業(yè)生產(chǎn)、家庭服務(wù)、科研探索等領(lǐng)域發(fā)揮更大價值。

----- END -----


wisemodel相關(guān):

系列模型:

關(guān)于wisemodel更多

1

歡迎持續(xù)關(guān)注和支持

開源社區(qū)建設(shè)需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區(qū)的志愿者計劃和開源共創(chuàng)計劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動態(tài)。

2

歡迎加盟wisemodel開源社區(qū)

始智AI wisemodel社區(qū)自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區(qū),為了加快公司發(fā)展,我們長期需要技術(shù)、運營等人才加盟,技術(shù)側(cè)重在AI infra、后端開發(fā),熟悉K8S、模型訓(xùn)練和推理等技術(shù), 以及熟悉開發(fā)者生態(tài)運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優(yōu)質(zhì)內(nèi)容

歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵高校實驗室、大企業(yè)研究團隊、個人等,在wisemodel平臺上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關(guān)于wisemodel開源社區(qū)

始智AI wisemodel.cn開源社區(qū)由清華校友總會AI大數(shù)據(jù)專委會副秘書長劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高校科研院所、大型互聯(lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個人開發(fā)者,以及政府部門、學會協(xié)會、聯(lián)盟、基金會等,還有投資機構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。

向上滑動查看

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
張雪峰前女友哭紅眼,喊話不要給張雪峰潑臟水,曝兩人分手原因

張雪峰前女友哭紅眼,喊話不要給張雪峰潑臟水,曝兩人分手原因

180視角
2026-03-26 14:51:03
7旬男子陪老伴住院,醫(yī)生看了他一眼發(fā)現(xiàn)其面部有猝死先兆,將其從死亡邊緣拉回

7旬男子陪老伴住院,醫(yī)生看了他一眼發(fā)現(xiàn)其面部有猝死先兆,將其從死亡邊緣拉回

觀威海
2026-03-26 09:55:04
“親媽霸占消防通道,兒子被火燒死”,這件事,簡直太魔幻了……

“親媽霸占消防通道,兒子被火燒死”,這件事,簡直太魔幻了……

桌子的生活觀
2026-03-26 12:28:04
張雪峰去世真相!網(wǎng)友:偌大的公司靠他個人ip養(yǎng)活,早死是必然的

張雪峰去世真相!網(wǎng)友:偌大的公司靠他個人ip養(yǎng)活,早死是必然的

火山詩話
2026-03-25 09:18:58
宋喆出獄后現(xiàn)狀:縣城搬菜月入三千,前妻楊慧橫店開公司年入千萬

宋喆出獄后現(xiàn)狀:縣城搬菜月入三千,前妻楊慧橫店開公司年入千萬

一盅情懷
2026-03-26 14:47:59
A股:股民做好下車準備,大資金明牌了,周五將迎更大的暴風雨?

A股:股民做好下車準備,大資金明牌了,周五將迎更大的暴風雨?

夜深愛雜談
2026-03-26 17:19:44
勇敢發(fā)聲!科威特記者聯(lián)合國痛批“反以儀式”

勇敢發(fā)聲!科威特記者聯(lián)合國痛批“反以儀式”

Nee看
2026-03-26 14:15:21
春天,這堿性菜再貴也要多吃,殺菌強免疫,補鈣補鉀兩不誤,好吃

春天,這堿性菜再貴也要多吃,殺菌強免疫,補鈣補鉀兩不誤,好吃

阿龍美食記
2026-03-25 10:38:40
廣東一男子買啤酒抽中電動車大獎,將中獎二維碼發(fā)網(wǎng)上詢問后被他人掃走核銷,網(wǎng)友:“這下又上了一課”

廣東一男子買啤酒抽中電動車大獎,將中獎二維碼發(fā)網(wǎng)上詢問后被他人掃走核銷,網(wǎng)友:“這下又上了一課”

洪觀新聞
2026-03-26 10:56:49
烏克蘭打出400:1恐怖戰(zhàn)績,俄羅斯列寧格勒港口基本被打癱瘓

烏克蘭打出400:1恐怖戰(zhàn)績,俄羅斯列寧格勒港口基本被打癱瘓

史政先鋒
2026-03-26 16:17:12
高速統(tǒng)一限速3月26日正式落地!五檔限速+清理非標不會再亂扣分!

高速統(tǒng)一限速3月26日正式落地!五檔限速+清理非標不會再亂扣分!

沙雕小琳琳
2026-03-26 09:41:30
湖北十堰大山深處,那個號稱“小香港”的萬人廠,如今人去樓空

湖北十堰大山深處,那個號稱“小香港”的萬人廠,如今人去樓空

GA環(huán)球建筑
2026-03-26 14:10:54
斯柯達將退出中國,大眾中國回應(yīng)

斯柯達將退出中國,大眾中國回應(yīng)

第一財經(jīng)資訊
2026-03-26 15:14:56
網(wǎng)友曝張雪峰搶救細節(jié):倒地30分鐘才被發(fā)現(xiàn),用ECMO全力搶救無效

網(wǎng)友曝張雪峰搶救細節(jié):倒地30分鐘才被發(fā)現(xiàn),用ECMO全力搶救無效

半窗疏影
2026-03-26 20:17:36
萬科高管被要求退還薪酬

萬科高管被要求退還薪酬

地產(chǎn)微資訊
2026-03-26 12:22:04
伊朗女藥劑師拒絕撤離,空襲第10天在“精準”打擊下被“誤殺”

伊朗女藥劑師拒絕撤離,空襲第10天在“精準”打擊下被“誤殺”

網(wǎng)易新聞出品
2026-03-26 11:16:13
張雪峰去世巨額遺產(chǎn)曝光,能給女兒留下多少錢?

張雪峰去世巨額遺產(chǎn)曝光,能給女兒留下多少錢?

藍鯨新聞
2026-03-26 17:41:20
俄羅斯主帥:FIFA把我們禁賽了,就算加入亞足聯(lián)頂多踢亞洲杯

俄羅斯主帥:FIFA把我們禁賽了,就算加入亞足聯(lián)頂多踢亞洲杯

懂球帝
2026-03-26 16:30:07
香港馬拉松,阿Sa臉饅化成蔡明,黃曉明白又嫩,林志玲被嘲太做作

香港馬拉松,阿Sa臉饅化成蔡明,黃曉明白又嫩,林志玲被嘲太做作

老吳教育課堂
2026-03-26 14:11:15
中共中央批準,開除劉慧黨籍

中共中央批準,開除劉慧黨籍

新京報
2026-03-26 17:14:17
2026-03-26 21:51:00
wisemodel開源社區(qū) incentive-icons
wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū),打造中國版“huggingface”
466文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

美國總統(tǒng)特朗普公開宣布訪華行程 外交部回應(yīng)

頭條要聞

美國總統(tǒng)特朗普公開宣布訪華行程 外交部回應(yīng)

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

家居
手機
數(shù)碼
時尚
教育

家居要聞

傍海而居 靜觀蝴蝶海

手機要聞

15年經(jīng)典落幕!MIUI正式停更,澎湃OS全面接棒

數(shù)碼要聞

iQOO Z11x發(fā)布:LCD黨的護眼神機 1499元起

上新|| 她們說,找到了自己的人生裙子!

教育要聞

江蘇省教育廳公布全省中小學生競賽活動名單

無障礙瀏覽 進入關(guān)懷版