国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

浙大教授章國鋒帶隊創(chuàng)業(yè),打造無限時長實時3D世界模型

0
分享至



編輯|澤南

AI 領(lǐng)域最前沿的方向「世界模型」,正在出現(xiàn)一場革命。

互聯(lián)網(wǎng)上,OpenClaw 的「賽博龍蝦」在虛擬數(shù)字世界中靈活穿梭,無所不能;現(xiàn)實中,具身機器人卻依然受困于試驗場的圍欄,難以邁向復(fù)雜的物理空間。這道橫跨虛擬與現(xiàn)實的鴻溝,本質(zhì)上是智能體對空間智能(Spatial Intelligence)感知的缺失。

2024 年,被譽為「AI 教母」的李飛飛教授創(chuàng)立World Labs強勢入局,正式點燃了空間智能這一千億級賽道的全球戰(zhàn)火。就在不久前,該公司完成了最新一輪融資,估值直接飆升至 50 億美元RTFM(實時幀模型)是 World Labs 去年 10 月發(fā)布的實時生成式世界模型,其核心在于構(gòu)建一個擁有永久一致性(Persistence)的 3D 場景,讓智能體不僅能「看見」空間,更能真正理解并實時交互物理世界。

在 50 億美元估值神話的背后,這一空間智能的最新高地正被國內(nèi)創(chuàng)業(yè)公司攻克并推向產(chǎn)業(yè)縱深。近日,影溯(InSpatio)正式發(fā)布并開源了其實時幀生成模型InSpatio-WorldFM,一個實時交互的 3D 世界模型。這標志著中國團隊在空間智能底層技術(shù)上取得了奠基性突破,而且以開放的姿態(tài),正成為推動 AI 從虛擬屏幕走向物理現(xiàn)實的關(guān)鍵破局者。



  • InSpatio-WorldFM 項目主頁:https://inspatio.github.io/worldfm/
  • 模型 GitHub:https://github.com/inspatio/worldfm
  • 模型在線體驗:http://www.inspatio.com/worldfm

InSpatio-WorldFM 的發(fā)布和開源不僅是對全球頂尖技術(shù)路線的快速響應(yīng),更是中國團隊在空間智能領(lǐng)域的獨立思考。由浙江大學計算機輔助設(shè)計與圖形系統(tǒng)全國重點實驗室教授、國家杰青章國鋒博士領(lǐng)銜,影溯憑借在 3D 視覺和空間計算領(lǐng)域深耕 20 多年的底蘊,跳出了單純依賴極稀缺「原生 3D 數(shù)據(jù)」的傳統(tǒng)路徑,通過獨創(chuàng)的「數(shù)據(jù)升維」與「幾何約束」策略,成功激活了互聯(lián)網(wǎng)海量 2D 存量視頻數(shù)據(jù)中蘊含的 3D 空間知識。

這一技術(shù)路徑精準破解了困擾行業(yè)已久的「高質(zhì)量、規(guī)?;?3D 數(shù)據(jù)貧礦」局限,將海量 2D 存量數(shù)據(jù)高效轉(zhuǎn)化為驅(qū)動 3D 世界模型的高維原動力。

InSpatio-WorldFM 能夠高效地進行多視角一致的空間推理,并支持實時交互式探索。它的效果是這樣的:



該項目發(fā)布后迅速獲得硅谷多位 AI 領(lǐng)域意見領(lǐng)袖轉(zhuǎn)發(fā)關(guān)注,在線 Demo 訪問量短時間內(nèi)激增,一度出現(xiàn)排隊和訪問擁堵。



得益于 3D 的模型機制,其生成的虛擬世界有高度的一致性,模型生成的場景在空間幾何與光照與物理規(guī)律上非常穩(wěn)定,無限時長推理不會出現(xiàn)遺忘和衰退。

值得關(guān)注的是,相比以往的世界模型,InSpatio-WorldFM 對于算力的需求很低。影溯的目標是讓實時的空間推理能在消費級 GPU 上實現(xiàn),將空間智能從數(shù)據(jù)中心擴展到邊緣設(shè)備 —— 甚至在單塊 RTX 4090 GPU 上就能實現(xiàn)實時的推理,這就一下子打開了商業(yè)價值的想象空間。

生成的空間還支持整體一致性編輯 —— 不再是對單個物體或局部區(qū)域的零散修改,而是在保持幾何結(jié)構(gòu)、光照關(guān)系、材質(zhì)屬性與物理邏輯全局一致的前提下,進行跨視角、跨區(qū)域的統(tǒng)一調(diào)整。

比如從這樣:



到這樣:



無論是整體風格遷移、空間布局重構(gòu),光照材質(zhì),系統(tǒng)都能確保改動在所有視角與后續(xù)生成結(jié)果中保持一致,避免「前后打架」或「視角錯位」。

換句話說,它編輯的不是一幀圖像,而是一個可控、連貫、具物理約束的三維世界本體

技術(shù)路線

維度突破,構(gòu)建原生 3D

目前,不論是科技巨頭還是創(chuàng)業(yè)公司都在加速發(fā)力世界模型。

圖靈獎得主 Yann LeCun 曾多次表示,僅靠預(yù)測下一個 token 的生成式模型無法真正做到理解現(xiàn)實世界,世界模型將會是 AI 下一次技術(shù)突破的大方向。然而當前絕大多數(shù)主流的世界模型、圖像生成模型(如谷歌的 Genie 3、OpenAI 的 Sora)進行 2D 像素概率預(yù)測的本質(zhì),并不符合技術(shù)前進的需要。

目前絕大多數(shù)的世界模型,如谷歌的 Genie3、英偉達 Cosmos、Runway GWM-1、Lingbo-World、PixVerse R1 等,本質(zhì)上都是基于 2D 的視頻生成模型,其每個時刻的空間狀態(tài)都是由平面的 2D 圖像進行表達。但物理世界是 3D 的空間,AI 要和物理世界交互,空間狀態(tài)的表達也應(yīng)該是 3D 的。

影溯所走的技術(shù)路線在于善用「第一性原理」,不再執(zhí)著于逐像素地生成畫面,而是構(gòu)建原生的 3D 世界。

這意味著需要走一條更具挑戰(zhàn)的路,讓模型學會對真實世界傳感器數(shù)據(jù)進行抽象建模,過濾掉不可預(yù)測的噪聲信息,并在更高層次的表征空間中進行預(yù)測與推理。

對此,影溯沒有選擇從零開始學習物理常識,而是將互聯(lián)網(wǎng)海量 2D 存量視頻數(shù)據(jù)中蘊含的 3D 空間知識成功激活。通過精確控制,他們反向抽取出其中蘊含的三維幾何與物理規(guī)律。在其生成的 3D 世界中,人或 AI 也可以自由地行動,不必擔心會出現(xiàn)不可靠的細節(jié)。

正是基于獨特的 3D 技術(shù)路線,影溯的世界模型可以有效解決目前 AIGC 工具「盲盒抽卡」的痛點,不僅能在實時生成的場景自由漫游,而且支持將視頻中的動態(tài)前景無縫轉(zhuǎn)移到另一個空間環(huán)境中,并且能嚴格保證轉(zhuǎn)移后的前景與新背景在空間幾何、光照、物理規(guī)則上的高度一致性。 一次生成,精準可控,徹底告別反復(fù)重試的算力浪費。



可以看出,影溯的模型在背景變換與運鏡控制上,展現(xiàn)出卓越的像素級前景鎖定能力和精準運鏡控制,其主體一致性與運鏡穩(wěn)定性已超越當前主流的世界模型與視頻生成模型。尤為突出的是,即使背景完全變換、光線隨新環(huán)境自然適配,前景主體的光照依然能與新背景保持高度一致,細節(jié)與結(jié)構(gòu)毫發(fā)無傷、紋絲不動。

影溯團隊透露,其世界模型的訓(xùn)練僅僅動用了 100 張卡的算力規(guī)模,遠低于現(xiàn)在視頻模型訓(xùn)練所需要的算力。當大廠還在用萬張顯卡暴力猜測「下一個 2D 像素是什么」時,影溯直接在底層構(gòu)建了物理引擎的 3D 骨架。計算物理場,遠比窮舉像素更省算力。

具體來說,影溯這次開源的 InSpatio-WorldFM 具備三大特性:

突破 2D 限制:賦予空間智能一致性

在嘗試當前的先進 AI 視頻生成工具時,你一定遇到過這樣的尷尬:鏡頭一轉(zhuǎn),原本的人物變形了,背景里的建筑憑空消失或發(fā)生了扭曲。這種現(xiàn)象的本質(zhì),是因為基于 2D 的 AI 模型只是在進行像素級的二維變化預(yù)測,它們并不懂什么是真正的物理世界。

InSpatio-WorldFM 拋棄了純 2D 的學習路徑,將「三維多視圖一致性」作為內(nèi)容生成的核心約束機制。無論是在預(yù)計算階段還是實時推理中,模型都被強制要求理解并保持 3D 空間結(jié)構(gòu)的連貫性。



多視一致的生成模型

于是在 InSpatio-WorldFM 生成的世界里,物體不僅具備真實的物理體積,而且不會隨時間發(fā)生漂移或形變。它賦予了空間智能最稀缺的品質(zhì) —— 物理級的持久一致性。

InSpatio-WorldFM 在構(gòu)建 3D 世界時,可以保持生成的場景在時空上的持久一致性,無論在這個虛擬空間里轉(zhuǎn)多久,場景都不會像其他 AI 生成的視頻那樣崩壞變形,這對影視制作、游戲資產(chǎn)和具身智能來說是殺手級特性,證明了模型不是在「畫畫」,而是在「計算物理場」。由此生成的虛擬世界不再只是炫酷的視頻,而是直接為未來的機器人生準備的數(shù)以萬計的虛擬訓(xùn)練場。

這種 3D 機制突破了 2D 視頻模型的極限時空記憶,解決了世界模型一直以來頭疼的「長時序遺忘」和「空間幾何崩塌」問題。

實現(xiàn)高效率

InSpatio-WorldFM 構(gòu)建了輕量化與高效率的框架。通過基于幀的架構(gòu),輔以模型蒸餾和推理優(yōu)化技術(shù),影溯成功地壓縮了龐大的空間計算需求。影溯的目標是:在消費級 GPU 上實現(xiàn)實時的空間推理。這不僅能讓實時交互成為可能,更意味著空間智能將徹底走出數(shù)據(jù)中心,真正被部署到從機器人到 XR 眼鏡的各類端側(cè)設(shè)備中。



高效率低延遲的實時生成

顯式錨點 + 隱式記憶:實現(xiàn)空間記憶

空間智能的終極考驗在于「記憶」:如果一個機器人在轉(zhuǎn)頭的瞬間,就忘記了身后倉庫的布局和貨架的位置,那么高階規(guī)劃和自主導(dǎo)航就無從談起。為了解決這一痛點,InSpatio-WorldFM 創(chuàng)新地采用了一種「顯式錨點 + 隱式記憶」混合架構(gòu)設(shè)計

在該模型中,團隊利用前沿的前饋式重建技術(shù)生成顯式的物理空間錨點,為模型提供穩(wěn)固的 3D 結(jié)構(gòu)支撐。與此同時,模型會將參考幀作為生成模型內(nèi)部的隱式記憶。



這就像是讓 AI 擁有了「三維坐標體系」,不論鏡頭怎么轉(zhuǎn),生成場景的內(nèi)容都不會發(fā)生漂移和變化。

這種設(shè)計讓 AI 不僅能像神經(jīng)元一樣靈活思考,還能擁有幾何級別的嚴密記憶,確保了 AI 即使在跨越復(fù)雜視點、經(jīng)歷長時間推移后,依然能保持穩(wěn)定、高效且可擴展的空間推理能力。

在以往,視頻模型由于空間記憶限制,隨著時長延長,復(fù)雜度指數(shù)級上升,因此 Genie3 等世界模型能夠生成的時長有限。InSpatio-WorldFM 理論上生成的時長則是無限的。

除此以外,在訓(xùn)練數(shù)據(jù)上,影溯團隊利用自身在 SLAM(同步定位與建圖)、NeRF(神經(jīng)輻射場)和 3DGS 等領(lǐng)域的技術(shù)積累,能夠極低成本地合成海量高質(zhì)量的 3D 訓(xùn)練數(shù)據(jù),從而打破了 3D 訓(xùn)練數(shù)據(jù)極度匱乏的行業(yè)瓶頸。

正是得益于這些架構(gòu)的創(chuàng)新與底層數(shù)據(jù)的積累,從目前的一系列 demo 中可以看出,InSpatio-WorldFM 呈現(xiàn)出了很強的「工程可用性」。

這種創(chuàng)新與實用的并重,讓我們不得不把目光轉(zhuǎn)向影溯的核心團隊。

頂尖團隊下場創(chuàng)業(yè)

等了 20 年的「3D 時刻」

訓(xùn)練 3D 世界模型是一個極具挑戰(zhàn)的任務(wù),互聯(lián)網(wǎng)上存在海量的 2D 視頻數(shù)據(jù),但 3D 數(shù)據(jù)極其匱乏,另一方面,精通 3D 視覺與圖形學的人才長期以來極為稀缺。

在通往空間智能的 AI 終極賽道上,影溯選擇硬核的原生 3D 路線,其底氣源自核心團隊在 3D 領(lǐng)域 20 多年的技術(shù)積淀。

影溯的班底堪稱國內(nèi)空間計算領(lǐng)域「夢之隊」,由浙江大學計算機輔助設(shè)計與圖形系統(tǒng)全國重點實驗室(圖形學領(lǐng)域全球排名第三,僅次于斯坦福和 MIT)與原商湯科技 3D 視覺與混合現(xiàn)實團隊的頂尖專家組成:

其中創(chuàng)始人章國鋒為浙江大學求是特聘教授、國家杰青,前商湯數(shù)字空間事業(yè)群首席科學家。作為國內(nèi)空間計算領(lǐng)域的領(lǐng)軍人物,他在 SLAM(同步定位與建圖)和 3D 重建領(lǐng)域深耕已超過 20 年,是國內(nèi)空間計算領(lǐng)域公認的引領(lǐng)者。

聯(lián)合創(chuàng)始人兼 CTO 劉浩敏是前商湯研究總監(jiān)、浙大博士。他的一個重要成就是:曾主導(dǎo)實現(xiàn)了業(yè)內(nèi)首個手機端無標志 SLAM 商業(yè)系統(tǒng),比蘋果的 ARKit 和谷歌的 ARCore 早了整整 3 年。

隨著生成式 AI 的爆發(fā),3D 空間的重建與生成開始合流。影溯團隊敏銳地捕捉到了這個歷史性的「3D 時刻」,于 2025 年 7 月下場創(chuàng)業(yè),致力于打造屬于中國的 3D 世界模型。

在這場世界模型的狂歡中,影溯的目標是讓 AI 真正理解 3D 物理世界中的空間幾何、物理規(guī)則和因果關(guān)系,利用 3D 視覺和圖形學的底座,來實現(xiàn) AI 的升維,通向真正的世界模型。

基于團隊 20 多年的空間計算 / 智能的技術(shù)積累,影溯已經(jīng)構(gòu)建了一個三維場景重建與生成平臺,具備大尺度真實場景的快速掃描與重建生成能力,提供了從數(shù)據(jù)采集、場景生成、場景編輯到應(yīng)用開發(fā)的完整工具鏈,可通過無人機、全景相機甚至手機拍攝實現(xiàn)低成本純視覺三維重建和生成。

影溯構(gòu)建了一套行業(yè)內(nèi)獨有的「3D 數(shù)據(jù)升維引擎」:不盲目耗費海量算力,而是從現(xiàn)有的海量視頻抽取 3D 知識,用成熟的幾何約束工具鏈打破 3D 數(shù)據(jù)荒。這是大廠短期內(nèi)拿算力也砸不出來的能力,也是影溯的核心商業(yè)壁壘。

長期 3D 視覺和圖形學算法的積累、成熟的工程化工具鏈,構(gòu)成了影溯難以被輕易復(fù)制的技術(shù)護城河。他們用著相對少的資源,撬動了空間智能的未來。

結(jié)語

與 World Labs 選擇閉源的商業(yè)路徑不同,影溯從一開始便確立了開源共建的核心戰(zhàn)略,認為空間智能的未來不應(yīng)由單一企業(yè)定義,而應(yīng)由全球開發(fā)者共同創(chuàng)造。

InSpatio-WorldFM 推出之后,為了支持全球 AI 社區(qū)的共建,影溯團隊下一步計劃提供更豐富的技術(shù)細節(jié)。同時,擴展版模型,以及支持與動態(tài)世界實時交互的體驗應(yīng)用也將在不久后推出。

隨著 InSpatio-WorldFM 等開源空間智能模型的推出,生成模型、具身智能體和現(xiàn)實世界的機器人現(xiàn)在站在了全新的起跑線上。

AI 的下一個故事,才剛剛開始。

文中視頻鏈接:https://mp.weixin.qq.com/s/T3F7-xFx72KmZ9nkhdr2-w

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
她就是李谷一女兒,辭掉央視工作,專心照顧母親,如今46歲仍未婚

她就是李谷一女兒,辭掉央視工作,專心照顧母親,如今46歲仍未婚

白面書誏
2026-03-06 14:20:11
雷軍稱贊宇樹科技讓全球震撼,目前小米機器人也在擰螺絲了;海爾是小米的老師,真誠邀請周云杰到工廠參觀指導(dǎo)

雷軍稱贊宇樹科技讓全球震撼,目前小米機器人也在擰螺絲了;海爾是小米的老師,真誠邀請周云杰到工廠參觀指導(dǎo)

極目新聞
2026-03-06 13:46:51
中央一號文件定調(diào)!2026年起駐村全面常態(tài)化,機制大改農(nóng)民放心了

中央一號文件定調(diào)!2026年起駐村全面常態(tài)化,機制大改農(nóng)民放心了

李博世財經(jīng)
2026-03-05 17:01:00
中國股市大佬罕見發(fā)聲:炒股發(fā)財?shù)挠肋h只有一種人!僅分享這一次

中國股市大佬罕見發(fā)聲:炒股發(fā)財?shù)挠肋h只有一種人!僅分享這一次

股經(jīng)縱橫談
2026-03-06 20:09:27
軍統(tǒng)中統(tǒng)屢滲延安屢敗,戴笠坦言:因毛澤東身邊有位紅色福爾摩斯

軍統(tǒng)中統(tǒng)屢滲延安屢敗,戴笠坦言:因毛澤東身邊有位紅色福爾摩斯

嘮叨說歷史
2026-03-03 11:55:40
這是目前為止,我見過腰最細的女生,沒有之一

這是目前為止,我見過腰最細的女生,沒有之一

草莓解說體育
2026-03-03 19:15:05
全國人大代表陳瑋:建議將全面性教育納入基礎(chǔ)教育

全國人大代表陳瑋:建議將全面性教育納入基礎(chǔ)教育

界面新聞
2026-03-05 17:39:01
“中國,我的母親我來了!” 首批新加坡華人后代正退籍、賣房…

“中國,我的母親我來了!” 首批新加坡華人后代正退籍、賣房…

新加坡萬事通
2026-03-06 18:49:21
43歲張杰正式宣布退出!原因令人意外,周深的天終于亮了

43歲張杰正式宣布退出!原因令人意外,周深的天終于亮了

興史興談
2026-01-28 00:29:21
伊朗發(fā)出威力強大的宗教追殺令:要求全球穆斯林人人追殺美以元首

伊朗發(fā)出威力強大的宗教追殺令:要求全球穆斯林人人追殺美以元首

音樂時光的娛樂
2026-03-05 11:56:33
賈國龍不再擔任西貝CEO,有門店前店長稱多個崗位員工工資延遲發(fā)放通知已被撤回

賈國龍不再擔任西貝CEO,有門店前店長稱多個崗位員工工資延遲發(fā)放通知已被撤回

紅星新聞
2026-03-06 21:16:15
歐足聯(lián)官方:皇馬被罰15000歐+緩期一年單場比賽關(guān)閉部分看臺

歐足聯(lián)官方:皇馬被罰15000歐+緩期一年單場比賽關(guān)閉部分看臺

懂球帝
2026-03-06 18:36:38
中東還沒結(jié)束,亞太又出問題?朝鮮突發(fā)導(dǎo)彈,特朗普收到一封挑戰(zhàn)書

中東還沒結(jié)束,亞太又出問題?朝鮮突發(fā)導(dǎo)彈,特朗普收到一封挑戰(zhàn)書

策略述
2026-03-06 17:26:03
恢復(fù)神速!冬奧會嚴重受傷后不到1個月,林賽沃恩已重返健身房

恢復(fù)神速!冬奧會嚴重受傷后不到1個月,林賽沃恩已重返健身房

全景體育V
2026-03-06 20:25:59
西班牙議員:立刻退出北約,美國和以色列就是人類最大的威脅!

西班牙議員:立刻退出北約,美國和以色列就是人類最大的威脅!

達文西看世界
2026-03-06 11:39:26
劉國梁忍無可忍,道出與樊振東真實關(guān)系

劉國梁忍無可忍,道出與樊振東真實關(guān)系

孤傲何妨初
2026-03-07 03:37:55
巴方總統(tǒng)警告中國,中國要是敢反擊,巴拿馬就動手,后果自負!

巴方總統(tǒng)警告中國,中國要是敢反擊,巴拿馬就動手,后果自負!

有牙的兔紙
2026-03-06 13:59:12
河南企業(yè)家崔培軍:從年前風光發(fā)錢到年后意外轉(zhuǎn)折

河南企業(yè)家崔培軍:從年前風光發(fā)錢到年后意外轉(zhuǎn)折

三農(nóng)老歷
2026-03-06 19:52:06
革命衛(wèi)隊已事實獨立!伊朗外長這句話把世界看懵了

革命衛(wèi)隊已事實獨立!伊朗外長這句話把世界看懵了

鳳眼論
2026-03-04 07:41:50
貝克漢姆小兒子克魯茲被問及家中矛盾,表示想與大哥修復(fù)關(guān)系

貝克漢姆小兒子克魯茲被問及家中矛盾,表示想與大哥修復(fù)關(guān)系

懂球帝
2026-03-07 01:08:07
2026-03-07 06:12:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12430文章數(shù) 142578關(guān)注度
往期回顧 全部

科技要聞

獨家|除夕加班、毫無黑料!林俊旸無奈離場

頭條要聞

伊朗稱向美軍“林肯”號航母發(fā)射導(dǎo)彈

頭條要聞

伊朗稱向美軍“林肯”號航母發(fā)射導(dǎo)彈

體育要聞

跑了24年,他終于成為英超“最長的河”

娛樂要聞

周杰倫社交媒體曬昆凌,夫妻感情穩(wěn)定

財經(jīng)要聞

關(guān)于經(jīng)濟、股市等,五部門都說了啥?

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

游戲
時尚
家居
教育
數(shù)碼

曝下代Xbox靠純算力制霸!性能“爆殺”PS6

這些才是適合普通人的穿搭!搭配腰帶、多穿牛仔褲,簡單舒適

家居要聞

暖棕撞色 輕法奶油風

教育要聞

“縣城的最愛學這種課”,一段女兒當街走秀視頻,把人看尷尬了

數(shù)碼要聞

AYANEO Pocket AIR Mini x B.Duck小黃鴨聯(lián)名限定款掌機亮相

無障礙瀏覽 進入關(guān)懷版