国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

圓桌|世界模型的“前世今生”與終局猜想

0
分享至

至今,科技圈對“世界模型”仍未給出一個標準定義。但這不妨礙它成為當下最性感的敘事:

在VC眼中,它是驗證商業(yè)閉環(huán)的終極沙盤;在具身智能賽道,它是讓機器人學會“走一步看三步”的預判大腦;而在元宇宙的廢墟之上,它被視為信息載體從2D視頻向3D交互世界躍遷的最后一塊拼圖。

就在1月23日,據(jù)彭博社報道,李飛飛正在就其創(chuàng)辦的初創(chuàng)公司 World Labs 進行新一輪融資洽談,目標估值約為 50 億美元。

在這個概念還未被祛魅的時刻,中關村早期投資論壇找到幾位不同背景的先行者。他們不談虛無的共識,只求在視角的碰撞中,厘清這波AI新浪潮的真實商業(yè)脈絡。

由雷峰網(wǎng)總編輯林覺民主持的一場圓桌論壇上,英諾科創(chuàng)基金合伙人王晟、流形空間創(chuàng)始人武偉、VAST創(chuàng)始人宋亞宸以及千訣科技合伙人蔣屹舟齊聚一堂。這場對話并非為了尋求某種平庸的共識,而是旨在呈現(xiàn)出一場關于世界模型討論。


圓桌論壇現(xiàn)場

以下是本次圓桌的深度對話實錄:

林覺民:請各位做一下簡單的自我介紹。


雷峰網(wǎng)總編輯林覺民

武偉: Manifold AI(流形空間),去年6月剛成立,專注世界模型,目前主攻具身大腦落地,用在機械和無人機上。

宋亞宸:VAST創(chuàng)始人,做AI 3D大模型,服務游戲、動畫、影視這些需要"造世界"的場景。

蔣屹舟:千訣科技合伙人,今天本來是師兄(CEO)來,我們師兄弟三人一起創(chuàng)業(yè),我臨時頂包。我們做家居場景的通用機器人類腦大腦,用類腦技術做決策和感知。

一、 概念定義:從仿真到預測

林覺民:聽說這場圓桌本來是要"干仗"的,主要是目前行業(yè)內(nèi)對于“世界模型”尚未形成統(tǒng)一的定義,有人要做具身智能的世界模型,有人做數(shù)字空間的,Google Gemini3 又是一派。所以今天我們不凝聚共識,就各抒己見,百家爭鳴。

王晟(英諾科創(chuàng)基金):

我們將世界模型視為特定領域內(nèi)逼近“Ground Truth(地面真值)”的模擬系統(tǒng)。

它不一定要在物理上100%復刻真實世界,而是要定義一個“域(World)”,比如醫(yī)療、法律或具身智能領域。在這個域中,模型能夠模擬出符合客觀規(guī)律的反饋。以醫(yī)療為例,如果模型能準確模擬出病人服藥后的生理指標變化,且無限接近真實結(jié)果,它就是該領域的優(yōu)秀世界模型。其核心價值在于提供準確的反饋(Reward),強化AI的學習效率。


英諾科創(chuàng)基金創(chuàng)始人王晟

武偉(流形空間):

我們的定義包含兩個關鍵詞:模擬與交互。即“用模擬的方式實現(xiàn)泛化的交互”。

目前行業(yè)內(nèi)主要有三個流派:1.仿真器派: 如英偉達,主要用于云端合成數(shù)據(jù),輔助智能體訓練;2.通用交互界面派: 如Google Gemini、World Labs,打造開放的可交互數(shù)字環(huán)境,偏向娛樂應用;3.具身大腦派(我們所選路線): 讓機器人具備內(nèi)生的推理和想象能力。不僅是模仿動作,而是通過大腦推演“如果我這樣做,世界會發(fā)生什么變化”,從而指導實際操作。


流形空間創(chuàng)始人 武偉

林覺民:Manifold和蔣總都是做“大腦”的,我們現(xiàn)在是哪個路線,以及為什么要選擇這樣的路線?

武偉(流形空間):

準確說是foundation model 派 vs 內(nèi)腦架構(gòu)派。我們把世界模型當作機器人原生的 foundation model,建模物理空間移動和操作的內(nèi)生認知,用一段式或兩段式端到端實現(xiàn);千訣則是模擬人腦分區(qū),用多個小模型/skills組合來降低功耗。

這種差異純粹是團隊基因決定的——我們是晟總 PPT 里那批"CV 派+自動駕駛派",我 2015 年加入商湯干了十年,2021-2025 年在中國最早提出自動駕駛端到端和世界模型。這種背景讓我們必須 all in 端到端和數(shù)據(jù)的 scaling,而不是走小模型拼接的路線。

宋亞宸(VAST):

李飛飛 World Labs 的 BP 里唯一提到的公司就是我們,我還發(fā)給晟總偷看了。她定義世界模型三大場景:3D 生成、XR 空間智能、機器人——前兩個才是重點。

Luma(我們老同行,做 AI 3D 轉(zhuǎn)去做世界模型)剛?cè)诹?9 億美金,比李飛飛還多,估值 40 億。這說明世界模型確實是 AI 終局,但分兩層:一層是具身智能讓機器人替代人類,這層很可怕——作為文科生,要是會寫小說,未來就是恐怖片。

另一層更重要:勞動力被解放后,人最終只能卷創(chuàng)意本身。當 AI 3D 讓人"造萬物"、AI Coding 讓人"定規(guī)則",每個人都能零門檻創(chuàng)造虛擬世界——重力可以不是 9.8,你可以飛、可以重寫社會規(guī)則。這就是馬良的神筆,人人為我、我為人人的"天堂"。

未來人的價值,就看你創(chuàng)造的世界里別人愿意花多少時間。AI 讓人像神一樣創(chuàng)造世界級體驗,這才是世界大模型的終局意義。


VAST創(chuàng)始人宋亞宸

林覺民:您這就是想造個"言出法隨"的東西?

宋亞宸(VAST):必然的!未來每個人心想事成、言出法隨,就是馬良的神筆。

林覺民:快過年了,這話太應景了,不過宋總確實站得高,不僅是李飛飛 BP 里唯一提到的公司,他自己也是 MiniMax 早期創(chuàng)始人,剛才直接把世界模型定義成了整個 AI 的終局。

蔣屹舟(千訣科技):

其實早年實驗室看世界模型,核心在于"理解世界"而非預測——就像牛頓看蘋果落地能推導出萬有引力公式,或者AI只讀文字就能畫出世界地圖,這是一種對物理規(guī)律的底層抽象。

后來李飛飛帶火了"預測世界",我們起初覺得"又來吹牛了",這不就是十年前強化學習里用的"視頻預測"換了個名字嗎?但后來發(fā)現(xiàn)對機器人確實關鍵——沒有理解就無法外推,比如疊大小不同的衣服,這種細微差別很難人工建模,必須讓模型具備底層認知才能做預測。

我們走類腦路線(非端到端的小模型組合),因為機器人不像GPT可以"思考十分鐘",人看到機器人在等待會很痛苦。所以世界模型對我們來說是"一步三算、一步十算",像CPU分支預測一樣提前推演各種可能性分支(比如回家打掃時遇到不同情況該怎么走),現(xiàn)在主要用于決策環(huán)節(jié),讓機器人具備真正的實時反應能力。


千訣科技創(chuàng)始人蔣屹舟

林覺民:所以蔣總我們其實已經(jīng)把世界模型用在現(xiàn)實生活中了是嗎?

蔣屹舟:對,目前用的更多可能是決策環(huán)節(jié),因為我們的決策是能夠一步三算的。

林覺民:李飛飛吹牛不怕,只要能實現(xiàn),這個東西還是一個很好的愿景。

二、 技術路線:端到端 VS 類腦架構(gòu)

林覺民:世界模型路線五花八門,最后拼什么才能跑出來?

王晟(英諾科創(chuàng)基金):這個問題挺復雜的,世界模型現(xiàn)在更多是投資共識的"標簽"——就像之前必須投"具身智能"一樣,現(xiàn)在必須投"基于世界模型的具身智能",這樣才好交流、好決策。但細節(jié)層面其實一團亂麻,每家定義都不同,我作為投資人可以接受任何聽起來合理的定義。

真正決定勝負的只有一點:你能不能建立一套接近 ground truth 的驗證/仿真系統(tǒng),能源源不斷產(chǎn)出高質(zhì)量數(shù)據(jù)。 在 scaling law 的暴力美學下,數(shù)據(jù)是核心燃料,尤其在具身領域,corner case 數(shù)據(jù)直接決定機器人會不會像自動駕駛一樣出事故。這套系統(tǒng)產(chǎn)出的數(shù)據(jù)必須夠 scale、夠真實(能給你準確的 reward),同時分布均衡(稠密和稀疏性平衡),才能訓練出既不過擬合也不稀疏的模型——核心還是歸到數(shù)據(jù)。

林覺民:武總是做“大腦”的,過去一個月發(fā)了兩個大腦模型,都宣稱自己是世界第一,想請武總聚焦具身大腦領域回答一下。

武偉(流形空間):

商業(yè)公司活路就兩條:要么 Day 1 有健康現(xiàn)金流,要么燒錢但增長快、天花板高。世界模型顯然屬于后者,關鍵看三點:找對落地場景、增長夠快、天花板夠高。

我們選具身大腦作為第一個產(chǎn)品化方向。做個思維游戲:人從出生到 18 歲,眼睛大概收集 300 萬 clips;掌握 2000 個工種,再攢 3 億 clips。人類一輩子能收集的數(shù)據(jù)天花板約 10 億 clips。 如果能用 10 億 clips 訓出世界模型,達到人的智能化上限——簡單任務零樣本泛化,復雜任務幾十個樣本學會——這就是世界模型的終極天花板,商業(yè)價值極高。

倒推回來,做世界模型公司怎么 survive?快速收集 10 億高質(zhì)量數(shù)據(jù)、找到能 pre-train 的架構(gòu)、泛化到零樣本/少樣本的應用場景——這三件事做到,就能在具身大腦這個狹窄賽道里跑出來。

宋亞宸(VAST):

為什么今天大家都在談論世界模型?并不是因為AI技術突然成熟了,也不是因為具身智能到了某個時間點。根本原因在于,人類的信息載體正在經(jīng)歷一場終極升維。

回顧人類歷史,我們其實一直在做一件事:對“真實世界”進行壓縮。

在文字誕生前的史前文明(如良渚文化),人類接觸的是直接的、3D的大自然,那是“原文件”。后來為了便于傳播,我們不得不將這些3D體驗“壓縮”——先是壓縮成文字(龜殼刻字),再是圖片,直到1889年我們發(fā)明了視頻。視頻本質(zhì)上依然是對3D世界的一種“ZIP壓縮包”。

當信息密度越低(如文字),傳播越容易;當帶寬和算力提升,我們才開始普及圖片和視頻。而到了AI時代,基礎設施終于足以支撐我們解壓這個“壓縮包”,讓我們重新回到3D和世界本身。

所以,世界模型不是新物種,而是信息載體的“復原”。我們終于有能力不再處理壓縮后的視頻,而是直接以3D原文件作為媒介。這才是世界模型出現(xiàn)的真正意義。

林覺民:這個相當于是對信息的利用效率?

宋亞宸:本質(zhì)是傳播成本決定載體形式——信息密度越低越易傳播,所以龜殼時代只能刻字,互聯(lián)網(wǎng)時代能傳圖文視頻。而 3D 或世界本身,才是我們最終的信息載體。

蔣屹舟(千訣科技):

我們認為世界模型不局限于視覺——盲人操作物體靠的不是看,而是對物理因果的理解(知道動作會帶來什么后果,進而影響下一步?jīng)Q策)。這種對因果關系的把握才是核心。

類腦路線采用非端到端架構(gòu),最大優(yōu)勢是不需要暴力堆數(shù)據(jù)?,F(xiàn)在 VLA 很頭疼的是必須靠機械臂瘋狂采集或仿真訓練,而我們認為可以用人類判斷代替——比如抓取物體,不必讓機械臂試成千上萬次,直接讓人判斷"人會怎么抓",把這套理解喂給模型就夠了。

另外,世界模型也不一定要理解整個自然世界,人類構(gòu)建的抽象世界也算——語言就是人對世界的最根本抽象,LLM 已經(jīng)證明了這一點。所以只要在任意層面具備對世界的理解和預測能力,就是世界模型。我們的工作會在各個模型里融入這種思路,不局限于單一技術路線。(雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng))

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
繞道阿曼!迪拜機場關閉后,滯留游客曲線回國:轉(zhuǎn)機3次,耗時四五十個小時

繞道阿曼!迪拜機場關閉后,滯留游客曲線回國:轉(zhuǎn)機3次,耗時四五十個小時

每日經(jīng)濟新聞
2026-03-02 18:10:27
這個死磕王楚欽的裁判,決賽就沒讓她上場

這個死磕王楚欽的裁判,決賽就沒讓她上場

楊仔述
2026-03-02 11:13:02
演員于某在北京被抓

演員于某在北京被抓

老吳教育課堂
2026-03-02 20:13:46
向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

談史論天地
2026-02-10 08:16:24
韓國網(wǎng)紅博主上海旅游被宰客?一頓火鍋花了177萬韓幣!

韓國網(wǎng)紅博主上海旅游被宰客?一頓火鍋花了177萬韓幣!

奮斗在韓國
2026-03-02 11:00:03
哈梅內(nèi)伊遇害后,特朗普為啥還要打四周?美以準備“補槍”?

哈梅內(nèi)伊遇害后,特朗普為啥還要打四周?美以準備“補槍”?

上觀新聞
2026-03-02 20:27:08
上海電影院現(xiàn)場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

上海電影院現(xiàn)場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

靜若梨花
2026-03-01 16:25:46
熬了800多天,從660萬降到345.8萬!深圳一業(yè)主賣房經(jīng)歷引關注

熬了800多天,從660萬降到345.8萬!深圳一業(yè)主賣房經(jīng)歷引關注

火山詩話
2026-03-02 06:08:24
美軍B2轟炸機空襲伊朗導彈設施

美軍B2轟炸機空襲伊朗導彈設施

財聯(lián)社
2026-03-02 01:22:05
為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

越過海面
2026-03-02 09:54:46
街頭,伊朗人悲傷地跳了起來?

街頭,伊朗人悲傷地跳了起來?

關爾東
2026-03-01 23:02:58
603966,控制權擬變更!無錫市新吳區(qū)人民政府入主!明天復牌

603966,控制權擬變更!無錫市新吳區(qū)人民政府入主!明天復牌

證券時報e公司
2026-03-02 21:18:48
以色列警告中國導彈!以色列說讓埃及撤下中國的導彈

以色列警告中國導彈!以色列說讓埃及撤下中國的導彈

安安說
2026-03-01 10:09:28
“戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

“戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

流史歲月
2026-01-26 10:58:30
你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

帶你感受人間冷暖
2026-01-29 00:10:05
視頻|世界多地爆發(fā)反美以游行 多國民眾譴責侵略行徑

視頻|世界多地爆發(fā)反美以游行 多國民眾譴責侵略行徑

國際在線
2026-03-01 20:15:30
又貴又臭!沒你4戰(zhàn)全勝,有你2戰(zhàn)全輸....

又貴又臭!沒你4戰(zhàn)全勝,有你2戰(zhàn)全輸....

柚子說球
2026-03-01 20:48:58
汪小菲要把滿月兒子綁在身上坐飛機?馬筱梅急了:干脆放籃子里!

汪小菲要把滿月兒子綁在身上坐飛機?馬筱梅急了:干脆放籃子里!

喜歡歷史的阿繁
2026-03-02 09:51:13
1986年陳永貴病逝,追悼會規(guī)格成難題,鄧小平只說了一句話,全場安靜

1986年陳永貴病逝,追悼會規(guī)格成難題,鄧小平只說了一句話,全場安靜

寄史言志
2026-01-04 16:34:31
一位腫瘤醫(yī)生的忠告:這世上除了生死,都是小事

一位腫瘤醫(yī)生的忠告:這世上除了生死,都是小事

洞見
2026-02-28 21:27:24
2026-03-02 22:04:49
雷峰網(wǎng) incentive-icons
雷峰網(wǎng)
關注智能與未來!
68618文章數(shù) 656082關注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

伊朗公布最新戰(zhàn)況 通報還披露內(nèi)塔尼亞胡行蹤

頭條要聞

伊朗公布最新戰(zhàn)況 通報還披露內(nèi)塔尼亞胡行蹤

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

家居
房產(chǎn)
親子
健康
教育

家居要聞

萬物互聯(lián) 享科技福祉

房產(chǎn)要聞

方案突然曝光!海口北師大附校,又有書包大盤殺出!

親子要聞

姐姐比弟弟大6歲,有個弟弟真好,能給姐姐撐腰了

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

免費課后 上精品課

無障礙瀏覽 進入關懷版