国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

首個微觀世界模型MicroVerse來了,AI開始模擬看不見的世界

0
分享至



過去兩年,世界模型(World Model)正在成為大模型演進(jìn)的重要方向。

從具身智能到自動駕駛,研究者希望 AI 不再只是理解數(shù)據(jù),而是能夠在內(nèi)部構(gòu)建一個可預(yù)測、可推演的 “世界”。模型學(xué)會物體如何運(yùn)動、環(huán)境如何變化,甚至能夠在行動發(fā)生之前完成模擬。

但一個關(guān)鍵盲區(qū)始終存在:今天幾乎所有世界模型,理解的都是 “人類肉眼可見的世界”。

街道、人物、機(jī)械運(yùn)動可以被成功建模,而一旦尺度縮小到細(xì)胞、組織乃至分子層級,現(xiàn)有模型往往只是在生成視覺紋理,而非真實過程本身。

  • 細(xì)胞分裂為何發(fā)生?
  • 蛋白結(jié)構(gòu)如何變化?
  • 微觀系統(tǒng)中的動態(tài)規(guī)律如何長期演化?
  • 這些問題背后需要的,不只是生成能力,而是機(jī)制級模擬能力。

然而,微觀世界建模面臨著截然不同的挑戰(zhàn):尺度跨度巨大、動態(tài)過程高度復(fù)雜、真實數(shù)據(jù)稀缺,同時還必須滿足物理與生物約束。

在這樣的背景下,本文提出MicroVerse— 一個面向微觀世界(Micro-World)的模擬框架,嘗試讓生成模型首次從 “宏觀場景建模” 走向微尺度科學(xué)過程模擬。

與傳統(tǒng)視頻生成不同,MicroVerse 的目標(biāo)并非生成更逼真的畫面,而是回答一個更根本的問題:AI 能否像科學(xué)模擬系統(tǒng)一樣,理解并重建微觀世界的運(yùn)行機(jī)制?

這一工作將世界模型的研究邊界,從可見世界進(jìn)一步推進(jìn)到了不可見尺度。



  • 論文標(biāo)題:MicroVerse: A Preliminary Exploration Toward a Micro-World Simulation
  • 論文鏈接:https://arxiv.org/abs/2603.00585
  • Github:https://github.com/FreedomIntelligence/MicroVerse

現(xiàn)狀:為何我們需要微觀世界的 “模擬器”?

在宏觀世界,我們可以通過攝像頭記錄一切。但在微觀尺度,生命活動的本質(zhì) — 從血液流動的物質(zhì)交換到 DNA 的精密復(fù)制 — 都發(fā)生在肉眼不可見的方寸之間。



微觀模擬的意義遠(yuǎn)非 “視覺奇觀”,它是理解生命運(yùn)作的鑰匙:

  • 加速科學(xué)洞察:如果能精準(zhǔn)模擬免疫細(xì)胞如何識別并攻擊癌細(xì)胞的過程,研究人員就能更直觀地觀察復(fù)雜的細(xì)胞交互,輔助驗證生物學(xué)假設(shè)。
  • 降低實驗成本:傳統(tǒng)的顯微實驗成本高昂且變量難以控制,通過 AI 生成具有物理保真度的視頻,可以預(yù)先篩選出有研究價值的動態(tài)場景。
  • 教育與科普:手工動畫高度依賴藝術(shù)表達(dá),難以做到科學(xué)動態(tài)的實時交互。AI 模擬器能讓學(xué)生在虛擬實驗室里 “親眼” 看見生命過程的每一個細(xì)節(jié)。

盡管學(xué)術(shù)界近期涌現(xiàn)出諸如MedOS [1](聚焦手術(shù)機(jī)器人的臨床感知與動作決策)、CLARITY [2](側(cè)重腫瘤演化軌跡的抽象潛空間建模)以及MeWM [3](致力于術(shù)后 CT 影像的視覺預(yù)測)等優(yōu)秀的醫(yī)學(xué)世界模型,但其核心大多錨定于宏觀層面的臨床決策支持或醫(yī)療影像模擬,本質(zhì)上是服務(wù)于診療邏輯的 “預(yù)言機(jī)”。與之不同的是,我們關(guān)注的是分子與細(xì)胞層面的微觀世界模型,而這一領(lǐng)域目前的視頻生成范式正面臨嚴(yán)重的效能危機(jī)。研究團(tuán)隊對比發(fā)現(xiàn),當(dāng)要求生成 “細(xì)胞分裂” 或 “DNA 復(fù)制” 時,SOTA 模型雖然畫面精美,卻存在三大致命硬傷:

1.違反物理結(jié)構(gòu):血管紋理反自然,細(xì)胞器排布雜亂。

2.生物形態(tài)錯誤:模擬 RNA 時產(chǎn)生錯誤的形變,DNA 鏈條隨意斷裂。

3.時間動態(tài)不一致:例如在模擬細(xì)胞有絲分裂時,細(xì)胞核會憑空消失,過程完全不符合生物學(xué)邏輯。

一句話總結(jié):AI 生成的微觀視頻 “像真的”,但機(jī)制全錯了。它們只學(xué)習(xí)了宏觀視覺統(tǒng)計,未學(xué)習(xí)微觀物理規(guī)律。

MicroWorldBench:給微觀視頻立下 “科學(xué)規(guī)矩”

為了糾正視頻生成模型在微觀世界的 “信口開河”,研究團(tuán)隊提出了 MicroWorldBench — 這是全球首個針對微觀生物模擬的量表化評測基準(zhǔn)。



如果說以前的視頻評測是看 “電影感”,那么 MicroWorldBench 就是一場嚴(yán)苛的“生物奧林匹克競賽”。它不再滿足于畫面是否高清,而是要給每一幀畫面進(jìn)行 “切片檢查”。

層次分明的 “考題” 設(shè)計

研究團(tuán)隊從數(shù)萬個候選任務(wù)中,精選出459 項核心模擬任務(wù),構(gòu)建了一個跨越尺度的三層模擬體系:

  • 器官級(Organ-level):生理功能的 “動力學(xué)”
  • 考題示例:模擬心臟瓣膜在不同壓力下的啟閉,或者肺泡內(nèi)壁紅細(xì)胞的氧氣交換。
  • 核心難度:要求 AI 理解流體力學(xué)與組織形變的配合,不能只是 “亂顫”,必須有規(guī)律。
  • 細(xì)胞級(Cell-level):生命律動的 “社交學(xué)”
  • 考題示例:模擬白細(xì)胞如何在復(fù)雜的趨化因子引導(dǎo)下,穿過血管壁抵達(dá)炎癥現(xiàn)場(跨內(nèi)皮遷移)。
  • 核心難度:AI 需要模擬出細(xì)胞偽足的延伸、細(xì)胞體的擠壓形變,這考驗的是模型對生物柔性體動力學(xué)的理解。
  • 亞細(xì)胞級(Subcellular-level):生命底層的 “精密機(jī)械”
  • 考題示例:DNA 復(fù)制叉的推進(jìn)、線粒體的融合與分裂、細(xì)胞凋亡時的膜泡化(Blebbing)。
  • 核心難度:這是最精微的視角,要求極高的保真度。AI 必須準(zhǔn)確還原分子層面的信號級聯(lián),稍有差錯,在生物學(xué)上就是 “物種變異”。

專家級 “監(jiān)考官”:拒絕視覺欺騙

為了確保評分的權(quán)威性,MicroWorldBench 引入了LLM + 領(lǐng)域?qū)<业穆?lián)合評審機(jī)制:

1.科學(xué)真實性(Scientific Fidelity):這是 “一票否決權(quán)”。專家制定了極細(xì)的加權(quán)規(guī)則,比如:模擬有絲分裂時,如果中期染色體沒有在赤道板對齊,畫質(zhì)再好也要打低分。

2.視覺質(zhì)量(Visual Quality):評估視頻是否存在閃爍、噪點,是否達(dá)到了實驗室級的顯微成像質(zhì)感。

3.指令一致性(Instruction Following):測試 AI 能否精準(zhǔn)響應(yīng)復(fù)雜指令,如 “生成一段受損肝細(xì)胞自我修復(fù)的微觀過程”。

扎心的真相:視覺巨人,科學(xué)矮子



在 MicroWorldBench 的嚴(yán)苛審視下,一個殘酷的現(xiàn)狀浮出水面:當(dāng)前最頂尖的視頻生成模型,正陷入一種“像素級真實,機(jī)制級崩塌”的尷尬境地。

視覺高分,科學(xué)低分:它們能生成令人驚嘆的景深效果、細(xì)膩的細(xì)胞質(zhì)感和真實的顯微光影。在涉及因果律和生物邏輯的環(huán)節(jié),這些模型表現(xiàn)得像個 “只會臨摹的畫家,卻不懂解剖學(xué)的醫(yī)生”;

宏觀統(tǒng)計規(guī)律無法推導(dǎo)微觀物理約束:當(dāng)前模型本質(zhì)上是在學(xué)習(xí)像素流的統(tǒng)計關(guān)聯(lián)。在宏觀世界,人類活動的數(shù)據(jù)量極其龐大,AI 能夠通過 “暴力學(xué)習(xí)” 摸清重力和慣性的規(guī)律。但在微觀世界,由于缺乏龐大的數(shù)據(jù),AI 只能用宏觀的 “視覺經(jīng)驗” 去強(qiáng)行解釋微觀的 “生物邏輯”,導(dǎo)致了嚴(yán)重的科學(xué)偏差。

MicroVerse:從 “像素畫師” 向 “微觀世界模型” 的進(jìn)化

MicroWorldBench 的意義在于確立了一個科學(xué)的秩序:視頻生成的下一場革命,不再是分辨率的競賽,而是世界知識嵌入的競賽。研究者指出,如果不能在模型底層引入物理約束與領(lǐng)域知識監(jiān)督,AI 將永遠(yuǎn)停留在 “特效模擬” 階段,而無法成為真正的 “科學(xué)模擬器”。

如果說此前的視頻模型只是在 “畫出” 生命的形狀,那么 MicroVerse 則是試圖在比特世界里 “重建” 生命的算法。

MicroSim-10K:為 AI 補(bǔ)齊缺失的 “微觀常識”

任何世界模型的預(yù)測能力都受限于其 “認(rèn)知邊際”。MicroVerse 的核心基石是MicroSim-10K— 這是全球首個專注于微觀機(jī)制的大規(guī)模專家級數(shù)據(jù)集。

  • 從像素統(tǒng)計轉(zhuǎn)向機(jī)制對齊:9,601 段視頻均經(jīng)專家驗證。它強(qiáng)制 AI 過濾掉宏觀世界的重力、慣性等常識,轉(zhuǎn)而學(xué)習(xí)微觀尺度的流體動力學(xué)、細(xì)胞膜張力以及分子擴(kuò)散規(guī)律。
  • 高密度的語義監(jiān)督:每段視頻配備了“機(jī)制級標(biāo)注”的描述并非簡單的視覺標(biāo)簽。例如,它不再簡單標(biāo)注 “一些顆粒在移動”,而是會明確告訴模型:“當(dāng)偵測到病原體入侵,免疫細(xì)胞會迅速極化并延伸出偽足,像‘獵人’一樣追蹤并精準(zhǔn)包裹住游走的細(xì)菌。” 這種精準(zhǔn)的語義引導(dǎo),讓模型在生成的瞬間,就完成了從視覺信號到生物邏輯的映射。

架構(gòu)演進(jìn):從 “視覺模仿” 到 “動力學(xué)推演”

在模型層面,MicroVerse 通過引入初級的物理約束與領(lǐng)域知識監(jiān)督,實現(xiàn)了生成表現(xiàn)的跨越:



  • 科學(xué)保真度的定向演化:在最復(fù)雜的細(xì)胞級模擬中,MicroVerse 取得了 53.3 的高分。這意味著模型不再是胡亂拼湊像素塊,而是開始呈現(xiàn)出具有生物學(xué)意義的動態(tài)機(jī)制,如細(xì)胞在遷移過程中的自適應(yīng)形變邏輯。



  • Scaling Law 驗證:實驗證明,隨著模型參數(shù)擴(kuò)展至14B,模型對信號級聯(lián)反應(yīng)等極高復(fù)雜過程的理解出現(xiàn)了明顯的 “性能涌現(xiàn)”。這種擴(kuò)展性意味著 MicroVerse 有潛力成為一個可無限加載科學(xué)知識的數(shù)字生命底座。

突破:從 “特效” 到 “科學(xué)模擬” 的 POC

通過對比可以直白地看到 MicroVerse 帶來的改變,它將視頻生成從 “視覺游戲” 變成了真正的概念驗證(POC):

  • DNA 復(fù)制:通用模型生成的往往只是無規(guī)則旋轉(zhuǎn)的絲帶,而 MicroVerse 能夠精準(zhǔn)還原解旋酶推進(jìn)、引物結(jié)合以及新鏈合成的動態(tài)秩序。
  • 細(xì)胞凋亡:在模擬這一程序化死亡過程時,它不再是模糊的淡出,而是能細(xì)膩呈現(xiàn)出細(xì)胞膜起泡(Blebbing)、染色質(zhì)固縮等一系列具有病理學(xué)意義的特征。

這些突破證明:生成模型可以被引導(dǎo)去學(xué)習(xí)生命過程的底層物理與生物規(guī)律。

結(jié)論:從可見的 “物理世界” 邁向不可見的 “生命引擎”

視頻生成技術(shù)已經(jīng)能夠逼真地重現(xiàn)人類社會的街景與繁華,但生命最核心的奧秘,始終隱藏在那些肉眼不可見、規(guī)律極其復(fù)雜的微尺度動態(tài)之中。

MicroVerse 的意義,絕不僅僅在于它生成了幾段高清的生物視頻,而在于它在生成式 AI 與嚴(yán)謹(jǐn)科學(xué)模擬之間,強(qiáng)行破開了一道通往未來的裂縫:

  • 確立了科學(xué)模擬的新秩序:通過MicroWorldBench,研究團(tuán)隊第一次為 AI 定義了何為 “微觀世界的科學(xué)正確”;
  • 構(gòu)建了生命知識的數(shù)字基底:MicroSim-10K證明了,只要喂給模型正確的 “真理”,AI 就能從像素的泥淖中掙脫,建立起對底層機(jī)制的直覺;
  • 完成了范式轉(zhuǎn)移的 POC:MicroVerse的成功,標(biāo)志著生成大模型正在從 “宏觀視覺統(tǒng)計” 向 “微觀機(jī)制模擬” 完成驚險的一跳。

這本質(zhì)上是一條從 “世界模型” 通往 “生命模型” 的必經(jīng)之路。當(dāng) AI 能夠精準(zhǔn)模擬細(xì)胞的律動與分子的呼吸,它就不再僅僅是作畫的工具,而是一個運(yùn)行在硅基芯片上的虛擬生命實驗場。

從觀察生命,到模擬生命,再到最終理解生命。微觀世界的生成時代,才剛剛開始。

作者介紹

本文的共同第一作者為王榮勝與吳銘昊,均來自香港中文大學(xué)(深圳)。兩位作者均在王本友教授的指導(dǎo)下進(jìn)行研究,王教授及其團(tuán)隊長期致力于語音與醫(yī)療大模型、自然語言處理和多模態(tài)學(xué)習(xí)等前沿領(lǐng)域的探索。

王榮勝,香港中文大學(xué)(深圳)一年級博士生,研究方向為可信醫(yī)療大模型與多模態(tài)生成。

吳銘昊,香港中文大學(xué)(深圳)數(shù)據(jù)科學(xué)學(xué)院一年級博士,研究方向為 LLM Agent 與視頻生成。曾在 NeurIPS, ICLR 發(fā)表論文。

相關(guān)工作

[1] Yang Y, Wang Z Y, Liu Q, et al. Medical world model: Generative simulation of tumor evolution for treatment planning [J]. arXiv preprint arXiv:2506.02327, 2025.

[2] Ding T, Zou Y, Chen C, et al. CLARITY: Medical World Model for Guiding Treatment Decisions by Modeling Context-Aware Disease Trajectories in Latent Space [J]. arXiv preprint arXiv:2512.08029, 2025.

[3] Wu Y C, Yin M, Shi B, et al. MedOS: AI-XR-Cobot World Model for Clinical Perception and Action [J]. medRxiv, 2026: 2026.02. 18.26345936.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
起售價6.58萬元!零跑A10正式上市 配備激光雷達(dá)

起售價6.58萬元!零跑A10正式上市 配備激光雷達(dá)

CNMO科技
2026-03-26 20:26:04
85萬元買的瑪莎拉蒂汽車故障后更換發(fā)動機(jī),6年后車主才發(fā)現(xiàn)4S店換上的是老舊拆車件!法院判了:構(gòu)成欺詐

85萬元買的瑪莎拉蒂汽車故障后更換發(fā)動機(jī),6年后車主才發(fā)現(xiàn)4S店換上的是老舊拆車件!法院判了:構(gòu)成欺詐

揚(yáng)子晚報
2026-03-26 22:51:04
圈內(nèi)大佬剛內(nèi)涵潛規(guī)則,關(guān)曉彤鹿晗分手原因就上熱搜,真瞞不住了

圈內(nèi)大佬剛內(nèi)涵潛規(guī)則,關(guān)曉彤鹿晗分手原因就上熱搜,真瞞不住了

情感大頭說說
2026-03-26 10:12:47
上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脫...

上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脫...

黃河新聞網(wǎng)呂梁
2026-03-26 15:14:06
奔馳官宣:S級將在華投產(chǎn)!在2026年底

奔馳官宣:S級將在華投產(chǎn)!在2026年底

網(wǎng)上車市
2026-03-26 21:41:53
微信直接能用!騰訊這只小龍蝦,幫我找到了最強(qiáng)股市薅羊毛姿勢

微信直接能用!騰訊這只小龍蝦,幫我找到了最強(qiáng)股市薅羊毛姿勢

極客公園
2026-03-25 12:08:53
上海一女子“閃婚”拿到價值近千萬房產(chǎn)99%份額,“閃離”后起訴分割房產(chǎn),法院判了!

上海一女子“閃婚”拿到價值近千萬房產(chǎn)99%份額,“閃離”后起訴分割房產(chǎn),法院判了!

環(huán)球網(wǎng)資訊
2026-03-26 08:13:14
震驚!聊天框打出“飛機(jī)”,華為是民航客機(jī),蘋果是螺旋槳小飛機(jī)

震驚!聊天框打出“飛機(jī)”,華為是民航客機(jī),蘋果是螺旋槳小飛機(jī)

火山詩話
2026-03-26 09:43:22
這曾經(jīng)是多少男人心中女神,她竟然這么蒼老,真是歲月不饒人呀

這曾經(jīng)是多少男人心中女神,她竟然這么蒼老,真是歲月不饒人呀

東方不敗然多多
2026-03-27 00:11:10
和老伴在四川成都住了半年,實話實說:跟網(wǎng)上評價的完全不一樣

和老伴在四川成都住了半年,實話實說:跟網(wǎng)上評價的完全不一樣

楓塵余往逝
2026-03-27 01:46:08
航班在美國發(fā)生事故后加拿大航空公司CEO僅用英語發(fā)表講話,加總理批:我非常失望

航班在美國發(fā)生事故后加拿大航空公司CEO僅用英語發(fā)表講話,加總理批:我非常失望

環(huán)球網(wǎng)資訊
2026-03-26 18:26:42
張雪峰的財產(chǎn)幾個億,竟然沒買車,天天吃外賣,生活簡樸到極致

張雪峰的財產(chǎn)幾個億,竟然沒買車,天天吃外賣,生活簡樸到極致

魔都姐姐雜談
2026-03-25 15:59:12
外資大撤退:亞洲股市遭遇2009年以來...

外資大撤退:亞洲股市遭遇2009年以來...

新浪財經(jīng)
2026-03-27 01:06:32
獨家:某運(yùn)營商2025年營收幾乎0增長! 好日子快到頭了! 其實三大運(yùn)營商日子都那樣!

獨家:某運(yùn)營商2025年營收幾乎0增長! 好日子快到頭了! 其實三大運(yùn)營商日子都那樣!

新浪財經(jīng)
2026-03-24 22:43:29
伊朗獲得強(qiáng)援,又一中東國家下場,還是美國親自送上門的幫手

伊朗獲得強(qiáng)援,又一中東國家下場,還是美國親自送上門的幫手

墨道榮
2026-03-27 05:44:49
驚呆了!網(wǎng)傳某婦產(chǎn)醫(yī)院一少婦哭求醫(yī)生,改她兒子的血型鑒定書…

驚呆了!網(wǎng)傳某婦產(chǎn)醫(yī)院一少婦哭求醫(yī)生,改她兒子的血型鑒定書…

火山詩話
2026-03-26 11:40:00
臺積電突然斷供?直接甩出“稀土”,外媒:這才是真正的殺手锏!

臺積電突然斷供?直接甩出“稀土”,外媒:這才是真正的殺手锏!

瑛派兒老黃
2026-03-24 18:56:06
理解城市 | 開封文旅原來這樣“火”

理解城市 | 開封文旅原來這樣“火”

澎湃新聞
2026-03-26 12:58:34
西安某建筑公司全方位崩塌!

西安某建筑公司全方位崩塌!

黯泉
2026-03-26 18:49:04
浙江男子馬達(dá)加斯加開“手機(jī)網(wǎng)吧”爆火:全天候營業(yè),收費(fèi)1.5元/小時,每天約200人次來玩

浙江男子馬達(dá)加斯加開“手機(jī)網(wǎng)吧”爆火:全天候營業(yè),收費(fèi)1.5元/小時,每天約200人次來玩

極目新聞
2026-03-26 19:21:35
2026-03-27 06:40:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12608文章數(shù) 142594關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:對伊朗能源設(shè)施空襲再推遲10天

頭條要聞

特朗普:對伊朗能源設(shè)施空襲再推遲10天

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

游戲
數(shù)碼
健康
本地
公開課

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動,支持B70 / B65顯卡

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版