国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ICLR 2026|新版「圖靈測試」:當VLA走進生物實驗室

0
分享至



現(xiàn)有 VLA 模型的研究和基準測試多局限于家庭場景(如整理餐桌、折疊衣物),缺乏對專業(yè)科學場景(尤其是生物實驗室)的適配。生物實驗室具有實驗流程結構化、操作精度要求高、多模態(tài)交互復雜(透明容器、數(shù)字界面)等特點,是評估 VLA 模型精準操作、視覺推理和指令遵循能力的理想場景之一。



近期,來自香港大學MMLAB 羅平老師團隊和上海交大穆堯老師團隊的工作——Autobio 正式被 ICLR 2026 接收,并獲得了 8-8-6-6 的同行評議分數(shù)。AutoBio 是一個面向數(shù)字化生物實驗室的機器人仿真系統(tǒng)與基準測試平臺。我們通過這篇工作,嘗試系統(tǒng)性回答一個關鍵問題:

當前主流的視覺 - 語言 - 動作(Vision-Language-Action, VLA)模型,是否已經(jīng)具備在真實生物實驗室中執(zhí)行實驗流程的能力?



  • 論文標題:AutoBio: A Simulation and Benchmark for Robotic Automation in Digital Biology Laboratory
  • 論文鏈接:https://openreview.net/forum?id=UUE6HEtjhu
  • 論文代碼:https://github.com/autobio-bench/AutoBio
  • https://huggingface.co/autobio-bench

一.研究背景:為何生物實驗室構成關鍵挑戰(zhàn)

與日常操作環(huán)境相比,生物實驗室在機器人自動化層面呈現(xiàn)出一組高度耦合的挑戰(zhàn):

首先,實驗操作通常具有長時序和強約束特征。即便單步動作相對簡單,其組合往往構成對順序一致性和狀態(tài)依賴高度敏感的完整實驗流程。

其次,實驗器材大多數(shù)為交互式,廣泛采用螺紋、卡扣、分檔旋鈕等精細機械結構,對位姿控制和軌跡規(guī)劃提出遠高于常規(guī)操作的要求。

此外,液體樣本與透明容器的普遍存在,對視覺感知提出了更大的挑戰(zhàn),而這類場景在現(xiàn)有仿真與評測體系中長期被簡化或忽略。

上述因素共同導致:即便在家庭或工業(yè)場景中表現(xiàn)良好的模型,也可能在實驗室任務中迅速失效。這一現(xiàn)象表明,現(xiàn)有基準并不足以反映模型在科研場景下的真實能力邊界。



二.AutoBio 的核心設計思想





如上圖,AutoBio 并非簡單復刻實驗室環(huán)境,而是從實驗流程本身出發(fā),提出一種以生物實驗語義為中心的建模與評測范式。

我們將復雜實驗操作抽象為一組生物實驗原語(biological primitives),例如樣本轉(zhuǎn)移、混合反應、條件調(diào)控、分離與保存等。這些原語進一步映射為可執(zhí)行的機器人運動與控制模塊,并在統(tǒng)一的仿真環(huán)境中進行組合。

在系統(tǒng)層面,AutoBio 由三部分構成:

  • 面向真實實驗室的高保真仿真系統(tǒng);
  • 覆蓋多難度等級的標準化實驗任務基準;
  • 與 VLA 模型直接兼容的數(shù)據(jù)生成、訓練與評測接口。

這一設計使 AutoBio 能夠在保持實驗語義一致性的前提下,對不同模型進行可復現(xiàn)、可對比的系統(tǒng)評估。

三.一個真正 “像實驗室” 的仿真系統(tǒng)

為了讓機器人面對的環(huán)境盡可能接近真實實驗室,AutoBio 在仿真層面進行了多項針對性擴展:

1. 實驗儀器的數(shù)字化建模

為確保實驗操作的真實性,AutoBio 引入了一套從真實儀器到仿真資產(chǎn)的系統(tǒng)化建模流程。通過多視角視頻采集與 3D Gaussian Splatting 重建,我們獲得高保真的幾何與外觀表示,并結合 CAD 建模與結構標注,生成可用于物理仿真的數(shù)字儀器模型。

該流程兼顧了視覺真實性與物理可交互性,避免了傳統(tǒng)手工建模在復雜結構與真實比例上的偏差。



2. 實驗室專用物理機制

標準物理引擎往往難以直接覆蓋實驗室中常見的交互模式。為此,AutoBio 針對生物實驗高頻操作擴展了一系列物理機制,包括但不限于:

  • 基于螺紋結構的旋擰與自鎖建模;
  • 具有離散阻尼特性的分檔旋鈕;
  • 偏心機構驅(qū)動的周期性振蕩;
  • 面向液體樣本的準靜態(tài)液面建模。

這些機制使仿真環(huán)境能夠更準確地反映實驗操作中的關鍵物理約束,從而避免模型在評測中依賴不現(xiàn)實的 “捷徑策略”。



3. 面向視覺模型的渲染與界面支持

考慮到 VLA 模型高度依賴視覺輸入,AutoBio 在渲染層面引入了基于物理的渲染(PBR)管線,以提升透明材料、液體以及儀器表面的視覺真實性。

同時,系統(tǒng)支持儀器數(shù)字界面的動態(tài)渲染,使機器人能夠通過視覺信號讀取參數(shù)、識別狀態(tài)變化并執(zhí)行相應操作。這一能力對于涉及人機界面的實驗任務尤為關鍵。



四、AutoBio Benchmark:從實驗流程到評測任務

基于上述仿真能力,AutoBio 構建了一個包含 16 個任務的評測基準,覆蓋三個難度等級:

  • 簡單任務:單步或低精度操作,如打開或關閉儀器蓋;
  • 中等任務:需要一定精度和語言理解能力,如擰開離心管、樣本轉(zhuǎn)移;
  • 困難任務:涉及多模態(tài)推理,如讀取屏幕參數(shù)并精確調(diào)節(jié)實驗設備。



每個任務均支持自動化專家軌跡生成、隨機化初始條件以及統(tǒng)一的成功判定機制,使不同模型能夠在一致條件下進行公平比較。

五、當前模型的能力邊界

我們系統(tǒng)評測了多種主流開源 VLA 模型。實驗結果如下圖:



  • 在簡單任務上,模型已表現(xiàn)出較高成功率;
  • 當任務涉及高精度裝配、液體判斷或屏幕讀數(shù)時,成功率顯著下降;
  • 失敗往往源于細節(jié)誤差的持續(xù)累積,而非對任務的完全誤解。

這一結果揭示出當前模型在高精度操作、細粒度視覺推理以及長期實驗流程建模方面仍存在顯著不足,也進一步驗證了 AutoBio 在刻畫真實科研場景挑戰(zhàn)方面的必要性。

六、總結

AutoBio 提供了一個面向生物實驗室的統(tǒng)一仿真與評測框架,使研究者能夠系統(tǒng)性分析機器人在真實科研場景中的能力與局限。

我們的目標并非給出最終解決方案,而是通過清晰的問題定義和可復現(xiàn)的評測體系,為通用機器人走向科研自動化提供一個堅實的起點。

隨著模型架構、訓練范式與跨模態(tài)推理能力的持續(xù)發(fā)展,我們希望 AutoBio 能夠成為連接機器人學習與生命科學自動化的重要基礎設施。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
【李國豪】南京長江大橋設計時,他主張6車道,當?shù)卣畧猿?車道

【李國豪】南京長江大橋設計時,他主張6車道,當?shù)卣畧猿?車道

年之父
2026-02-23 09:10:06
看懂抗美援朝,也就懂了伊朗總統(tǒng)萊希死后,中國為啥在臺海掀桌子

看懂抗美援朝,也就懂了伊朗總統(tǒng)萊希死后,中國為啥在臺海掀桌子

聽風行江湖
2026-01-03 03:50:34
豪取11連勝,打破NBA塵封79年神紀錄!3大細節(jié)證明圣城馬刺回來了

豪取11連勝,打破NBA塵封79年神紀錄!3大細節(jié)證明圣城馬刺回來了

鍋子籃球
2026-02-27 14:55:39
鏡報:13人缺戰(zhàn)阿森納vs切爾西,包括梅里諾、埃斯特旺、庫庫

鏡報:13人缺戰(zhàn)阿森納vs切爾西,包括梅里諾、埃斯特旺、庫庫

懂球帝
2026-02-28 16:36:41
張洪福母親感謝恒大足校:樹高千尺不忘根,人行千里莫忘本

張洪福母親感謝恒大足校:樹高千尺不忘根,人行千里莫忘本

懂球帝
2026-02-28 10:47:21
一盤木耳毒死10人?醫(yī)生警告:木耳盡量注意別這樣吃,比礎霜還毒

一盤木耳毒死10人?醫(yī)生警告:木耳盡量注意別這樣吃,比礎霜還毒

垚垚分享健康
2026-02-27 13:15:05
“為什么現(xiàn)在鹵味越來越賣不動了?”網(wǎng)友的評論真的狠狠認同!

“為什么現(xiàn)在鹵味越來越賣不動了?”網(wǎng)友的評論真的狠狠認同!

夜深愛雜談
2026-02-27 20:29:23
俄媒警告中國:美國打伊朗只是幌子,目的是逼解放軍到太平洋決戰(zhàn)

俄媒警告中國:美國打伊朗只是幌子,目的是逼解放軍到太平洋決戰(zhàn)

情系雨櫻花葉
2026-02-28 11:20:39
被裁判針對?大滿貫賽王楚欽勝韓一哥,三次發(fā)球被罰兩次挑戰(zhàn)成功

被裁判針對?大滿貫賽王楚欽勝韓一哥,三次發(fā)球被罰兩次挑戰(zhàn)成功

老汆古裝影視解說
2026-02-28 16:14:55
王晶沒撒謊!退出春晚、和沈騰決裂,性格大變的賈玲印證他說的話

王晶沒撒謊!退出春晚、和沈騰決裂,性格大變的賈玲印證他說的話

胡一舸南游y
2026-01-25 14:54:04
中方宣布:調(diào)整對原產(chǎn)于加拿大的部分進口商品加征關稅措施 不加征對油渣餅、豌豆加征的100%關稅以及對龍蝦、蟹加征的25%關稅

中方宣布:調(diào)整對原產(chǎn)于加拿大的部分進口商品加征關稅措施 不加征對油渣餅、豌豆加征的100%關稅以及對龍蝦、蟹加征的25%關稅

每日經(jīng)濟新聞
2026-02-27 21:40:06
WTT大滿貫:王楚欽旗開得勝!首局兌現(xiàn)第3個局點,11-4領先張禹珍

WTT大滿貫:王楚欽旗開得勝!首局兌現(xiàn)第3個局點,11-4領先張禹珍

劉姚堯的文字城堡
2026-02-28 15:29:42
女明星不紅了只能接商演,聽說一小時僅5萬元,真是太可憐了!

女明星不紅了只能接商演,聽說一小時僅5萬元,真是太可憐了!

老吳教育課堂
2026-02-28 11:30:11
被傳賣掉上億豪宅、移民美國的王剛,如今生活狀況卻出人意料

被傳賣掉上億豪宅、移民美國的王剛,如今生活狀況卻出人意料

卷史
2026-02-27 18:51:18
馬筱梅產(chǎn)子僅4天,S媽不再沉默,委托律師發(fā)聲明 具俊曄默不作聲

馬筱梅產(chǎn)子僅4天,S媽不再沉默,委托律師發(fā)聲明 具俊曄默不作聲

樂悠悠娛樂
2026-02-28 12:56:28
吳宜澤:無法理解江俊的打球方式,希望我再次專注比賽并爭取奪冠

吳宜澤:無法理解江俊的打球方式,希望我再次專注比賽并爭取奪冠

世界體壇觀察家
2026-02-28 08:43:10
一顆沒賣出去!英偉達H200對華銷量歸零,美國芯片鬧劇演砸了

一顆沒賣出去!英偉達H200對華銷量歸零,美國芯片鬧劇演砸了

Thurman在昆明
2026-02-27 11:22:09
市委決定:王達品任首都醫(yī)科大學黨委書記

市委決定:王達品任首都醫(yī)科大學黨委書記

上觀新聞
2026-02-28 16:20:46
NBA宣布!東契奇正式掉隊!再見了,MVP

NBA宣布!東契奇正式掉隊!再見了,MVP

籃球教學論壇
2026-02-28 15:13:41
戰(zhàn)爭打響,伊朗唯一活路是把一萬枚導彈當成“一次性打火機”!

戰(zhàn)爭打響,伊朗唯一活路是把一萬枚導彈當成“一次性打火機”!

百態(tài)人間
2026-01-29 15:41:40
2026-02-28 16:51:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12382文章數(shù) 142573關注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

內(nèi)塔尼亞胡:美以軍事行動目標是推翻伊朗政權

頭條要聞

內(nèi)塔尼亞胡:美以軍事行動目標是推翻伊朗政權

體育要聞

球隊主力全報銷?頂風擺爛演都不演了

娛樂要聞

疑似王一博被爆私密聊天記錄

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

藝術
旅游
健康
家居
公開課

藝術要聞

2025第十四屆中國藝術節(jié)全國優(yōu)秀美術作品展 | 入選油畫選刊

旅游要聞

9天超長春節(jié)長假收官,上海接待超2167萬人次游客,全要素旅游消費總額超256億元

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

家居要聞

素色肌理 品意式格調(diào)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版