国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ICCV 2025 Highlight | 大規(guī)模具身仿真平臺UnrealZoo

0
分享至

你是否曾為搭建具身仿真環(huán)境耗費(fèi)數(shù)周學(xué)習(xí)卻效果寥寥? 是否因人工采集海量交互數(shù)據(jù)需要高昂成本而望而卻步? 又是否因找不到足夠豐富真實(shí)的開放場景讓你的智能體難以施展拳腳?

來自北京師范大學(xué)、北京航空航天大學(xué)、北京大學(xué)等機(jī)構(gòu)的聯(lián)合研究團(tuán)隊(duì),為具身智能(Embodied AI)研究帶來了具身仿真環(huán)境平臺 UnrealZoo!這是一個基于虛幻引擎(Unreal Engine)構(gòu)建的近真實(shí)三維虛擬世界集合,旨在 1:1 還原開放世界的復(fù)雜性與多變性。

目前,UnrealZoo 已收錄 100 余個高質(zhì)量、高逼真、大尺度 3D 場景,從溫馨室內(nèi)家居到繁華城市街道,從靜謐校園醫(yī)院到壯麗自然景觀,甚至涵蓋大型工業(yè)工廠等專業(yè)場景,全方位滿足不同研究需求。UnrealZoo 還內(nèi)置了機(jī)器狗、無人機(jī)、汽車、人體、動物等多樣化具身形態(tài),搭配靈活易用的交互接口,無需復(fù)雜配置即可快速上手。無論是算法驗(yàn)證、數(shù)據(jù)合成還是智能體訓(xùn)練,都能在 UnrealZoo 一站式完成!


標(biāo)題: UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI 論文鏈接: https://arxiv.org/abs/2412.20977 開源代碼: https://github.com/UnrealZoo/unrealzoo-gym 項(xiàng)目主頁: http://unrealzoo.site
一、UnrealZoo 做了什么?

UnrealZoo 是一個基于虛幻引擎 UE5 開發(fā)的高保真虛擬環(huán)境集合,環(huán)境內(nèi)提供了 100 + 的場景地圖以及 66 個可自定義操控的具身實(shí)體,包括人類角色、動物、車輛、無人機(jī)等。不同智能體可以與其他智能體或者環(huán)境進(jìn)行交互。

為支持豐富的任務(wù)需求以提供更好的使用體檢,UnrealZoo 基于開源工具 UnrealCV 提供了一套易用的 Python 接口和工具,并優(yōu)化了渲染和通信效率,以支持?jǐn)?shù)據(jù)收集、環(huán)境增強(qiáng)、分布式訓(xùn)練和多智能體交互等各種潛在應(yīng)用。

此外,研究團(tuán)隊(duì)還通過實(shí)驗(yàn)深入探索了 UnrealZoo 在視覺導(dǎo)航與主動目標(biāo)跟蹤等關(guān)鍵任務(wù)的應(yīng)用潛力,揭示了擴(kuò)充訓(xùn)練場景豐富度對模型泛化性的提升的必要性,以及當(dāng)前基于強(qiáng)化學(xué)習(xí)(RL)和大型視覺 - 語言模型(VLM)的視覺智能體在開放世界中所面臨的巨大挑戰(zhàn)。完整的 UE5 場景已經(jīng)在 Modelscope 開放下載。

Modelscope 地址: https://www.modelscope.cn/datasets/UnrealZoo/UnrealZoo-UE5
二、為什么要搭建 UnrealZoo?

隨著具身智能(Embodied AI)的快速發(fā)展,智能體逐漸從簡單的任務(wù)執(zhí)行者向能夠在復(fù)雜環(huán)境中進(jìn)行感知、推理、規(guī)劃與行動的系統(tǒng)進(jìn)化。雖然現(xiàn)有模擬器如 Habitat、AI-Thor 和 Carla 等,已在家庭場景或自動駕駛等領(lǐng)域取得了一定進(jìn)展,但它們的應(yīng)用場景往往局限于特定任務(wù)和環(huán)境。這也阻礙了具身智能體在多變的開放世界中的適應(yīng)性和泛化能力的發(fā)展。這些能力對于具身智能體在真實(shí)世界中的廣泛應(yīng)用至關(guān)重要。

為了彌補(bǔ)這一短板,具身智能研究迫切需要支持多樣化和高保真虛擬環(huán)境的模擬平臺,幫助智能體在更加復(fù)雜和動態(tài)的環(huán)境中進(jìn)行訓(xùn)練。3D 場景的多樣性與智能體形態(tài)的多變性將使智能體能夠在更多種類的任務(wù)中進(jìn)行學(xué)習(xí),從而提升其空間智能和任務(wù)執(zhí)行能力。而隨著多智能體交互的加入,智能體不僅能獨(dú)立完成任務(wù),還能模擬和人類類似的社會智能行為,如合作、競爭與溝通,極大地提升其在真實(shí)世界中的應(yīng)用潛力。

更重要的是,開放世界中的訓(xùn)練環(huán)境能夠幫助研究人員評估智能體在應(yīng)對多種不確定性、動態(tài)變化和復(fù)雜任務(wù)時(shí)的表現(xiàn),進(jìn)而避免因直接在現(xiàn)實(shí)中部署時(shí)發(fā)生故障或造成硬件損失。

基于以上原因,UnrealZoo 為智能體提供了一個近真實(shí)、多樣化、靈活易用的仿真平臺,推動具身智能從虛擬世界走向現(xiàn)實(shí)世界,助力更加廣泛且真實(shí)的應(yīng)用場景。



表 1:UnrealZoo (基于 UE4/5) 與其他主流虛擬環(huán)境的對比 三、本文貢獻(xiàn)

提出了 UnrealZoo,這是一個基于「虛幻引擎」(Unreal Engine) 和「虛幻計(jì)算機(jī)視覺」(UnrealCV)的逼真虛擬世界的綜合集合。UnrealZoo 具有各種復(fù)雜的開放世界和可玩實(shí)體,旨在推動具身人工智能及相關(guān)領(lǐng)域的研究。

這個高質(zhì)量的集合包括 100+ 個不同規(guī)模的逼真場景,如房屋、超市、火車站、工廠、城市、村莊、寺廟和自然景觀。每個環(huán)境都由藝術(shù)家精心設(shè)計(jì),以模擬逼真的照明、紋理和動態(tài),與現(xiàn)實(shí)世界的體驗(yàn)高度相似。還包括各種可玩實(shí)體,包括人類、動物、機(jī)器人、無人機(jī)、摩托車和汽車。這種多樣性使研究人員能夠研究智能體在不同表現(xiàn)形式中的泛化能力,或構(gòu)建具有眾多異構(gòu)智能體的復(fù)雜 3D 社會世界。

為了提高可用性,研究團(tuán)隊(duì)進(jìn)一步優(yōu)化了「虛幻計(jì)算機(jī)視覺增強(qiáng)版」(UnrealCV+),并提供了一套易于使用的 Python API 和工具,包括環(huán)境增強(qiáng)、演示收集和分布式訓(xùn)練 / 測試。這些工具允許對環(huán)境進(jìn)行定制和擴(kuò)展,以滿足未來應(yīng)用中的各種需求,確保 UnrealZoo 隨著具身人工智能智能體的發(fā)展而保持適應(yīng)性。

貢獻(xiàn)可以總結(jié)如下:

  • 構(gòu)建了 UnrealZoo,它包含 100 個高質(zhì)量的逼真場景和一組具有多樣化特征的可玩實(shí)體,涵蓋了開放世界中對具身人工智能智能體最具挑戰(zhàn)性的場景。

  • 優(yōu)化了 UnrealCV API 的通信效率,并提供了帶有工具包的易于使用的 Gym 接口,以滿足各種需求。

  • 進(jìn)行實(shí)驗(yàn)以證明 UnrealZoo 的可用性,展示了環(huán)境多樣性對具身智能體的重要性,并分析了當(dāng)前基于強(qiáng)化學(xué)習(xí)和基于視覺語言模型的智能體在開放世界中的局限性。

四、UnrealZoo 技術(shù)方案 4.1 多樣化場景收集

UnrealZoo 包含 100 + 個基于虛幻引擎 4 和 5 的場景,從虛幻引擎市場精心挑選,涵蓋多種風(fēng)格,包括古代到虛構(gòu)的各類場景。場景按類別、規(guī)模、空間結(jié)構(gòu)、動力學(xué)和風(fēng)格等標(biāo)簽分類,以滿足不同測試和訓(xùn)練需求,最大場景達(dá) 16 平方公里。


圖 1 UnrealZoo 通過結(jié)合多樣化的場景和可交互實(shí)體,豐富了高真實(shí)感虛擬世界。它支持訓(xùn)練具有泛化能力的具身智能體,用于導(dǎo)航、主動追蹤以及社會交互等任務(wù)。圖 2 UnrealZoo 內(nèi)不同類型場景的統(tǒng)計(jì)分布,涵蓋多種風(fēng)格, 如住宅、超市、火車站、工業(yè)工廠、城市、鄉(xiāng)村、寺廟以及自然景觀等。 4.2 可交互智能體

多樣化的智能體類型



無人機(jī)第一視角


駕駛汽車第一視角


駕駛摩托車第一視角


四足機(jī)器人

UnrealZoo 內(nèi)包含人類、動物、汽車、摩托車、無人機(jī)、移動機(jī)器人和飛行相機(jī)等七種類型,共 66 個實(shí)體,各具不同的動作空間和視點(diǎn),支持多種功能,如切換紋理外觀、捕獲不同類型圖像數(shù)據(jù),可通過函數(shù)控制其屬性和運(yùn)動。

?♂? 智能體在開放世界的探索


爬樓梯


攀爬高臺


下蹲穿越


跑跳

智能體的基礎(chǔ)移動能力。UnrealZoo 的運(yùn)動系統(tǒng)基于 Smart Locomotion,賦予智能體在復(fù)雜三維空間中自由探索的能力。智能體不僅可以進(jìn)行跑步、跳躍和攀爬等動作,還能夠在多層次、動態(tài)變化的環(huán)境中自如移動。通過這些運(yùn)動方式,智能體需要準(zhǔn)確評估距離、高度和空間布局,做出合理的運(yùn)動決策。這對智能體的空間感知提出了新的挑戰(zhàn),要求它們不僅能在平面上導(dǎo)航,還能理解和推理復(fù)雜的三維空間結(jié)構(gòu),從而提升其在開放世界中進(jìn)行導(dǎo)航和互動的能力。


內(nèi)置基于地圖的自主導(dǎo)航系統(tǒng)

導(dǎo)航系統(tǒng)?;?NavMesh 開發(fā),支持智能體在環(huán)境中自主導(dǎo)航,能在不同場景中根據(jù)地形和規(guī)則實(shí)現(xiàn)智能路徑規(guī)劃和避障。

豐富的交互系統(tǒng)


物體拿放動作


球體碰撞交互


上下車動作


車輛破壞模擬


開關(guān)門動作


坐下

智能體與環(huán)境的交互。UnrealZoo 的交互系統(tǒng)為智能體提供了與物體和環(huán)境的靈活互動能力。智能體可以通過抓取、推動、開關(guān)等方式與物體進(jìn)行物理交互,如開關(guān)門、移動箱子、駕駛車輛等,物體的物理特性(如重量、材質(zhì))會影響交互效果。同時(shí),智能體還能夠感知和適應(yīng)環(huán)境變化,利用傳感器(如視覺、深度信息)在復(fù)雜地形中進(jìn)行導(dǎo)航,并根據(jù)實(shí)時(shí)變化(如天氣、時(shí)間變化)調(diào)整行動策略。這種物理與感知交互能力,使得智能體能夠在不同的虛擬環(huán)境中完成各種任務(wù),如操作、導(dǎo)航和任務(wù)執(zhí)行。

智能體之間的交互。UnrealZoo 還支持智能體之間的交互,使得多智能體環(huán)境中的合作與對抗成為可能。智能體可以共享信息,進(jìn)行協(xié)作任務(wù),或在競技場中與其他智能體競爭。例如,在災(zāi)后救援任務(wù)中,多個智能體可以協(xié)調(diào)合作,完成物品搬運(yùn)或場地清理任務(wù);而在對抗場景中,智能體通過實(shí)時(shí)策略選擇與其他智能體互動,增強(qiáng)了多樣性與挑戰(zhàn)性。這種多層次的交互功能為人工智能提供了更加動態(tài)和真實(shí)的模擬環(huán)境,推動了 AI 在實(shí)際應(yīng)用中的發(fā)展。

4.3 通用編程接口

為提升可用性,UnrealZoo 進(jìn)一步優(yōu)化了 UnrealCV,并提供了一套易于使用的 Python API 和工具(UnrealCV+),包括環(huán)境增強(qiáng)、示范采集以及分布式訓(xùn)練 / 測試。這些工具允許用戶根據(jù)未來應(yīng)用的需求自定義和擴(kuò)展環(huán)境,確保 UnrealZoo 能夠隨具身 AI 智能體的演進(jìn)保持適應(yīng)性。


圖 3 UnrealZoo 的詳細(xì)架構(gòu)?;疑虮硎?UE 二進(jìn)制文件,包含場景和可交互實(shí)體。UnrealCV+ Server 作為插件嵌入到該二進(jìn)制文件中。用戶端通過 Gym 接口進(jìn)行 api 調(diào)用,通過配置文件自定義任務(wù),并包含一個工具包,其中包含用于環(huán)境增強(qiáng)、種群控制等功能的一組 Gym 封裝器。 五、實(shí)驗(yàn)結(jié)果 5.1 UnrealCV+ 效果測試


UnrealCV 為研究使用虛幻引擎提供 Python 接口。
表 2 Unreal Engine 4.27 中使用 UnrealCV 和 UnrealCV + 的幀率(FPS)對比。報(bào)告的結(jié)果為 6 個典型環(huán)境的平均性能表現(xiàn)。

UnrealCV+ 是對原版 UnrealCV 的改進(jìn)版本,專為高效交互而優(yōu)化(代碼已同步至

https://github.com/unrealcv/unrealcv
)。原版 UnrealCV 主要用于生成計(jì)算機(jī)視覺合成數(shù)據(jù),幀率(FPS)未針對實(shí)時(shí)交互優(yōu)化。UnrealCV + 優(yōu)化了渲染管道和服務(wù)器與客戶端之間的通信協(xié)議,顯著提高了 FPS,尤其是在大規(guī)模場景中通過并行處理物體級分割圖和深度圖。對于多智能體交互,UnrealCV + 引入了批量命令協(xié)議,允許客戶端一次發(fā)送多個命令,服務(wù)器處理并返回結(jié)果,從而減少通信時(shí)間。為了提高穩(wěn)定性,unrealcv + 用進(jìn)程間通信(IPC)套接字代替了 TCP 套接字,以應(yīng)對高負(fù)載下的服務(wù)器 - 客戶端通信。

研究團(tuán)隊(duì)還開發(fā)了基于 UnrealCV 命令系統(tǒng)的高級 Python API,簡化了環(huán)境交互,使初學(xué)者也能輕松使用和定制環(huán)境。

5.2 視覺導(dǎo)航 / Visual Navigation

實(shí)驗(yàn)設(shè)置

  • 復(fù)雜環(huán)境:在 UnrealZoo 的環(huán)境中中,3D 探索的獨(dú)特優(yōu)勢為視覺語言導(dǎo)航任務(wù)帶來了前所未有的挑戰(zhàn)。在開放世界中,智能體不僅需要應(yīng)對二維平面上的導(dǎo)航,更需要理解和適應(yīng)三維空間結(jié)構(gòu)。本文的導(dǎo)航任務(wù)引入了比傳統(tǒng)室內(nèi)場景或自動駕駛?cè)蝿?wù)更高的復(fù)雜性。實(shí)驗(yàn)中,智能體被放置在開放世界環(huán)境中,需要通過一系列動作(如奔跑、攀爬、跳躍、蹲下)來克服無結(jié)構(gòu)地形中的各種障礙,以到達(dá)目標(biāo)物體。

  • 評估指標(biāo):使用兩個關(guān)鍵指標(biāo)來評估視覺導(dǎo)航智能體:

    • 平均回合長度(Average Episode Length, EL),表示每回合的平均步數(shù)。

    • 成功率(Success Rate, SR),測量智能體成功導(dǎo)航到目標(biāo)物體的百分比基線方法。

    • 路徑長度加權(quán)的成功率 (Success weighted by Path Length, SPL)

基線方法

  • 在線強(qiáng)化學(xué)習(xí)(Online RL):在 Roof 和 Factory 環(huán)境中分別訓(xùn)練 RL 智能體,使用分布式在線強(qiáng)化學(xué)習(xí)方法(如 A3C)。模型輸入第一人稱視角的分割掩碼和智能體與目標(biāo)之間的相對位置,并輸出直接控制信號進(jìn)行導(dǎo)航。

  • GPT-4o:使用 GPT-4o 模型來采取行動,利用其強(qiáng)大的多模態(tài)推理能力。模型輸入第一人稱視角的圖像和智能體與固定目標(biāo)之間的相對位置,根據(jù)預(yù)定義的控制空間推理適當(dāng)?shù)膭幼鳌?/p>

  • 人類玩家:人類玩家使用鍵盤控制智能體,類似于第一人稱視頻游戲。玩家從隨機(jī)起點(diǎn)導(dǎo)航到固定目標(biāo),基于視覺觀察做出決策。

實(shí)驗(yàn)結(jié)果



圖 4 具身導(dǎo)航智能體在 Roof 場景中的示例序列。基于強(qiáng)化學(xué)習(xí)(RL)的智能體學(xué)會了攀爬箱子和墻壁,并跳躍障礙物,以短路徑到達(dá)目標(biāo)位置。

  • RL 智能體在較簡單環(huán)境中表現(xiàn)較好,但在復(fù)雜環(huán)境中表現(xiàn)不佳(需要進(jìn)行攀爬、跳躍等立體空間感知)。

  • GPT-4o 在兩種場景中都表現(xiàn)不佳,表明其在復(fù)雜 3D 場景推理中的局限性。

  • 人類玩家在兩個任務(wù)中都表現(xiàn)出色,顯示出當(dāng)前智能體與人類之間的顯著差距。

5.3 主動視覺跟蹤 / Active Visual Tracking

實(shí)驗(yàn)設(shè)置

  • 環(huán)境選擇:利用 unrealzoo 的環(huán)境多樣性,選擇四個環(huán)境類別(室內(nèi)場景、宮殿、荒野、現(xiàn)代場景)進(jìn)行評估,每個類別包含 4 個獨(dú)立環(huán)境。實(shí)驗(yàn)旨在捕捉環(huán)境合集中的廣泛特征,確保對智能體追蹤能力的全面評估。

  • 評估指標(biāo):使用三個關(guān)鍵指標(biāo)評估:

    • 平均回合回報(bào)(Average Episodic Return, ER),提供整體跟蹤性能的洞察;

    • 平均回合長度(Average Episode Length, EL),反映長期跟蹤效果;

    • 成功率(Success Rate, SR),測量完成 500 步的回合百分比。

基線方法

  • PID 方法:一種經(jīng)典的控制方法,使用 PID 控制器通過最大化目標(biāo)邊界框與預(yù)期位置之間的 IoU 來調(diào)整智能體的動作。OpenVLA:通過對 OpenVLA 進(jìn)行了微調(diào),使其適應(yīng)追蹤任務(wù)。

  • 離線強(qiáng)化學(xué)習(xí)(Offline RL):擴(kuò)展自最近的離線 RL 方法,收集離線數(shù)據(jù)集并采用原始網(wǎng)絡(luò)架構(gòu)。通過收集不同數(shù)量環(huán)境的離線數(shù)據(jù)集來分析數(shù)據(jù)多樣性的影響。

  • GPT-4o:使用 GPT-4o 模型直接生成基于觀察圖像的動作,以跟蹤目標(biāo)人物。設(shè)計(jì)了系統(tǒng)提示來幫助模型理解任務(wù)并標(biāo)準(zhǔn)化輸出格式。

實(shí)驗(yàn)結(jié)果

面對不同環(huán)境挑戰(zhàn)的效果評估


圖 5 Offline-RL 訓(xùn)練得到的智能體在四類環(huán)境中的平均成功率。智能體分別在三種離線數(shù)據(jù)集設(shè)置(1 個環(huán)境、2 個環(huán)境、8 個環(huán)境)下進(jìn)行訓(xùn)練。結(jié)果表明,隨著數(shù)據(jù)集中包含的環(huán)境多樣性增加,智能體的泛化能力顯著提升。然而,對于具有復(fù)雜空間結(jié)構(gòu)的環(huán)境(如 Interior Scenes 和 Palace),成功率較低,突顯了在障礙物規(guī)避和導(dǎo)航方面的挑戰(zhàn)。


圖 6 用于測試追蹤智能體的 16 個環(huán)境概覽,左側(cè)的文本對應(yīng)每一行的環(huán)境類別,每個環(huán)境下方的文本對應(yīng)環(huán)境名稱。

  • 隨著訓(xùn)練環(huán)境數(shù)量的增加,智能體在所有類別中的長期跟蹤性能普遍提高。

  • 在野外環(huán)境中(Wilds),使用 8 Envs. 數(shù)據(jù)集的成功率顯著提高,表明多樣化的環(huán)境數(shù)據(jù)對提高智能體在更復(fù)雜的開放世界環(huán)境中的泛化能力至關(guān)重要。

面對動態(tài)干擾的效果評估


  • 動態(tài)干擾:在人群中進(jìn)行跟蹤時(shí),智能體需要處理動態(tài)干擾。實(shí)驗(yàn)中,生成具有不同數(shù)量人類角色的群體作為干擾。

    隨著干擾數(shù)量的增加,離線 RL 方法保持相對穩(wěn)定的成功率,而其余基線模型在動態(tài)環(huán)境中表現(xiàn)不佳,顯示出其在動態(tài)干擾下的局限性。

跨實(shí)體泛化


  • 跨實(shí)體泛化:將針對人類角色訓(xùn)練的智能體轉(zhuǎn)移到機(jī)器人狗上進(jìn)行評估。結(jié)果顯示成功率下降,表明研究社區(qū)應(yīng)更多關(guān)注跨實(shí)體泛化。

控制頻率的影響



  • 控制頻率:使用時(shí)間膨脹包裝器模擬不同的控制頻率。結(jié)果表明,當(dāng)感知 - 控制循環(huán)的頻率低于 10 FPS 時(shí),性能顯著下降。高控制頻率使 RL 智能體在社會跟蹤中表現(xiàn)更好,強(qiáng)調(diào)了在動態(tài)開放世界中完成任務(wù)時(shí)構(gòu)建高效模型的重要性。

六、總結(jié)
  • 論文提出了 UnrealZoo,一個多樣化的照片級虛擬世界合集,旨在推動具身 AI 研究的發(fā)展。

  • 通過提供高質(zhì)量的虛擬環(huán)境和優(yōu)化的編程接口,UnrealZoo 能夠支持高效的單智能體和多智能體系統(tǒng)交互。

  • 實(shí)驗(yàn)結(jié)果表明,智能體在開放世界的空間感知和導(dǎo)航能力仍然具有很大發(fā)展空間,多樣化的訓(xùn)練環(huán)境對智能體的泛化能力和魯棒性至關(guān)重要,而基于 RL 的方法在處理動態(tài)環(huán)境和社交互動方面表現(xiàn)出色。

  • 未來的工作將繼續(xù)豐富虛擬世界的場景、實(shí)體和交互任務(wù),推動具身 AI 在現(xiàn)實(shí)世界中的應(yīng)用。

論文部分重要參考文獻(xiàn)

[1] Weichao Qiu, Fangwei Zhong, Yi Zhang, Siyuan Qiao, Zihao Xiao, Tae Soo Kim, Yizhou Wang and Alan Yuille. Unrealcv: Virtual Worlds for Computer Vision. ACM MM. 2017.

[2] Aviral Kumar, Aurick Zhou, George Tucker, and Sergey Levine. Conservative Q-Learning for Offline Reinforcement Learning. NeurIPS 2020.

[3] Fangwei Zhong, Kui Wu, Hai Ci, Churan Wang, and Hao Chen. Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL. ECCV 2024.

[4] Moo Jin Kim, Karl Pertsch, Siddharth Karamcheti, Ted Xiao, Ashwin Balakrishna, Suraj Nair, Rafael Rafailov, Ethan P Foster, Pannag R Sanketi, Quan Vuong, Thomas Kollar, Benjamin Burchfiel, Russ Tedrake, Dorsa Sadigh, Sergey Levine, Percy Liang, and Chelsea Finn. OpenVLA: An Open-Source Vision-Language-Action Model. CoRL 2025.

[5] Shital Shah, Debadeepta Dey, Chris Lovett and Ashish Kapoor. AirSim: High-Fidelity Visual and Physical Simulation for Autonomous Vehicles. Field and service robotics: Results of the 11th international conference, 2017.

[6] Alexey Dosovitskiy, German Ros, Felipe Codevilla, Antonio Lopez and Vladlen Koltun. CARLA: An Open Urban Driving Simulator. CoRL 2017.

來源:公眾號【機(jī)器之心】

llustration From IconScout By IconScout Store

-The End-

掃碼觀看!

本周上新!

“AI技術(shù)流”原創(chuàng)投稿計(jì)劃

TechBeat是由將門創(chuàng)投建立的AI學(xué)習(xí)社區(qū)(www.techbeat.net)。社區(qū)上線700+期talk視頻,3000+篇技術(shù)干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會及其他線上交流活動,不定期舉辦技術(shù)人線下聚會交流活動。我們正在努力成為AI人才喜愛的高質(zhì)量、知識型交流平臺,希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其成長。

投稿內(nèi)容

// 最新技術(shù)解讀/系統(tǒng)性知識分享 //

// 前沿資訊解說/心得經(jīng)歷講述 //

投稿須知

稿件需要為原創(chuàng)文章,并標(biāo)明作者信息。

我們會選擇部分在深度技術(shù)解析及科研心得方向,對用戶啟發(fā)更大的文章,做原創(chuàng)性內(nèi)容獎勵

投稿方式

發(fā)送郵件到

michellechang@thejiangmen.com

或添加工作人員微信(michelle333_)投稿,溝通投稿詳情

關(guān)于我“門”

將門是一家以專注于數(shù)智核心科技領(lǐng)域新型創(chuàng)投機(jī)構(gòu),也是北京市標(biāo)桿型孵化器。 公司致力于通過連接技術(shù)與商業(yè),發(fā)掘和培育具有全球影響力的科技創(chuàng)新企業(yè),推動企業(yè)創(chuàng)新發(fā)展與產(chǎn)業(yè)升級。

將門成立于2015年底,創(chuàng)始團(tuán)隊(duì)由微軟創(chuàng)投在中國的創(chuàng)始團(tuán)隊(duì)原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。

如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價(jià)值的投后服務(wù),歡迎發(fā)送或者推薦項(xiàng)目給我“門”:

bp@thejiangmen.com


點(diǎn)擊右上角,把文章分享到朋友圈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
4-2輕取石洵瑤!17歲張本美和零消耗晉級 四強(qiáng)出爐中日各兩席

4-2輕取石洵瑤!17歲張本美和零消耗晉級 四強(qiáng)出爐中日各兩席

顏小白的籃球夢
2026-03-14 21:48:24
中國女籃10分險(xiǎn)勝!產(chǎn)生2個意想不到,最新形勢:基本晉級世界杯

中國女籃10分險(xiǎn)勝!產(chǎn)生2個意想不到,最新形勢:基本晉級世界杯

侃球熊弟
2026-03-14 20:18:44
山東泰山2:1力克北京國安,徐亮賽后點(diǎn)評,句句在理,客觀中肯!

山東泰山2:1力克北京國安,徐亮賽后點(diǎn)評,句句在理,客觀中肯!

田先生籃球
2026-03-14 22:02:01
中國女足主帥米利西奇:半決賽王霜缺席是損失,全隊(duì)要一起向前看

中國女足主帥米利西奇:半決賽王霜缺席是損失,全隊(duì)要一起向前看

極目新聞
2026-03-14 21:07:31
深圳寶馬4S店“銷冠店”停擺,店內(nèi)財(cái)產(chǎn)已被法院查封

深圳寶馬4S店“銷冠店”停擺,店內(nèi)財(cái)產(chǎn)已被法院查封

南方都市報(bào)
2026-03-14 16:52:20
中建五局掀桌子,一口氣舉報(bào)了14家央企!

中建五局掀桌子,一口氣舉報(bào)了14家央企!

巢客HOME
2026-03-13 17:51:43
真正的“逆齡運(yùn)動”,堅(jiān)持一年大腦年輕2.3歲!不是跑步、走路……

真正的“逆齡運(yùn)動”,堅(jiān)持一年大腦年輕2.3歲!不是跑步、走路……

人民日報(bào)健康客戶端
2026-02-25 07:34:27
丟人丟到國外!中國男子在肯尼亞機(jī)場被攔,行李中發(fā)現(xiàn)2238只蟻后

丟人丟到國外!中國男子在肯尼亞機(jī)場被攔,行李中發(fā)現(xiàn)2238只蟻后

萬象硬核本尊
2026-03-14 20:02:47
低頭了!古巴扛不住重壓與美談判,革命風(fēng)骨終究敗給生存

低頭了!古巴扛不住重壓與美談判,革命風(fēng)骨終究敗給生存

老馬拉車莫少裝
2026-03-13 23:56:24
TVB前女星退圈29年罕現(xiàn)身,古天樂請客掀回憶殺,自曝曾兩度流產(chǎn)

TVB前女星退圈29年罕現(xiàn)身,古天樂請客掀回憶殺,自曝曾兩度流產(chǎn)

蒂蒂茱家
2026-03-14 18:45:28
廣東省高齡津貼新標(biāo)準(zhǔn),3月1日起執(zhí)行!標(biāo)準(zhǔn)是多少,如何申領(lǐng)?

廣東省高齡津貼新標(biāo)準(zhǔn),3月1日起執(zhí)行!標(biāo)準(zhǔn)是多少,如何申領(lǐng)?

云鵬敘事
2026-03-14 16:48:43
巴黎現(xiàn)場太真實(shí)!Lisa三角區(qū)尷尬,全智賢狀態(tài)差,劉亦菲也翻車了

巴黎現(xiàn)場太真實(shí)!Lisa三角區(qū)尷尬,全智賢狀態(tài)差,劉亦菲也翻車了

一娛三分地
2026-03-12 19:11:45
股民要坐穩(wěn)扶好了,下周周一周二兩天,或?qū)⒅匮?8年歷史行情!

股民要坐穩(wěn)扶好了,下周周一周二兩天,或?qū)⒅匮?8年歷史行情!

風(fēng)風(fēng)順
2026-03-15 01:00:08
砍27分+7記三分!國手后衛(wèi)打法堪比CBA小外援,率隊(duì)掀翻衛(wèi)冕冠軍

砍27分+7記三分!國手后衛(wèi)打法堪比CBA小外援,率隊(duì)掀翻衛(wèi)冕冠軍

老葉評球
2026-03-14 23:08:04
空箱裝船離開巴爾博亞港,法院判了合同作廢,中資不聲不響全撤了

空箱裝船離開巴爾博亞港,法院判了合同作廢,中資不聲不響全撤了

生活新鮮市
2026-03-14 17:15:43
評論 | 誰是南亞軍購?fù)??最新武器貿(mào)易數(shù)據(jù)全解讀

評論 | 誰是南亞軍購?fù)酰孔钚挛淦髻Q(mào)易數(shù)據(jù)全解讀

南亞研究通訊
2026-03-13 23:06:50
女孩一邊照顧患癌母親一邊考研,二戰(zhàn)上岸卻確診癌癥晚期,當(dāng)事人發(fā)聲

女孩一邊照顧患癌母親一邊考研,二戰(zhàn)上岸卻確診癌癥晚期,當(dāng)事人發(fā)聲

環(huán)球網(wǎng)資訊
2026-03-14 18:28:08
Meta大裁員:1.58萬人面臨失業(yè)!

Meta大裁員:1.58萬人面臨失業(yè)!

芯智訊
2026-03-14 23:17:42
張柏芝戴大金鏈子火了!西裝配粗金鏈,又酷又美反差直接拉滿

張柏芝戴大金鏈子火了!西裝配粗金鏈,又酷又美反差直接拉滿

觀魚聽雨
2026-03-12 22:44:11
你知道古人如何養(yǎng)“死士”的?看完讓人頭皮發(fā)麻

你知道古人如何養(yǎng)“死士”的?看完讓人頭皮發(fā)麻

史政先鋒
2026-03-13 17:17:54
2026-03-15 02:11:00
將門創(chuàng)投 incentive-icons
將門創(chuàng)投
加速及投資技術(shù)驅(qū)動型初創(chuàng)企業(yè)
2310文章數(shù) 596關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

伊朗船只迫近林肯號航母 美軍連開數(shù)炮全打空

頭條要聞

伊朗船只迫近林肯號航母 美軍連開數(shù)炮全打空

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂要聞

九成美曝田栩?qū)幵衅诔鲕?AI反轉(zhuǎn)引熱議

財(cái)經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實(shí)力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

教育
時(shí)尚
家居
旅游
藝術(shù)

教育要聞

去英國留學(xué)的核心意義,其實(shí)80%以上國內(nèi)家庭是不知道的!

伊姐周六熱推:電視劇《逐玉》;電視劇《江湖夜雨十年燈》......

家居要聞

藝術(shù)之家 法式優(yōu)雅

旅游要聞

西藏林芝桃花節(jié)定了,與清明節(jié)重逢:只有15天花期;錯過得等一年

藝術(shù)要聞

迪拜的房地產(chǎn)市場面臨嚴(yán)峻考驗(yàn)

無障礙瀏覽 進(jìn)入關(guān)懷版