国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

英偉達拿出推理版VLA:Alpamayo-R1讓自動駕駛AI更會動腦子

0
分享至



一、自動駕駛的瓶頸:「看」得見,卻「想」不明白

當今自動駕駛模型越來越強大,攝像頭、雷達、Transformer 網絡一齊上陣,似乎什么都「看得見」。但真正的挑戰(zhàn)在于:模型能否像人一樣「想明白」為什么要這么開?

傳統的端到端(E2E)系統雖然能從感知到控制一氣呵成,卻常在「長尾場景」翻車 —— 比如:

  • 迎面來車違規(guī)左轉;
  • 行人突然闖入;
  • 臨時施工、交通標志被遮擋。

這些「極少數但容易發(fā)生事故」的場景正是當前系統的盲點。

二、Alpamayo-R1:給模型裝上「推理鏈條」

NVIDIA Research 推出的Alpamayo-R1(AR1),是一種全新的帶有推理能力的視覺 - 語言 - 行動模型(Reasoning VLA),讓車輛不只是「執(zhí)行指令」,而是能在決策前「推理出因果關系」。



圖 1:Alpamayo-R1 模型架構(示意)

AR1 的核心創(chuàng)新有三個方面:

1. Chain of Causation(因果鏈)數據集

AR1 引入了一套全新的數據標注體系:每一段駕駛數據不僅有「做了什么」,還有 「為什么這樣做」。例如:「減速并左變道,是因為前方有助動車等紅燈,且左側車道空閑。」



圖 2:因果鏈(CoC)標注示例

2. Diffusion-based Trajectory Decoder(擴散式軌跡解碼器)

AR1 引入了一種基于擴散模型的軌跡解碼器,它能在實時約束下生成連續(xù)、動態(tài)可行的駕駛軌跡。該模塊結合語言推理輸出與物理約束,實現從推理到控制的無縫銜接。

3. Multi-Stage Training(多階段訓練策略)

AR1 是基于 NVIDIA 的 Cosmos Reason 模型,這是一種專為物理 AI(Physical AI)設計的推理視覺語言模型;并采用多階段訓練策略:首先在大規(guī)模駕駛數據上做模態(tài)注入,學習從視覺到動作的基本映射;第二階段在 CoC 因果鏈數據上做監(jiān)督微調,顯式教會模型「先想清楚再開」;最后通過強化學習(RL)進一步優(yōu)化推理質量、推理 - 行動一致性和軌跡安全性。

這種分階段、分目標的訓練流程,使得模型在開放場景、長尾危險場景中都表現的更加穩(wěn)健。

三、性能飛躍:更穩(wěn)、更準、更懂你

在實驗中,AR1 為以下性能帶來了顯著提升:

  • 規(guī)劃精度提升 12%
  • 越界率降低 35%
  • 近碰率降低 25%
  • 推理 - 行動一致性提升 37%
  • ? 實時性能:99 ms 端到端延遲

更重要的是,這些提升主要體現在以往最容易出錯的「長尾場景」中 —— 也就是說,它更接近「真正會判斷的司機」。

四、Vision Encoding:高效多相機時序感知

AR1 的輸入由多相機、多時序觀測幀組成,同時可以選配高層語言輸入(如導航指令或駕駛目標)。所有輸入(包括歷史自車運動)會被統一編碼成多模態(tài) token 序列,按時序和傳感器順序排列,再送入主干模型 Cosmos-Reason 進行推理與預測。

在這一過程中:

  • 每個相機視角先經過輕量級 CNN 與時間注意力模塊做特征壓縮與時序建模;
  • 多相機特征隨后融合為 BEV(鳥瞰圖)表征;
  • 所有模態(tài)(圖像、導航文本、自車狀態(tài))被 token 化后統一輸入 Transformer;
  • 模型的輸出包含三類 token:推理鏈(reasoning traces)、中層動作(meta-actions)與未來軌跡預測(trajectories)。

這種統一編碼方式讓模型具備了多模態(tài)語義理解與運動狀態(tài)感知的「一體化」能力。

五、數據的靈魂:結構化標注的革命

AR1 的 CoC 數據集采用「人機協同標注」機制:

  • 人工部分:標注關鍵幀、核心因果因素(如紅燈、行人、障礙物),并撰寫推理鏈。
  • 自動部分:通過 GPT-5 等大模型自動生成初版推理,再由人類審查。
  • 質量審核:每條樣本通過因果覆蓋、因果正確性、近因優(yōu)先等四項規(guī)則嚴格把關。

最終形成數十萬條高質量推理 - 行動樣本,使 VLA 模型能真正「理解因果,而非記憶現象」。



圖 3:CoC 數據標注流程示意圖

六、Multi-Stage Training:從常識推理到行為控制

Alpamayo-R1 的訓練分為三個階段,旨在讓模型從「看懂」到「會想」再到「能開」。



圖 4: AR1 訓練流程示意圖

1. 監(jiān)督微調(Supervised Fine-Tuning, SFT)

基于 Cosmos-Reason 的預訓練權重進行微調。該主干模型原本在 370 萬條 VQA 數據上后訓練(post-training),其中包括 2.47 萬條專為駕駛設計的視頻樣本,帶有場景描述、駕駛難度和推理軌跡標注,幫助模型建立「物理常識」和 「因果直覺」。

此外還構建了額外的 10 萬條駕駛樣本,標注關鍵目標、交通信號、因果行為解釋等信息,用于領域自適應微調。

2. 因果鏈監(jiān)督階段(CoC Supervision)

引入 CoC 因果鏈數據集,顯式監(jiān)督模型的推理輸出,使其能回答「為什么要減速」、「為什么左轉」。這一階段通過人工 + 教師模型(如 GPT-5)生成高質量推理樣本,使模型在策略學習前先獲得強大的語言 - 推理能力。

3. 強化學習后訓練優(yōu)化(Reinforcement Learning based Post-Training)。

在最終階段,英偉達通過強化學習對模型進行策略微調,以進一步提升其在推理精準性、推理–行動一致性、軌跡平滑性以及閉環(huán)控制穩(wěn)定性等方面的表現。

Alpamayo-R1 引入了多維度獎勵機制:包括由專家級推理模型提供的反饋信號,用于評估并引導模型生成更具因果邏輯的推理;「推理–行動一致性(Reasoning–Action Consistency)」獎勵,用于鼓勵模型依據自身推理合理執(zhí)行動作;以及底層安全獎勵,用以促進模型生成更加安全、平滑且可執(zhí)行的運動軌跡。

七、未來展望:邁向可解釋的 L4 自動駕駛

AR1 的設計理念可以看作是自動駕駛從「黑箱」到「白箱」的轉折點。

它不再只是一個會開車的 AI,而是一個能告訴你「為什么這樣開」的駕駛員。

? 小結:讓自動駕駛「有理可講」

Alpamayo-R1 的意義不止在性能提升,更在于:它讓 AI 的「推理鏈」與物理世界的「行動鏈」形成真正的閉環(huán)。

當車輛能解釋自己的每一個決策時,才能確保更加安全,信任與普及才會得以實現。

一句話總結:AR1 = 會開車 + 會思考 + 會解釋的自動駕駛模型。

詳細內容請查看:https://research.nvidia.com/publication/2025-10_alpamayo-r1

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
亞歷山大談多爾特被驅逐:我沒看到發(fā)生了什么,但他只是想贏

亞歷山大談多爾特被驅逐:我沒看到發(fā)生了什么,但他只是想贏

懂球帝
2026-02-28 21:46:40
第一性原理為何如此重要?讀懂此文,2026事業(yè)起飛

第一性原理為何如此重要?讀懂此文,2026事業(yè)起飛

高博新視野
2026-02-27 17:17:48
杉杉集團破產,事實證明:美女主持人只會排節(jié)目,對管理無能為力

杉杉集團破產,事實證明:美女主持人只會排節(jié)目,對管理無能為力

晨光蘇醒a
2026-02-27 06:33:24
抱頭鼠竄塔利班求助安理會,川普力挺巴基斯坦再狠一點!

抱頭鼠竄塔利班求助安理會,川普力挺巴基斯坦再狠一點!

移光幻影
2026-02-28 13:25:17
陳秀英:百歲媽媽,因近親結婚生下3個“猴娃”,50年沒出過村子

陳秀英:百歲媽媽,因近親結婚生下3個“猴娃”,50年沒出過村子

雍親王府
2026-01-25 09:30:03
日本新晉女神!阿部夏樹,魔鬼般的身材比例,算得上是頂級天賦。

日本新晉女神!阿部夏樹,魔鬼般的身材比例,算得上是頂級天賦。

情感大頭說說
2026-02-28 15:21:28
此隧道一旦建成,將打破青島交通死角格局,使其成為東北亞樞紐?

此隧道一旦建成,將打破青島交通死角格局,使其成為東北亞樞紐?

好笑娛樂君每一天
2026-02-28 11:46:51
大量瑞幸新年禮盒流入閑魚,內含便攜咖啡機,全新最低46塊

大量瑞幸新年禮盒流入閑魚,內含便攜咖啡機,全新最低46塊

閑搞機
2026-02-27 11:02:52
白馬會所一夜覆滅

白馬會所一夜覆滅

來科點譜
2026-02-28 07:45:18
普京宮殿的“遺產”:65億盧布天降橫財,最終都流向了同一個人

普京宮殿的“遺產”:65億盧布天降橫財,最終都流向了同一個人

老馬拉車莫少裝
2026-02-26 18:52:14
王楚欽怒了,4-0很強勢!賽后采訪高情商談張禹珍,裁判無地自容

王楚欽怒了,4-0很強勢!賽后采訪高情商談張禹珍,裁判無地自容

有范又有料
2026-02-28 16:57:31
內馬爾:我跟維尼修斯說,他進球再做和首回合同樣的慶祝動作

內馬爾:我跟維尼修斯說,他進球再做和首回合同樣的慶祝動作

懂球帝
2026-02-28 19:27:26
54歲仍未婚,有北京戶口卻為母親定居青島,譚凱坦言從沒后悔過

54歲仍未婚,有北京戶口卻為母親定居青島,譚凱坦言從沒后悔過

風月得自難尋
2026-02-27 21:37:53
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
中東誰也打不過的以色列,在東亞算什么水平?韓國:誰也打不過

中東誰也打不過的以色列,在東亞算什么水平?韓國:誰也打不過

比利
2025-11-29 18:49:51
一家三口看《飛馳人生》, 老婆約小三坐旁邊偷情, 被老公炸裂抓奸

一家三口看《飛馳人生》, 老婆約小三坐旁邊偷情, 被老公炸裂抓奸

扮貓騎老虎
2026-02-26 17:21:01
你啥時候意識到錢的重要性?網友:錢能解決85%以上的雞毛蒜皮事

你啥時候意識到錢的重要性?網友:錢能解決85%以上的雞毛蒜皮事

帶你感受人間冷暖
2026-02-23 01:22:30
特朗普官宣:美軍大規(guī)模進攻伊朗,政權更迭、全面摧毀目標全公開

特朗普官宣:美軍大規(guī)模進攻伊朗,政權更迭、全面摧毀目標全公開

老馬拉車莫少裝
2026-02-28 21:53:45
又一個“扶弟魔”!訂婚宴上彩禮臨時漲價38萬,男方被逼直接退婚

又一個“扶弟魔”!訂婚宴上彩禮臨時漲價38萬,男方被逼直接退婚

丫頭舫
2026-02-28 11:22:55
深圳灣公園晚上“黑燈瞎火”被吐槽,公園管理中心回應:為了讓鳥兒睡好覺,主要出入口等地保留了基礎照明

深圳灣公園晚上“黑燈瞎火”被吐槽,公園管理中心回應:為了讓鳥兒睡好覺,主要出入口等地保留了基礎照明

揚子晚報
2026-02-27 12:33:02
2026-02-28 22:28:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12382文章數 142573關注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

87歲哈梅內伊對拉里賈尼委以重任 還建立完整繼承體系

頭條要聞

87歲哈梅內伊對拉里賈尼委以重任 還建立完整繼承體系

體育要聞

球隊主力全報銷?頂風擺爛演都不演了

娛樂要聞

疑似王一博被爆私密聊天記錄

財經要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

健康
手機
時尚
房產
教育

轉頭就暈的耳石癥,能開車上班嗎?

手機要聞

酷比魔方掌玩mini 4 Ultra要上Flyme?官方表態(tài):在談適配

發(fā)現4種春季很襯膚色的辦法,照著穿

房產要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

教育要聞

要調劑的老師來!!!

無障礙瀏覽 進入關懷版