国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達拿出推理版VLA:Alpamayo-R1讓自動駕駛AI更會動腦子

0
分享至



一、自動駕駛的瓶頸:「看」得見,卻「想」不明白

當(dāng)今自動駕駛模型越來越強大,攝像頭、雷達、Transformer 網(wǎng)絡(luò)一齊上陣,似乎什么都「看得見」。但真正的挑戰(zhàn)在于:模型能否像人一樣「想明白」為什么要這么開?

傳統(tǒng)的端到端(E2E)系統(tǒng)雖然能從感知到控制一氣呵成,卻常在「長尾場景」翻車 —— 比如:

  • 迎面來車違規(guī)左轉(zhuǎn);
  • 行人突然闖入;
  • 臨時施工、交通標(biāo)志被遮擋。

這些「極少數(shù)但容易發(fā)生事故」的場景正是當(dāng)前系統(tǒng)的盲點。

二、Alpamayo-R1:給模型裝上「推理鏈條」

NVIDIA Research 推出的Alpamayo-R1(AR1),是一種全新的帶有推理能力的視覺 - 語言 - 行動模型(Reasoning VLA),讓車輛不只是「執(zhí)行指令」,而是能在決策前「推理出因果關(guān)系」。



圖 1:Alpamayo-R1 模型架構(gòu)(示意)

AR1 的核心創(chuàng)新有三個方面:

1. Chain of Causation(因果鏈)數(shù)據(jù)集

AR1 引入了一套全新的數(shù)據(jù)標(biāo)注體系:每一段駕駛數(shù)據(jù)不僅有「做了什么」,還有 「為什么這樣做」。例如:「減速并左變道,是因為前方有助動車等紅燈,且左側(cè)車道空閑?!?/p>



圖 2:因果鏈(CoC)標(biāo)注示例

2. Diffusion-based Trajectory Decoder(擴散式軌跡解碼器)

AR1 引入了一種基于擴散模型的軌跡解碼器,它能在實時約束下生成連續(xù)、動態(tài)可行的駕駛軌跡。該模塊結(jié)合語言推理輸出與物理約束,實現(xiàn)從推理到控制的無縫銜接。

3. Multi-Stage Training(多階段訓(xùn)練策略)

AR1 是基于 NVIDIA 的 Cosmos Reason 模型,這是一種專為物理 AI(Physical AI)設(shè)計的推理視覺語言模型;并采用多階段訓(xùn)練策略:首先在大規(guī)模駕駛數(shù)據(jù)上做模態(tài)注入,學(xué)習(xí)從視覺到動作的基本映射;第二階段在 CoC 因果鏈數(shù)據(jù)上做監(jiān)督微調(diào),顯式教會模型「先想清楚再開」;最后通過強化學(xué)習(xí)(RL)進一步優(yōu)化推理質(zhì)量、推理 - 行動一致性和軌跡安全性。

這種分階段、分目標(biāo)的訓(xùn)練流程,使得模型在開放場景、長尾危險場景中都表現(xiàn)的更加穩(wěn)健。

三、性能飛躍:更穩(wěn)、更準(zhǔn)、更懂你

在實驗中,AR1 為以下性能帶來了顯著提升:

  • 規(guī)劃精度提升 12%
  • 越界率降低 35%
  • 近碰率降低 25%
  • 推理 - 行動一致性提升 37%
  • ? 實時性能:99 ms 端到端延遲

更重要的是,這些提升主要體現(xiàn)在以往最容易出錯的「長尾場景」中 —— 也就是說,它更接近「真正會判斷的司機」。

四、Vision Encoding:高效多相機時序感知

AR1 的輸入由多相機、多時序觀測幀組成,同時可以選配高層語言輸入(如導(dǎo)航指令或駕駛目標(biāo))。所有輸入(包括歷史自車運動)會被統(tǒng)一編碼成多模態(tài) token 序列,按時序和傳感器順序排列,再送入主干模型 Cosmos-Reason 進行推理與預(yù)測。

在這一過程中:

  • 每個相機視角先經(jīng)過輕量級 CNN 與時間注意力模塊做特征壓縮與時序建模;
  • 多相機特征隨后融合為 BEV(鳥瞰圖)表征;
  • 所有模態(tài)(圖像、導(dǎo)航文本、自車狀態(tài))被 token 化后統(tǒng)一輸入 Transformer;
  • 模型的輸出包含三類 token:推理鏈(reasoning traces)、中層動作(meta-actions)與未來軌跡預(yù)測(trajectories)。

這種統(tǒng)一編碼方式讓模型具備了多模態(tài)語義理解與運動狀態(tài)感知的「一體化」能力。

五、數(shù)據(jù)的靈魂:結(jié)構(gòu)化標(biāo)注的革命

AR1 的 CoC 數(shù)據(jù)集采用「人機協(xié)同標(biāo)注」機制:

  • 人工部分:標(biāo)注關(guān)鍵幀、核心因果因素(如紅燈、行人、障礙物),并撰寫推理鏈。
  • 自動部分:通過 GPT-5 等大模型自動生成初版推理,再由人類審查。
  • 質(zhì)量審核:每條樣本通過因果覆蓋、因果正確性、近因優(yōu)先等四項規(guī)則嚴(yán)格把關(guān)。

最終形成數(shù)十萬條高質(zhì)量推理 - 行動樣本,使 VLA 模型能真正「理解因果,而非記憶現(xiàn)象」。



圖 3:CoC 數(shù)據(jù)標(biāo)注流程示意圖

六、Multi-Stage Training:從常識推理到行為控制

Alpamayo-R1 的訓(xùn)練分為三個階段,旨在讓模型從「看懂」到「會想」再到「能開」。



圖 4: AR1 訓(xùn)練流程示意圖

1. 監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT)

基于 Cosmos-Reason 的預(yù)訓(xùn)練權(quán)重進行微調(diào)。該主干模型原本在 370 萬條 VQA 數(shù)據(jù)上后訓(xùn)練(post-training),其中包括 2.47 萬條專為駕駛設(shè)計的視頻樣本,帶有場景描述、駕駛難度和推理軌跡標(biāo)注,幫助模型建立「物理常識」和 「因果直覺」。

此外還構(gòu)建了額外的 10 萬條駕駛樣本,標(biāo)注關(guān)鍵目標(biāo)、交通信號、因果行為解釋等信息,用于領(lǐng)域自適應(yīng)微調(diào)。

2. 因果鏈監(jiān)督階段(CoC Supervision)

引入 CoC 因果鏈數(shù)據(jù)集,顯式監(jiān)督模型的推理輸出,使其能回答「為什么要減速」、「為什么左轉(zhuǎn)」。這一階段通過人工 + 教師模型(如 GPT-5)生成高質(zhì)量推理樣本,使模型在策略學(xué)習(xí)前先獲得強大的語言 - 推理能力。

3. 強化學(xué)習(xí)后訓(xùn)練優(yōu)化(Reinforcement Learning based Post-Training)。

在最終階段,英偉達通過強化學(xué)習(xí)對模型進行策略微調(diào),以進一步提升其在推理精準(zhǔn)性、推理–行動一致性、軌跡平滑性以及閉環(huán)控制穩(wěn)定性等方面的表現(xiàn)。

Alpamayo-R1 引入了多維度獎勵機制:包括由專家級推理模型提供的反饋信號,用于評估并引導(dǎo)模型生成更具因果邏輯的推理;「推理–行動一致性(Reasoning–Action Consistency)」獎勵,用于鼓勵模型依據(jù)自身推理合理執(zhí)行動作;以及底層安全獎勵,用以促進模型生成更加安全、平滑且可執(zhí)行的運動軌跡。

七、未來展望:邁向可解釋的 L4 自動駕駛

AR1 的設(shè)計理念可以看作是自動駕駛從「黑箱」到「白箱」的轉(zhuǎn)折點。

它不再只是一個會開車的 AI,而是一個能告訴你「為什么這樣開」的駕駛員。

? 小結(jié):讓自動駕駛「有理可講」

Alpamayo-R1 的意義不止在性能提升,更在于:它讓 AI 的「推理鏈」與物理世界的「行動鏈」形成真正的閉環(huán)。

當(dāng)車輛能解釋自己的每一個決策時,才能確保更加安全,信任與普及才會得以實現(xiàn)。

一句話總結(jié):AR1 = 會開車 + 會思考 + 會解釋的自動駕駛模型。

詳細內(nèi)容請查看:https://research.nvidia.com/publication/2025-10_alpamayo-r1

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
王石不戴假發(fā)樣子曝光!光頭更年輕,到香港聚餐,只喝茶不敢喝酒

王石不戴假發(fā)樣子曝光!光頭更年輕,到香港聚餐,只喝茶不敢喝酒

老頭的傳奇色彩
2026-02-28 19:57:17
新iPhone 正式官宣:3 月 2 日,即將發(fā)布!

新iPhone 正式官宣:3 月 2 日,即將發(fā)布!

科技堡壘
2026-02-28 11:22:07
建業(yè)集團董事長胡葆森滯留香港

建業(yè)集團董事長胡葆森滯留香港

地產(chǎn)微資訊
2026-02-28 12:39:40
主裁解釋沖突懲罰!約基奇回應(yīng)多爾特惡犯:那是一個不必要動作

主裁解釋沖突懲罰!約基奇回應(yīng)多爾特惡犯:那是一個不必要動作

追球者
2026-02-28 15:01:57
妖、魔、鬼、怪、精,到底有什么區(qū)別?

妖、魔、鬼、怪、精,到底有什么區(qū)別?

歷史地理大發(fā)現(xiàn)
2026-02-27 23:49:41
萬萬沒料到,新當(dāng)選國民黨主席鄭麗文,一查才發(fā)現(xiàn)她是“藍二代”

萬萬沒料到,新當(dāng)選國民黨主席鄭麗文,一查才發(fā)現(xiàn)她是“藍二代”

南權(quán)先生
2025-12-03 16:07:52
“考研6年,卻敗給了一條黑褲襪”,90后女生活成研王爺,被群嘲

“考研6年,卻敗給了一條黑褲襪”,90后女生活成研王爺,被群嘲

妍妍教育日記
2026-02-27 18:35:54
CBA徹底亂套了?遼籃苦主連裁兩名外援:直接擺爛全華班出戰(zhàn)?

CBA徹底亂套了?遼籃苦主連裁兩名外援:直接擺爛全華班出戰(zhàn)?

籃球快餐車
2026-03-01 00:45:18
剛從印度回來,說點不中聽的:印度的真實面目,可能讓你很意外

剛從印度回來,說點不中聽的:印度的真實面目,可能讓你很意外

世界圈
2026-02-26 19:15:06
是它,磷化工寡頭,狂攬370億,獨一無二!

是它,磷化工寡頭,狂攬370億,獨一無二!

飛鯨投研
2026-02-28 19:08:36
他曾與劉濤同床共枕4年,如今年過六旬依舊未娶,劉濤坦言很愧疚

他曾與劉濤同床共枕4年,如今年過六旬依舊未娶,劉濤坦言很愧疚

她時尚丫
2026-02-21 22:03:30
47歲保姆坦言:可以做有償陪伴保姆,但必須要遵守3個約定

47歲保姆坦言:可以做有償陪伴保姆,但必須要遵守3個約定

孢木情感
2026-02-22 11:24:44
王思聰母親林寧疑似低調(diào)探視孩子!母愛無聲卻溫暖人心

王思聰母親林寧疑似低調(diào)探視孩子!母愛無聲卻溫暖人心

草莓解說體育
2026-03-01 01:40:14
兩極反轉(zhuǎn)!網(wǎng)友被父母的老式旅游折服了!評論區(qū)全部是真香現(xiàn)場

兩極反轉(zhuǎn)!網(wǎng)友被父母的老式旅游折服了!評論區(qū)全部是真香現(xiàn)場

另子維愛讀史
2026-02-26 21:36:17
撒貝寧一家回武漢走完親戚返京!老婆太漂亮,龍鳳胎身高沒有隨爹

撒貝寧一家回武漢走完親戚返京!老婆太漂亮,龍鳳胎身高沒有隨爹

大中國
2026-02-26 18:05:01
哇,身材豐腴壯實,長的漂亮,這才是旺夫的女人

哇,身材豐腴壯實,長的漂亮,這才是旺夫的女人

情感大頭說說
2026-02-28 10:03:55
東詹翻臉三大鏡頭曝光!入場就鬧翻,隊友手足無措,艾頓成替罪羊

東詹翻臉三大鏡頭曝光!入場就鬧翻,隊友手足無措,艾頓成替罪羊

嘴炮體壇
2026-02-28 11:26:34
伊朗軍方稱過去數(shù)小時內(nèi)擊落12架敵方作戰(zhàn)和偵查無人機

伊朗軍方稱過去數(shù)小時內(nèi)擊落12架敵方作戰(zhàn)和偵查無人機

財聯(lián)社
2026-03-01 01:00:02
3月開始中國或?qū)⒂瓉硭拇蠼祪r潮:除房價以外,這三類也要降價了

3月開始中國或?qū)⒂瓉硭拇蠼祪r潮:除房價以外,這三類也要降價了

boss外傳
2026-03-01 06:00:03
相親旺季結(jié)束,相親的樂子永遠看不完!看網(wǎng)友分享比春晚還有看頭兒

相親旺季結(jié)束,相親的樂子永遠看不完!看網(wǎng)友分享比春晚還有看頭兒

墻頭草
2026-02-25 13:09:54
2026-03-01 07:32:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12382文章數(shù) 142573關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

以官員稱哈梅內(nèi)伊身亡 遺體在其官邸廢墟中被找到

頭條要聞

以官員稱哈梅內(nèi)伊身亡 遺體在其官邸廢墟中被找到

體育要聞

球隊主力全報銷?頂風(fēng)擺爛演都不演了

娛樂要聞

周杰倫兒子正面照曝光,與父親好像

財經(jīng)要聞

沖突爆發(fā) 市場變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

藝術(shù)
親子
家居
房產(chǎn)
軍事航空

藝術(shù)要聞

驚艷!這位天使般的女子與油畫讓人心動不已!

親子要聞

逆天,在醫(yī)院上班懷孕都要提前申請了!

家居要聞

素色肌理 品意式格調(diào)

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

軍事要聞

美國以色列聯(lián)合襲擊伊朗 實時戰(zhàn)況

無障礙瀏覽 進入關(guān)懷版