国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達投下自動駕駛重磅炸彈!首次開源VLA模型Alpamayo-R1

0
分享至

車東西(公眾號:chedongxi)
作者 | Janson
編輯 | 志豪

英偉達要用“因果推理”重塑L4自動駕駛?!

車東西12月3日消息,日前,英偉達(NVIDIA)研究團隊正式發(fā)布并開源全新的視覺-語言-動作(VLA)模型Alpamayo-R1,并明確宣布計劃在未來的更新中開源該模型及部分核心數(shù)據(jù)集。


▲Alpamayo-R1對應(yīng)的數(shù)據(jù)集已上傳至開源社區(qū)

目前,該模型對應(yīng)的數(shù)據(jù)集也已上傳至開源社區(qū),總大小約100TB,這也是英偉達首次將VLA模型進行開源。


▲Alpamayo-R1模型架構(gòu)

這一舉措不僅打破了高端自動駕駛模型的封閉高墻,更標志著端到端自動駕駛技術(shù)從單純的“模仿行為”邁向了具備深層“因果思考”的新階段。

對于自動駕駛行業(yè)而言,Alpamayo-R1的出現(xiàn)直擊了當前最令人頭疼的痛點——長尾場景(Long-tail scenarios)下的安全性。

英偉達此次帶來的 Alpamayo-R1正是為了終結(jié)這一困境,而其交出的實測成績單也足夠令人信服。


▲Alpamayo-R1相對基線的提升明顯

在針對極高難度長尾場景的測試中,AR1的規(guī)劃準確率相比僅有軌跡預(yù)測的基線模型提升了整整12%;

在閉環(huán)仿真測試里,AR1成功將車輛沖出道路的事故率降低了35%;

與其他車輛或行人的近距離危險遭遇率也大幅減少了25%。

更值得一提的是,即便在集成復(fù)雜的推理大腦后,該模型在NVIDIA RTX 6000 Pro Blackwell車載硬件上依然保持了99毫秒的端到端超低延遲,完全滿足了實時自動駕駛的嚴苛需求。

一、解決自動駕駛端到端黑盒問題 引入因果鏈數(shù)據(jù)集

過去幾年,基于模仿學(xué)習(xí)的端到端大模型雖然通過堆砌數(shù)據(jù)量取得了顯著進步,但它們本質(zhì)上更像是一個只會死記硬背的“黑盒”。

這些模型能夠精準模仿人類駕駛員的操作,卻缺乏對場景的因果理解。它們知道“前面有車要剎車”,卻不知道“為什么要剎車”。

這種知其然不知其所以然的缺陷,導(dǎo)致車輛在面對從未見過的高風(fēng)險復(fù)雜路況時,往往表現(xiàn)脆弱,決策邏輯甚至自相矛盾。

為了讓AI真正學(xué)會像人類老司機一樣思考,英偉達并沒有選擇在現(xiàn)有模型上修修補補,而是從最底層的數(shù)據(jù)構(gòu)建開始了一場革命。


▲因果鏈推理演示

為了解決傳統(tǒng)數(shù)據(jù)集中描述模糊、缺乏邏輯關(guān)聯(lián)的問題,研究團隊構(gòu)建了一套全新的“因果鏈”(Chain of Causation, CoC)數(shù)據(jù)集。

這套數(shù)據(jù)集的核心在于教會模型建立“觀察-原因-決策”的嚴密邏輯閉環(huán)。它不再讓AI生成諸如“天氣晴朗、路面寬闊”這類無關(guān)痛癢的旁白。

在這套模型下,提示詞可明確指出“因為左側(cè)有車輛正在強行并線,且前方有行人橫穿,所以我決定減速避讓”。

這種數(shù)據(jù)構(gòu)建方式不僅消除了因果混淆,更有效提升了模型的邏輯性。

二、引入新架構(gòu) 平衡模型性能

在強大的數(shù)據(jù)支撐下,Alpamayo-R1采用了一種模塊化且高效的架構(gòu)設(shè)計,巧妙地平衡了“慢思考”與“快行動”。

其大腦由英偉達專為物理AI打造的Cosmos-Reason視覺語言模型驅(qū)動,負責處理復(fù)雜的環(huán)境理解和邏輯推理。

而行動則交由一個基于流匹配(Flow Matching)技術(shù)的動作專家解碼器來控制。

這種分工合作的機制,讓模型既能利用大語言模型的廣博知識進行深思熟慮,又能通過擴散模型生成絲般順滑且符合車輛動力學(xué)的行駛軌跡,完美解決了大模型通常反應(yīng)遲鈍的弊病。

不過,真正讓Alpamayo-R1與眾不同的,是其在訓(xùn)練階段引入的強化學(xué)習(xí)(RL)機制。


▲推理-動作高一致性將提升獎勵

在監(jiān)督學(xué)習(xí)教會模型基本的駕駛技能后,研究人員引入了一個更為嚴苛的“判卷老師”——利用更大規(guī)模的推理模型作為批評者(Critic),對AR1的表現(xiàn)進行打分。

這個階段的訓(xùn)練目標非常明確——要求模型言行一致。

對此,該模型中的獎勵函數(shù)不僅看重車輛是否開得安全,更看重模型嘴上說的推理邏輯與實際做出的駕駛動作是否吻合。

如果模型推理說“因為紅燈要停車”,但實際動作卻在加速,它就會受到嚴厲懲罰。


▲采用強化學(xué)習(xí)新模式后質(zhì)量顯著提升

這種訓(xùn)練方式讓AI的解釋不再是一種事后的敷衍,而是真正成為了指導(dǎo)車輛行動的決策綱領(lǐng),推理質(zhì)量因此提升了45%,推理與行動的一致性也提高了37%。

在論文的最后還有一個小彩蛋,致謝中排在第一位的正是英偉達自動駕駛負責人吳新宙。


▲吳新宙在致謝第一位

結(jié)語:英偉達首次開源VLA模型

隨著 Alpamayo-R1 的發(fā)布及后續(xù)開源計劃的推進,英偉達不僅展示了一條通往 L4 級自動駕駛的務(wù)實技術(shù)路徑,更為整個開源社區(qū)注入了強勁動力。

當自動駕駛汽車開始能夠清晰地解釋自己的每一個決策邏輯時,我們距離那個真正安全、可信的自動駕駛未來,或許只剩下最后的一公里。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
倫納德41分殺瘋,哈登14罰12中硬扛,6個問題戳穿兩隊真相

倫納德41分殺瘋,哈登14罰12中硬扛,6個問題戳穿兩隊真相

籃球看比賽
2025-12-25 11:13:09
蘭桂坊平安夜人流增,內(nèi)地客:香港圣誕氣氛冠絕全國

蘭桂坊平安夜人流增,內(nèi)地客:香港圣誕氣氛冠絕全國

星島記事
2025-12-25 09:18:35
反差!艾什莉體模竟是《無雙》粉絲 曬出大量古早周邊

反差!艾什莉體模竟是《無雙》粉絲 曬出大量古早周邊

游民星空
2025-12-25 22:04:23
重要賽事!12月25日晚19:00!中央5套CCTV5、CCTV5+直播節(jié)目表

重要賽事!12月25日晚19:00!中央5套CCTV5、CCTV5+直播節(jié)目表

林子說事
2025-12-25 16:22:10
鄭州高新區(qū)通報“一學(xué)校學(xué)生意外墜樓”:已成立聯(lián)合調(diào)查組

鄭州高新區(qū)通報“一學(xué)校學(xué)生意外墜樓”:已成立聯(lián)合調(diào)查組

上觀新聞
2025-12-25 07:32:05
驚呆!26歲新手媽媽被當成初中生,喂水時老公成“爸爸”?

驚呆!26歲新手媽媽被當成初中生,喂水時老公成“爸爸”?

特約前排觀眾
2025-12-24 00:10:06
醫(yī)學(xué)博士:腫瘤越來越高發(fā),我們究竟被隱瞞了什么?

醫(yī)學(xué)博士:腫瘤越來越高發(fā),我們究竟被隱瞞了什么?

深度報
2025-12-21 23:01:02
主動投案,物產(chǎn)中大融資租賃集團有限公司黨委副書記、紀委書記蔣松海接受審查調(diào)查

主動投案,物產(chǎn)中大融資租賃集團有限公司黨委副書記、紀委書記蔣松海接受審查調(diào)查

界面新聞
2025-12-25 17:32:56
人到中年,家里達到4個以上條件,你已經(jīng)超越90%的家庭了

人到中年,家里達到4個以上條件,你已經(jīng)超越90%的家庭了

十點讀書
2025-12-24 19:30:57
外交部:堅決反對美方報告挑撥中國同其他國家關(guān)系

外交部:堅決反對美方報告挑撥中國同其他國家關(guān)系

新京報
2025-12-25 15:48:03
偷渡美國,大喊甜甜圈好吃的王偉恒,終于等來了現(xiàn)世報

偷渡美國,大喊甜甜圈好吃的王偉恒,終于等來了現(xiàn)世報

法老不說教
2025-12-25 23:57:30
中日爭端大結(jié)局?高市連送中國兩份大禮,日本50年國運沒了!

中日爭端大結(jié)局?高市連送中國兩份大禮,日本50年國運沒了!

花花娛界
2025-12-25 20:42:12
還記得克拉拉的紅裙嗎?9年后《情圣3》歸來,驚艷不再,只?;奶?>
    </a>
        <h3>
      <a href=娛樂圈十三太保
2025-12-25 16:45:29
帕金斯認為雷霆與馬刺的圣誕大戰(zhàn)必須取勝:你想摧毀他們的自信

帕金斯認為雷霆與馬刺的圣誕大戰(zhàn)必須取勝:你想摧毀他們的自信

好火子
2025-12-26 03:04:17
大跌眼鏡!美國斬殺線讓美國破了大防!

大跌眼鏡!美國斬殺線讓美國破了大防!

小莜讀史
2025-12-24 13:06:02
曾仕強教授:2026年是一道大坎,很多人恐怕?lián)尾贿^去

曾仕強教授:2026年是一道大坎,很多人恐怕?lián)尾贿^去

心靈短笛
2025-12-03 10:08:19
今天下午,中超傳來重慶銅梁龍、向余望、北京國安消息

今天下午,中超傳來重慶銅梁龍、向余望、北京國安消息

林子說事
2025-12-26 00:31:57
馬卡談恩德里克租借:皇馬出租出去的前鋒再回歸時很難有成就

馬卡談恩德里克租借:皇馬出租出去的前鋒再回歸時很難有成就

懂球帝
2025-12-25 21:50:21
不只是俄羅斯傻眼了,就連我們都傻眼了

不只是俄羅斯傻眼了,就連我們都傻眼了

南權(quán)先生
2025-12-24 16:55:53
《老舅》開播登頂!卻被罵上熱搜?這國產(chǎn)劇到底咋了?

《老舅》開播登頂!卻被罵上熱搜?這國產(chǎn)劇到底咋了?

小片片說大片
2025-12-25 11:25:09
2025-12-26 07:44:49
車東西
車東西
未來汽車看這里。
5773文章數(shù) 6384關(guān)注度
往期回顧 全部

科技要聞

“不再是機器人大國”,日本錯過了什么?

頭條要聞

美國始料未及:日本防衛(wèi)開支若到GDP3% "安保條約"作廢

頭條要聞

美國始料未及:日本防衛(wèi)開支若到GDP3% "安保條約"作廢

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當球踢!

財經(jīng)要聞

新規(guī)來了,年化超24%的小貸被即刻叫停

汽車要聞

速來!智界在上海西岸準備了年末潮流盛典

態(tài)度原創(chuàng)

藝術(shù)
旅游
家居
房產(chǎn)
軍事航空

藝術(shù)要聞

William Dyce:19世紀蘇格蘭重要的畫家

旅游要聞

灣里項目今日啟幕

家居要聞

經(jīng)典彌新 品味浪漫居所

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬家,又一波巨頭涌向海南!

軍事要聞

俄方:歐洲“根本沒有考慮和平”

無障礙瀏覽 進入關(guān)懷版