国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

競速與暗戰(zhàn),智能輔助駕駛邁入Next Level

0
分享至


理想主義者是值得尊敬的,但很少成功。在當(dāng)下的輔助駕駛領(lǐng)域,尤為如此。

2025年智能輔助駕駛戰(zhàn)場,彌漫著“短平快”的焦慮。部分車企依賴人工采集“老司機(jī)數(shù)據(jù)”,甚至雇傭數(shù)百人實車路測,成本高昂卻效率低下。同時,“端到端+VLM”架構(gòu)遭遇瓶頸——訓(xùn)練數(shù)據(jù)突破1000萬Clips后,性能增長緩慢。實車測試無法復(fù)現(xiàn)極端場景,接管里程的數(shù)字繁榮背后隱藏著極端場景的未解難題。

面對這些現(xiàn)象,現(xiàn)有端到端模型已給不出更多答案,端到端模型像猴子開車,能夠?qū)W習(xí)人類行為,但并不理解物理世界。傳統(tǒng)用規(guī)則算法“修補(bǔ)”端到端缺陷的方式已然失效,而現(xiàn)在,理想、小鵬等造車新勢力正在推翻現(xiàn)有架構(gòu),以全新的VLA大模型重燃新一輪智駕戰(zhàn)火。


新勢力押注VLA

在最近理想和小鵬首發(fā)的i8和G7 Ultra中,VLA成為關(guān)鍵技術(shù)。

理想i8核心亮點就是VLA“司機(jī)大模型”,這是理想汽車智駕領(lǐng)域繼去年推出“端到端+VLM”之后的又一新進(jìn)展。理想VLA的所有模塊經(jīng)過全新設(shè)計,空間編碼器通過語言模型并結(jié)合邏輯推理,給出合理的駕駛決策,并通過Diffusion(擴(kuò)散模型)預(yù)測其他車輛和行人的軌跡,進(jìn)一步優(yōu)化出最佳的駕駛軌跡。


8月15日,小鵬汽車宣布,小鵬G7 Ultra的VLA能力再度提前,現(xiàn)已明確8月內(nèi)可以開啟首批推送。“高速人機(jī)共駕”等功能,不僅即將登陸Ultra車型,也會通過OTA推送至Max車型。


據(jù)稱,小鵬G7 Ultra車型將搭載本地端VLA模型,具備VLA思考推理可視化、語音控車、主動推薦等功能。這一版本使用了3顆小鵬汽車自研的圖靈AI芯片,綜合算力高達(dá)2250TOPS。

“端到端+VLM”被視為區(qū)分智能輔助駕駛技術(shù)的分水嶺。在此之前,NPN(先驗網(wǎng)絡(luò))輕圖、無圖均是人工時代的技術(shù),而人工時代的最大特點是“規(guī)則算法”,需要工程師設(shè)計算法并編寫程序,因此提升輔助駕駛性能依賴于工程師的能力和經(jīng)驗。

然而,從“端到端+VLM”開始,車企不再用傳統(tǒng)的方式做,“端到端+VLM”架構(gòu)的本質(zhì)是模仿學(xué)習(xí),是用人類駕駛數(shù)據(jù)訓(xùn)練模型,數(shù)據(jù)數(shù)量和質(zhì)量決定性能。

這場智能輔助駕駛的比拼特別像體育界的鐵人三項,要想贏得競賽,需要三個核心要素:技術(shù)、工程和產(chǎn)品。智能輔助駕駛要實現(xiàn)好用、愛用,需要關(guān)注兩個維度。一個是Scale up(性能提升),即把系統(tǒng)打磨到可以處理各種極端環(huán)境和復(fù)雜交通流;另一個是Scale out(場景泛化),即系統(tǒng)在全場景下在不同的時間、天氣、環(huán)境和不同的城市都可以有很好的表現(xiàn)。

從技術(shù)路徑看,無論端到端也好,還是VLM也罷,最后來看都將殊途同歸,就是建立VLA流程,整體系統(tǒng)會更加接近于人的應(yīng)激反應(yīng),(感知)看到什么,(規(guī)控)就能做出相應(yīng)的駕駛動作。不少智駕行業(yè)人士都將VLA視為當(dāng)下“端到端”方案的2.0版本,認(rèn)為這是未來確定的技術(shù)路線,只是實現(xiàn)的時間快慢問題。

在智能輔助駕駛的發(fā)展過程中,VLA和一段式端到端是兩個較為主流的技術(shù)路徑。

VLA作為一種融合了視覺(Vision)、語言(Language)和操作決策(Action)的多模態(tài)大模型,是介于傳統(tǒng)模塊化和端到端之間的技術(shù)架構(gòu)。它不直接控制車輛,而是先把路況轉(zhuǎn)化為“語義信息”,比如把感知硬件看到的車道、障礙物、紅綠燈等信息做成語義標(biāo)注,包括文本描述和視覺關(guān)聯(lián),動作生成器綜合視覺和語義信息輸出決策。


從理論上分析,作為多模態(tài)大模型,VLA具有強(qiáng)大的場景推理和語言理解能力,可適應(yīng)復(fù)雜、邊緣情況或動態(tài)交通環(huán)境。此外,由于融入了“世界知識”和“常識推理”,VLA理論上具備更高上限的智能行為。

比如,VLA可以理解城市中的“潮汐車道”“公交車道”等指示牌的文字信息,甚至可以理解駕駛者的語音指令并做出相應(yīng)的動作。

VLA架構(gòu)下,端到端與多模態(tài)大模型的結(jié)合將會更徹底。但更具挑戰(zhàn)的是,當(dāng)端到端與VLM模型合二為一后,車端模型參數(shù)將變得更大,這既要有高效實時推理能力,同時還要有大模型認(rèn)識復(fù)雜世界并給出建議的能力,對車端芯片硬件有相當(dāng)高要求。

如何將端到端與多模態(tài)大模型的數(shù)據(jù)與信息進(jìn)行深度交融,實現(xiàn)軟硬件的無縫融合與協(xié)同配合,將考驗著每一個智能輔助駕駛團(tuán)隊的模型框架定義能力、模型的工程開發(fā)能力以及模型快速迭代能力。

在過去一年,幾乎所有主流的車企在輔助駕駛上都更新成了端到端大模型驅(qū)動的系統(tǒng),在短時間內(nèi)性能和體驗提升都比較明顯。但端到端黑盒的研發(fā)模式,導(dǎo)致了部分Corner Case無法追溯產(chǎn)生的原因,這也導(dǎo)致一部分車企很快地從“熱戀期”進(jìn)入到了“瓶頸期”。

即使是當(dāng)前TOP級別的端到端系統(tǒng),在面臨復(fù)雜道路結(jié)構(gòu)疊加復(fù)雜車流博弈時大多數(shù)情況也會崩潰。行業(yè)普遍面臨瓶頸,所以很自然地有公司開始探尋上限更高的新架構(gòu)。

而VLA通過語言模型的引入,很好地解決了研發(fā)和用戶兩端黑盒的問題。

不過,這并不意味著端到端不值得投入開發(fā)。如果規(guī)則算法都做不好,那么根本不知道怎么去做端到端;如果端到端沒有做到一個非常極致的水平,那連VLA怎么去訓(xùn)練都不知道。換句話說,在端到端上取得大規(guī)模成功量產(chǎn)經(jīng)驗,是探索VLA的一個門檻。

為什么是VLA?

過去幾年,輔助駕駛經(jīng)歷了三種架構(gòu)的迭代:規(guī)則算法、端到端、VLA,這是一個從指令控制,到模仿行為,再到理解意圖的過程。每一代技術(shù)都在不停地提升算力、平均接管里程,本質(zhì)上是要不斷接近人類的駕駛方式。

輔助駕駛的人工時代到現(xiàn)在AI時代的分水嶺,是從無圖到端到端。在原來輕圖、NPN 或者無圖的人工時代,輔助駕駛的核心是規(guī)則算法。

最早的輔助駕駛采用模塊化架構(gòu),由于感知、規(guī)劃及執(zhí)行系統(tǒng)相對獨立,且每個步驟都要占用一定的計算時間,整體系統(tǒng)的響應(yīng)較慢,延時較高。

簡單來說,就是需要在既定的規(guī)則下,同時依賴高精地圖,類似螞蟻的行動和完成任務(wù)的方式。但無法完成更復(fù)雜的事情,需要不斷地加限定規(guī)則。

人工時代的局限性在于,單靠人力難以解決所有場景,很多場景是“按下葫蘆起來瓢”,于是輔助駕駛進(jìn)入了端到端時代。

端到端階段通過大模型學(xué)習(xí)人類駕駛行為,足以應(yīng)對大部分泛化場景,但端到端很難解決從未遇到過或特別復(fù)雜的問題,此時需要配合VLM。VLM對復(fù)雜交通環(huán)境具有更強(qiáng)的理解能力,但現(xiàn)有VLM在應(yīng)對復(fù)雜交通環(huán)境時只能起到輔助作用。

“端到端+VLM”的核心是模仿學(xué)習(xí),用人類駕駛的數(shù)據(jù)來訓(xùn)練模型。這個技術(shù)階段,決定性的因素就是數(shù)據(jù)。數(shù)據(jù)多,覆蓋的場景全,數(shù)據(jù)質(zhì)量好——最好是來自老司機(jī),這時訓(xùn)練模型的性能就會非常好。

但模仿學(xué)習(xí)終究有上限。相比過去只依賴真實駕駛數(shù)據(jù),VLA采用生成數(shù)據(jù)和仿真環(huán)境結(jié)合的方式,讓模型能在無風(fēng)險、可控的虛擬世界中自主進(jìn)化。這套思路如今也正在被更多車企采納,VLA正成為智能駕駛的新共識。

由于人類駕駛數(shù)據(jù)存在嚴(yán)重的分布不均,大多集中在白天、晴天、正常通勤等常規(guī)場景,真正復(fù)雜或危險的工況數(shù)據(jù)稀缺且難以采集。而訓(xùn)練具備真實決策能力的模型,恰恰需要這些邊緣與極端場景。

這就要求引入合成數(shù)據(jù)和高質(zhì)量仿真環(huán)境,用生成式方法構(gòu)建覆蓋更全、分布更廣的數(shù)據(jù)集,同時不斷評測模型表現(xiàn)。最終決定模型性能提升速度的關(guān)鍵,不是收集了多少真實數(shù)據(jù),而是仿真迭代的效率。相比傳統(tǒng)的數(shù)據(jù)驅(qū)動方式,這是一種更具主動性的訓(xùn)練方式。

事實上,VLA并不是一套跳級的打法,而是端到端之后的自然發(fā)展。如果沒有經(jīng)歷過端到端階段對模型感知、決策、控制等環(huán)節(jié)的完整訓(xùn)練,就無法一步跨入VLA。

在VLA階段,利用3D視覺和2D的組合構(gòu)建更真實的物理世界,此階段系統(tǒng)可實現(xiàn)看懂導(dǎo)航軟件的運(yùn)行邏輯,而非VLM階段僅能看到一張圖。

同時,VLA不僅能看到物理世界,更能理解物理世界,具有自己的語言和思維鏈系統(tǒng),有推理能力,可以像人類一樣去執(zhí)行一些復(fù)雜動作,能夠更好的處理人類駕駛行為的多模態(tài)性,可以適應(yīng)更多駕駛風(fēng)格。

在海量的優(yōu)質(zhì)數(shù)據(jù)的加持下,VLA模型在絕大多數(shù)場景下能接近人類的駕駛水平;隨著偏好數(shù)據(jù)的逐步豐富,模型的表現(xiàn)也逐步接近專業(yè)司機(jī)的水平,安全下限也得到了巨大的提升。

VLA雖然給自動駕駛行業(yè)提出了新的可能,但實際應(yīng)用依舊面臨很多挑戰(zhàn)。

首先是模型可解釋性不足,作為“黑盒子”系統(tǒng),很難逐步排查在邊緣場景下的決策失誤,給安全驗證帶來難度。

其次,端到端訓(xùn)練對數(shù)據(jù)質(zhì)量和數(shù)量要求極高,還需構(gòu)建覆蓋多種交通場景的高保真仿真環(huán)境。另外,計算資源消耗大、實時性優(yōu)化難度高,也是VLA商用化必須克服的技術(shù)壁壘。

為了解決上述問題,車企也正在探索多種技術(shù)路徑。如有通過引入可解釋性模塊或后驗可視化工具,對決策過程進(jìn)行透明化;還有利用Diffusion模型對軌跡生成進(jìn)行優(yōu)化,確?刂浦噶畹钠交耘c穩(wěn)定性。同時,將VLA與傳統(tǒng)規(guī)則引擎或模型預(yù)測控制(MPC)結(jié)合,以混合架構(gòu)提高安全冗余和系統(tǒng)魯棒性也成為熱門方向。

智能輔助駕駛接近決戰(zhàn)時刻

理想、小鵬并不是智能輔助駕駛領(lǐng)域的先行者,當(dāng)技術(shù)方向清晰后,它們迅速通過投入大算力和海量的數(shù)據(jù),快速驗證路徑,追上了對手。這種路徑適用于車輛保有量大、且駕駛數(shù)據(jù)可有效回傳的車企。但隨著時間的推進(jìn),落后者的機(jī)會窗口逐漸縮窄。

從端到端到“端到端+VLM”再到VLA,其中需要面臨很多現(xiàn)實難題,比如多模態(tài)對齊工程龐大,成熟度亟待提升,多模態(tài)數(shù)據(jù)的獲取和訓(xùn)練也十分困難,對于算力需求更是水漲船高。

目前,行業(yè)應(yīng)用的主流英偉達(dá)Orin芯片單顆算力254TOPS,且不支持直接運(yùn)行語言模型。而英偉達(dá)Thor芯片由于存在設(shè)計缺陷和工程問題,實際算力與宣傳數(shù)據(jù)相比大幅縮水,其中Thor S、Thor U版本的算力約為700TOPS,而Thor Z基礎(chǔ)版算力約為300TOPS,對于端到端+VLM的算力需求而言,都依然緊張。


算力不足會導(dǎo)致大模型在推理過程中可能出現(xiàn)時延超過200毫秒的問題,而自動駕駛系統(tǒng)對于緊急制動等操作的響應(yīng)時間要求是控制在100毫秒以內(nèi)。

正因如此,目前行業(yè)內(nèi)的芯片算力大戰(zhàn)正在逐漸升溫。除了英偉達(dá),高通推出的8797艙駕一體芯片最高支持350TOPS算力,也已成為車企的選擇之一。

而車企,尤其是新勢力企業(yè)自研AI芯片已經(jīng)逐漸成為潮流,其中,理想汽車自研的馬赫(原名“舒馬赫”)100大算力AI芯片,盡管尚未透露參數(shù),但今年5月已經(jīng)流片成功,計劃2026年量產(chǎn)。

特斯拉下一代全自動駕駛(FSD)芯片AI 5已進(jìn)入量產(chǎn)階段,單顆算力或達(dá)到2500TOPS,較AI 4提升4~5倍,據(jù)稱最快在今年年底啟用。

此外,多模態(tài)對齊使得VLA需要依賴海量的標(biāo)注數(shù)據(jù)來實現(xiàn),然而在實際應(yīng)用場景中,雨天反光、夜間弱光等并不常見的極端場景相關(guān)數(shù)據(jù)積累不足,將影響VLA的決策準(zhǔn)確率及可靠性。所以,VLA要實現(xiàn)大規(guī)模落地,至少需要3~5年時間甚至更久。

VLA的大規(guī)模落地,本質(zhì)是算法、算力、數(shù)據(jù)技術(shù)革命的交匯。短期(2025~2026年)具備VLA功能的車型將在高速公路、封閉園區(qū)等特定場景運(yùn)行,典型應(yīng)用包括自動泊車、高速領(lǐng)航等。

中期(2027~2029年),隨著算力達(dá)2000TOPS及以上新一代AI芯片量產(chǎn),VLA將覆蓋城市道路全場景,平均無接管里程將顯著提升,或突破100公里,接管率或降至0.01次/公里以下。

長期(2030年后),將出現(xiàn)如光計算架構(gòu)等專用AI芯片,并與腦機(jī)接口技術(shù)融合,或?qū)⑹筕LA實現(xiàn)類人駕駛的直覺決策能力,如準(zhǔn)確預(yù)判行人突發(fā)行為的概率等。

多模態(tài)對齊成熟度、訓(xùn)練效率提升、芯片能效比革命等一些關(guān)鍵因素,都可能在未來3~5年迎來新的突破,為VLA大規(guī)模落地提供更好支持。

然而,技術(shù)路線的驟然升級與競賽變奏,為還沒發(fā)力端到端的玩家設(shè)置了更高門檻,后發(fā)制人的機(jī)會更加稀少,距離智能輔助駕駛的決戰(zhàn)時刻已經(jīng)越來越近。

- 本文為極智GeeTech原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載 -

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
對裁判長達(dá)99秒的怒斥,杰倫·布朗表明他已經(jīng)忍無可忍,不怕罰

對裁判長達(dá)99秒的怒斥,杰倫·布朗表明他已經(jīng)忍無可忍,不怕罰

好火子
2026-01-12 01:43:58
東莞市衛(wèi)健局回應(yīng)“網(wǎng)傳疑患梅毒網(wǎng)紅住院記錄”:診療記錄涉隱私需保護(hù),將調(diào)查核實 本人發(fā)檢測報告否認(rèn)

東莞市衛(wèi)健局回應(yīng)“網(wǎng)傳疑患梅毒網(wǎng)紅住院記錄”:診療記錄涉隱私需保護(hù),將調(diào)查核實 本人發(fā)檢測報告否認(rèn)

紅星新聞
2026-01-11 17:02:17
土葬大調(diào)整!2026年3月施行,耕地上老墳拆不拆?補(bǔ)貼明細(xì)來了!

土葬大調(diào)整!2026年3月施行,耕地上老墳拆不拆?補(bǔ)貼明細(xì)來了!

老特有話說
2026-01-10 17:37:12
威海開啟暴雪模式:深夜下起“傾盆大瓢雪”,積雪深度超20厘米,有游客凌晨海邊玩雪3小時

威海開啟暴雪模式:深夜下起“傾盆大瓢雪”,積雪深度超20厘米,有游客凌晨海邊玩雪3小時

極目新聞
2026-01-11 12:16:32
太陽報:長子向小貝夫婦發(fā)函,警告他們只能通過律師與他聯(lián)系

太陽報:長子向小貝夫婦發(fā)函,警告他們只能通過律師與他聯(lián)系

懂球帝
2026-01-09 20:05:05
中國有源相控陣?yán)走_(dá)真實水平:并非世界第一,和美差距有多大

中國有源相控陣?yán)走_(dá)真實水平:并非世界第一,和美差距有多大

黑翼天使
2026-01-10 03:28:16
超級驚喜!真不像傳統(tǒng)的中國男足 1-0爆冷澳大利亞 2輪4分升頭名

超級驚喜!真不像傳統(tǒng)的中國男足 1-0爆冷澳大利亞 2輪4分升頭名

侃球熊弟
2026-01-11 20:18:32
記者:施羅德找到東契奇說“你不能在場上叫我碧池后就裝沒事人”

記者:施羅德找到東契奇說“你不能在場上叫我碧池后就裝沒事人”

懂球帝
2026-01-11 11:49:14
吵翻天了!美國新版膳食指南重磅發(fā)布,國人如何借鑒?

吵翻天了!美國新版膳食指南重磅發(fā)布,國人如何借鑒?

營養(yǎng)師谷傳玲
2026-01-10 14:59:39
每天一個水煮蛋是“死亡催化劑”?提醒:想健康吃蛋,5個錯別犯

每天一個水煮蛋是“死亡催化劑”?提醒:想健康吃蛋,5個錯別犯

健康科普365
2026-01-11 20:30:03
真沒想到!風(fēng)電龍頭竟然承包了半壁航天供應(yīng)鏈

真沒想到!風(fēng)電龍頭竟然承包了半壁航天供應(yīng)鏈

和訊網(wǎng)
2026-01-11 21:53:47
WTT冠軍賽:奧運(yùn)亞軍出局后喊話樊振東:我要跟我的好朋友去爭冠

WTT冠軍賽:奧運(yùn)亞軍出局后喊話樊振東:我要跟我的好朋友去爭冠

十點街球體育
2026-01-12 00:00:03
上觀新聞:安東尼奧的丑陋踢法符合中國足球?qū)嶋H

上觀新聞:安東尼奧的丑陋踢法符合中國足球?qū)嶋H

懂球帝
2026-01-11 22:32:27
廣州小學(xué)生被抽血事件:告訴爸媽就扣小紅花

廣州小學(xué)生被抽血事件:告訴爸媽就扣小紅花

每日一見
2026-01-02 12:21:28
外籍身份藏著掖著,海外資產(chǎn)早鋪好了退路,轉(zhuǎn)頭教普通人“吃苦”

外籍身份藏著掖著,海外資產(chǎn)早鋪好了退路,轉(zhuǎn)頭教普通人“吃苦”

百態(tài)人間
2026-01-10 05:20:05
山東造車殺瘋了!半年產(chǎn)百萬輛直逼廣東,不是老頭樂是真逆襲

山東造車殺瘋了!半年產(chǎn)百萬輛直逼廣東,不是老頭樂是真逆襲

青眼財經(jīng)
2026-01-09 19:14:45
44歲秦嵐同居實錘!情侶拖鞋+見家長,偏不領(lǐng)證太清醒

44歲秦嵐同居實錘!情侶拖鞋+見家長,偏不領(lǐng)證太清醒

陳意小可愛
2026-01-09 08:29:47
36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

釋凡電影
2025-08-14 09:33:19
WTT多哈冠軍賽:1月11日賽程公布!誕生2項冠軍,國乒3大主力出戰(zhàn)

WTT多哈冠軍賽:1月11日賽程公布!誕生2項冠軍,國乒3大主力出戰(zhàn)

全言作品
2026-01-11 04:15:10
女子面試收到66元紅包和感謝信,網(wǎng)友大贊“神仙公司”,負(fù)責(zé)人:應(yīng)聘者付出了時間和誠意,我們應(yīng)該感謝

女子面試收到66元紅包和感謝信,網(wǎng)友大贊“神仙公司”,負(fù)責(zé)人:應(yīng)聘者付出了時間和誠意,我們應(yīng)該感謝

極目新聞
2026-01-11 12:58:16
2026-01-12 02:24:49
極智GeeTech incentive-icons
極智GeeTech
釋放科技想象,探索數(shù)字未來。
69文章數(shù) 11關(guān)注度
往期回顧 全部

汽車要聞

2026款宋Pro DM-i長續(xù)航補(bǔ)貼后9.98萬起

頭條要聞

美軍突襲委內(nèi)瑞拉俄制防空系統(tǒng)失聯(lián) 俄方回應(yīng)

頭條要聞

美軍突襲委內(nèi)瑞拉俄制防空系統(tǒng)失聯(lián) 俄方回應(yīng)

體育要聞

U23國足形勢:末輪不負(fù)泰國即確保晉級

娛樂要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

科技要聞

“我們與美國的差距也許還在拉大”

態(tài)度原創(chuàng)

家居
健康
房產(chǎn)
藝術(shù)
數(shù)碼

家居要聞

木色留白 演繹現(xiàn)代自由

這些新療法,讓化療不再那么痛苦

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

藝術(shù)要聞

25位世界名人告訴你,音樂是人一生能擁有最棒的事!

數(shù)碼要聞

科技有AI,連接全球:海信家電參展CES 2026,定義智慧生活新圖景

無障礙瀏覽 進(jìn)入關(guān)懷版