国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

自動(dòng)駕駛派系之爭,四大技術(shù)路線的博弈與融合

0
分享至

當(dāng)Waymo的2500輛Robotaxi在舊金山灣區(qū)、洛杉磯、鳳凰城、奧斯汀、亞特蘭大五大城市的街頭自如穿梭,自動(dòng)駕駛行業(yè)儼然已叩響規(guī);虡I(yè)化的大門。

然而,在車隊(duì)擴(kuò)張的熱鬧表象之下,自動(dòng)駕駛領(lǐng)域的技術(shù)流派分歧仍未消弭。純視覺與多傳感器融合的感知路線該如何抉擇?系統(tǒng)架構(gòu)該堅(jiān)守模塊化還是擁抱端到端?在AI大模型賦能下,VLA與世界模型又誰能定義自動(dòng)駕駛的“靈魂”?

這些懸而未決的爭議,正悄然左右著自動(dòng)駕駛的未來走向,也讓這場技術(shù)路線之爭充滿了更多看點(diǎn)。



純視覺與多傳感器融合的路線之爭

感知是自動(dòng)駕駛的基石,而“如何讓車輛看見世界”,則是行業(yè)內(nèi)對(duì)峙多年的核心議題,兩大技術(shù)陣營的較量可追溯至2004年。

當(dāng)年,美國國防高級(jí)研究計(jì)劃局(DARPA)在莫哈韋沙漠發(fā)起挑戰(zhàn)賽,以200萬美元獎(jiǎng)金吸引了數(shù)十支頂尖高校與科研機(jī)構(gòu)團(tuán)隊(duì),試圖攻克車輛環(huán)境感知難題。

最終,卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)等團(tuán)隊(duì)采用的激光雷達(dá)方案脫穎而出,其生成的高精度3D點(diǎn)云圖,為早期自動(dòng)駕駛技術(shù)發(fā)展奠定了核心路線,這一方案也被谷歌旗下的Waymo繼承并持續(xù)深耕。

但激光雷達(dá)方案存在致命短板——高昂的成本。一套激光雷達(dá)系統(tǒng)在當(dāng)時(shí)造價(jià)高達(dá)7.5 萬美元,這在當(dāng)時(shí)注定其只能走小規(guī)模精英化路線,難以適配大規(guī)模商業(yè)化的需求。

十年后,特斯拉扛起了純視覺路線的大旗,給出了截然不同的解題思路。其核心邏輯是“人類靠雙眼和大腦就能開車,機(jī)器也應(yīng)如此”。

2014年,特斯拉Autopilot系統(tǒng)問世,搭載Mobileye視覺方案,確立了以攝像頭為核心的感知路徑。2016年,馬斯克公開宣稱“激光雷達(dá)是徒勞的”,將純視覺路線推向行業(yè)焦點(diǎn)。

特斯拉通過8個(gè)環(huán)繞式攝像頭模擬人類視野,依托深度學(xué)習(xí)算法從二維圖像中重建三維駕駛環(huán)境。這一方案的優(yōu)勢極為顯著:成本極低,可支撐大規(guī)模量產(chǎn);更關(guān)鍵的是,量產(chǎn)車輛能收集海量真實(shí)路況數(shù)據(jù),形成“數(shù)據(jù)飛輪”,反哺算法持續(xù)迭代,實(shí)現(xiàn)“越用越強(qiáng)”的閉環(huán)。



不過,純視覺方案的局限性也十分突出。攝像頭屬于被動(dòng)傳感器,性能高度依賴環(huán)境光照,在逆光、眩光、黑夜、大雨、大霧等復(fù)雜場景下,感知能力會(huì)大幅衰減,遠(yuǎn)不及激光雷達(dá)的穩(wěn)定性。

以激光雷達(dá)為核心的多傳感器融合陣營則認(rèn)為,在可見的未來,機(jī)器智能難以復(fù)刻人類基于經(jīng)驗(yàn)的常識(shí)與直覺,惡劣環(huán)境下必須依靠激光雷達(dá)等硬件冗余,來彌補(bǔ)軟件算法的不足。

簡言之,純視覺路線將技術(shù)壓力全部集中于算法,賭的是AI智能化的突破。多傳感器融合則更側(cè)重工程落地的安全性,選擇的是經(jīng)過驗(yàn)證的穩(wěn)妥方案。

目前,Waymo、小鵬、蔚來等主流車企與自動(dòng)駕駛公司,均站在多傳感器融合陣營,在他們看來,安全是自動(dòng)駕駛不可逾越的紅線,而硬件冗余是保障安全的核心途徑。

值得一提的是,兩條路線并非完全割裂,正呈現(xiàn)相互融合的趨勢:純視覺方案開始引入更多類型的傳感器補(bǔ)充感知能力;多傳感器融合方案中,視覺算法的地位也持續(xù)提升,成為理解場景語義的關(guān)鍵核心。

激光雷達(dá)與毫米波雷達(dá)的互補(bǔ)博弈

即便在多傳感器融合陣營內(nèi)部,也存在一場關(guān)于傳感器選型的細(xì)分爭議:毫米波雷達(dá)成本僅數(shù)百元,而早期激光雷達(dá)動(dòng)輒數(shù)萬美元,為何車企仍愿為激光雷達(dá)投入高額成本?

激光雷達(dá)(LiDAR)可通過發(fā)射激光束并測算返回時(shí)間,構(gòu)建出超高精度的3D點(diǎn)云圖像,能精準(zhǔn)解決其他傳感器難以應(yīng)對(duì)的極端場景(Corner Case)。其角分辨率極高,可清晰識(shí)別行人姿態(tài)、車輛輪廓,甚至路面微小障礙物。

在L4/L5級(jí)商業(yè)自動(dòng)駕駛領(lǐng)域,激光雷達(dá)是唯一能同時(shí)滿足高精度感知與靜態(tài)物體檢測的傳感器,為了實(shí)現(xiàn)基礎(chǔ)自動(dòng)駕駛功能與安全冗余,這筆成本堪稱車企必須支付的 “入場券”。

但激光雷達(dá)并非完美無缺。激光本質(zhì)是紅外光,波長極短,當(dāng)雨滴、霧滴、雪花、煙塵等顆粒的尺寸與激光波長接近時(shí),會(huì)引發(fā)激光散射與吸收,產(chǎn)生大量“噪聲”點(diǎn)云,嚴(yán)重影響感知精度。



4D毫米波雷達(dá)則恰好能彌補(bǔ)這一短板,其具備全天候工作能力,在惡劣天氣下可憑借強(qiáng)穿透性,率先探測前方障礙物并輸出距離、速度數(shù)據(jù)。不過,毫米波雷達(dá)的回波點(diǎn)極為稀疏,僅能形成少量點(diǎn)云,無法像激光雷達(dá)那樣勾勒物體輪廓與形狀,還可能因電子干擾出現(xiàn)“幽靈識(shí)別”的誤判。低分辨率的缺陷,決定了它只能作為輔助傳感器上車,無法成為感知核心。

由此可見,激光雷達(dá)與4D毫米波雷達(dá)并非替代關(guān)系,而是形成了“常規(guī)場景靠毫米波雷達(dá)控成本,復(fù)雜場景靠激光雷達(dá)保安全”的互補(bǔ)邏輯,不同車型會(huì)根據(jù)定位采用差異化配置:L4級(jí)Robotaxi與豪華車型,通常采用“激光雷達(dá)為主、毫米波雷達(dá)為輔”的策略,不計(jì)成本堆砌傳感器以追求極致安全與性能上限;L2+、L3級(jí)量產(chǎn)經(jīng)濟(jì)型車型,則以“攝像頭 + 毫米波雷達(dá)”為基礎(chǔ),僅在車頂?shù)汝P(guān)鍵位置配備1-2顆激光雷達(dá),打造高性價(jià)比的感知方案。

車企圍繞傳感器的選型爭議,本質(zhì)是一場以最低成本實(shí)現(xiàn)最高安全的技術(shù)探索與商業(yè)博弈。未來,各類傳感器的融合將進(jìn)一步深化,催生出更多元化的感知搭配方案。

端到端與模塊化的架構(gòu)對(duì)決

如果說傳感器是自動(dòng)駕駛的“眼睛”,那算法架構(gòu)就是其“大腦”,而“大腦”的構(gòu)建模式,正經(jīng)歷模塊化與端到端的激烈對(duì)決。

長期以來,自動(dòng)駕駛系統(tǒng)普遍采用模塊化設(shè)計(jì),將完整駕駛?cè)蝿?wù)拆解為感知、預(yù)測、規(guī)劃、控制等獨(dú)立子任務(wù)。每個(gè)模塊各司其職,配備專屬算法與優(yōu)化目標(biāo),如同一條分工明確的流水線。

這種架構(gòu)的優(yōu)勢十分明顯:可解釋性強(qiáng)、支持并行開發(fā)、便于調(diào)試維護(hù)。但它的缺陷也同樣致命——局部最優(yōu)不等于全局最優(yōu),各模塊在信息傳遞過程中,會(huì)對(duì)原始數(shù)據(jù)進(jìn)行簡化與抽象,導(dǎo)致大量關(guān)鍵信息在層層流轉(zhuǎn)中丟失,最終制約系統(tǒng)的整體性能上限。

2022-2023年,以特斯拉FSD V12為代表的“端到端”模型橫空出世,徹底顛覆了傳統(tǒng)架構(gòu)范式。這一方案的靈感源于人類駕駛學(xué)習(xí)邏輯:新手司機(jī)不會(huì)先鉆研光學(xué)原理與交通規(guī)則,而是通過觀察教練操作直接習(xí)得駕駛技能。



端到端模型摒棄了人為的模塊劃分,通過學(xué)習(xí)海量人類駕駛數(shù)據(jù),構(gòu)建起龐大的神經(jīng)網(wǎng)絡(luò),可直接將傳感器輸入的原始數(shù)據(jù),映射為方向盤轉(zhuǎn)角、油門開度、剎車力度等終端駕駛控制指令。

與模塊化架構(gòu)相比,端到端模型全程無信息損耗,性能上限更高,還能大幅簡化開發(fā)流程;但其“黑箱”特質(zhì)也帶來了嚴(yán)峻挑戰(zhàn),一旦發(fā)生事故,工程師難以追溯問題根源,無法判斷是算法誤判還是數(shù)據(jù)缺陷,后續(xù)優(yōu)化更是無從下手。

端到端模型的出現(xiàn),推動(dòng)自動(dòng)駕駛從“規(guī)則驅(qū)動(dòng)”轉(zhuǎn)向“數(shù)據(jù)驅(qū)動(dòng)”,但“黑箱”風(fēng)險(xiǎn)讓眾多重視安全的車企望而卻步,且海量訓(xùn)練數(shù)據(jù)的需求,也只有具備大規(guī)模車隊(duì)的企業(yè)才能滿足。

為此,行業(yè)衍生出折中方案——“顯式端到端”,即在端到端模型中保留可行駛區(qū)域、目標(biāo)軌跡等中間輸出,力求在性能突破與可解釋性之間找到平衡。

VLA與世界模型的智能定義之爭

隨著AI發(fā)展,新的戰(zhàn)場在大模型內(nèi)部開辟。這關(guān)乎自動(dòng)駕駛的靈魂,它應(yīng)該是輔助駕駛的思考者,還是執(zhí)行者?

世界模型信奉“先建模、再?zèng)Q策”的邏輯,更追求對(duì)駕駛場景的深度認(rèn)知與過程可控,也被稱為認(rèn)知派。

該路線認(rèn)為,自動(dòng)駕駛系統(tǒng)要像人類駕駛員一樣,先在“大腦”中構(gòu)建出周圍環(huán)境的數(shù)字化虛擬模型,再基于這個(gè)模型模擬不同駕駛策略的潛在結(jié)果,最終篩選出最優(yōu)方案。它強(qiáng)調(diào)AI需先理解世界的運(yùn)行規(guī)律,再結(jié)合傳統(tǒng)自動(dòng)駕駛模塊完成決策,將大模型的認(rèn)知能力與成熟的工程控制方案結(jié)合,規(guī)避純算法決策的幻覺風(fēng)險(xiǎn)。

VLA(視覺-語言-動(dòng)作模型)信奉能力“涌現(xiàn)”,追求結(jié)果最優(yōu),被稱為端到端的終極形態(tài)。該流派主張只要模型足夠大、數(shù)據(jù)足夠多,AI就能自己從零開始學(xué)會(huì)駕駛的一切細(xì)節(jié)和規(guī)則,無需預(yù)先構(gòu)建顯性的環(huán)境模型,最終其駕駛能力會(huì)超越人類和基于規(guī)則的系統(tǒng)。它直接將傳感器輸入的視覺信息、環(huán)境語言描述與終端控制動(dòng)作綁定,實(shí)現(xiàn)從感知到執(zhí)行的一站式?jīng)Q策。



圍繞VLA與世界模型的爭議,本質(zhì)是自動(dòng)駕駛智能決策邏輯的路線分歧,也延續(xù)了模塊化與端到端方案的核心辯論。

從可解釋性來看,VLA存在著難以溯源的黑箱困境。如果一輛搭載VLA功能的車輛發(fā)生了一次急剎車,工程師幾乎無法追溯原因:是因?yàn)樗殃幱罢`判為坑洞?還是它學(xué)到了某個(gè)人類司機(jī)的不良習(xí)慣?這種無法調(diào)試、無法驗(yàn)證的特性,與汽車行業(yè)嚴(yán)格的功能安全標(biāo)準(zhǔn)形成了根本性沖突。

世界模型的核心是“先構(gòu)建環(huán)境認(rèn)知模型,再分步推演決策”,其決策鏈路本就分為“感知-建模-規(guī)劃-控制”等明確模塊,每個(gè)環(huán)節(jié)都有獨(dú)立的輸出和可監(jiān)測的運(yùn)行狀態(tài),因此具備全程可分解、可分析、可優(yōu)化的特質(zhì)。

世界模型與VLA的核心差異之一就是可溯源性,其模塊化的決策鏈路能讓工程師精準(zhǔn)定位問題環(huán)節(jié)。如果遇到復(fù)雜路況,工程師可以清晰看到完整決策過程:傳統(tǒng)感知模塊識(shí)別到未知物體、世界模型將其建模為“被風(fēng)吹動(dòng)的塑料袋”,并模擬其運(yùn)動(dòng)軌跡,規(guī)劃模塊據(jù)此決定“無需緊急剎車,僅輕微減速避讓即可”。即便發(fā)生事故,也能精準(zhǔn)界定是建模環(huán)節(jié)的疏漏,還是規(guī)劃模塊的判斷失誤。

除了可解釋性的兩極分化,訓(xùn)練成本與數(shù)據(jù)需求也是車企猶疑不決的核心原因之一。

VLA需要海量的“視頻-控制信號(hào)”配對(duì)數(shù)據(jù),即輸入一段8攝像頭同步視頻,必須輸出對(duì)應(yīng)的方向盤轉(zhuǎn)角、油門開合度、剎車力度等實(shí)時(shí)控制信號(hào)。這類數(shù)據(jù)不僅采集難度大,且標(biāo)注制作成本極高,僅少數(shù)擁有大規(guī)模車隊(duì)的企業(yè)能夠支撐。

世界模型的優(yōu)勢則在于數(shù)據(jù)來源的廣泛性,它可先利用互聯(lián)網(wǎng)規(guī)模的“圖像-文本”“環(huán)境-規(guī)則”等多模態(tài)數(shù)據(jù)完成預(yù)訓(xùn)練,構(gòu)建起基礎(chǔ)的世界認(rèn)知框架,再通過真實(shí)駕駛數(shù)據(jù)和仿真場景數(shù)據(jù)進(jìn)行微調(diào),既能降低數(shù)據(jù)采集成本,也能通過仿真推演補(bǔ)足極端場景的數(shù)據(jù)缺口。

回顧自動(dòng)駕駛的派系之爭,不難發(fā)現(xiàn),這些技術(shù)博弈從未以某一方的完全勝利告終,而是在碰撞中不斷融合,走向更高層次的技術(shù)統(tǒng)一:激光雷達(dá)與視覺正整合為多模態(tài)感知系統(tǒng),實(shí)現(xiàn)全場景精準(zhǔn)感知;模塊化架構(gòu)開始吸納端到端的優(yōu)勢,平衡性能與可解釋性;AI大模型則為所有系統(tǒng)注入認(rèn)知智能,推動(dòng)自動(dòng)駕駛向更高階進(jìn)化。

那些曾困擾行業(yè)的技術(shù)謎題,或許沒有絕對(duì)標(biāo)準(zhǔn)答案,但每一次爭議與探索,都成為自動(dòng)駕駛技術(shù)迭代的重要注腳,持續(xù)推動(dòng)著這一賽道向前邁進(jìn)。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
西部排名又變了:湖人創(chuàng)NBA奇跡,快船收大禮,3隊(duì)排名互換

西部排名又變了:湖人創(chuàng)NBA奇跡,快船收大禮,3隊(duì)排名互換

籃球大視野
2026-03-11 17:06:11
誰與爭鋒?烏軍精銳425團(tuán)狂突10公里,匈牙利通過反烏克蘭決議

誰與爭鋒?烏軍精銳425團(tuán)狂突10公里,匈牙利通過反烏克蘭決議

史政先鋒
2026-03-11 19:14:30
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
陳毅去世后,追悼詞周總理寫“功大于過”,毛主席批示:去掉這個(gè)

陳毅去世后,追悼詞周總理寫“功大于過”,毛主席批示:去掉這個(gè)

雍親王府
2026-03-03 13:35:07
多家券商緊急通知 嚴(yán)控“小龍蝦”公司內(nèi)部安裝使用

多家券商緊急通知 嚴(yán)控“小龍蝦”公司內(nèi)部安裝使用

財(cái)聯(lián)社
2026-03-11 15:25:11
山東洗碗阿姨被辭退后續(xù):帶全家人大鬧飯店,原因曝光,老板回應(yīng)

山東洗碗阿姨被辭退后續(xù):帶全家人大鬧飯店,原因曝光,老板回應(yīng)

觀察鑒娛
2026-03-11 08:34:48
生育大局已定:不出意外的話,在2026年中國人口將會(huì)迎3大變化

生育大局已定:不出意外的話,在2026年中國人口將會(huì)迎3大變化

現(xiàn)代小青青慕慕
2026-03-11 18:52:51
住家保姆喝光雇主六瓶52年茅臺(tái),雇主沒讓她賠錢,一句話讓她崩潰

住家保姆喝光雇主六瓶52年茅臺(tái),雇主沒讓她賠錢,一句話讓她崩潰

民間精選故事匯
2026-03-10 17:59:56
中方表態(tài)!任何情況下都不允許!

中方表態(tài)!任何情況下都不允許!

看看新聞Knews
2026-03-11 16:06:02
毫不避諱,
王毅外長正式回應(yīng)特朗普訪華!

毫不避諱, 王毅外長正式回應(yīng)特朗普訪華!

南權(quán)先生
2026-03-10 15:26:57
焊死在歷史上!歐冠10大最難破的神跡:C羅梅西壟斷

焊死在歷史上!歐冠10大最難破的神跡:C羅梅西壟斷

格斗社
2026-03-11 08:00:03
伊朗:逮捕81名“內(nèi)鬼”,在網(wǎng)絡(luò)上向境外提供情報(bào);朝鮮強(qiáng)烈譴責(zé)美以,“尊重伊朗人民選出自己最高領(lǐng)袖的權(quán)利”

伊朗:逮捕81名“內(nèi)鬼”,在網(wǎng)絡(luò)上向境外提供情報(bào);朝鮮強(qiáng)烈譴責(zé)美以,“尊重伊朗人民選出自己最高領(lǐng)袖的權(quán)利”

每日經(jīng)濟(jì)新聞
2026-03-11 09:52:55
世界冠軍王曼昱爆冷后,沒想到鄧亞萍會(huì)這么說,馬琳的話有人信了

世界冠軍王曼昱爆冷后,沒想到鄧亞萍會(huì)這么說,馬琳的話有人信了

以茶帶書
2026-03-11 12:34:05
國際油價(jià)大幅收跌,布油跌8.14%

國際油價(jià)大幅收跌,布油跌8.14%

每日經(jīng)濟(jì)新聞
2026-03-11 05:58:05
演都不演了!盧旺達(dá)全國上下靠著“抄襲”中國逆風(fēng)翻盤,西方惱了

演都不演了!盧旺達(dá)全國上下靠著“抄襲”中國逆風(fēng)翻盤,西方惱了

看盡人間百態(tài)
2026-03-10 02:12:52
駐韓美軍6部薩德發(fā)射車全部運(yùn)出

駐韓美軍6部薩德發(fā)射車全部運(yùn)出

界面新聞
2026-03-11 09:47:13
央視體育主持人上新

央視體育主持人上新

極目新聞
2026-03-11 14:59:20
難以置信!網(wǎng)傳一女子征婚,稱網(wǎng)貸欠200多萬,誰幫還債就嫁給誰

難以置信!網(wǎng)傳一女子征婚,稱網(wǎng)貸欠200多萬,誰幫還債就嫁給誰

火山詩話
2026-03-10 13:46:15
藏了半年終于亮相!米格-29掛上中國超音速導(dǎo)彈,歐洲都看懵了

藏了半年終于亮相!米格-29掛上中國超音速導(dǎo)彈,歐洲都看懵了

策略述
2026-03-11 12:43:00
中國研發(fā)出半人馬機(jī)器人:與人背部連接 全向跟隨

中國研發(fā)出半人馬機(jī)器人:與人背部連接 全向跟隨

快科技
2026-03-09 18:07:13
2026-03-11 20:39:00
極智GeeTech incentive-icons
極智GeeTech
釋放科技想象,探索數(shù)字未來。
73文章數(shù) 13關(guān)注度
往期回顧 全部

科技要聞

騰訊"養(yǎng)蝦"暴漲后,百度急得在門口"裝蝦"

頭條要聞

美叫停以軍打擊伊朗油庫 以軍"打擊規(guī)模遠(yuǎn)超美國預(yù)期"

頭條要聞

美叫停以軍打擊伊朗油庫 以軍"打擊規(guī)模遠(yuǎn)超美國預(yù)期"

體育要聞

郭艾倫重傷,CBA下半賽季還能期待些什么

娛樂要聞

楊冪連續(xù)五年為劉詩詩慶生,劉詩詩回應(yīng)

財(cái)經(jīng)要聞

喚醒10萬億存量資金 公積金改革大潮來了

汽車要聞

蓮花糾偏, 馮擎峰的“收”與“守”

態(tài)度原創(chuàng)

藝術(shù)
游戲
教育
時(shí)尚
公開課

藝術(shù)要聞

這組剪紙?zhí)懒耍?/h3>

再戰(zhàn)六年 Falcom社長確認(rèn)《軌跡》系列將在2032年完結(jié)

教育要聞

AI只能考16,高考學(xué)霸拿不了滿分…新加坡PSLE數(shù)學(xué)難度“地獄級(jí)”

何穗:新生亦重生

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版