国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

VLA 與世界模型決戰(zhàn):智駕落地的關(guān)鍵,是融合效率

0
分享至

智駕行業(yè)最近非常熱鬧,各種高階智駕方案扎堆亮相,一個(gè)比一個(gè)能打:

  • 華為乾崑發(fā)布896線雙光路激光雷達(dá),ADS 4.0 智駕能力再上一個(gè)臺(tái)階;
  • 小鵬發(fā)布 VLA 2.0 新一代高階智駕系統(tǒng),直接對(duì)標(biāo) L4 級(jí)能力;
  • Momenta 將在 ID.ERA 9X 首搭 R7 世界模型智駕,實(shí)現(xiàn)從 L2+ 到 L4 級(jí)智駕的跨越;
  • 理想發(fā)布 MindVLA-o1 的 VLA 方案,同樣瞄準(zhǔn) L4 級(jí)高階智駕;
  • 地平線HSD 走普惠路線,“上車” iCAR V27 獵鷹 700。

梳理下來(lái),企業(yè)在智駕模型架構(gòu)的選擇上大致分為兩條路線:理想、小鵬偏好VLA模型架構(gòu),華為乾崑、Momenta則押注世界模型架構(gòu)。

兩條路線本可以并行發(fā)展,但兩邊陣營(yíng)的擁躉卻爭(zhēng)論開了。

有人認(rèn)為,世界模型對(duì)芯片算力要求高、交互能力偏弱,對(duì)下沉車型不太友好;也有人覺得,VLA 的物理精度表現(xiàn)一般,可能會(huì)影響車輛的實(shí)時(shí)判斷能力。



(圖源:微博直播截圖)

事實(shí)真如大家爭(zhēng)論的那樣,VLA 和世界模型必須二選一?各家企業(yè)又如何解決高階智駕模型的技術(shù)痛點(diǎn)?

VLA 擬人行車邏輯,世界模型精于物理推演

在討論兩種智駕路線是否需要二選一之前,我們應(yīng)先看清二者的技術(shù)底層差異,才能做出客觀判斷。

先來(lái)說(shuō)說(shuō) VLA,這是視覺、語(yǔ)言、動(dòng)作集合的簡(jiǎn)稱。這條技術(shù)路線,走的是從圖像感知到語(yǔ)義定義,再到邏輯決策,最終實(shí)現(xiàn)動(dòng)作輸出的路徑,整個(gè)駕駛決策流程和真人開車的思路幾乎一致。

比如在遇到一個(gè)無(wú)紅綠燈路口,VLA 會(huì)先識(shí)別路口有無(wú)突然出現(xiàn)的行人、非機(jī)動(dòng)車等不確定因素,如果沒有這些情況則將按照禮讓行人、直行優(yōu)先的交規(guī)準(zhǔn)則,作出減速避讓通行的決策。

這個(gè)過(guò)程和我們平時(shí)遵循的“一看二望三通行”的駕駛邏輯相似,是經(jīng)過(guò)思考和推理作出的決策,即便是沒有遇過(guò)的場(chǎng)景,車輛也會(huì)根據(jù)邏輯泛化做出合理判斷。



(圖源:電車通攝制)

再看世界模型,它的底層邏輯是基于物理引擎的動(dòng)態(tài)模擬,運(yùn)作流程完全不同。

從過(guò)程來(lái)看,世界模型是先通過(guò)激光雷達(dá)和攝像頭同步掃描周邊環(huán)境,為智駕芯片構(gòu)建出車輛周圍的實(shí)時(shí)路況模型,再由智駕芯片完成物理推演,最終下達(dá)行動(dòng)決策,整個(gè)過(guò)程更像是一臺(tái)高精度運(yùn)轉(zhuǎn)的“交通模擬器”。

世界模型是根據(jù)海量數(shù)據(jù)訓(xùn)練物理規(guī)則做出的推演,優(yōu)勢(shì)是標(biāo)準(zhǔn)化場(chǎng)景下精度極高,可一旦碰到訓(xùn)練庫(kù)之外的非標(biāo)場(chǎng)景,就容易出現(xiàn)決策僵硬的問題。

比方說(shuō)遇到行人過(guò)馬路的場(chǎng)景,它不會(huì)像人類一樣優(yōu)先主動(dòng)禮讓,而是會(huì)精準(zhǔn)計(jì)算行人運(yùn)動(dòng)速度、車輛制動(dòng)距離、兩車交匯時(shí)間差等數(shù)據(jù),規(guī)劃出一條最優(yōu)行駛軌跡,也正因如此,往往會(huì)出現(xiàn)不主動(dòng)禮讓行人的情況。

VLA 善于適配城市場(chǎng)景,世界模型更為精準(zhǔn)

在實(shí)際使用場(chǎng)景上,VLA 的核心優(yōu)勢(shì)是能更好地應(yīng)對(duì)未知、多變的規(guī)劃路線,而世界模型對(duì)于端到端的理想路況有更好的適應(yīng)力。

國(guó)內(nèi)城市道路擁有最豐富、最復(fù)雜的道路駕駛環(huán)境,經(jīng)常能遇到突然出現(xiàn)的施工路段、非標(biāo)路口、臨時(shí)交通管制、突然闖出的行人及電動(dòng)車,這些都給智駕技術(shù)提出了不小的挑戰(zhàn),而 VLA 能更好地適應(yīng)這種情況。

靠著擬人化的邏輯推理,VLA 能快速處理這些突發(fā)狀況,遇到阻礙時(shí)會(huì)主動(dòng)規(guī)劃繞行路線,而非固守預(yù)設(shè)軌跡停滯不前。從場(chǎng)景適配性來(lái)看,VLA無(wú)疑更適合復(fù)雜的城市道路駕駛。

正因如此,小鵬在展示 VLA 2.0 技術(shù)時(shí),沒有選在空曠的開發(fā)新區(qū)、衛(wèi)星城等理想的測(cè)試環(huán)境,而是把搭載 VLA 2.0 技術(shù)的測(cè)試車直接開進(jìn)廣州路況最為復(fù)雜、駕駛難度最高的城中村,直接將挑戰(zhàn)系數(shù)拉滿。而實(shí)際測(cè)試的結(jié)果是,其 VLA 2.0 智駕技術(shù)能很好地完成在非標(biāo)場(chǎng)景的駕駛。

不過(guò),VLA 技術(shù)存在物理精度表現(xiàn)一般的痛點(diǎn),在一些精度要求較高的駕駛要求上,它的表現(xiàn)會(huì)不如世界模型。之所以會(huì)有這種情況,恰恰源于其自身的架構(gòu)基因。

VLA 是基于“語(yǔ)義思考”再做判斷決策的,攝像頭識(shí)別到的物體會(huì)轉(zhuǎn)換成語(yǔ)言 token,再由大模型推理作出決策。

這種運(yùn)作模式帶來(lái)的直觀差異是,VLA輸出的是“前方有車”“距離有點(diǎn)遠(yuǎn)”“行人要過(guò)馬路”這類描述性信息,而智駕芯片實(shí)際需要的,卻是“距離3.72米”“速度42.5km/h”“1.2秒后會(huì)相交”這類精準(zhǔn)量化反饋,二者的信息維度差異,直接導(dǎo)致了VLA物理精度的不足。

反觀物理精確度,正是世界模型的核心優(yōu)勢(shì)所在。正因如此,在端到端的高階智駕場(chǎng)景里,搭載世界模型技術(shù)的車輛,能夠輕松實(shí)現(xiàn)車位到車位的精準(zhǔn)預(yù)判駕駛,同時(shí)在能耗控制與行車安全性把控上,表現(xiàn)也更為出色。

不過(guò)與之對(duì)應(yīng)的是,世界模型的適用場(chǎng)景范圍相對(duì)局限,遠(yuǎn)沒有VLA寬泛,它更適合高速路、封閉園區(qū)、城市快速路這類路況規(guī)整、變數(shù)較少的標(biāo)準(zhǔn)化道路。



(圖源:鴻蒙智行官網(wǎng))

除了場(chǎng)景適配局限,世界模型還有兩大明顯劣勢(shì):一是高度依賴高算力芯片,二是自然語(yǔ)言交互能力較弱。

由于需要完成大規(guī)模的數(shù)據(jù)實(shí)時(shí)推演,世界模型對(duì)算力消耗極大,對(duì)智駕芯片的性能要求極高,這也直接導(dǎo)致,常規(guī)基于世界模型打造的智駕車型,整體售價(jià)居高不下,難以實(shí)現(xiàn)普惠。

當(dāng)然,這一劣勢(shì)由于技術(shù)的升級(jí)而逐步得到改善。

目前最直接的例子就是,華為乾崑近期發(fā)布的896線激光雷達(dá),已經(jīng)應(yīng)用在20萬(wàn)級(jí)別的尚界Z7/Z7T、問界M6上。通過(guò)硬件成本下探、算力架構(gòu)持續(xù)優(yōu)化,原本對(duì)芯片要求極高的世界模型,也能在主流價(jià)位車型上穩(wěn)定落地。

即便同樣主打端到端智駕,基于世界模型打造的地平線HSD方案,已經(jīng)成功實(shí)現(xiàn)高階智駕技術(shù)下放,將其普惠至15萬(wàn)元級(jí)別的主流家用車型,徹底打破了世界模型智駕成本居高不下、難以普及的固有認(rèn)知。憑借這套高性價(jià)比的智駕方案,地平線征程芯片累計(jì)出貨量更是突破1000萬(wàn),成功賦能超500款車型落地,讓世界模型技術(shù)的普惠化成為可能。

另一方面,世界模型對(duì)于自然語(yǔ)言交互能力不及 VLA,比如在使用智駕時(shí),駕駛員發(fā)出“前面車太慢,找機(jī)會(huì)超了它”“別跟大車太近”“前面靠邊停一下”等指令,可能得不到世界模型的及時(shí)響應(yīng),它依舊會(huì)根據(jù)設(shè)定的路線“自顧自地開”,稍微不夠靈活。

雙引擎協(xié)同互補(bǔ),是實(shí)現(xiàn)L4智駕的趨勢(shì)

既然VLA與世界模型兩條技術(shù)路線各有優(yōu)劣、場(chǎng)景適配互補(bǔ),那能否將二者優(yōu)勢(shì)結(jié)合,取長(zhǎng)補(bǔ)短打造出更完善的高階智駕方案?

答案顯然是肯定的,行業(yè)內(nèi)也早已開始布局這種融合式技術(shù)路徑。

小鵬 VLA 2.0、理想 MindVLA-o1、Momenta R7強(qiáng)化學(xué)習(xí)世界模型正是將兩者融合的代表方案,業(yè)內(nèi)也將其稱作智駕“雙引擎”模式。

以Momenta R7為例,這套大模型就是在強(qiáng)化學(xué)習(xí)的基礎(chǔ)上引入了世界模型,讓AI能夠逐步理解世界的物理本質(zhì),包括物體的物理屬性、運(yùn)動(dòng)的因果關(guān)系以及交互過(guò)程中的潛在可能,不再只是簡(jiǎn)單地模仿駕駛動(dòng)作。

在這套協(xié)同架構(gòu)里,世界模型承擔(dān)“底層基建”的核心角色,依托激光雷達(dá)與算力支撐,在云端構(gòu)建高精度物理仿真環(huán)境,生成海量長(zhǎng)尾極端場(chǎng)景,完成物理軌跡規(guī)劃與底層數(shù)據(jù)訓(xùn)練,筑牢智駕的精準(zhǔn)執(zhí)行基礎(chǔ)。

VLA則主攻“上層決策”,依托世界模型的精準(zhǔn)物理預(yù)判,結(jié)合自身擬人化語(yǔ)義邏輯推理能力,專門處理復(fù)雜道路社交場(chǎng)景、非標(biāo)突發(fā)路況,做出更貼合人類駕駛習(xí)慣的柔性決策。

兩者“合體”落到實(shí)際使用場(chǎng)景中可能是這樣的:駕駛者啟動(dòng)了端到端的智駕,車輛駛出車位,在馬路上遇到行人,實(shí)現(xiàn)禮讓行人后通行。在智駕過(guò)程中,駕駛者想到路邊買瓶水,用語(yǔ)音指令讓車輛靠邊停車等待,待駕駛者上車后,車輛自動(dòng)駛往目的地停車位,從而實(shí)現(xiàn)整個(gè)智駕流程,駕駛者無(wú)需接管。



(圖源:理想官網(wǎng))

這種融合架構(gòu),既解決了世界模型“不懂變通”的問題,又彌補(bǔ)了VLA“效率不足” 的缺陷,讓智駕系統(tǒng)既能精準(zhǔn)算物理軌跡,又能靈活懂社交規(guī)則,真正接近人類司機(jī)的駕駛水平。

這既是 VLA 和世界模型合體的魅力,也是 L4 級(jí)高階智駕的設(shè)想,當(dāng)然它也許可以做到更多。



(圖源:理想官網(wǎng))

這也印證了,下一代智駕技術(shù)的發(fā)展方向,從來(lái)不是非此即彼的路線之爭(zhēng),而是通過(guò)分層協(xié)同、精細(xì)化打磨,讓一套系統(tǒng)適配全場(chǎng)景復(fù)雜路況,再依托持續(xù)完善的數(shù)據(jù)閉環(huán)迭代,讓智駕系統(tǒng)隨著使用不斷優(yōu)化,變得越來(lái)越聰明。

可以預(yù)見的是,未來(lái) 1-2 年,雙引擎智駕方案必然會(huì)成為大多數(shù)頭部車企的選擇,整個(gè)行業(yè)的競(jìng)爭(zhēng)焦點(diǎn)也不再是單一技術(shù)路線的比拼。

更何況,現(xiàn)在已經(jīng)車企,以及地平線等智駕企業(yè)在這一點(diǎn)上發(fā)力。想必不用等太久,高階智駕就能真正落地到日常開車?yán)?,不再是高價(jià)車的專屬,既能算得準(zhǔn)、走得穩(wěn),又能靈活應(yīng)對(duì)各種突發(fā)狀況,實(shí)實(shí)在在貼合普通人的用車需求。

(封面圖源:電車通攝制)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
地鐵吐血女孩最新回應(yīng):目前仍在搶救室,感謝關(guān)注;重慶紅十字會(huì)稱會(huì)提供幫助;其前男友離世前曾委托人轉(zhuǎn)5萬(wàn)元助女孩治病

地鐵吐血女孩最新回應(yīng):目前仍在搶救室,感謝關(guān)注;重慶紅十字會(huì)稱會(huì)提供幫助;其前男友離世前曾委托人轉(zhuǎn)5萬(wàn)元助女孩治病

大象新聞
2026-03-24 15:45:03
中美俄都不希望的事已出現(xiàn),歐爾班面臨下臺(tái),俄或失去三大優(yōu)勢(shì)

中美俄都不希望的事已出現(xiàn),歐爾班面臨下臺(tái),俄或失去三大優(yōu)勢(shì)

趣文說(shuō)娛
2026-03-24 19:34:30
張雪峰,販賣焦慮的時(shí)代標(biāo)本熄滅了

張雪峰,販賣焦慮的時(shí)代標(biāo)本熄滅了

智識(shí)漂流
2026-03-24 21:52:20
敬酒不吃吃罰酒,既然日本不聽勸,那就別怪俄羅斯不客氣了

敬酒不吃吃罰酒,既然日本不聽勸,那就別怪俄羅斯不客氣了

科羅廖夫
2026-03-25 07:20:38
二手網(wǎng)簽破9千套!廣州業(yè)主心態(tài)大變,漲價(jià)超百萬(wàn)!

二手網(wǎng)簽破9千套!廣州業(yè)主心態(tài)大變,漲價(jià)超百萬(wàn)!

廣州樓市發(fā)布
2026-03-25 19:50:58
78歲連路都走不穩(wěn)還開演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

78歲連路都走不穩(wěn)還開演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

洲洲影視娛評(píng)
2026-01-28 12:23:18
養(yǎng)肥了再宰?蒙古對(duì)西方巨頭下手了,這一刀也給中國(guó)提了個(gè)醒

養(yǎng)肥了再宰?蒙古對(duì)西方巨頭下手了,這一刀也給中國(guó)提了個(gè)醒

財(cái)經(jīng)保探長(zhǎng)
2026-03-19 19:39:45
87年薄一波去杭州探望陳云,期間二人神秘交談,薄提醒:你悠著點(diǎn)

87年薄一波去杭州探望陳云,期間二人神秘交談,薄提醒:你悠著點(diǎn)

談古論今歷史有道
2026-03-25 15:15:03
誰(shuí)干的?美國(guó)本土炸了!

誰(shuí)干的?美國(guó)本土炸了!

大嘴說(shuō)天下
2026-03-24 18:46:21
廣州城投,徹底想通了

廣州城投,徹底想通了

地產(chǎn)K線官方
2026-03-25 21:26:42
學(xué)渣的父母不停地講道理,而學(xué)霸的父母,都在悄悄運(yùn)用刺猬法則

學(xué)渣的父母不停地講道理,而學(xué)霸的父母,都在悄悄運(yùn)用刺猬法則

蓁蓁心理?yè)狃B(yǎng)
2025-12-21 12:30:07
難以置信!一福建男子稱,感謝失業(yè)后妻子和他離婚,幫他減輕壓力

難以置信!一福建男子稱,感謝失業(yè)后妻子和他離婚,幫他減輕壓力

火山詩(shī)話
2026-03-20 09:50:39
全球最大彈藥庫(kù):澳門大搬空需6年,是否足夠美國(guó)打次世界大戰(zhàn)?

全球最大彈藥庫(kù):澳門大搬空需6年,是否足夠美國(guó)打次世界大戰(zhàn)?

小蒨喜歡解說(shuō)
2026-03-23 17:51:09
男性衰老的標(biāo)志:1臭、2大、2小,如果你沒有,說(shuō)明還年輕!

男性衰老的標(biāo)志:1臭、2大、2小,如果你沒有,說(shuō)明還年輕!

健康科普365
2026-03-16 20:35:03
德媒文章:“史詩(shī)怒火”將讓美國(guó)付出巨大代價(jià)

德媒文章:“史詩(shī)怒火”將讓美國(guó)付出巨大代價(jià)

參考消息
2026-03-25 15:23:26
蔣經(jīng)國(guó)寫給宋慶齡的硬筆書信驚艷書壇!字跡畢恭畢敬!好似小學(xué)生

蔣經(jīng)國(guó)寫給宋慶齡的硬筆書信驚艷書壇!字跡畢恭畢敬!好似小學(xué)生

鶴羽說(shuō)個(gè)事
2026-03-20 21:20:03
日本網(wǎng)友對(duì)比梅洛尼和高市早苗會(huì)見特朗普畫面,發(fā)出提問 “維護(hù)國(guó)家尊嚴(yán),誰(shuí)的行為是正確的”

日本網(wǎng)友對(duì)比梅洛尼和高市早苗會(huì)見特朗普畫面,發(fā)出提問 “維護(hù)國(guó)家尊嚴(yán),誰(shuí)的行為是正確的”

大象新聞
2026-03-25 15:49:04
藍(lán)思科技:公司已成功研發(fā)出抗原子氧剝蝕、抗輻射的大尺寸UTG柔性玻璃,應(yīng)用于柔性太陽(yáng)翼的封裝

藍(lán)思科技:公司已成功研發(fā)出抗原子氧剝蝕、抗輻射的大尺寸UTG柔性玻璃,應(yīng)用于柔性太陽(yáng)翼的封裝

每日經(jīng)濟(jì)新聞
2026-03-25 15:23:33
向余望必須MVP!陳澤仕+李新翔高分,于金永不夠果決,兩將不及格

向余望必須MVP!陳澤仕+李新翔高分,于金永不夠果決,兩將不及格

刀鋒體育
2026-03-25 23:26:05
中央氣象臺(tái)發(fā)布大霧黃色預(yù)警

中央氣象臺(tái)發(fā)布大霧黃色預(yù)警

界面新聞
2026-03-25 18:03:12
2026-03-26 00:15:00
雷科技 incentive-icons
雷科技
專注AI硬科技
36590文章數(shù) 811949關(guān)注度
往期回顧 全部

汽車要聞

智己LS8放大招 30萬(wàn)內(nèi)8系旗艦+全線控底盤秀實(shí)力

頭條要聞

伊朗放話愿意與"主和派"萬(wàn)斯談 特朗普表態(tài)

頭條要聞

伊朗放話愿意與"主和派"萬(wàn)斯談 特朗普表態(tài)

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰經(jīng)搶救無(wú)效不幸去世 年僅41歲

財(cái)經(jīng)要聞

管濤:中東局勢(shì)如何影響人民幣匯率走勢(shì)?

科技要聞

紅極一時(shí)卻草草收?qǐng)觯琒ora宣布正式關(guān)停

態(tài)度原創(chuàng)

健康
數(shù)碼
藝術(shù)
本地
公開課

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

蘋果AirPods Max 2耳機(jī)已接受訂購(gòu),4月1日發(fā)貨

藝術(shù)要聞

《百花譜》,這個(gè)春天畫花不用愁!

本地新聞

來(lái)永泰同安 赴一場(chǎng)春天的約會(huì)

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版