国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

小鵬加速?zèng)_向L4終局:對(duì)VLA架構(gòu)「動(dòng)刀」成關(guān)鍵一環(huán)

0
分享至



編輯|澤南、杜偉

兩個(gè)月前的 CES 上,黃仁勛開源了英偉達(dá)的首個(gè) VLA(視覺(jué) - 語(yǔ)言 - 動(dòng)作)模型,并高調(diào)宣稱物理 AI 的「ChatGPT 時(shí)刻」馬上就要到來(lái)。

如今,物理世界的 AI 正在成為一個(gè)重要趨勢(shì):從機(jī)器人到輔助駕駛,越來(lái)越多的公司正在嘗試用 VLA 模型來(lái)重構(gòu)機(jī)器與物理世界交互的方式。

在輔助駕駛領(lǐng)域,端到端的 VLA 方法已經(jīng)經(jīng)歷了大量驗(yàn)證,實(shí)現(xiàn)了前所未有的效果。然而,這種架構(gòu)面臨一個(gè)天然挑戰(zhàn):作為中間層的語(yǔ)言難以完整準(zhǔn)確表達(dá)現(xiàn)實(shí)物理世界的全部細(xì)節(jié)。李飛飛曾在一次訪談中表示,「語(yǔ)言本身只是對(duì)物理世界的一種有損表達(dá)?!?/p>

在需要實(shí)時(shí)理解環(huán)境并生成駕駛決策的自動(dòng)駕駛環(huán)境中,通過(guò)語(yǔ)言這一中間層來(lái)描述物理世界既有可能引入信息損失,還會(huì)增加額外推理路徑。隨著駕駛場(chǎng)景復(fù)雜度的增加,這種架構(gòu)缺陷制約了系統(tǒng)準(zhǔn)確率與效率的繼續(xù)提升。

針對(duì)這一痛點(diǎn),小鵬汽車給出的創(chuàng)新性解法是:直接去掉「語(yǔ)言轉(zhuǎn)譯」環(huán)節(jié),在業(yè)界首次實(shí)現(xiàn)從視覺(jué)信號(hào)到動(dòng)作指令的端到端直接生成。這正是其在去年 11 月亮相的第二代 VLA(XPENG VLA 2.0),并在此后數(shù)月完成了 468 個(gè)版本更新。

新技術(shù)很快產(chǎn)生了質(zhì)變:在 3 月 2 日舉辦的「小鵬第二代 VLA 媒體體驗(yàn)日」上,何小鵬宣布,第二代 VLA 將于本月開啟推送。



人們普遍預(yù)測(cè),2026 年將成為「物理 AI 元年」。小鵬第二代 VLA 的落地,率先給出了通向完全自動(dòng)駕駛的「中國(guó)答案」。

跨代級(jí)的駕駛體驗(yàn)

在實(shí)際體驗(yàn)上,第二代 VLA 的提升主要體現(xiàn)在三大維度:安心絲滑、全場(chǎng)景能力和高效率

由于端到端模型的泛化能力,小鵬第二代 VLA 已實(shí)現(xiàn)實(shí)現(xiàn)準(zhǔn)確識(shí)別各種異形車輛的能力。



即使是對(duì)面來(lái)車的交通事故,VLA 也能正確識(shí)別障礙物和阻礙路線的車輛,并進(jìn)行實(shí)時(shí)的路徑規(guī)劃。



在安全和流暢度提升的同時(shí),小鵬的第二代 VLA 成為了真正的「全場(chǎng)景輔助駕駛」,支持從停車位、P 擋的原地激活,覆蓋園區(qū)小路、鄉(xiāng)村土路及無(wú)導(dǎo)航道路,能夠應(yīng)對(duì)小路通行、鄉(xiāng)村小路避坑等復(fù)雜場(chǎng)景。

在擁擠且復(fù)雜的停車場(chǎng),第二代 VLA 輔助駕駛可以自動(dòng)漫游一直穿行到出門,給你充分的時(shí)間設(shè)置好導(dǎo)航,可以開始正式的行程。



這意味著從你上車按下啟動(dòng)鍵開始,AI 系統(tǒng)就能接管駕駛,真正實(shí)現(xiàn)了從家里車位到公司車位的點(diǎn)到點(diǎn)無(wú)縫銜接。何小鵬表示,全場(chǎng)景的輔助駕駛能力將保證在今年年內(nèi)推出,在所有場(chǎng)景下的輔助駕駛能力都會(huì)像主干道一樣達(dá)到「99 分水平」。

第二代 VLA 的通行效率也有大幅提升,在保障安全的前提下,小鵬實(shí)測(cè)其綜合行車效率提升了 23%。在城市晚高峰的復(fù)雜路況下,其通行效率超過(guò)了傳統(tǒng)的 L2 智駕和 Robotaxi。

基于這樣的能力,第二代 VLA 的使用門檻大幅降低。何小鵬表示,好的技術(shù)一定要讓每一個(gè)人都能用起來(lái),國(guó)民的智駕就應(yīng)該像坐電梯一樣簡(jiǎn)單,做到簡(jiǎn)單、安全且好用。

不過(guò),體驗(yàn)上是極度的簡(jiǎn)單好用,并不意味著技術(shù)上是在原有智駕框架上的簡(jiǎn)單修補(bǔ)。小鵬第二代 VLA 背后,是底層技術(shù)架構(gòu)的一次完全「推倒重來(lái)」。

重構(gòu)技術(shù)底座:原生多模態(tài)物理大模型

面向 L4 的終極目標(biāo),小鵬汽車自前年開始立項(xiàng),對(duì)端到端的智能駕駛進(jìn)行了完全的底層重構(gòu)。

為了將自動(dòng)駕駛推向物理 AI 的本質(zhì),小鵬構(gòu)建了全流程能力,其中第二代 VLA 是真正做好高階自動(dòng)駕駛的關(guān)鍵技術(shù)底座

第二代 VLA 代表了 AI 驅(qū)動(dòng)駕駛技術(shù)的一次重要架構(gòu)升級(jí),其不再像傳統(tǒng) VLA 模型那樣先通過(guò)視覺(jué)感知獲取環(huán)境信息,再將這些信息轉(zhuǎn)化為基于語(yǔ)言的推理過(guò)程,最終生成車輛的行動(dòng)指令。

通過(guò)引入一種端到端的「視覺(jué) - 動(dòng)作」(Vision-to-Action)架構(gòu),第二代 VLA 使系統(tǒng)能夠?qū)h(huán)境感知直接轉(zhuǎn)化為駕駛決策,提升了整體效率,并顯著加快了系統(tǒng)響應(yīng)速度。

用一句話總結(jié)第二代 VLA:其以統(tǒng)一模型貫通環(huán)境感知、場(chǎng)景推理與行動(dòng)決策,實(shí)現(xiàn)「感知 — 推理 — 行動(dòng)」一體化

在感知層面,通過(guò)原生多模態(tài) Tokenizer,打破不同模態(tài)之間的壁壘,實(shí)現(xiàn)了視覺(jué)、語(yǔ)音、文本等的統(tǒng)一編碼與融合,對(duì)物理世界形成了統(tǒng)一的理解。

在推理層面,引入超密集的視覺(jué)思維鏈(Visual CoT),能夠?qū)?fù)雜場(chǎng)景進(jìn)行更高效視覺(jué)推理,相較于傳統(tǒng) CoT 推理效率提升約 32 倍。同時(shí)相較傳統(tǒng) CoT 預(yù)測(cè)誤差降低 33%,提升系統(tǒng)對(duì)復(fù)雜駕駛環(huán)境的理解與決策判斷。

在行動(dòng)層面,直接生成多模態(tài)輸出,包括語(yǔ)音、視覺(jué)反饋以及具體動(dòng)作和行為。



小鵬通用智能中心負(fù)責(zé)人劉先明

不僅如此,小鵬汽車還聯(lián)合北京大學(xué)提出了一種全新的視覺(jué) token 剪枝框架FastDriveVLA,它能讓 AI 像人類司機(jī)一樣,在復(fù)雜路況下自動(dòng)忽略路邊的廣告牌和無(wú)關(guān)風(fēng)景,只盯著核心路況。

通過(guò)讓 AI 只專注有用的核心信息而忽略無(wú)用信息,該框架高效解決了自動(dòng)駕駛模型 VLA 在處理高幀率圖像時(shí)帶來(lái)的超高計(jì)算量問(wèn)題。相關(guān)論文已被 AI 頂會(huì) AAAI 2026 接收。



論文地址:https://arxiv.org/pdf/2507.23318

當(dāng)然,構(gòu)建出強(qiáng)大的 AI 底座僅僅是第一步。在高度復(fù)雜的物理世界中,面向 L4 級(jí)的輔助駕駛,還必須依托于另外幾個(gè)核心要素。

能力公式重構(gòu):模型 × 算力 × 數(shù)據(jù) × 本體

小鵬提出:第二代 VLA 的突破并非單點(diǎn)能力升級(jí),而是遵循 L4 能力等于「模型 × 算力 × 數(shù)據(jù) × 本體」的 Scaling Laws(規(guī)模法則)

正如前沿 AI 技術(shù)應(yīng)用不斷驗(yàn)證的那樣,單純堆疊通用芯片算力或一味追求龐大的模型參數(shù),往往會(huì)在實(shí)際部署時(shí)遭遇瓶頸。真正的能力護(hù)城河,必須是算法、底層硬件架構(gòu)與海量數(shù)據(jù)的深度耦合。

在自動(dòng)駕駛這個(gè)頂級(jí) AI 工程問(wèn)題上,要想實(shí)現(xiàn)真正的 L4 級(jí)自動(dòng)駕駛,僅靠單一的算法模型突破是遠(yuǎn)遠(yuǎn)不夠的。系統(tǒng)必須依托車輛這個(gè)「物理本體」,在模型、算力和數(shù)據(jù)三個(gè)維度實(shí)現(xiàn)高度協(xié)同。

這是一條難而正確的路。

在這其中,既包含了理解真實(shí)世界的基礎(chǔ):原生多模態(tài)大模型。正如上文所述,小鵬的基座模型實(shí)現(xiàn)「看、聽、讀」的感官合一,將感知理解、場(chǎng)景推理、行動(dòng)執(zhí)行統(tǒng)一到同一模型框架中。



同時(shí)也包含了高度優(yōu)化的軟硬件協(xié)同,利用有效算力打開智能的上限

小鵬在底層算力架構(gòu)上進(jìn)行了深度定制。依靠自研的圖靈芯片,小鵬實(shí)現(xiàn)了「芯片 - 編譯器 - 模型」的聯(lián)合優(yōu)化研發(fā)。通過(guò)專門開發(fā)的自動(dòng)化編譯器和基于芯片定制化的圖靈結(jié)構(gòu)模型,小鵬最大化了算力的利用率,使得模型在車端的運(yùn)行速度飆升了 12 倍。



這種深度的軟硬件一體化設(shè)計(jì),正是第二代 VLA 能夠?qū)崟r(shí)處理海量視覺(jué)信息的底氣。

在訓(xùn)練 AI 的過(guò)程中,還必須構(gòu)筑起數(shù)據(jù)飛輪,讓視覺(jué)數(shù)據(jù)的高信息密度價(jià)值得以充分釋放。

一個(gè)值得關(guān)注的對(duì)比是:當(dāng)前國(guó)內(nèi)所有數(shù)字 AI(主要是各類大語(yǔ)言模型)的日調(diào)用量大約為 0.737 萬(wàn)億 Token,而小鵬僅僅 20 萬(wàn)輛搭載第二代 VLA Ultra 的車輛,每天在車端模型上消耗的物理 AI Token 量就高達(dá) 58.8 萬(wàn)億 —— 小鵬車端模型每天消耗的 Token,是全國(guó)數(shù)字 AI 日調(diào)用量的近 80 倍。

目前,小鵬已經(jīng)積累了超過(guò) 50PB 的訓(xùn)練數(shù)據(jù),小鵬車端的高清傳感器每秒要處理高達(dá) 53 億字節(jié)的視覺(jué)數(shù)據(jù)。

最后,這一切都需要依托強(qiáng)大的 AI Infra,再通過(guò)世界模型的仿真訓(xùn)練實(shí)現(xiàn)閉環(huán)。

依托領(lǐng)先的 AI 基礎(chǔ)設(shè)施,自去年科技日以來(lái),小鵬在半年內(nèi)完成了 468 個(gè)模型的版本迭代。

此外為了應(yīng)對(duì)現(xiàn)實(shí)世界中難以窮盡的 Corner Case,小鵬引入了世界模型進(jìn)行閉環(huán)仿真。如今,其仿真場(chǎng)景庫(kù)已從一年前的 3 萬(wàn)個(gè)激增至 50 多萬(wàn)個(gè),每天在虛擬世界中進(jìn)行基于強(qiáng)化學(xué)習(xí)的「自我對(duì)弈」,日均仿真測(cè)試?yán)锍痰刃в?3000 萬(wàn)公里的實(shí)車測(cè)試。



可以說(shuō),小鵬第二代 VLA 是一個(gè)基于端到端 AI 算法、定制芯片高度整合,由海量數(shù)據(jù)和世界模型知識(shí)共同構(gòu)建的超級(jí)物理 AI 生命體。

結(jié)語(yǔ)

隨著新一代 VLA 智能駕駛的出現(xiàn),物理 AI 的實(shí)力正在逐漸展現(xiàn)。



何小鵬表示,基于端到端模型的輔助駕駛能力將會(huì)成為汽車行業(yè)未來(lái)三年的重要突破,它是面向完全自動(dòng)駕駛的第一個(gè)版本。在小鵬內(nèi)部,該技術(shù)正在以前所未有的速度迭代。

對(duì)于一家車企而言,第二代 VLA 是小鵬在自動(dòng)駕駛技術(shù)路徑上的一次重要探索:不同于傳統(tǒng)駕駛系統(tǒng)各個(gè)模塊(如感知、規(guī)劃、控制)逐一優(yōu)化的工程化思路,其圍繞自研基座模型打造統(tǒng)一的物理世界智能系統(tǒng),從而具備理解真實(shí)世界并持續(xù)學(xué)習(xí)、演進(jìn)的能力。

隨著自動(dòng)駕駛技術(shù)加速邁向 AI 驅(qū)動(dòng)的智能時(shí)代,這種技術(shù)體系勢(shì)必成為其在下一階段競(jìng)爭(zhēng)中爭(zhēng)奪主動(dòng)權(quán)的關(guān)鍵變量。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
如果熱刺在英超降級(jí)卻奪得歐冠冠軍,會(huì)發(fā)生什么?

如果熱刺在英超降級(jí)卻奪得歐冠冠軍,會(huì)發(fā)生什么?

星耀國(guó)際足壇
2026-03-06 23:58:30
太危險(xiǎn)了! 2025年浙江男子自制1800伏“電貓”,拉70多米抓2只吃

太危險(xiǎn)了! 2025年浙江男子自制1800伏“電貓”,拉70多米抓2只吃

萬(wàn)象硬核本尊
2026-03-06 18:36:27
美軍陣亡士兵遺體繼續(xù)在中東被發(fā)現(xiàn)

美軍陣亡士兵遺體繼續(xù)在中東被發(fā)現(xiàn)

碳基生物關(guān)懷組織
2026-03-03 23:37:09
繼女訂婚,我送一套婚房,婚宴前晚她來(lái)電:叔叔,明天你別坐主桌

繼女訂婚,我送一套婚房,婚宴前晚她來(lái)電:叔叔,明天你別坐主桌

堇色夜行
2025-12-06 14:47:59
不是打不贏,而是打不起!美國(guó)高層直言:拿下伊朗易如反掌,但這會(huì)讓中國(guó)徹底脫離牽制

不是打不贏,而是打不起!美國(guó)高層直言:拿下伊朗易如反掌,但這會(huì)讓中國(guó)徹底脫離牽制

起喜電影
2026-03-06 03:28:53
五五分流為什么分不下去了?背后的真相

五五分流為什么分不下去了?背后的真相

楓冷慕詩(shī)
2026-01-24 13:09:19
極目調(diào)查丨老板瘋狂搶人,一天500元難招技工,廣州“制衣村”工人為何如此緊俏?

極目調(diào)查丨老板瘋狂搶人,一天500元難招技工,廣州“制衣村”工人為何如此緊俏?

極目新聞
2026-03-06 22:41:34
中國(guó)女籃72-66雙殺巴西!數(shù)據(jù)一清二楚:不是張子宇 最大功臣是她

中國(guó)女籃72-66雙殺巴西!數(shù)據(jù)一清二楚:不是張子宇 最大功臣是她

侃球熊弟
2026-03-06 21:12:18
國(guó)家敲定2026年養(yǎng)老金上漲,漲多少?一個(gè)沒(méi)想到,還有一個(gè)好消息

國(guó)家敲定2026年養(yǎng)老金上漲,漲多少?一個(gè)沒(méi)想到,還有一個(gè)好消息

鯨探所長(zhǎng)
2026-03-06 19:21:04
曾有個(gè)很流行的日本謠言:質(zhì)量好的留在日本,等外品的垃圾賣中國(guó)

曾有個(gè)很流行的日本謠言:質(zhì)量好的留在日本,等外品的垃圾賣中國(guó)

章哥說(shuō)買房
2026-03-05 12:17:42
掛斷王毅電話后,以色列大軍突然向北進(jìn)攻,第二場(chǎng)大戰(zhàn)爆發(fā)

掛斷王毅電話后,以色列大軍突然向北進(jìn)攻,第二場(chǎng)大戰(zhàn)爆發(fā)

Ck的蜜糖
2026-03-04 17:58:13
姑姑春節(jié)給我10萬(wàn)紅包,只因她生了二胎,想要我包20萬(wàn)紅包

姑姑春節(jié)給我10萬(wàn)紅包,只因她生了二胎,想要我包20萬(wàn)紅包

星羽故事集
2026-02-26 10:52:39
全國(guó)人大代表顧祥林:留學(xué)生回國(guó)求職規(guī)模大,怎樣避免“僧多粥少”局面?

全國(guó)人大代表顧祥林:留學(xué)生回國(guó)求職規(guī)模大,怎樣避免“僧多粥少”局面?

上觀新聞
2026-03-06 20:57:06
農(nóng)民養(yǎng)老金問(wèn)題,今年開始破冰?

農(nóng)民養(yǎng)老金問(wèn)題,今年開始破冰?

中產(chǎn)先生
2026-03-06 12:16:45
說(shuō)白了,一開始,全世界都在下注,賭中國(guó)會(huì)輸。

說(shuō)白了,一開始,全世界都在下注,賭中國(guó)會(huì)輸。

忠于法紀(jì)
2025-12-20 10:12:27
伊朗稱向美軍“林肯”號(hào)航母發(fā)射導(dǎo)彈

伊朗稱向美軍“林肯”號(hào)航母發(fā)射導(dǎo)彈

環(huán)球網(wǎng)資訊
2026-03-07 03:21:50
伊朗網(wǎng)紅吐槽中國(guó)網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭(zhēng)的殘酷

伊朗網(wǎng)紅吐槽中國(guó)網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭(zhēng)的殘酷

新游戲大妹子
2026-03-05 12:59:52
那些慣于宏大敘事的人,會(huì)聆聽重慶女孩和長(zhǎng)沙街頭餓暈的人嗎?

那些慣于宏大敘事的人,會(huì)聆聽重慶女孩和長(zhǎng)沙街頭餓暈的人嗎?

林中木白
2025-10-09 16:35:47
美以伊軍事沖突最大副作用,是斬?cái)嗔硕砹_斯的“救命稻草”

美以伊軍事沖突最大副作用,是斬?cái)嗔硕砹_斯的“救命稻草”

廖保平
2026-03-05 12:08:52
360周鴻祎眼睛換上人工晶體:摘掉眼鏡是為了戴AI眼鏡

360周鴻祎眼睛換上人工晶體:摘掉眼鏡是為了戴AI眼鏡

IT之家
2026-03-05 11:02:08
2026-03-07 06:11:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12430文章數(shù) 142578關(guān)注度
往期回顧 全部

科技要聞

獨(dú)家|除夕加班、毫無(wú)黑料!林俊旸無(wú)奈離場(chǎng)

頭條要聞

伊朗稱向美軍“林肯”號(hào)航母發(fā)射導(dǎo)彈

頭條要聞

伊朗稱向美軍“林肯”號(hào)航母發(fā)射導(dǎo)彈

體育要聞

跑了24年,他終于成為英超“最長(zhǎng)的河”

娛樂(lè)要聞

周杰倫社交媒體曬昆凌,夫妻感情穩(wěn)定

財(cái)經(jīng)要聞

關(guān)于經(jīng)濟(jì)、股市等,五部門都說(shuō)了啥?

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
親子
游戲
手機(jī)

藝術(shù)要聞

陳獨(dú)秀寫給青年毛澤東的對(duì)聯(lián),一語(yǔ)雙關(guān),陳氏書法“天花板”!

這些才是適合普通人的穿搭!搭配腰帶、多穿牛仔褲,簡(jiǎn)單舒適

親子要聞

兒童鼻出血的常見問(wèn)題,兒科醫(yī)生解答

曝下代Xbox靠純算力制霸!性能“爆殺”PS6

手機(jī)要聞

榮耀600系列曝光:9000mAh+2億像素+超聲波指紋,這波堆料太狠

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版