国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

警惕VLA“泡沫”,VLA只是錦上添花,并不是“萬能鑰匙”

0
分享至

就在VLA被推上“神壇”之際,博世智能駕控中國區(qū)總裁吳永橋給VLA潑了一盆涼水。剛剛結(jié)束的2025世界人工智能大會(WAIC)上,吳永橋提出了一個(gè)反共識的觀點(diǎn):VLA短期內(nèi)難以落地,仍需攻克多維難題。

其實(shí)2024年就有企業(yè)提及VLA的概念,2025年以來,VLA開始被行業(yè)大肆鼓吹。語音、手勢、甚至表情控制智駕系統(tǒng),VLA被描繪得無所不能。這個(gè)原本在具身智能機(jī)器人領(lǐng)域廣泛討論的技術(shù)被移植到了自動駕駛。但在吳永橋看來,行業(yè)對VLA的癡迷太過急于求成。他提到VLA當(dāng)下存在很多問題(引號內(nèi)為吳永橋原話):

“首先,多模態(tài)大模型的特征對齊很難實(shí)現(xiàn)(視覺、語言、動作)”;

這里的多模態(tài)特征對齊指的是將不同模態(tài)(如圖像、文本、音頻等)的特征映射到統(tǒng)一的語義空間,從而實(shí)現(xiàn)跨模態(tài)信息的有效融合與理解。這種技術(shù)在多模態(tài)學(xué)習(xí)中扮演著“橋梁”的角色,使得不同模態(tài)的數(shù)據(jù)能夠協(xié)同工作,提升模型的智能表現(xiàn)。

“其次,多模態(tài)的數(shù)據(jù)獲取和訓(xùn)練也十分困難?!?/p>

按照不少車企的宣傳話術(shù),VLA可以實(shí)現(xiàn)語音識別,手勢識別,甚至眼神識別等,但是這些數(shù)據(jù)從哪來,沒有足夠多的實(shí)際數(shù)據(jù)作為支撐如何保證絲滑體驗(yàn)。

“最重要的一點(diǎn),VLA模型要部署在智駕芯片上,才能實(shí)現(xiàn)行車安全以及駕駛高度擬人化,模型規(guī)模必須要做到7B-10B左右。但目前市面上幾乎所有的三方智駕芯片都不是專為大模型的計(jì)算而設(shè)計(jì)的,帶寬相對較小,僅3B的模型布置在Thor芯片,頻率很難做到10赫茲?!?/p>

這里其實(shí)提到了3個(gè)問題,首先是參數(shù)量的問題,目前行業(yè)主流的車端VLA模型參數(shù)差不多在2B左右,企業(yè)披露的最高是4B。跟吳永橋說的10B(100億)差距甚遠(yuǎn)。

聚焦VLA的企業(yè)首先要解決的就是量的問題。目前看來沒有任何一家企業(yè)能夠達(dá)到這個(gè)數(shù)據(jù)量,而且短期內(nèi)很難速成,只能靠賣車一點(diǎn)點(diǎn)積累。

另外一個(gè)就是芯片問題。芯片硬件的設(shè)計(jì)要提前預(yù)判幾年后的軟件趨勢。VLA是最近1年才流行起來的說法,而目前主流的芯片都是至少3年前就開始立項(xiàng)開發(fā),并不是專門針對大模型參數(shù)設(shè)計(jì),這就存在吳永橋提到的帶寬問題。就是芯片在一定時(shí)間內(nèi)能夠傳輸?shù)臄?shù)據(jù)量。是數(shù)據(jù)傳輸率的一個(gè)重要指標(biāo),表示在傳輸管道中可以傳遞數(shù)據(jù)的能力。大家可以換一個(gè)蓄水池的角度理解或許更形象,就是在一個(gè)足夠大的蓄水池里,但是出水口徑只有2cm,效率其實(shí)是非常低的。

有技術(shù)預(yù)判的企業(yè)肯定意識到了這個(gè)問題,為了支持大參數(shù)量,車企們的策略是自研芯片,小鵬和蔚來已經(jīng)上車,但效果怎么樣還是未知數(shù)。但其實(shí)還是繞不開那個(gè)問題,這幾家企業(yè)芯片立項(xiàng)的時(shí)間都比較早,能考慮到多大的硬件極限也不清楚。

再有就是刷新頻率。就是系統(tǒng)對外部輸入信息的實(shí)時(shí)更新,按照吳永橋的說法,現(xiàn)在的模型刷新頻率都很難達(dá)到VLA需要的10赫茲。也有企業(yè)說達(dá)到了這個(gè)數(shù)據(jù)。

最后,吳永橋給了一個(gè)結(jié)論,可能要在3-5年之后,有了真正能跑大模型的芯片,才能支持VLA落地。博世并不否認(rèn)VLA的價(jià)值,但是當(dāng)下,吳永橋認(rèn)為一段式端到端更有意義。只有將一段式端到端打磨到極致的性能,才能帶來高度擬人化、絲滑的智駕產(chǎn)品。(當(dāng)然他說的應(yīng)該是當(dāng)下最好的產(chǎn)品)

無獨(dú)有偶,博世并不是唯一一個(gè)提醒大家保持冷靜的人。技術(shù)控曹旭東對VLA的態(tài)度更克制。上海車展期間,Momenta創(chuàng)始人曹旭東在接受騰訊汽車采訪時(shí)也提到了相同的觀點(diǎn)。(引號部分為曹旭東原話)

“VLM(Visual-Language Model,視覺語言模型)、VLA(Vision-Language-Action Model,視覺語言行動模型)是很好的方向,但在我看來是錦上添花的方向,在技術(shù)實(shí)現(xiàn)上其實(shí)沒那么難。它可能對自動駕駛系統(tǒng)上限,或者系統(tǒng)安全性來說,會有少則三五倍、多則五到十倍的提升,但這個(gè)提升對實(shí)現(xiàn)規(guī)?;疞4是遠(yuǎn)遠(yuǎn)不夠的,規(guī)?;疞4至少是100倍到1000倍的提升才有可能實(shí)現(xiàn)?!?/p>

這里曹旭東表達(dá)了3個(gè)意思:1、VLA是一個(gè)不錯(cuò)的方向;2、技術(shù)難度并不高;3、對系統(tǒng)安全的性能提升有限,最多5-10倍,這個(gè)提升對L4規(guī)?;h(yuǎn)遠(yuǎn)不夠。

這個(gè)可以順著他的意思把其中的邏輯給拆解一下,第一點(diǎn)他說VLA是一個(gè)很好的方向,但并沒有強(qiáng)調(diào)VLA的唯一性,這和不少企業(yè)將VLA宣傳成自動駕駛的必須且唯一解有本質(zhì)區(qū)別。

后面2點(diǎn),曹旭東解釋自動駕駛本身就是一個(gè)vision action(視覺-行動)的東西,把語言加進(jìn)去,相當(dāng)于加了一個(gè)信息輸入而已,技術(shù)難度并不高,而且加入一個(gè)信息元素系統(tǒng)安全也很難提升100到1000倍。

“我們認(rèn)為提升要用強(qiáng)化學(xué)習(xí),把端到端大模型放到通過海量真實(shí)數(shù)據(jù)構(gòu)建起來的仿真環(huán)境去做探索,成功就給獎勵,失敗就給懲罰,這個(gè)模型就能夠?qū)W習(xí)到什么是安全駕駛、高效駕駛的概念。這種能力是能夠把模型的上限和安全的上限、下限提升100到1000倍,甚至1000到10000倍都是可以的?!?/p>

和吳永橋一樣,曹旭東也認(rèn)為,要保證優(yōu)質(zhì)的自動駕駛體驗(yàn),將端到端與強(qiáng)化學(xué)習(xí)結(jié)合是更靠譜的方案。

相較于這些概念性的東西。曹旭東更強(qiáng)調(diào)自動駕駛本源的三要素:模型、數(shù)據(jù)、算法。他認(rèn)為,模型設(shè)計(jì)的上限決定了系統(tǒng)學(xué)習(xí)能力的上限。如果模型設(shè)計(jì)的不好,給他再多的數(shù)據(jù)也學(xué)不會。就像老鼠的腦結(jié)構(gòu)不可能超越人類。

順著這個(gè)思路再往下走,VLA只是一種“視覺-語言-行為”模型,證明它可以在一個(gè)模型里處理這些信息,但處理的好不好是另一回事。如果按照老鼠,猴子,猩猩,人類腦結(jié)構(gòu)來劃分,不同物種有不同的VLA結(jié)構(gòu)。其實(shí)又回到了模型設(shè)計(jì)的問題,然后通過大數(shù)據(jù)喂養(yǎng)和強(qiáng)化學(xué)習(xí)訓(xùn)練在生成一個(gè)好的模型。而且還有一個(gè)核心的問題,目前最好的模型是什么人類無法提前預(yù)知,只能先搭建,然后用數(shù)據(jù)去試。

如果我們把視角再往前推會發(fā)現(xiàn)一個(gè)非常有意思的事情,大概1年前整個(gè)行業(yè)將端到端推上神壇,一體化架構(gòu)、自主學(xué)習(xí)……各種花里胡哨的名詞,仿佛有了端到端就無所不能。結(jié)果僅僅一年時(shí)間,端到端還沒成熟,新的VLA技術(shù)又粉墨登場,被大肆宣揚(yáng)。

慶幸的是,在所有人都被流量裹挾時(shí)被總有人發(fā)出不一樣的聲音。就像當(dāng)年端到端大火的時(shí)候,所有人提起端到端都兩眼放光,前圖森未來創(chuàng)始人侯曉迪給端到端破了一盆冷水,他認(rèn)為端到端只是人工智能里很平常的一項(xiàng)技術(shù),提醒行業(yè)不要過分神化,有了端到端也未必能解決所有問題。站在今天的視角來看,端到端已經(jīng)從成了大家口中的牛夫人,VLA才是當(dāng)下的小甜甜,但是這股風(fēng)到底會持續(xù)多久誰也不知道。明年會不會又有什么新的技術(shù)名詞出現(xiàn)呢?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
外交部發(fā)言人反問日媒:“你見過有人未經(jīng)允許持刀進(jìn)入使館與大使交談的先例嗎?”

外交部發(fā)言人反問日媒:“你見過有人未經(jīng)允許持刀進(jìn)入使館與大使交談的先例嗎?”

環(huán)球網(wǎng)資訊
2026-03-25 15:39:26
停炸五天的真正含義:伊朗被迫進(jìn)入二選一困局

停炸五天的真正含義:伊朗被迫進(jìn)入二選一困局

斌聞天下
2026-03-26 07:45:03
以色列人哭了:這不是該發(fā)生在劣等民族身上的嗎?

以色列人哭了:這不是該發(fā)生在劣等民族身上的嗎?

李榮茂
2026-03-23 18:59:00
53歲寧靜近況曝光!29年前嫁美國演員生一子,離婚后盡享單身生活

53歲寧靜近況曝光!29年前嫁美國演員生一子,離婚后盡享單身生活

代軍哥哥談娛樂
2026-03-25 11:31:55
中方駁斥“闖館事件”日方荒謬說法:你見過未經(jīng)允許持刀進(jìn)入使館同大使交談的先例嗎?

中方駁斥“闖館事件”日方荒謬說法:你見過未經(jīng)允許持刀進(jìn)入使館同大使交談的先例嗎?

環(huán)球網(wǎng)資訊
2026-03-26 07:09:09
我想過Sora會死,但沒想到這么快。

我想過Sora會死,但沒想到這么快。

差評XPIN
2026-03-26 00:04:51
4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務(wù)必抓緊辦

4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務(wù)必抓緊辦

混沌錄
2026-03-25 15:50:11
張雪峰去世事件升級!很多人連夜下單AED,有店鋪一天銷售100多臺

張雪峰去世事件升級!很多人連夜下單AED,有店鋪一天銷售100多臺

火山詩話
2026-03-26 07:32:38
伊朗議長和外長被移出美以清除名單,“時(shí)限4到5天”!專家:若達(dá)成協(xié)議最慌的是以色列!特朗普:油價(jià)漲、股市跌,我無所謂

伊朗議長和外長被移出美以清除名單,“時(shí)限4到5天”!專家:若達(dá)成協(xié)議最慌的是以色列!特朗普:油價(jià)漲、股市跌,我無所謂

每日經(jīng)濟(jì)新聞
2026-03-26 12:20:14
經(jīng)濟(jì)學(xué)歷巴曙松被帶走調(diào)查

經(jīng)濟(jì)學(xué)歷巴曙松被帶走調(diào)查

地產(chǎn)微資訊
2026-03-25 20:49:47
布朗31分8板8助凱爾特人終結(jié)雷霆12連勝,亞歷山大33分8助攻

布朗31分8板8助凱爾特人終結(jié)雷霆12連勝,亞歷山大33分8助攻

湖人崛起
2026-03-26 10:00:59
兩省省委領(lǐng)導(dǎo)班子調(diào)整

兩省省委領(lǐng)導(dǎo)班子調(diào)整

上觀新聞
2026-03-25 15:07:07
“住宅禁放骨灰盒”新規(guī)出爐,引爭議!網(wǎng)友:可以去化房地產(chǎn)庫存

“住宅禁放骨灰盒”新規(guī)出爐,引爭議!網(wǎng)友:可以去化房地產(chǎn)庫存

火山詩話
2026-03-26 11:11:22
原來她是張雪峰前妻,90后歷史學(xué)博士?,兩人離婚后曾一起上節(jié)目

原來她是張雪峰前妻,90后歷史學(xué)博士?,兩人離婚后曾一起上節(jié)目

大鐵貓娛樂
2026-03-25 13:03:57
四天619次進(jìn)攻、6090人傷亡:俄春季攻勢為何高傷亡低戰(zhàn)果?

四天619次進(jìn)攻、6090人傷亡:俄春季攻勢為何高傷亡低戰(zhàn)果?

高博新視野
2026-03-25 08:00:28
廣東一男子買啤酒抽中電動車大獎,將中獎二維碼發(fā)網(wǎng)上詢問后被他人掃走核銷,網(wǎng)友:“這下又上了一課”

廣東一男子買啤酒抽中電動車大獎,將中獎二維碼發(fā)網(wǎng)上詢問后被他人掃走核銷,網(wǎng)友:“這下又上了一課”

洪觀新聞
2026-03-26 10:56:49
“史上最慘”的成都糖酒會,徹底撕開了白酒行業(yè)的遮羞布

“史上最慘”的成都糖酒會,徹底撕開了白酒行業(yè)的遮羞布

財(cái)經(jīng)早餐
2026-03-25 22:42:59
萬科高管被要求退還薪酬

萬科高管被要求退還薪酬

地產(chǎn)微資訊
2026-03-26 12:22:04
曾因污言穢語被封禁的張雪峰,憑什么讓鄭大悼念,新華社發(fā)訃告?

曾因污言穢語被封禁的張雪峰,憑什么讓鄭大悼念,新華社發(fā)訃告?

觀察者海風(fēng)
2026-03-25 22:10:33
美方提“15點(diǎn)計(jì)劃”,伊朗稱“又一個(gè)謊言”,美國“一邊準(zhǔn)備談判一邊握拳”

美方提“15點(diǎn)計(jì)劃”,伊朗稱“又一個(gè)謊言”,美國“一邊準(zhǔn)備談判一邊握拳”

環(huán)球網(wǎng)資訊
2026-03-26 06:58:33
2026-03-26 13:56:49
圓周智行
圓周智行
智能出行產(chǎn)業(yè)科技研究院
160文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時(shí)限4到5天

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時(shí)限4到5天

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
家居
數(shù)碼
藝術(shù)
游戲

親子要聞

躺平的孩子意外覺醒了,在父母學(xué)會當(dāng)“烏龜”!

家居要聞

傍海而居 靜觀蝴蝶海

數(shù)碼要聞

Intel史上最先進(jìn)!酷睿Ultra 300系列vPro平臺發(fā)布

藝術(shù)要聞

哪一座橋不是風(fēng)景?

IGN認(rèn)為Xbox機(jī)會來了!新主機(jī)要轉(zhuǎn)守為攻 重塑自我

無障礙瀏覽 進(jìn)入關(guān)懷版