国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

元戎啟行周光:VLA的下限,已超過端到端1.0的上限

0
分享至

2024年6月,元戎啟行CEO周光乘坐測試車經(jīng)過一處紅綠燈,看到了一個不起眼的交通牌——「車輛左轉(zhuǎn)不受燈控」,但測試車依舊停下等待紅燈轉(zhuǎn)綠。

在后方不斷傳來的鳴笛催促聲中,周光意識到:即便是當(dāng)時的端到端模型,也無法充分理解道路環(huán)境與通行條件。而且,許多人類能輕易察覺的潛在風(fēng)險,系統(tǒng)卻無法感知。

同年9月,周光公開表示:“現(xiàn)在的VLM(端到端1.0),就相當(dāng)于一個帶著學(xué)員的教練,通過語言的形式,告訴學(xué)員左轉(zhuǎn)、減速…而VLA,則是換成教練親自開車。”

也是從這時起,元戎啟行將VLA模型提升為公司級研發(fā)項目。并在反復(fù)的測試中,驗證了VLA「讓機(jī)器讀懂物理世界」的神奇能力,認(rèn)定它會是Corner case泥潭中的一條新航道。

到了昨日(8月26日),元戎啟行發(fā)布全新一代輔助駕駛平臺——DeepRoute IO 2.0,該平臺搭載自研的VLA(Vision-Language-Action)模型,融合視覺感知、語義理解與動作決策三大核心能力,對比傳統(tǒng)端到端模型,VLA模型更擅長應(yīng)對復(fù)雜路況,可謂實現(xiàn)了斷代式突破。

如何讓AI懂得「害怕」?

盡管如今的AI技術(shù)路線仍沒有標(biāo)準(zhǔn)答案,但是在包括汽車在內(nèi)的整個具身智能行業(yè)中,VLA已經(jīng)成為了代表技術(shù)能力和落地可行性的關(guān)鍵路徑。

今年,小鵬、理想相繼宣布VLA的量產(chǎn)消息。而元戎啟行也表示,在基于DeepRoute IO 2.0平臺的5個定點合作項目中,首批量產(chǎn)車即將進(jìn)入市場。

據(jù)了解,DeepRoute IO 2.0可以支持激光雷達(dá)與純視覺雙版本,率先適配英偉達(dá)Drive Thor芯片,后續(xù)將拓展至更多平臺。

“在DeepRoute IO 2.0中,我們讓AI學(xué)會了‘害怕’——害怕是生物進(jìn)化出的保護(hù)機(jī)制,AI也應(yīng)當(dāng)具備對風(fēng)險的敬畏之心。”周光表示,防御性駕駛是VLA的核心目標(biāo)。只有讓AI學(xué)會害怕,才是對安全真正的重視。

之所以反復(fù)強(qiáng)調(diào)「防御性駕駛」,是因為他深知CNN或BEV端到端系統(tǒng)的瓶頸所在——看不見等于不存在。

他表示,人類司機(jī)會憑借對空間遮擋關(guān)系的理解,采取謹(jǐn)慎策略通過復(fù)雜場景。例如,當(dāng)看到人車混行的橋洞、無信號燈的路口,或者視線被遮擋嚴(yán)重時,人類是一定會減速的。

這意味著,輔助駕駛系統(tǒng)必須提升對高級語義和空間關(guān)系的理解能力,而上一代端到端無法做到這一點,因為BEV是難以學(xué)習(xí)空間理解的。

“VLA的下限,就已經(jīng)是端到端1.0的上限了”。在發(fā)布會上,他總結(jié)了VLA模型的4大功能:空間語義理解、異形障礙物識別、文字類引導(dǎo)牌理解、記憶語音控車。

比起許多用戶認(rèn)為非常炫酷的「語音交互」功能,周光認(rèn)為VLA主動預(yù)判、規(guī)避風(fēng)險的作用更為重要。

“語音控車功能甚至通過Rule-based就能實現(xiàn),而VLA架構(gòu)真正的難點,是對場景的高級語義推理,這也是其核心進(jìn)化方向——CoT思維鏈?!?/p>

長時序分析,深層次推理

自去年開始,周光就已指出,VLA的關(guān)鍵特性就是思維鏈:“你需要通過多重信息來決定如何通過復(fù)雜場景,也需要不斷地與其他車輛博弈、交互,這種復(fù)雜度是規(guī)則庫無法應(yīng)對的?!?/p>

他表示,短期記憶依靠視頻幀,長期記憶則借助關(guān)鍵幀與語言描述——正如人類通過文字記錄歷史,語言是對現(xiàn)實的高效壓縮。而VLA就是因為能夠進(jìn)行長時序上下文分析,所以能處理更復(fù)雜的路況,完成更深層次的推理。

“現(xiàn)實駕駛環(huán)境中存在大量文字信息,例如交通標(biāo)志、臨時路牌等。有些是印刷在道路上的靜態(tài)文字,可借助地圖數(shù)據(jù);但還有很多是臨時設(shè)置,必須通過實時感知和理解才能正確處理。語言理解能力可讓車輛更好地與現(xiàn)實世界交互,為用戶帶來更多便利?!?/p>

例如, VLA模型能通過文本等看懂潮汐車道、公交車道、臨時限行區(qū)域等道路標(biāo)志,并從多重信息中確認(rèn)通行規(guī)則。

基于此,DeepRoute IO 2.0也將擁有更高階的思考能力,能夠理解交通場景中復(fù)雜的交互事件、隱藏的語義信息和邏輯推理。

除了上述功能外,VLA還具備更高的異形障礙物識別水平,并擁有記憶語音控車功能。其中,后者不僅能支持「快一點/慢一點」等基礎(chǔ)指令,還能記憶用戶偏好,實現(xiàn)個性化體驗。

通過實際體驗,我們可以發(fā)現(xiàn)DeepRoute IO 2.0在道路兩側(cè)停滿車輛、存在「鬼探頭」風(fēng)險時,降速緩行;并在經(jīng)過存在盲區(qū)的橋洞時,同樣比較嚴(yán)謹(jǐn)。另外,對于多種載貨兩輪/三輪車輛,系統(tǒng)也能夠較好地識別。

周光認(rèn)為,盡管目前的VLA模型仍處于「幼年期」,但其上限遠(yuǎn)高于端到端方案:“新一代架構(gòu)需要新一代芯片支持,這不是CNN時代可比的?!?/p>

算力枷鎖終將瓦解

目前,「成本」經(jīng)常被認(rèn)為是VLA上車的阻礙之一。而周光卻表示,DeepRoute IO 2.0不僅可面向多種主流乘用車平臺開展定制化部署,可適配的車型更是低至15萬元級別,甚至10萬元級別的車型通過優(yōu)化也有機(jī)會搭載。

“從傳感器方面來看,11個攝像頭正成為主流配置;同時行業(yè)整體都在提升算力,下一代芯片將達(dá)到5000TOPS,甚至10000TOPS級別也不遠(yuǎn)了?!?/p>

他表示,VLA與端到端1.0的主要成本差異在于芯片,其余部分基本一致。而芯片成本取決于制程工藝,目前千T級芯片算力時代已經(jīng)到來,例如特斯拉2500TOPS芯片,雙芯片即可實現(xiàn)5000TOPS。

如今,元戎啟行的量產(chǎn)車輛已接近10萬臺,獲得超過10款車型的定點合作,預(yù)計第四季度的交付量還將進(jìn)一步提升。

交付量的擴(kuò)大,往往意味著要面臨更嚴(yán)格的市場監(jiān)督,任何問題都會被放大。在這一節(jié)點,元戎啟行正式步入「2.0階段」,打通上一代端到端的瓶頸,讓輔助駕駛系統(tǒng)更加可靠,體驗感更強(qiáng)。

周光預(yù)計, Thor+VLA能帶來的直觀效果,是絕大多數(shù)人都會認(rèn)為這樣的系統(tǒng)「是好用的」,城市接管可能達(dá)到百公里起步的水平。

“真正的智能駕駛必須依賴大模型,未來必將全面轉(zhuǎn)向基于GPT架構(gòu)的端到端系統(tǒng)。回顧大模型的發(fā)展,它經(jīng)歷了從通才到專家系統(tǒng)的演進(jìn):GPT-4屬于‘通才’,如今進(jìn)入強(qiáng)化學(xué)習(xí)階段,模型正變得更專業(yè)、更可靠?!?/p>

他認(rèn)為,雖然技術(shù)發(fā)展沒有標(biāo)準(zhǔn)答案,但實際上每個關(guān)鍵階段都無法跳過:從有圖、無圖、端到端到VLA模型,整個發(fā)展過程必不可少,不可能完全繞過。同時,他也呼吁行業(yè)應(yīng)關(guān)注大模型整體發(fā)展,避免局限在自動駕駛領(lǐng)域。

“技術(shù)發(fā)展需要時間,時間將驗證一切。”

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
香蕉被點名!醫(yī)生提醒:高血糖患者常吃香蕉,很快或迎來這些后果

香蕉被點名!醫(yī)生提醒:高血糖患者常吃香蕉,很快或迎來這些后果

白話電影院
2026-04-07 20:07:56
紹興一博物館戰(zhàn)國青銅劍被指多處“拼接痕”,庫保員:入庫時登記“完整”,但“拼接痕”說不清楚

紹興一博物館戰(zhàn)國青銅劍被指多處“拼接痕”,庫保員:入庫時登記“完整”,但“拼接痕”說不清楚

大風(fēng)新聞
2026-04-10 17:27:03
金毛下葬細(xì)節(jié),沒有舉辦葬禮,入不了祖墳,知情人偷露更多細(xì)節(jié)

金毛下葬細(xì)節(jié),沒有舉辦葬禮,入不了祖墳,知情人偷露更多細(xì)節(jié)

魔都姐姐雜談
2026-04-10 12:24:33
詹姆斯生涯助攻數(shù)來到11998記,距離歷史第三的基德還有93次

詹姆斯生涯助攻數(shù)來到11998記,距離歷史第三的基德還有93次

林子說事
2026-04-10 17:25:32
結(jié)婚42年,他定居上海成“上門女婿”,如今唯一女兒成他的驕傲

結(jié)婚42年,他定居上海成“上門女婿”,如今唯一女兒成他的驕傲

北緯的咖啡豆
2026-04-10 14:48:02
走進(jìn)人民大會堂前,鄭麗文團(tuán)中現(xiàn)“特殊人物”,臺當(dāng)局撒彌天大謊

走進(jìn)人民大會堂前,鄭麗文團(tuán)中現(xiàn)“特殊人物”,臺當(dāng)局撒彌天大謊

生活魔術(shù)專家
2026-04-10 13:32:53
剛從蒙古國回來,說點不中聽的:蒙古國真實面目,可能讓你很意外

剛從蒙古國回來,說點不中聽的:蒙古國真實面目,可能讓你很意外

復(fù)轉(zhuǎn)這些年
2026-04-06 22:24:11
六小齡童沒想到,馬德華參加陳麗華追悼會,因一個動作竟口碑暴增

六小齡童沒想到,馬德華參加陳麗華追悼會,因一個動作竟口碑暴增

以茶帶書
2026-04-09 17:37:33
伊朗官方確認(rèn):翼龍-2首次參戰(zhàn)即被擊落,海灣國家反應(yīng)強(qiáng)烈

伊朗官方確認(rèn):翼龍-2首次參戰(zhàn)即被擊落,海灣國家反應(yīng)強(qiáng)烈

最新聲音
2026-04-06 08:32:33
邁克-布朗教練收獲尼克斯執(zhí)教生涯第52勝!超越萊利創(chuàng)隊史紀(jì)錄

邁克-布朗教練收獲尼克斯執(zhí)教生涯第52勝!超越萊利創(chuàng)隊史紀(jì)錄

北青網(wǎng)-北京青年報
2026-04-10 19:52:03
德國總理:絕不允許以色列軍事行動破壞中東和平進(jìn)程

德國總理:絕不允許以色列軍事行動破壞中東和平進(jìn)程

環(huán)球網(wǎng)資訊
2026-04-10 09:09:08
員工曝真相!遲重瑞與陳麗華真實相處:對外是遲總,對內(nèi)是遲叔

員工曝真相!遲重瑞與陳麗華真實相處:對外是遲總,對內(nèi)是遲叔

情感大頭說說
2026-04-10 12:21:06
湖北一男子涉嫌殺害4歲女兒后報溺水假警被刑拘,細(xì)節(jié)曝光:案發(fā)前5個月曾給女兒投保意外險,事發(fā)當(dāng)天將女兒拋入江中,假意對遺體實施急救

湖北一男子涉嫌殺害4歲女兒后報溺水假警被刑拘,細(xì)節(jié)曝光:案發(fā)前5個月曾給女兒投保意外險,事發(fā)當(dāng)天將女兒拋入江中,假意對遺體實施急救

揚子晚報
2026-04-10 11:22:32
茶葉是高血壓的“催化劑”?醫(yī)生勸告:不想血壓飆升,少喝5種茶

茶葉是高血壓的“催化劑”?醫(yī)生勸告:不想血壓飆升,少喝5種茶

岐黃傳人孫大夫
2026-04-10 13:35:03
心寒到骨子里!趙麗穎為何寧賠違約金也絕不碰《楚喬傳2》?

心寒到骨子里!趙麗穎為何寧賠違約金也絕不碰《楚喬傳2》?

陳意小可愛
2026-04-10 06:40:58
別查了,受不了!巴拿馬外長終于急了:請中國尊重我!

別查了,受不了!巴拿馬外長終于急了:請中國尊重我!

青青子衿
2026-04-10 01:19:51
正式降級中日關(guān)系!日鼓噪中國欠其兩筆賬,稱臺海是嚴(yán)重關(guān)切事項

正式降級中日關(guān)系!日鼓噪中國欠其兩筆賬,稱臺海是嚴(yán)重關(guān)切事項

阿離家居
2026-04-10 20:31:47
鄭麗文在北京,有重大表態(tài),賴清德急了,盧秀燕蔣萬安回應(yīng)亮了

鄭麗文在北京,有重大表態(tài),賴清德急了,盧秀燕蔣萬安回應(yīng)亮了

小陸搞笑日常
2026-04-10 15:33:56
拜登兒子約戰(zhàn)特朗普兒子

拜登兒子約戰(zhàn)特朗普兒子

第一財經(jīng)資訊
2026-04-10 11:15:16
2025年我國留學(xué)回國人數(shù)達(dá)53.56萬

2025年我國留學(xué)回國人數(shù)達(dá)53.56萬

澎湃新聞
2026-04-10 10:00:07
2026-04-10 21:59:00
RoboX
RoboX
關(guān)注智能汽車、機(jī)器人在內(nèi)的具身智能前沿科技
237文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

頭條要聞

媒體:美伊談判即將開始 黎巴嫩對美來說是塊燙手山芋

頭條要聞

媒體:美伊談判即將開始 黎巴嫩對美來說是塊燙手山芋

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

黃景瑜王玉雯否認(rèn)戀情!聚會細(xì)節(jié)被扒

財經(jīng)要聞

李強(qiáng)主持召開經(jīng)濟(jì)形勢專家和企業(yè)家座談會

汽車要聞

搭載第二代刀片電池及閃充技術(shù) 騰勢N8L閃充版預(yù)售35萬起

態(tài)度原創(chuàng)

藝術(shù)
教育
家居
親子
軍事航空

藝術(shù)要聞

于小冬2026年4月油畫新作《花季》

教育要聞

北京教改風(fēng)向標(biāo)!海淀這所優(yōu)質(zhì)校正在交出“新樣本”

家居要聞

復(fù)古風(fēng)格 自然簡約

親子要聞

孩子身體隱私不正常的紅,寶媽們要高度警惕!

軍事要聞

特朗普:對美國與伊朗達(dá)成和平協(xié)議“非常樂觀”

無障礙瀏覽 進(jìn)入關(guān)懷版