国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

馬赫100芯片支撐、首搭全新L9

0
分享至

來源:市場資訊

(來源:Xauto報告)


架構升級成為今年自動駕駛賽道的一個關鍵詞。

今年以來,蔚來推送世界模型2.0、小鵬推送第二代VLA、Momenta推出Momenta R7強化學習世界模型,在前幾天舉辦的NVIDIA GTC 2026大會上,理想發(fā)布了下一代自動駕駛基座模型MindVLA-o1。

理想汽車基座模型負責人詹錕在演講中詳細地介紹了新一代架構,隨后,理想汽車創(chuàng)始人李想又與詹錕進行了一場生動的對話。

讓我們得以對理想下一代自動駕駛架構的搭建和思考有了更多了解。

01

自動駕駛架構再升級,引入3D ViT

詹錕介紹,自動駕駛架構進入端到端之后,才算是真正的AI系統(tǒng)。但早期的端到端屬于低階智能,類似于昆蟲具備的智能,本質(zhì)是通過學習模仿來做事情。

因此,想讓自動駕駛系統(tǒng)有好的表現(xiàn),就需要喂給它大量數(shù)據(jù)進行模仿學習,然而現(xiàn)實世界之復雜,長尾場景難以窮盡,靠吃數(shù)量來學習,顯然無法完全覆蓋。

這就是為什么,當前第一梯隊輔助駕駛系統(tǒng)在常規(guī)城市路況下表現(xiàn)都比較不錯,但在長尾場景中,依然會暴露各種各樣的問題,遠遠不如人類司機。

那么如何讓自動駕駛系統(tǒng)從模仿學習,進化到理解交通場景?

在端到端的基礎之上,各家技術架構開始分化。詹錕介紹,端到端中間加了Language語義推理,就成了VLA,中間加了未來圖像想象,就成了世界模型。

去年的英偉達GTC大會上,理想推出VLA架構。一年沉淀下來,理想智駕整體確實有很大進步,但很快又到了一個瓶頸期。在Xauto智駕榜30個考點中,理想在窄路通行、三點式掉頭等難度較高場景依然無法通過。


面對這樣的現(xiàn)狀,李想提出了一個思考。

人類開車看上去沒那么難,每個普通人都能把車開得又快又穩(wěn),但全世界最頂尖的企業(yè)砸了幾千億進去,自動駕駛?cè)匀贿M展緩慢。問題到底出在哪?

經(jīng)過總結(jié),理想認為,過去一直在教AI做成年人的事,但從來沒讓它當過小孩。

人類在0到6歲的階段學會了走路,學會了扔球、接球。這看起來只是簡單的動作,但實際上已經(jīng)幫助孩子建立了對三維物理空間的理解。

人類能精準測距、穩(wěn)定駕駛,是因為“3D預訓練”在人類6歲前就完成了。

今天所有的端到端系統(tǒng)本質(zhì)上都是“看2D視頻學開車”,更像是一個人坐在電腦前看了十萬小時行車記錄儀,然后直接上路。

此前被行業(yè)津津樂道的BEV、OCC都存在著短板,BEV把世界從俯視角拍扁,從而丟失了高度信息,OCC雖是3D,但是缺少語義信息。

理想認為,物理AI缺的不是更大的模型、更多的數(shù)據(jù),而是一個能真正理解3D世界的視覺基礎。

為了解決這個問題,理想引入了原生3D ViT,也就是三維視覺編碼器。

ViT(Vision Transformer),是基于Transformer的主干網(wǎng)絡,具備全局注意力的特性,能提取出更優(yōu)秀的全局上下文特征,是大模型時代的主流。

理想介紹,3D ViT是讓模型一開始就工作在真實的三維世界里,以高分辨率多視角視覺為核心,在編碼階段直接完成對3D空間幾何和語義的統(tǒng)一理解,包括空間結(jié)構、位置關系、語義信息等一次完成。

那么,模型不只是看見畫面,而是理解世界。

在這個體系下,激光雷達的角色變了,它不再是感知的核心,而更像一把高精度的尺子,為視覺提供幾何標定和近場空間約束。

李想表示,在統(tǒng)一建模下,3D ViT可以穩(wěn)定感知并推理到500米以上的空間范圍。

這里想提一個點,最近華為將旗下多款車型升級到了更高精度的896線激光雷達,或許也是基于同樣的思考,為自動駕駛模型描繪更高精度的物理世界。

既然3D ViT有諸多優(yōu)勢,理想為何此時才開始引入其自動駕駛架構?談及這個問題。

詹錕表示,因為3D ViT對車端推理算力提出了極高的要求,理想汽車自研的馬赫100芯片,單顆算力達到1280TOPS,自研芯片的落地為3D ViT部署提供基礎。

02

五大核心技術點,最新架構解讀

了解了理想汽車新一代自動駕駛架構的核心變化,我們再來全面了解一下其核心技術點。

理想汽車下一代自動駕駛架構的名稱是MindVLA-o1。

這個架構以原生多模態(tài)MoE Transformer為核心,有五方面核心技術點,包括3D空間理解、多模態(tài)思考、統(tǒng)一行為生成、閉環(huán)強化學習和軟硬件協(xié)同設計。


在感知層面,理想汽車采用以視覺為核心的3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達點云作為三維幾何提示,引導模型理解真實空間結(jié)構,使其同時具備語義理解與三維感知能力。

同時引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態(tài)環(huán)境與動態(tài)物體分別建模,并通過下一幀預測作為自監(jiān)督信號,使模型同時學習深度信息、語義結(jié)構與物體運動,最終形成融合空間結(jié)構與時間上下文的高質(zhì)量3D表示。

具備3D空間理解能力,使模型看得更遠。


在思考層面,自動駕駛既要理解當前環(huán)境,也要預測未來幾秒的場景演化。

在語言模型承擔語義理解、常識知識和交互能力的基礎上,理想汽車還引入了預測式隱世界模型,在隱空間中高效模擬未來。

訓練分三階段:

第一,用海量視頻數(shù)據(jù)預訓練Latent World Token(隱世界詞元),構建未來表征;

第二,在MindVLA-o1中持續(xù)世界模型的推演,形成隱空間的未來推理能力;

第三,將世界模型、多模態(tài)推理能力及駕駛行為進行聯(lián)合訓練與對齊。

由此,模型不僅能理解當前場景并進行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。

理想汽車將這種能力定義為多模態(tài)思考。擁有多模態(tài)思考能力,讓模型想得更深。


在行為層面,理想汽車構建了統(tǒng)一行為生成(Unified Action Generation)機制。

首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構,并引入專門的Action Expert,從3D場景特征、導航目標、駕駛指令等多維輸入中提取信息,并結(jié)合多模態(tài)思考生成高精度駕駛軌跡。

其次,為滿足實時性要求,系統(tǒng)采用并行解碼(Parallel Decoding),同時生成所有軌跡點,大幅提升效率。

最后,引入Discrete Diffusion(離散擴散)進行多輪迭代優(yōu)化,類似逐步去噪,確保軌跡空間連續(xù)、時間穩(wěn)定,并符合車輛動力學約束。

形成統(tǒng)一行為生成機制,使模型行得更穩(wěn)。


在模型迭代層面,理想汽車構建了閉環(huán)強化學習框架,讓模型不僅能從真實數(shù)據(jù)學習,還能在世界模擬器中持續(xù)探索和優(yōu)化策略。

為此,理想汽車將傳統(tǒng)逐步優(yōu)化式重建升級為Feed-forward(前饋)場景重建,使系統(tǒng)能夠瞬時生成大規(guī)模、高保真駕駛場景,支持大規(guī)模并行訓練。

同時,結(jié)合生成式模型,模擬環(huán)境可擴展、編輯并生成全新場景。

為支持大規(guī)模模擬與訓練,理想汽車開發(fā)了統(tǒng)一的3D Gaussian Splatting(3D高斯?jié)姙R)渲染引擎和分布式訓練框架,渲染速度提升近2倍,整體訓練成本降低約75%,實現(xiàn)低成本、高效率的強化學習閉環(huán)。

在閉環(huán)強化學習框架下,模型實現(xiàn)更快進化。


為解決傳統(tǒng)端側(cè)大模型部署耗時長、調(diào)試頻繁的問題,理想汽車提出面向端側(cè)大模型的軟硬件協(xié)同設計定律,將模型結(jié)構與驗證損失建模,并結(jié)合Roofline模型刻畫硬件計算能力與內(nèi)存帶寬限制,在模型性能與硬件約束之間建立統(tǒng)一的分析框架。

理想汽車基座模型團隊評估了近2000種模型架構配置,在英偉達Orin與Thor平臺上完成驗證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構探索時間從數(shù)月縮短至數(shù)天,大幅提升端側(cè)VLA模型的設計與部署效率。

在軟硬件協(xié)同設計定律下,模型部署更高效。

03

根據(jù)理想透露的信息,新一代自動駕駛架構量產(chǎn)時間或在今年二季度,首發(fā)落地車型是全新理想L9。

李想此前介紹稱,單顆馬赫100的有效算力就是英偉達Thor U的3倍。全新理想L9還準備了一個頂配版L9 Livis,這個版本將搭載兩顆馬赫100芯片。

另一個值得關注的地方是,主流自動駕駛玩家都在向世界模型靠攏,通過理想對于3D ViT的介紹也可以看到,理想也在試圖讓模型真正理解3D世界。

此外,行業(yè)的共識是,自動駕駛只是物理AI落地的一個關鍵場景,對于自動駕駛的探索,不僅服務于汽車,也可擴展至機器人及各種物理系統(tǒng)。

因此,打造一個通用物理AI基座模型,也是當前車企和智駕公司研發(fā)投入的重點。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
詹姆斯愿降薪2000萬!為留里夫斯+爭冠布局41歲老詹主動讓出頂薪

詹姆斯愿降薪2000萬!為留里夫斯+爭冠布局41歲老詹主動讓出頂薪

阿晞體育
2026-03-25 13:01:56
金正恩給普京回電:平壤永遠與莫斯科在一起,這是我們的選擇,也是堅定的意志

金正恩給普京回電:平壤永遠與莫斯科在一起,這是我們的選擇,也是堅定的意志

瀟湘晨報
2026-03-25 12:22:13
全球最大彈藥庫:澳門大搬空需6年,是否足夠美國打次世界大戰(zhàn)?

全球最大彈藥庫:澳門大搬空需6年,是否足夠美國打次世界大戰(zhàn)?

小蒨喜歡解說
2026-03-23 17:51:09
被抓后家中查出20噸黃金?秘密移民國外?趙本山身上的謠言太離譜

被抓后家中查出20噸黃金?秘密移民國外?趙本山身上的謠言太離譜

小蘭聊歷史
2026-03-25 17:34:51
“晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

“晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

安安說
2026-03-14 18:50:59
450億顆芯片懸空!荷蘭突然宣布光刻機決定,歐媒:一切都結(jié)束了

450億顆芯片懸空!荷蘭突然宣布光刻機決定,歐媒:一切都結(jié)束了

壹知眠羊
2026-03-25 09:50:00
張雪峰因心源性猝死去世!緊急提醒:猝死前身體的3個求救信號別忽視

張雪峰因心源性猝死去世!緊急提醒:猝死前身體的3個求救信號別忽視

人民日報健康客戶端
2026-03-24 23:54:26
“中園石化”加油站被立案調(diào)查!顧客加完油才發(fā)現(xiàn)不是“中國石化”

“中園石化”加油站被立案調(diào)查!顧客加完油才發(fā)現(xiàn)不是“中國石化”

大象新聞
2026-03-25 13:45:04
出國打球?李夢正式發(fā)聲,下家3選1,有望獲宮魯鳴認可重返國家隊

出國打球?李夢正式發(fā)聲,下家3選1,有望獲宮魯鳴認可重返國家隊

萌蘭聊個球
2026-03-25 14:32:07
醫(yī)生發(fā)現(xiàn):最傷害前列腺的行為,不是酗酒!而是頻繁去做這5件事

醫(yī)生發(fā)現(xiàn):最傷害前列腺的行為,不是酗酒!而是頻繁去做這5件事

垚垚分享健康
2026-03-25 15:11:28
上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

李昕言溫度空間
2026-03-19 22:56:18
長孫指的是誰?到底是年齡最大的孫子,還是長子的兒子為長孫?

長孫指的是誰?到底是年齡最大的孫子,還是長子的兒子為長孫?

長風文史
2026-03-24 14:24:24
就在重慶!這個央企總部即將入駐!

就在重慶!這個央企總部即將入駐!

奇思妙想生活家
2026-03-25 12:12:23
59+10+5!G聯(lián)盟歷史總得分王來了!

59+10+5!G聯(lián)盟歷史總得分王來了!

柚子說球
2026-03-25 19:50:01
看看文班亞馬和霍姆格倫二人恐怖的蓋帽能力,堪稱“竹竿雙神”!

看看文班亞馬和霍姆格倫二人恐怖的蓋帽能力,堪稱“竹竿雙神”!

田先生籃球
2026-03-24 22:15:04
太意外!米蘭寶格麗之夜合影:劉亦菲兩度被擠,下意識動作引熱議

太意外!米蘭寶格麗之夜合影:劉亦菲兩度被擠,下意識動作引熱議

時間巡查
2026-03-25 04:28:00
《逐玉》火了,全網(wǎng)都在問誰投的錢,沒人再關心誰演的

《逐玉》火了,全網(wǎng)都在問誰投的錢,沒人再關心誰演的

喜歡歷史的阿繁
2026-03-23 19:43:48
女兒坐飛機返崗上班,在飛機上意外拍到守在山頂送機的媽媽

女兒坐飛機返崗上班,在飛機上意外拍到守在山頂送機的媽媽

半島晨報
2026-03-23 14:40:37
日本現(xiàn)役自衛(wèi)隊軍官持刀闖中國大使館!日網(wǎng)全在罵他“蠢貨”

日本現(xiàn)役自衛(wèi)隊軍官持刀闖中國大使館!日網(wǎng)全在罵他“蠢貨”

這里是東京
2026-03-25 07:02:24
陜西檢察長陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

陜西檢察長陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

午夜故事會
2024-04-15 18:31:39
2026-03-25 21:24:49
新浪財經(jīng) incentive-icons
新浪財經(jīng)
新浪財經(jīng)是一家創(chuàng)建于1999年8月的財經(jīng)平臺
2626246文章數(shù) 6133關注度
往期回顧 全部

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實力

頭條要聞

伊朗放話愿意與"主和派"萬斯談 特朗普表態(tài)

頭條要聞

伊朗放話愿意與"主和派"萬斯談 特朗普表態(tài)

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰經(jīng)搶救無效不幸去世 年僅41歲

財經(jīng)要聞

管濤:中東局勢如何影響人民幣匯率走勢?

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

態(tài)度原創(chuàng)

藝術
時尚
本地
教育
親子

藝術要聞

《百花譜》,這個春天畫花不用愁!

今年春天最時髦的穿法:長外套+長裙、長針織+長褲,太高級了!

本地新聞

來永泰同安 赴一場春天的約會

教育要聞

理科女生如何選專業(yè)?工科專業(yè)有哪些選擇

親子要聞

幼兒園3年,家長培養(yǎng)寶寶4個好習慣,孩子成績比同齡人優(yōu)秀

無障礙瀏覽 進入關懷版