国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

理想汽車發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1

0
分享至

2026年3月17日,理想汽車基座模型負(fù)責(zé)人詹錕出席NVIDIA GTC 2026,發(fā)表主題演講《MindVLA-o1:開啟全能范式——下一代統(tǒng)一視覺-語言-動作自動駕駛大模型探索》,發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1。MindVLA-o1通過五大技術(shù)創(chuàng)新,構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型,讓自動駕駛看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效。

詹錕表示:“當(dāng)我們把視覺、語言和行動統(tǒng)一到一個(gè)模型中時(shí),它已不再只是自動駕駛模型,而是在逐漸演化為面向物理世界的通用智能體;谕惶譜LA模型,不僅可以控制車輛,也能夠擴(kuò)展到機(jī)器人。因此,自動駕駛只是物理AI的起點(diǎn),未來這類基礎(chǔ)模型將驅(qū)動新的具身智能范式!

從規(guī)則時(shí)代到AI時(shí)代 理想輔助駕駛持續(xù)演進(jìn)

自2021年啟動輔助駕駛自研以來,理想輔助駕駛技術(shù)架構(gòu)經(jīng)歷了多輪關(guān)鍵迭代,持續(xù)的技術(shù)探索與工程實(shí)踐,為理想汽車在軟硬件一體化研發(fā)領(lǐng)域積累了深厚的基礎(chǔ)研究能力與研發(fā)實(shí)力。2024年是理想輔助駕駛的重要分水嶺,隨著端到端+VLM(視覺語言模型)雙系統(tǒng)架構(gòu)量產(chǎn)交付,輔助駕駛首次真正具備了跨場景、跨任務(wù)的統(tǒng)一理解能力。2025年,理想汽車進(jìn)一步將空間理解、語言理解與行動決策統(tǒng)一到同一模型框架,構(gòu)建了基于VLA、世界模型與強(qiáng)化學(xué)習(xí)三大技術(shù)棧的VLA司機(jī)大模型,并于8月隨理想i8交付正式推送,9月向AD Max用戶全量推送。

截至2025年底,VLA司機(jī)大模型月使用率達(dá)到80%,VLA指令累計(jì)使用1225.4萬次;春節(jié)期間理想輔助駕駛總里程達(dá)2.5億公里,VLA指令使用次數(shù)達(dá)130.3萬次。規(guī);挠脩趄(yàn)證與持續(xù)積累的真實(shí)場景數(shù)據(jù),為理想汽車推進(jìn)下一代自動駕駛技術(shù)演進(jìn)提供了堅(jiān)實(shí)基礎(chǔ)。

MindVLA-o1五大技術(shù)創(chuàng)新:看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效

理想汽車提出下一代統(tǒng)一架構(gòu)——MindVLA-o1。該架構(gòu)以原生多模態(tài)MoE Transformer為核心,通過五大技術(shù)創(chuàng)新——3D空間理解、多模態(tài)思考、統(tǒng)一行為生成、閉環(huán)強(qiáng)化學(xué)習(xí)(Closed-loop RL)和軟硬件協(xié)同設(shè)計(jì)(Hardware–Software Co-Design),構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型。


在感知層面,理想汽車采用以視覺為核心的 3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達(dá)點(diǎn)云作為三維幾何提示,引導(dǎo)模型理解真實(shí)空間結(jié)構(gòu),使其在單一表示中同時(shí)具備語義理解與三維感知能力。同時(shí)引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態(tài)環(huán)境與動態(tài)物體分別建模,并通過下一幀預(yù)測(Next-state prediction)作為自監(jiān)督信號,使模型同時(shí)學(xué)習(xí)深度信息、語義結(jié)構(gòu)與物體運(yùn)動,最終形成融合空間結(jié)構(gòu)與時(shí)間上下文的高質(zhì)量3D表示。具備3D空間理解能力,使模型看得更遠(yuǎn)。


在思考層面,自動駕駛既要理解當(dāng)前環(huán)境,也要預(yù)測未來幾秒的場景演化。在語言模型承擔(dān)語義理解、常識知識和交互能力的基礎(chǔ)上,理想汽車還引入了預(yù)測式隱世界模型,在隱空間中高效模擬未來。訓(xùn)練分三階段:第一,用海量視頻數(shù)據(jù)預(yù)訓(xùn)練Latent World Token(隱世界詞元),構(gòu)建未來表征;第二,在MindVLA-o1中持續(xù)世界模型的推演,形成隱空間的未來推理能力;第三,將世界模型、多模態(tài)推理能力及駕駛行為進(jìn)行聯(lián)合訓(xùn)練與對齊。由此,模型不僅能理解當(dāng)前場景并進(jìn)行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。理想汽車將這種能力定義為多模態(tài)思考(Generative Multimodal Thinking)。擁有多模態(tài)思考能力,讓模型想得更深。


在行為層面,理想汽車構(gòu)建了統(tǒng)一行為生成(Unified Action Generation)機(jī)制。首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構(gòu),并引入專門的Action Expert(動作專家),從3D場景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息,并結(jié)合多模態(tài)思考生成高精度駕駛軌跡。其次,為滿足實(shí)時(shí)性要求,系統(tǒng)采用并行解碼(Parallel Decoding),同時(shí)生成所有軌跡點(diǎn),大幅提升效率。最后,引入Discrete Diffusion(離散擴(kuò)散)進(jìn)行多輪迭代優(yōu)化,類似逐步去噪,確保軌跡空間連續(xù)、時(shí)間穩(wěn)定,并符合車輛動力學(xué)約束。形成統(tǒng)一行為生成機(jī)制,使模型行得更穩(wěn)。


在模型迭代層面,理想汽車構(gòu)建了閉環(huán)強(qiáng)化學(xué)習(xí)框架,讓模型不僅能從真實(shí)數(shù)據(jù)學(xué)習(xí),還能在世界模擬器(World Simulator)中持續(xù)探索和優(yōu)化策略。為此,理想汽車將傳統(tǒng)逐步優(yōu)化式重建升級為Feed-forward(前饋)場景重建,使系統(tǒng)能夠瞬時(shí)生成大規(guī)模、高保真駕駛場景,支持大規(guī)模并行訓(xùn)練。同時(shí),結(jié)合生成式模型(Generative Models),模擬環(huán)境可擴(kuò)展、編輯并生成全新場景。為支持大規(guī)模模擬與訓(xùn)練,理想汽車開發(fā)了統(tǒng)一的3D Gaussian Splatting(3D高斯?jié)姙R)渲染引擎和分布式訓(xùn)練框架,渲染速度提升近2倍,整體訓(xùn)練成本降低約75%,實(shí)現(xiàn)低成本、高效率的強(qiáng)化學(xué)習(xí)閉環(huán)。在閉環(huán)強(qiáng)化學(xué)習(xí)框架下,模型實(shí)現(xiàn)更快進(jìn)化。


為解決傳統(tǒng)端側(cè)大模型部署耗時(shí)長、調(diào)試頻繁的問題,理想汽車提出面向端側(cè)大模型的軟硬件協(xié)同設(shè)計(jì)定律,將模型結(jié)構(gòu)與驗(yàn)證損失建模,并結(jié)合Roofline模型刻畫硬件計(jì)算能力與內(nèi)存帶寬限制,在模型性能與硬件約束之間建立統(tǒng)一的分析框架。理想汽車基座模型團(tuán)隊(duì)評估了近2000種模型架構(gòu)配置,在英偉達(dá)Orin與Thor平臺上完成驗(yàn)證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構(gòu)探索時(shí)間從數(shù)月縮短至數(shù)天,大幅提升端側(cè)VLA模型的設(shè)計(jì)與部署效率。在軟硬件協(xié)同設(shè)計(jì)定律下,模型部署更高效。


自動駕駛只是起點(diǎn),為具身智能構(gòu)建“數(shù)字大腦”

MindVLA-o1是理想汽車面向物理世界智能核心AI框架的重要組成部分。這套AI框架由四大核心模塊組成:MindData,統(tǒng)一的VLA數(shù)據(jù)引擎,負(fù)責(zé)大規(guī)模數(shù)據(jù)的采集、清洗和自動標(biāo)注;MindVLA-o1,統(tǒng)一的原生多模態(tài)VLA模型,可以理解環(huán)境、進(jìn)行推理,并生成駕駛行為;MindSim,可控的多模態(tài)世界模型,用于生成復(fù)雜駕駛場景并支持大規(guī)模閉環(huán)訓(xùn)練;RL Infra(強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施),通過獎(jiǎng)勵(lì)模型和策略學(xué)習(xí),使系統(tǒng)在仿真與真實(shí)環(huán)境中自我進(jìn)化。

四部分協(xié)同形成完整閉環(huán),使AI能夠感知、理解并在物理世界中自主行動,并持續(xù)學(xué)習(xí)。從結(jié)構(gòu)上看,這套系統(tǒng)如同一個(gè)“數(shù)字大腦”:感知層對應(yīng)視覺皮層,推理與規(guī)劃如前額葉,場景生成似運(yùn)動皮層,強(qiáng)化學(xué)習(xí)則類似多巴胺反饋,實(shí)現(xiàn)了感知、理解、行動和持續(xù)優(yōu)化的完整閉環(huán)。

該框架不僅服務(wù)于汽車,也可擴(kuò)展至機(jī)器人及各種物理系統(tǒng)。對理想汽車而言,車是最大號的機(jī)器人,其本質(zhì)是在構(gòu)建硅基生命體的軀干與大腦。


理想汽車在持續(xù)推進(jìn)技術(shù)創(chuàng)新的同時(shí),在人工智能領(lǐng)域頂級學(xué)術(shù)會議和期刊發(fā)表了大量研究成果,其中MindVLA-o1相關(guān)的多篇論文已在CVPR、ICLR、ICRA、AAAI等國際頂會上發(fā)表。未來,理想汽車將繼續(xù)以用戶價(jià)值為導(dǎo)向,投入前沿研究以及核心技術(shù)自研,持續(xù)構(gòu)建面向物理世界智能的完整AI系統(tǒng),堅(jiān)定邁向全球領(lǐng)先的具身智能企業(yè)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
科爾提議取消三分線?禪師菲爾·杰克遜:這事兒我憋了15年了

科爾提議取消三分線?禪師菲爾·杰克遜:這事兒我憋了15年了

仰臥撐FTUer
2026-04-28 09:58:02
中國造不出光刻機(jī)?中科大副院長:美國造不出,中國永遠(yuǎn)都不可能

中國造不出光刻機(jī)?中科大副院長:美國造不出,中國永遠(yuǎn)都不可能

小蘭聊歷史
2026-03-21 18:17:07
上海一男子領(lǐng)養(yǎng)12歲盲童,花25萬給她治眼睛,誰料,女孩恢復(fù)光明后,卻一把抱住他,淚如雨下:爸,對不起。

上海一男子領(lǐng)養(yǎng)12歲盲童,花25萬給她治眼睛,誰料,女孩恢復(fù)光明后,卻一把抱住他,淚如雨下:爸,對不起。

LULU生活家
2026-04-27 18:49:14
G1遼寧77-67戰(zhàn)勝山東 球員評價(jià):4人優(yōu)秀,4人及格,2人低迷

G1遼寧77-67戰(zhàn)勝山東 球員評價(jià):4人優(yōu)秀,4人及格,2人低迷

籃球資訊達(dá)人
2026-04-28 21:23:41
五一假期,跟著電影打卡粵港澳,太好拍了!

五一假期,跟著電影打卡粵港澳,太好拍了!

上觀新聞
2026-04-28 10:09:18
美國一學(xué)生打斷以色列士兵演講,當(dāng)眾怒斥以軍:6歲女孩被打335槍,超70000巴勒斯坦人被殺,你們犯下的暴行終將被清算

美國一學(xué)生打斷以色列士兵演講,當(dāng)眾怒斥以軍:6歲女孩被打335槍,超70000巴勒斯坦人被殺,你們犯下的暴行終將被清算

大象新聞
2026-04-28 23:48:20
科技裁員創(chuàng)兩年新高,但最糟的還沒來

科技裁員創(chuàng)兩年新高,但最糟的還沒來

碼上閑敘
2026-04-28 23:54:48
一斤它頂十斤黃芪!每天吃幾顆,身體壯了、氣色好了、臉上有光了

一斤它頂十斤黃芪!每天吃幾顆,身體壯了、氣色好了、臉上有光了

王二哥老搞笑
2026-04-28 11:40:53
成都警方通報(bào)一泳池遭投火鍋底料:8人被采取刑事強(qiáng)制措施

成都警方通報(bào)一泳池遭投火鍋底料:8人被采取刑事強(qiáng)制措施

上海法治聲音
2026-04-28 14:44:16
央國企倒查追責(zé),再次升級!

央國企倒查追責(zé),再次升級!

細(xì)說職場
2026-04-22 15:35:36
黃一鳴丑聞升級!前男友再出手:懷孕時(shí)周旋三男,更多細(xì)節(jié)流出

黃一鳴丑聞升級!前男友再出手:懷孕時(shí)周旋三男,更多細(xì)節(jié)流出

未曾青梅
2026-04-27 23:01:25
18℃!上海一原副區(qū)長受賄2959萬!兩周上4休3!男子酒后3次布洛芬全身95%潰爛!一地實(shí)行五一高速逆行!迪士尼打人者道歉!

18℃!上海一原副區(qū)長受賄2959萬!兩周上4休3!男子酒后3次布洛芬全身95%潰爛!一地實(shí)行五一高速逆行!迪士尼打人者道歉!

上觀新聞
2026-04-28 07:39:24
想要良知?就不要在這個(gè)圈子里混!

想要良知?就不要在這個(gè)圈子里混!

通往遠(yuǎn)方的路
2026-04-25 07:41:42
火箭扳回一場!誰是最大功臣,數(shù)據(jù)不會說謊

火箭扳回一場!誰是最大功臣,數(shù)據(jù)不會說謊

呂彍極限手工
2026-04-29 00:46:43
兩性關(guān)系,男人要明白:女人無論多大年齡,都有這樣一個(gè)需求

兩性關(guān)系,男人要明白:女人無論多大年齡,都有這樣一個(gè)需求

笑飲孤鴻非
2026-03-27 23:36:11
51歲周迅變樣:滿頭白發(fā)臉?biāo)煽,癟嘴像老奶奶,無兒無女成遺憾

51歲周迅變樣:滿頭白發(fā)臉?biāo)煽,癟嘴像老奶奶,無兒無女成遺憾

悅君兮君不知
2026-03-20 12:19:00
太心疼!馬筱梅哭到停更,帶娃逃回臺灣:憑啥要我和孩子遭這罪?

太心疼!馬筱梅哭到停更,帶娃逃回臺灣:憑啥要我和孩子遭這罪?

蕭狡科普解說
2026-04-28 15:21:07
當(dāng)選國王后首次!查爾斯三世不懼槍擊訪問美國,特朗普:他很勇敢

當(dāng)選國王后首次!查爾斯三世不懼槍擊訪問美國,特朗普:他很勇敢

iWeekly周末畫報(bào)
2026-04-28 09:05:48
在浙江發(fā)現(xiàn)一戶人家,一個(gè)客廳就讓無數(shù)人效仿,裝修太漂亮了

在浙江發(fā)現(xiàn)一戶人家,一個(gè)客廳就讓無數(shù)人效仿,裝修太漂亮了

手工制作阿愛
2026-04-27 18:29:32
全紅嬋被網(wǎng)暴到主動請假!人民日報(bào)罕見發(fā)聲:別把她修剪成盆景

全紅嬋被網(wǎng)暴到主動請假!人民日報(bào)罕見發(fā)聲:別把她修剪成盆景

子芫伴你成長
2026-04-02 19:12:58
2026-04-29 04:24:49
旭車評 incentive-icons
旭車評
網(wǎng)絡(luò)飛速 放慢腳步做車評
806文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

10億周活目標(biāo)落空!傳OpenAI爆發(fā)內(nèi)部分歧

頭條要聞

19歲中國女孩被困緬甸 交20萬贖金園區(qū)仍未放人

頭條要聞

19歲中國女孩被困緬甸 交20萬贖金園區(qū)仍未放人

體育要聞

魔術(shù)黑八活塞,一步之遙?!

娛樂要聞

蔡卓妍官宣結(jié)婚,老公比她小10歲

財(cái)經(jīng)要聞

中央政治局會議定調(diào),八大看點(diǎn)速覽!

汽車要聞

拒絕瘋狂套娃!現(xiàn)代艾尼氪金星長在未來審美點(diǎn)上

態(tài)度原創(chuàng)

教育
旅游
房產(chǎn)
手機(jī)
時(shí)尚

教育要聞

教育部通知,今年9月份開始,上學(xué)的規(guī)則全變了

旅游要聞

莫讓內(nèi)卷式競爭削弱旅游消費(fèi)信心

房產(chǎn)要聞

紅利爆發(fā)!海南,沖到全國人口增量第4省!

手機(jī)要聞

三星裸眼3D屏來了,廣告牌能“跳”出來

普通女性春天穿什么好看?這些穿搭值得借鑒,自然舒適

無障礙瀏覽 進(jìn)入關(guān)懷版