国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

理想汽車發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1

0
分享至

2026年3月17日,理想汽車基座模型負(fù)責(zé)人詹錕出席NVIDIA GTC 2026,發(fā)表主題演講《MindVLA-o1:開啟全能范式——下一代統(tǒng)一視覺-語言-動作自動駕駛大模型探索》,發(fā)布下一代自動駕駛基礎(chǔ)模型MindVLA-o1。MindVLA-o1通過五大技術(shù)創(chuàng)新,構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型,讓自動駕駛看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效。

詹錕表示:“當(dāng)我們把視覺、語言和行動統(tǒng)一到一個(gè)模型中時(shí),它已不再只是自動駕駛模型,而是在逐漸演化為面向物理世界的通用智能體;谕惶譜LA模型,不僅可以控制車輛,也能夠擴(kuò)展到機(jī)器人。因此,自動駕駛只是物理AI的起點(diǎn),未來這類基礎(chǔ)模型將驅(qū)動新的具身智能范式!

從規(guī)則時(shí)代到AI時(shí)代 理想輔助駕駛持續(xù)演進(jìn)

自2021年啟動輔助駕駛自研以來,理想輔助駕駛技術(shù)架構(gòu)經(jīng)歷了多輪關(guān)鍵迭代,持續(xù)的技術(shù)探索與工程實(shí)踐,為理想汽車在軟硬件一體化研發(fā)領(lǐng)域積累了深厚的基礎(chǔ)研究能力與研發(fā)實(shí)力。2024年是理想輔助駕駛的重要分水嶺,隨著端到端+VLM(視覺語言模型)雙系統(tǒng)架構(gòu)量產(chǎn)交付,輔助駕駛首次真正具備了跨場景、跨任務(wù)的統(tǒng)一理解能力。2025年,理想汽車進(jìn)一步將空間理解、語言理解與行動決策統(tǒng)一到同一模型框架,構(gòu)建了基于VLA、世界模型與強(qiáng)化學(xué)習(xí)三大技術(shù)棧的VLA司機(jī)大模型,并于8月隨理想i8交付正式推送,9月向AD Max用戶全量推送。

截至2025年底,VLA司機(jī)大模型月使用率達(dá)到80%,VLA指令累計(jì)使用1225.4萬次;春節(jié)期間理想輔助駕駛總里程達(dá)2.5億公里,VLA指令使用次數(shù)達(dá)130.3萬次。規(guī);挠脩趄(yàn)證與持續(xù)積累的真實(shí)場景數(shù)據(jù),為理想汽車推進(jìn)下一代自動駕駛技術(shù)演進(jìn)提供了堅(jiān)實(shí)基礎(chǔ)。

MindVLA-o1五大技術(shù)創(chuàng)新:看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效

理想汽車提出下一代統(tǒng)一架構(gòu)——MindVLA-o1。該架構(gòu)以原生多模態(tài)MoE Transformer為核心,通過五大技術(shù)創(chuàng)新——3D空間理解、多模態(tài)思考、統(tǒng)一行為生成、閉環(huán)強(qiáng)化學(xué)習(xí)(Closed-loop RL)和軟硬件協(xié)同設(shè)計(jì)(Hardware–Software Co-Design),構(gòu)建了面向物理世界智能的自動駕駛基礎(chǔ)模型。


在感知層面,理想汽車采用以視覺為核心的 3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達(dá)點(diǎn)云作為三維幾何提示,引導(dǎo)模型理解真實(shí)空間結(jié)構(gòu),使其在單一表示中同時(shí)具備語義理解與三維感知能力。同時(shí)引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態(tài)環(huán)境與動態(tài)物體分別建模,并通過下一幀預(yù)測(Next-state prediction)作為自監(jiān)督信號,使模型同時(shí)學(xué)習(xí)深度信息、語義結(jié)構(gòu)與物體運(yùn)動,最終形成融合空間結(jié)構(gòu)與時(shí)間上下文的高質(zhì)量3D表示。具備3D空間理解能力,使模型看得更遠(yuǎn)。


在思考層面,自動駕駛既要理解當(dāng)前環(huán)境,也要預(yù)測未來幾秒的場景演化。在語言模型承擔(dān)語義理解、常識知識和交互能力的基礎(chǔ)上,理想汽車還引入了預(yù)測式隱世界模型,在隱空間中高效模擬未來。訓(xùn)練分三階段:第一,用海量視頻數(shù)據(jù)預(yù)訓(xùn)練Latent World Token(隱世界詞元),構(gòu)建未來表征;第二,在MindVLA-o1中持續(xù)世界模型的推演,形成隱空間的未來推理能力;第三,將世界模型、多模態(tài)推理能力及駕駛行為進(jìn)行聯(lián)合訓(xùn)練與對齊。由此,模型不僅能理解當(dāng)前場景并進(jìn)行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。理想汽車將這種能力定義為多模態(tài)思考(Generative Multimodal Thinking)。擁有多模態(tài)思考能力,讓模型想得更深。


在行為層面,理想汽車構(gòu)建了統(tǒng)一行為生成(Unified Action Generation)機(jī)制。首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構(gòu),并引入專門的Action Expert(動作專家),從3D場景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息,并結(jié)合多模態(tài)思考生成高精度駕駛軌跡。其次,為滿足實(shí)時(shí)性要求,系統(tǒng)采用并行解碼(Parallel Decoding),同時(shí)生成所有軌跡點(diǎn),大幅提升效率。最后,引入Discrete Diffusion(離散擴(kuò)散)進(jìn)行多輪迭代優(yōu)化,類似逐步去噪,確保軌跡空間連續(xù)、時(shí)間穩(wěn)定,并符合車輛動力學(xué)約束。形成統(tǒng)一行為生成機(jī)制,使模型行得更穩(wěn)。


在模型迭代層面,理想汽車構(gòu)建了閉環(huán)強(qiáng)化學(xué)習(xí)框架,讓模型不僅能從真實(shí)數(shù)據(jù)學(xué)習(xí),還能在世界模擬器(World Simulator)中持續(xù)探索和優(yōu)化策略。為此,理想汽車將傳統(tǒng)逐步優(yōu)化式重建升級為Feed-forward(前饋)場景重建,使系統(tǒng)能夠瞬時(shí)生成大規(guī)模、高保真駕駛場景,支持大規(guī)模并行訓(xùn)練。同時(shí),結(jié)合生成式模型(Generative Models),模擬環(huán)境可擴(kuò)展、編輯并生成全新場景。為支持大規(guī)模模擬與訓(xùn)練,理想汽車開發(fā)了統(tǒng)一的3D Gaussian Splatting(3D高斯?jié)姙R)渲染引擎和分布式訓(xùn)練框架,渲染速度提升近2倍,整體訓(xùn)練成本降低約75%,實(shí)現(xiàn)低成本、高效率的強(qiáng)化學(xué)習(xí)閉環(huán)。在閉環(huán)強(qiáng)化學(xué)習(xí)框架下,模型實(shí)現(xiàn)更快進(jìn)化。


為解決傳統(tǒng)端側(cè)大模型部署耗時(shí)長、調(diào)試頻繁的問題,理想汽車提出面向端側(cè)大模型的軟硬件協(xié)同設(shè)計(jì)定律,將模型結(jié)構(gòu)與驗(yàn)證損失建模,并結(jié)合Roofline模型刻畫硬件計(jì)算能力與內(nèi)存帶寬限制,在模型性能與硬件約束之間建立統(tǒng)一的分析框架。理想汽車基座模型團(tuán)隊(duì)評估了近2000種模型架構(gòu)配置,在英偉達(dá)Orin與Thor平臺上完成驗(yàn)證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構(gòu)探索時(shí)間從數(shù)月縮短至數(shù)天,大幅提升端側(cè)VLA模型的設(shè)計(jì)與部署效率。在軟硬件協(xié)同設(shè)計(jì)定律下,模型部署更高效。


自動駕駛只是起點(diǎn),為具身智能構(gòu)建“數(shù)字大腦”

MindVLA-o1是理想汽車面向物理世界智能核心AI框架的重要組成部分。這套AI框架由四大核心模塊組成:MindData,統(tǒng)一的VLA數(shù)據(jù)引擎,負(fù)責(zé)大規(guī)模數(shù)據(jù)的采集、清洗和自動標(biāo)注;MindVLA-o1,統(tǒng)一的原生多模態(tài)VLA模型,可以理解環(huán)境、進(jìn)行推理,并生成駕駛行為;MindSim,可控的多模態(tài)世界模型,用于生成復(fù)雜駕駛場景并支持大規(guī)模閉環(huán)訓(xùn)練;RL Infra(強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施),通過獎(jiǎng)勵(lì)模型和策略學(xué)習(xí),使系統(tǒng)在仿真與真實(shí)環(huán)境中自我進(jìn)化。

四部分協(xié)同形成完整閉環(huán),使AI能夠感知、理解并在物理世界中自主行動,并持續(xù)學(xué)習(xí)。從結(jié)構(gòu)上看,這套系統(tǒng)如同一個(gè)“數(shù)字大腦”:感知層對應(yīng)視覺皮層,推理與規(guī)劃如前額葉,場景生成似運(yùn)動皮層,強(qiáng)化學(xué)習(xí)則類似多巴胺反饋,實(shí)現(xiàn)了感知、理解、行動和持續(xù)優(yōu)化的完整閉環(huán)。

該框架不僅服務(wù)于汽車,也可擴(kuò)展至機(jī)器人及各種物理系統(tǒng)。對理想汽車而言,車是最大號的機(jī)器人,其本質(zhì)是在構(gòu)建硅基生命體的軀干與大腦。


理想汽車在持續(xù)推進(jìn)技術(shù)創(chuàng)新的同時(shí),在人工智能領(lǐng)域頂級學(xué)術(shù)會議和期刊發(fā)表了大量研究成果,其中MindVLA-o1相關(guān)的多篇論文已在CVPR、ICLR、ICRA、AAAI等國際頂會上發(fā)表。未來,理想汽車將繼續(xù)以用戶價(jià)值為導(dǎo)向,投入前沿研究以及核心技術(shù)自研,持續(xù)構(gòu)建面向物理世界智能的完整AI系統(tǒng),堅(jiān)定邁向全球領(lǐng)先的具身智能企業(yè)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗到現(xiàn)在都不敢相信,40天的血戰(zhàn),給自己打出了半個(gè)世紀(jì)的國運(yùn)

伊朗到現(xiàn)在都不敢相信,40天的血戰(zhàn),給自己打出了半個(gè)世紀(jì)的國運(yùn)

共工之錨
2026-04-14 00:36:53
深度 | 從“粉絲”變對手:毛焦?fàn)柸绾谓K結(jié)歐爾班時(shí)代重塑匈牙利?

深度 | 從“粉絲”變對手:毛焦?fàn)柸绾谓K結(jié)歐爾班時(shí)代重塑匈牙利?

上觀新聞
2026-04-13 20:53:11
一路虎沖撞多車?衢州警方:2人受傷、8車受損,涉事男子被刑拘

一路虎沖撞多車?衢州警方:2人受傷、8車受損,涉事男子被刑拘

界面新聞
2026-04-14 13:50:22
64歲陳庭威:沒老婆沒孩子,定居廣東住豪宅,不服老打球很精彩

64歲陳庭威:沒老婆沒孩子,定居廣東住豪宅,不服老打球很精彩

白面書誏
2026-04-13 19:08:56
曲樂恒現(xiàn)狀:坐輪椅26年,49歲無人嫁靠父母照顧,和張玉寧沒和解

曲樂恒現(xiàn)狀:坐輪椅26年,49歲無人嫁靠父母照顧,和張玉寧沒和解

攬星河的筆記
2026-04-13 15:41:13
快手搜索人員調(diào)整:王毅離職,程稷李宣平接任

快手搜索人員調(diào)整:王毅離職,程稷李宣平接任

申媽的朋友圈
2026-04-13 11:09:18
大量中國游客滯留,航班被全部取消!

大量中國游客滯留,航班被全部取消!

新浪財(cái)經(jīng)
2026-04-14 13:39:36
河南鞏義:143天馬拉松式庭審背后,是一場瞄準(zhǔn)3.4億的精準(zhǔn)收割?

河南鞏義:143天馬拉松式庭審背后,是一場瞄準(zhǔn)3.4億的精準(zhǔn)收割?

有戲
2026-04-13 08:20:08
后續(xù)!孕婦200買水果被老公罵:已去醫(yī)院終止妊娠,坦言及時(shí)止損

后續(xù)!孕婦200買水果被老公罵:已去醫(yī)院終止妊娠,坦言及時(shí)止損

觀察鑒娛
2026-04-14 09:41:23
最差局面出現(xiàn),伊朗最想要的中國給了?不到24小時(shí),美國喊話中國

最差局面出現(xiàn),伊朗最想要的中國給了?不到24小時(shí),美國喊話中國

流史歲月
2026-04-13 15:00:08
河南一女子結(jié)婚3年,丈夫卻不愿公開關(guān)系!如今男方只想離婚:母親不同意,我也后悔了

河南一女子結(jié)婚3年,丈夫卻不愿公開關(guān)系!如今男方只想離婚:母親不同意,我也后悔了

深圳晚報(bào)
2026-04-14 10:44:36
002229,垂直漲停!利好,大爆發(fā)!601138,巨資搶籌

002229,垂直漲停!利好,大爆發(fā)!601138,巨資搶籌

證券時(shí)報(bào)e公司
2026-04-14 12:22:52
太陽報(bào):伊朗女足隊(duì)長在澳大利亞避難,全部財(cái)產(chǎn)已被伊朗當(dāng)局沒收

太陽報(bào):伊朗女足隊(duì)長在澳大利亞避難,全部財(cái)產(chǎn)已被伊朗當(dāng)局沒收

懂球帝
2026-04-14 08:51:06
涉嫌8罪名!67歲許家印當(dāng)庭認(rèn)罪悔罪 擇期宣判+最高可判無期徒刑

涉嫌8罪名!67歲許家印當(dāng)庭認(rèn)罪悔罪 擇期宣判+最高可判無期徒刑

念洲
2026-04-14 12:34:51
美媒:沙特施壓美國放棄封鎖霍爾木茲海峽,擔(dān)心促使伊朗升級行動,超15艘美軍艦已到位

美媒:沙特施壓美國放棄封鎖霍爾木茲海峽,擔(dān)心促使伊朗升級行動,超15艘美軍艦已到位

揚(yáng)子晚報(bào)
2026-04-14 12:13:08
輝瑞內(nèi)部人士爆料,德國約有6萬人死于新冠疫苗,馬斯克:完全認(rèn)同

輝瑞內(nèi)部人士爆料,德國約有6萬人死于新冠疫苗,馬斯克:完全認(rèn)同

可達(dá)鴨面面觀
2026-04-13 16:37:24
裘德·洛花1個(gè)月變成普京,新片預(yù)告片里連眼神都換了

裘德·洛花1個(gè)月變成普京,新片預(yù)告片里連眼神都換了

影視情報(bào)室
2026-04-14 08:05:09
連續(xù)打破兩個(gè) “不可能三角”,傳祺率先定義混動下一個(gè)時(shí)代

連續(xù)打破兩個(gè) “不可能三角”,傳祺率先定義混動下一個(gè)時(shí)代

功夫AUTO
2026-04-14 11:08:49
吳迎秋:新阿維塔12“不卷價(jià)格”

吳迎秋:新阿維塔12“不卷價(jià)格”

AutoBusiness
2026-04-13 16:45:42
許家印認(rèn)罪,都牽扯了誰?

許家印認(rèn)罪,都牽扯了誰?

石頭I侃房
2026-04-14 12:57:38
2026-04-14 15:55:00
燃擎頻道 incentive-icons
燃擎頻道
中國汽車自媒體前30強(qiáng)!
8695文章數(shù) 231288關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴(yán)對華芯片法案來了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴(yán)對華芯片法案來了

體育要聞

他做對了所有事,卻被整個(gè)職業(yè)網(wǎng)壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財(cái)經(jīng)要聞

許家印受審當(dāng)庭表示認(rèn)罪悔罪

汽車要聞

長城歐拉5限定版純電版上市 限量99臺售價(jià)13.38萬元

態(tài)度原創(chuàng)

教育
健康
房產(chǎn)
手機(jī)
游戲

教育要聞

初中數(shù)學(xué),根式運(yùn)算

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

房產(chǎn)要聞

改善標(biāo)桿,1.5w+起橫掃國興!?跇鞘,打出最猛一張牌!

手機(jī)要聞

榮耀WIN游戲本正式亮相,多品類矩陣宣告PC業(yè)務(wù)全面爆發(fā)

Switch 2立大功!日本25年主機(jī)游戲市場增長138.8%

無障礙瀏覽 進(jìn)入關(guān)懷版