国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

從“猴子開車”到“人類智能”:基礎(chǔ)模型定義智駕新賽點(diǎn)

0
分享至


文|三少爺

2026年3月17日,英偉達(dá)GTC大會(huì)的聚光燈下,理想汽車基座模型負(fù)責(zé)人詹錕向全球展示了下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1。

3月18日,“智己超級(jí)智能體IM Ultra Agent”發(fā)布會(huì)上,智己汽車與Momenta聯(lián)合宣布推出IM AD ZETA,稱其為“直接面向L4級(jí)自動(dòng)駕駛的基座模型”。無獨(dú)有偶,就在同一天,卓馭科技也發(fā)布了其面向移動(dòng)物理AI的原生多模態(tài)基礎(chǔ)模型。

一時(shí)間,基礎(chǔ)模型/基座模型這個(gè)在大語言模型、多模態(tài)生成等領(lǐng)域已被充分驗(yàn)證和廣泛宣傳的產(chǎn)業(yè)級(jí)范式,正式吹響了進(jìn)軍物理世界的號(hào)角,快步走向量產(chǎn)前線。一個(gè)清晰的信號(hào)正在釋放:打造一個(gè)強(qiáng)大的物理世界基礎(chǔ)模型,已成為躋身智能駕駛「真第一梯隊(duì)」的新門票,沒有基礎(chǔ)模型,就不要來湊第一梯隊(duì)的熱鬧了。

瞄準(zhǔn)物理AI的端側(cè)大腦

基礎(chǔ)模型的核心追求,在于鍛造一套面向物理世界的通用智能。這意味著,它不僅要能看懂紅綠燈和行人,更要能理解三維空間的幾何關(guān)系、物體運(yùn)動(dòng)的物理規(guī)律,并最終規(guī)劃出安全、舒適、高效的行動(dòng)軌跡。

簡(jiǎn)而言之,它要讓機(jī)器獲得在復(fù)雜、動(dòng)態(tài)的物理世界中自主移動(dòng)和操作所必需的空間直覺、物理常識(shí)與任務(wù)規(guī)劃能力。正因如此,它不再僅僅是“自動(dòng)駕駛專屬大腦”,而更像一個(gè)可以安裝在不同機(jī)器人身體上的“通用智慧內(nèi)核”。

在今年的GTC大會(huì)上,理想汽車自動(dòng)駕駛負(fù)責(zé)人詹錕就展示了這樣的一幕:同一個(gè)MindVLA-o1模型,不僅能熟練地駕駛車輛,在切換接口后,也能流暢地驅(qū)動(dòng)機(jī)器人完成操作任務(wù)。這一演示清晰地表明,基礎(chǔ)模型在設(shè)計(jì)之初,其視野就已超越了單一車輛的框架,內(nèi)嵌了對(duì)不同本體結(jié)構(gòu)、不同應(yīng)用場(chǎng)景的深刻理解與適應(yīng)潛力。


圖片來源:理想汽車

那么,基礎(chǔ)模型的核心特點(diǎn)到底是什么呢?我們可以從去年行業(yè)內(nèi)那場(chǎng)沸沸揚(yáng)揚(yáng)的VLA與世界模型之爭(zhēng)談起。當(dāng)時(shí)吵得多難聽我們就不再復(fù)述了,不過,那場(chǎng)有傷和氣的爭(zhēng)論到底在爭(zhēng)什么呢?這里既有技術(shù)路線的分歧,也包括對(duì)智能本質(zhì)的不同理解。

書說簡(jiǎn)短。傳統(tǒng)VLA如同一位“語言大師”,依托大語言模型,擅長將視覺信息轉(zhuǎn)化為文本進(jìn)行語義推理,能理解路牌、指令乃至手勢(shì)。但三維世界到一維語言的“翻譯”過程,難免丟失精確的空間細(xì)節(jié),它知道有行人,卻難以判斷那決定生死的幾十厘米。世界模型則更像一位“空間建筑師”,旨在內(nèi)部構(gòu)建動(dòng)態(tài)世界,直接理解物體的三維形狀、距離、速度與相互作用規(guī)律,能進(jìn)行更精細(xì)的環(huán)境感知與軌跡預(yù)測(cè)。但其表征往往是隱式的,在面對(duì)“潮汐車道”、“禮讓行人”等復(fù)雜社會(huì)規(guī)則時(shí),理解的靈活性不如VLA。


圖片來源:元戎啟行

基礎(chǔ)模型的核心特點(diǎn),正是彌合了VLA與世界模型之間的鴻溝,將語言智能的博聞強(qiáng)識(shí)與空間智能的精準(zhǔn)直覺,統(tǒng)一到了同一個(gè)“智慧內(nèi)核”之中。它意味著,基礎(chǔ)模型必須同時(shí)學(xué)會(huì)用語言理解“潮汐車道”的復(fù)雜規(guī)則,也用空間直覺判斷“右前方三輪車切入”的精確軌跡與風(fēng)險(xiǎn)。而這種融合后的統(tǒng)一智能,恰恰是任何想要在物理世界中安全、靈活移動(dòng)的智能體(無論是自動(dòng)駕駛汽車、人形機(jī)器人還是未來的飛行汽車)必須具備的基礎(chǔ)能力。它就像為機(jī)器安裝了一套通用的“感官與常識(shí)”系統(tǒng),使其能適應(yīng)不同本體,應(yīng)對(duì)萬千場(chǎng)景。

基礎(chǔ)模型兼具VLA和世界模型能力且適應(yīng)不同本體的特點(diǎn),在小鵬汽車VLA的研發(fā)脈絡(luò)與公開表述中,體現(xiàn)得尤為清晰。在2025年11月的發(fā)布會(huì)上,小鵬明確將其第二代VLA表述為“是VLA,也是世界模型”。這句看似矛盾的表述,恰恰表明,小鵬二代VLA已經(jīng)將語言智能的推理能力與空間智能的物理理解原生地糅合在了一起。


圖片來源:小鵬汽車

小鵬之所以沒有將其二代VLA高調(diào)地冠以“基礎(chǔ)模型/基座模型”這么吊炸天的名字,是因?yàn)樵谒脑捳Z體系里,真正的基座模型另有其人。那是一個(gè)位于云端的、更龐大的“母體”。

早在2025年4月,小鵬便推出了一個(gè)720億參數(shù)的“世界基座模型”,這個(gè)面向物理AI的通用“大腦”,作為一個(gè)知識(shí)淵博的“教師模型”,在云端消化海量的多模態(tài)數(shù)據(jù),理解通用的物理規(guī)律與社會(huì)規(guī)則。然后,通過針對(duì)性的微調(diào)與蒸餾,這個(gè)“教師模型”可以將自身的能力“灌注”到不同的端側(cè)模型之中。于是,車端那個(gè)能理解、能推演、能駕駛的VLA司機(jī)模型誕生了;未來,一個(gè)能操控機(jī)器人手臂完成精細(xì)作業(yè)的模型,同樣可以由此孕育而來。


圖片來源:小鵬汽車

作為自動(dòng)駕駛賽道的新晉玩家,小米同樣在基礎(chǔ)模型的星辰大海中展開了自己的探索。2025年11月,小米發(fā)布了“業(yè)界首個(gè)成功打通自動(dòng)駕駛與具身智能的跨域具身基座模型”MiMo-Embodied,在隨后推出的新一代SU 7上,首次搭載了“融入Xiaomi MiMo-Embodied具身智能基座模型”的XLA方案。

然而,仔細(xì)審視其技術(shù)報(bào)告會(huì)發(fā)現(xiàn),MiMo-Embodied采用的是“視覺編碼-投影對(duì)齊-語言推理”三段式架構(gòu),其核心架構(gòu)更加接近于傳統(tǒng)VLA,與前文所述的將語言智能與空間智能原生融合的統(tǒng)一表征思路仍存在清晰可辨的差異。這或許正揭示了當(dāng)前行業(yè)的一個(gè)現(xiàn)狀:“基礎(chǔ)模型”作為一個(gè)極具號(hào)召力的概念已被廣泛采納,但其具體的技術(shù)內(nèi)涵、架構(gòu)標(biāo)準(zhǔn)與能力邊界,仍在演進(jìn)之中。


圖片來源:小米

描繪一個(gè)統(tǒng)一的物理AI基礎(chǔ)模型的美好藍(lán)圖是一回事,真正將它鍛造出來并投入實(shí)戰(zhàn),則是另一回事。這道由基礎(chǔ)模型劃出的新戰(zhàn)線,其壁壘之高,遠(yuǎn)超單一算法的創(chuàng)新。它考驗(yàn)的是一家企業(yè)從模型、數(shù)據(jù)到軟硬協(xié)同部署的全棧體系化能力,將競(jìng)爭(zhēng)直接拉入了深水區(qū)。

難以逾越的三重鴻溝

一個(gè)強(qiáng)大的、面向物理AI的基礎(chǔ)模型,正在成為一道高聳的門檻。這并非單一技術(shù)的領(lǐng)先,而是體系化能力的代差,具體體現(xiàn)在三個(gè)相互關(guān)聯(lián)、卻又各自獨(dú)立的關(guān)鍵維度上。

第一重鴻溝,是模型規(guī)模與工程錘煉的能力代差。能夠理解并駕馭物理世界的基礎(chǔ)模型,參數(shù)量動(dòng)輒百億,這已非傳統(tǒng)用于感知或預(yù)測(cè)的專用小模型可比。而這種駕馭超大模型的能力,不是一蹴而就的。正所謂不積跬步無以至千里,它必須在之前完成徹底的、一段式端到端的架構(gòu)改造,并在視覺語言模型、世界模型等前沿方向上積累足夠的探索與實(shí)踐之后,才能夠逐步打磨出來。

端到端本身就是一個(gè)將感知、預(yù)測(cè)、規(guī)劃等任務(wù)不斷神經(jīng)網(wǎng)絡(luò)化,從而將模型參數(shù)越做越大的過程。從分段式端到端到一段式端到端,車企的算法團(tuán)隊(duì)正是在這個(gè)過程中,積累了處理海量數(shù)據(jù)、調(diào)試復(fù)雜網(wǎng)絡(luò)架構(gòu)、進(jìn)行超大規(guī)模分布式訓(xùn)練的核心工程能力。這種能力的積累是循序漸進(jìn)的,而模型參數(shù)規(guī)模的提升,正是這種能力積累到一定階段后的自然結(jié)果。

例如,理想汽車在2025年量產(chǎn)的VLA司機(jī)大模型參數(shù)約為40億級(jí)別,而其在GTC 2026發(fā)布的下一代MindVLA-o1,則明確指向百億參數(shù)以上的規(guī)模。小鵬汽車在2026年的技術(shù)規(guī)劃中也立下目標(biāo),計(jì)劃將其第二代VLA模型的參數(shù)量推向兩百億級(jí)別。沒有經(jīng)歷過這個(gè)漫長“煉丹”過程的團(tuán)隊(duì),很難憑空掌握駕馭百億參數(shù)巨獸的秘訣,這構(gòu)成了第一道堅(jiān)實(shí)的壁壘。


圖片來源:小鵬汽車

第二重鴻溝,是數(shù)據(jù)閉環(huán)的深度與“煉金”效率。很多車企宣稱不缺數(shù)據(jù),但自動(dòng)駕駛模型迭代的精髓在于針對(duì)性補(bǔ)齊短板,關(guān)鍵在于能否建立一套高效的機(jī)制,從充滿了無聊語料的數(shù)據(jù)海洋中篩選出真正的“黃金”。

這就像人的學(xué)習(xí)區(qū)分為舒適區(qū)和拉伸區(qū)一樣,大量簡(jiǎn)單、重復(fù)的行車數(shù)據(jù)是舒適區(qū),對(duì)能力提升貢獻(xiàn)有限,而那些復(fù)雜的交互、罕見的長尾場(chǎng)景,才是讓模型能力得到拉伸的關(guān)鍵。數(shù)據(jù)挖掘的核心意義,就在于高效、精準(zhǔn)地找到這些拉伸區(qū)數(shù)據(jù)。而這,特別考驗(yàn)車企的數(shù)據(jù)閉環(huán)體系。

第三重鴻溝,是軟硬件協(xié)同的終極考驗(yàn)。 一個(gè)百億參數(shù)的基座模型,最終要部署到車端芯片上,在幾十毫秒內(nèi)完成推理,同時(shí)滿足功能安全、實(shí)時(shí)性和功耗的嚴(yán)苛要求,這是一場(chǎng)極致的工程挑戰(zhàn)。


圖片來源:理想汽車

它要求從芯片架構(gòu)、編譯器、運(yùn)行時(shí)到算法模型進(jìn)行深度協(xié)同設(shè)計(jì)。理想汽車在發(fā)布MindVLA-o1時(shí)強(qiáng)調(diào)的軟硬件協(xié)同設(shè)計(jì)定律,小鵬汽車與北京大學(xué)前沿計(jì)算研究中心聯(lián)合研究如何對(duì)視覺Token進(jìn)行高效動(dòng)態(tài)剪枝,以極致優(yōu)化車端推理效率,都是這個(gè)層面的攻堅(jiān)。

這不僅僅是算法層面的優(yōu)化,更是對(duì)車載計(jì)算平臺(tái)從底層硬件到頂層應(yīng)用的全棧掌控能力。采用標(biāo)準(zhǔn)化、黑盒化供應(yīng)鏈方案的玩家,在這一環(huán)上幾乎失去了參與頂級(jí)競(jìng)賽的資格,因?yàn)樾阅芘c效率的極限,往往就誕生在軟硬件縫隙被徹底抹平的地方。

李想曾將自動(dòng)駕駛的演進(jìn)生動(dòng)地比作生物智能的躍遷:依賴規(guī)則算法的昆蟲智能、基于端到端方案的哺乳動(dòng)物智能、基于VLA大模型的人類智能。如今,行業(yè)頭部玩家集體瞄準(zhǔn)的物理AI基礎(chǔ)模型,其野心正是實(shí)現(xiàn)哺乳動(dòng)物智能到人類智能的躍遷。

不過,這最后的躍遷遠(yuǎn)比想象中艱難,它并非單一算法的突破,而是由模型規(guī)模、數(shù)據(jù)閉環(huán)與軟硬協(xié)同的三重高墻,共同構(gòu)成的一項(xiàng)龐大的系統(tǒng)工程。這道全新的門檻,正將智能駕駛的競(jìng)爭(zhēng),從功能體驗(yàn)的比拼,拉入一場(chǎng)考驗(yàn)全棧能力的深度較量。

當(dāng)理想汽車用MindVLA-o1演示多模態(tài)思考,當(dāng)小鵬汽車宣布其第二代VLA在內(nèi)部測(cè)試中實(shí)現(xiàn)“領(lǐng)先行業(yè)一流選手5倍”的體驗(yàn)領(lǐng)先時(shí),他們展示的,正是基礎(chǔ)模型在系統(tǒng)體驗(yàn)上必然帶來的大踏步跨越。

這種跨越代表著競(jìng)爭(zhēng)的邏輯已經(jīng)改變,那些仍在依賴舊范式、停留在“猴子開車”階段的玩家,面臨的不僅是體驗(yàn)的落差,更是技術(shù)代際的斷層。留給它們的時(shí)間真的不多了。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
霍爾木茲斷航!第一個(gè)亞洲國家已斷糧倒下,下一個(gè)受害者浮出水面

霍爾木茲斷航!第一個(gè)亞洲國家已斷糧倒下,下一個(gè)受害者浮出水面

小影的娛樂
2026-03-22 20:31:39
看上去像“公務(wù)員”,其實(shí)連編制都沒有的6個(gè)職業(yè)

看上去像“公務(wù)員”,其實(shí)連編制都沒有的6個(gè)職業(yè)

細(xì)說職場(chǎng)
2026-04-12 17:02:40
特朗普警告伊朗攻擊艇勿靠近封鎖線

特朗普警告伊朗攻擊艇勿靠近封鎖線

界面新聞
2026-04-13 22:33:11
溫瑞博擊敗吉村奪冠,沒想到對(duì)手當(dāng)場(chǎng)下跪,溫瑞博的反應(yīng)居然這樣

溫瑞博擊敗吉村奪冠,沒想到對(duì)手當(dāng)場(chǎng)下跪,溫瑞博的反應(yīng)居然這樣

阿錯(cuò)田間生活
2026-04-13 11:12:46
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
國家一級(jí)女演員陳麗云被逮捕!

國家一級(jí)女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
陪玩陪睡都是毛毛雨!王思聰前女友曝“丑聞”,王家徹底坐不住了

陪玩陪睡都是毛毛雨!王思聰前女友曝“丑聞”,王家徹底坐不住了

蜉蝣說
2026-04-12 11:19:36
開國上將鬧離婚:結(jié)發(fā)40年竟遭發(fā)妻死命舉報(bào),六名子女為何如釋重負(fù)

開國上將鬧離婚:結(jié)發(fā)40年竟遭發(fā)妻死命舉報(bào),六名子女為何如釋重負(fù)

睡前講故事
2026-04-07 14:43:34
曼聯(lián)vs利茲聯(lián):布魯諾-費(fèi)爾南德斯、卡塞米羅首發(fā),卡爾弗特-勒溫、奧卡福爾出戰(zhàn)

曼聯(lián)vs利茲聯(lián):布魯諾-費(fèi)爾南德斯、卡塞米羅首發(fā),卡爾弗特-勒溫、奧卡福爾出戰(zhàn)

懂球帝
2026-04-14 01:58:05
西班牙首相和夫人逛北京什剎海,夫人穿七分褲超精致優(yōu)雅

西班牙首相和夫人逛北京什剎海,夫人穿七分褲超精致優(yōu)雅

點(diǎn)點(diǎn)細(xì)語
2026-04-13 09:44:52
美國終于開始害怕?比稀土更致命王牌出手了,萬斯:中國要冷靜

美國終于開始害怕?比稀土更致命王牌出手了,萬斯:中國要冷靜

混沌錄
2026-04-10 22:53:19
勝山西更衣室!沈梓捷廖三寧直指金鑫重要性,朱松瑋寄語延續(xù)能量

勝山西更衣室!沈梓捷廖三寧直指金鑫重要性,朱松瑋寄語延續(xù)能量

籃球資訊達(dá)人
2026-04-14 00:35:11
A-史密斯:若沒有東、里,詹姆斯率領(lǐng)的湖人可能會(huì)被火箭橫掃

A-史密斯:若沒有東、里,詹姆斯率領(lǐng)的湖人可能會(huì)被火箭橫掃

懂球帝
2026-04-13 23:32:10
南非財(cái)長未獲美方許可出席G20會(huì)議

南非財(cái)長未獲美方許可出席G20會(huì)議

澎湃新聞
2026-04-14 01:06:05
美股深V拉升,英特爾市值8日狂飆1000億美元,油價(jià)直線下跌

美股深V拉升,英特爾市值8日狂飆1000億美元,油價(jià)直線下跌

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-04-13 23:25:13
續(xù)航100公里僅跑30公里 充電31秒電量猛漲10% 東莞網(wǎng)約車司機(jī):深藍(lán)SL03虛到不敢接單

續(xù)航100公里僅跑30公里 充電31秒電量猛漲10% 東莞網(wǎng)約車司機(jī):深藍(lán)SL03虛到不敢接單

信網(wǎng)
2026-04-11 17:05:04
何家擁頂級(jí)醫(yī)療資源,何超蕸仍不敵病魔,她到底得了什么病?

何家擁頂級(jí)醫(yī)療資源,何超蕸仍不敵病魔,她到底得了什么病?

啰嗦的小羊
2026-04-13 12:47:24
藍(lán)戰(zhàn)非領(lǐng)獎(jiǎng)穿著被吐槽!網(wǎng)友:都是千萬級(jí)別網(wǎng)紅,郭有財(cái)紳士儒雅

藍(lán)戰(zhàn)非領(lǐng)獎(jiǎng)穿著被吐槽!網(wǎng)友:都是千萬級(jí)別網(wǎng)紅,郭有財(cái)紳士儒雅

火山詩話
2026-04-11 15:43:54
重要提醒!人民幣突然升值大漲!有存款的家庭,今年錢更值錢了!

重要提醒!人民幣突然升值大漲!有存款的家庭,今年錢更值錢了!

凡知
2026-04-13 20:19:25
牛馬的一天開始了

牛馬的一天開始了

小怪吃美食
2026-04-12 10:23:28
2026-04-14 02:12:49
autocarweekly incentive-icons
autocarweekly
負(fù)責(zé)不一樣的汽車觀點(diǎn)和福利
9737文章數(shù) 110028關(guān)注度
往期回顧 全部

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

頭條要聞

上海女子2個(gè)月內(nèi)結(jié)2次婚 生下的孩子卻是第3個(gè)男人的

頭條要聞

上海女子2個(gè)月內(nèi)結(jié)2次婚 生下的孩子卻是第3個(gè)男人的

體育要聞

一支球隊(duì)不夠爛,也是一種悲哀

娛樂要聞

初代“跑男團(tuán)”合體,鄧超、鹿晗缺席

財(cái)經(jīng)要聞

談判未完全關(guān)閉?3國力促美伊重啟談判

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

親子
游戲
藝術(shù)
本地
公開課

親子要聞

老了才明白:不管多 心疼兒女,幫忙帶 娃時(shí),都要留意這3點(diǎn)

韓國傳奇選手坦言不希望LCK再奪冠!網(wǎng)友:他不怕被韓網(wǎng)爆破嗎?

藝術(shù)要聞

你絕對(duì)想不到!這位美女畫家的夏天竟如此夢(mèng)幻!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版