国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

理想汽車VLA司機大模型 從動物進化到人類

0
分享至

2025年5月7日,理想汽車推出“理想AI Talk第二季——理想VLA司機大模型,從動物進化到人類”,理想汽車董事長兼CEO李想重點分享了對于人工智能的最新思考,VLA司機大模型的作用、訓(xùn)練方法和挑戰(zhàn),以及對于創(chuàng)業(yè)和個人成長的見解。

李想將AI工具分為三個層級,分別是信息工具、輔助工具和生產(chǎn)工具。目前,大多數(shù)人將AI作為信息工具使用,但信息工具常伴隨大量無效信息、無效結(jié)果和無效結(jié)論,僅具參考價值。成為輔助工具后,AI可以提升效率,例如現(xiàn)在的輔助駕駛,但仍需人類參與。未來,AI發(fā)展為生產(chǎn)工具后,將能獨立完成專業(yè)任務(wù),顯著提升效率與質(zhì)量。

李想表示:“判斷Agent(智能體)是否真正智能,關(guān)鍵在于它是否成為生產(chǎn)工具。只有當(dāng)人工智能變成生產(chǎn)工具,才是其真正爆發(fā)的時刻。就像人類會雇傭司機,人工智能技術(shù)最終也會承擔(dān)類似職責(zé),成為真正的生產(chǎn)工具。”

VLA的實現(xiàn)不是突變的過程,是進化的過程

目前的L2、L2+組合駕駛輔助仍屬于輔助工具階段,而VLA(Vision-Language-Action Model,視覺語言行動模型)能夠讓AI真正成為司機,成為交通領(lǐng)域的專業(yè)生產(chǎn)工具。對理想汽車而言, 未來的VLA就是一個像人類司機一樣工作的司機大模型”。

VLA的實現(xiàn)不是一個突變的過程,是進化的過程,經(jīng)歷了三個階段,對應(yīng)理想汽車輔助駕駛的昨天、今天和明天。第一階段,理想汽車自2021年起自研依賴規(guī)則算法和高精地圖的輔助駕駛,類似“昆蟲動物智能”。第二階段,理想汽車自2023年起研究,并于2024年正式推送的端到端+VLM(Vision Language Model,視覺語言模型)輔助駕駛,接近“哺乳動物智能”。

端到端模型在處理復(fù)雜問題時存在局限,雖可借助VLM視覺語言模型輔助,但VLM使用開源模型,使其在交通領(lǐng)域的能力有限。同時端到端模型也難以與人類溝通。為了解決這些問題并提升用戶的智能體驗,理想汽車自2024年起開展VLA研究,并在多項頂級學(xué)術(shù)會議上發(fā)表論文,夯實了理論基礎(chǔ)。

在端到端的基礎(chǔ)上,到第三階段,VLA將開啟“人類智能”的階段。它能通過3D和2D視覺的組合,完整地看到物理世界,而不像VLM僅能解析2D圖像。同時,VLA擁有完整的腦系統(tǒng),具備語言、CoT(Chain of Thought,思維鏈)推理能力,既能看,也能理解并真正執(zhí)行行動,符合人類的運作方式。

VLA訓(xùn)練過程模擬人類學(xué)習(xí),對齊人類價值觀

VLA的訓(xùn)練分為預(yù)訓(xùn)練、后訓(xùn)練和強化訓(xùn)練三個環(huán)節(jié),類似于人類學(xué)習(xí)駕駛技能的過程。預(yù)訓(xùn)練相當(dāng)于人類學(xué)習(xí)物理世界和交通領(lǐng)域的常識,通過大量高清2D和3D Vision(視覺)數(shù)據(jù)、交通相關(guān)的Language(語言)語料,以及與物理世界相關(guān)的VL(Vision-Language,視覺和語言)聯(lián)合數(shù)據(jù),訓(xùn)練出云端的VL基座模型,并通過蒸餾轉(zhuǎn)化為在車端高效運行的端側(cè)模型。

后訓(xùn)練相當(dāng)于人類去駕校學(xué)習(xí)開車的過程。隨著Action(動作)數(shù)據(jù)的加入——即對周圍環(huán)境和自車駕駛行為的編碼,VL基座變?yōu)閂LA司機大模型。得益于短鏈條的CoT,以及Diffusion擴散模型對于他車軌跡和環(huán)境的預(yù)測,VLA具備實時性的特點,實現(xiàn)了在復(fù)雜交通環(huán)境中的博弈能力。

強化訓(xùn)練類似于人類在社會中實際開車練習(xí),目標(biāo)是讓VLA司機大模型更加安全、舒適,對齊人類價值觀,甚至超越人類駕駛水平。強化訓(xùn)練包含兩部分:一是通過RLHF(Reinforcement Learning from Human Feedback,基于人類反饋的強化學(xué)習(xí))完成安全對齊,使模型遵守交通規(guī)則,貼合中國用戶的駕駛習(xí)慣;二是將純強化學(xué)習(xí)模型放入世界模型中訓(xùn)練,提升舒適性,避免碰撞事故,遵守交通規(guī)則。經(jīng)過預(yù)訓(xùn)練、后訓(xùn)練和強化訓(xùn)練后,VLA司機大模型即可部署至車端運行。

VLA司機大模型以“司機Agent(智能體)”的產(chǎn)品形態(tài)呈現(xiàn),用戶可通過自然語言與司機Agent溝通,跟人類司機怎么說,就跟司機Agent怎么說。簡單通用的短指令由端側(cè)的VLA直接處理,復(fù)雜指令則先由云端的VL基座模型解析,再交由VLA處理。

超級對齊確保AI決策安全,世界模型破解AI黑盒難題

除了提升專業(yè)能力,VLA司機大模型還需解決安全性和模型黑盒的問題。

模型能力越強,越需要職業(yè)性約束,以確保能力下限。為了保障VLA司機大模型能夠?qū)崿F(xiàn)職業(yè)司機般的安全和舒適,避免學(xué)習(xí)加塞等違規(guī)行為,理想汽車在強化訓(xùn)練環(huán)節(jié)投入大量資源,并于2024年底組建超過100人的超級對齊團隊,相當(dāng)于為司機Agent注入職業(yè)素養(yǎng)。

為解決模型的黑盒問題,理想汽車結(jié)合重建和生成兩種路徑,打造了真實、符合物理世界規(guī)律的世界模型,覆蓋所有交通參與者和要素?;谑澜缒P偷姆抡婺芰Γ琕LA可以在世界模型中低成本、準(zhǔn)確地驗證現(xiàn)實問題,提升解決問題的效率,有效應(yīng)對模型黑盒帶來的挑戰(zhàn)。

判斷司機Agent是否是個好司機,有三個關(guān)鍵標(biāo)準(zhǔn):專業(yè)能力、職業(yè)能力和構(gòu)建信任的能力。VLA司機大模型提升了專業(yè)能力,超級對齊增強了職業(yè)能力,VLA通過理解自然語言、具備記憶能力提升了構(gòu)建信任的能力。

人工智能時代,扎實的基本功比走捷徑重要

理想汽車實現(xiàn)技術(shù)快速躍遷的背后,是從研究、研發(fā)到能力表達,再到將能力變成業(yè)務(wù)價值的基本功積累。研究是關(guān)鍵,研究突破后,研發(fā)的效率會大幅提升,且注重價值轉(zhuǎn)化,最終實現(xiàn)業(yè)務(wù)落地。

理想汽車堅持自研,通過技術(shù)賦能用戶價值。例如,在輔助駕駛方面,由于英偉達Orin-X芯片無法直接運行語言模型,端到端+VLM的輔助駕駛方案對部分企業(yè)來說仍具挑戰(zhàn)。理想汽車依托自有編譯團隊,自研底層推理引擎,使芯片可通過INT4(4比特整型)量化的方式運行VLM。同時,憑借芯片、控制器設(shè)計和自研汽車操作系統(tǒng)等綜合能力,理想汽車實現(xiàn)了讓雙Orin-X芯片和Thor-U芯片運行同等規(guī)模的VLA司機大模型。李想表示,大型企業(yè)的基本功和能力永遠無法被逾越。

得益于DeepSeek的開源,理想汽車在VLA司機大模型的語言能力研發(fā)上提速顯著,節(jié)省了近9個月的時間和數(shù)億元成本。盡管如此,理想汽車仍選擇加大投入,在基座模型上投入超預(yù)期3倍的訓(xùn)練卡,專注打造適配多場景的自研模型。李想表示:“我們可以站在巨人的肩膀上,但它只是其中的一部分。”在受益開源的同時,理想汽車也選擇開源自研的汽車操作系統(tǒng)——理想星環(huán)OS,回饋社會。

成長帶來能量,在痛苦中保持正能量

今年7月,理想汽車將迎來成立十周年。李想表示,創(chuàng)業(yè)路上苦多于甜,他選擇保留那些有價值的美好片段,用來激勵自己保持正能量。“創(chuàng)業(yè)確實不容易,但是沒必要苦哈哈的。苦和甜是一個硬幣的正反面,取決于看哪一面。”他將企業(yè)遭遇的打擊視為必須面對的挑戰(zhàn),也正是這些挑戰(zhàn),賦予了理想汽車更多的能力。也正因這份積極樂觀的創(chuàng)業(yè)心態(tài),理想汽車才能快速成長為千億營收規(guī)模、百萬交付量的新勢力企業(yè)。

談及如何成為更有能量的人,李想認(rèn)為,關(guān)鍵在于關(guān)注自我,接受自身的優(yōu)點和不足,并用成長替代改變——成長意味著增強能力。除此之外,李想強調(diào)親密關(guān)系同樣重要,關(guān)注他人的成長也能帶來能量,家人和同事能夠和他形成互補,相互支撐。“我需要家人和同事甚至超過了他們需要我,首先是我需要他們,然后才是他們需要我,我們在一起能夠形成非常強的腦力和心力?!崩钕氡硎尽?/p>

回顧幾次創(chuàng)業(yè)經(jīng)歷,李想表示,從高中創(chuàng)辦個人網(wǎng)站至今,自己的思維方式?jīng)]有什么變化:遇到問題解決問題,解決別人不愿解決的難題,解決用戶的痛點,不斷向他人學(xué)習(xí)。不同的是,如今面臨的問題更復(fù)雜、服務(wù)的用戶群體更多、公司規(guī)模和組織也更龐大?!皫状蝿?chuàng)業(yè)一路走來,最難時有人相助,遇坑也能迅速爬出,一幫人齊心協(xié)力變得更好,這是種幸運,也沒什么可后悔的。”

面對AI的發(fā)展,李想認(rèn)為,在AI面前所有的人性都應(yīng)被保留,無論好壞,因為一切人性都是文化、生命、性格、能力的特質(zhì),也是人類真正的生命力所在。

從使用增程電動和5C超充技術(shù)解決電池成本高、充電難、充電慢的問題,到自研汽車操作系統(tǒng)攻克傳統(tǒng)汽車操作系統(tǒng)性能差、開發(fā)緩慢、芯片匹配周期長等挑戰(zhàn),理想汽車始終以技術(shù)創(chuàng)新解決行業(yè)無法解決的問題。自研VLA時,理想汽車更是踏入了人工智能的無人區(qū)。當(dāng)前,輔助駕駛走到了新的十字路口上,理想汽車將不斷挑戰(zhàn)成長的極限,持續(xù)為行業(yè)和用戶創(chuàng)造價值。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
以老帶新!吉翔領(lǐng)銜多名“老人”馳援新江蘇隊,新賽季目標(biāo)沖乙

以老帶新!吉翔領(lǐng)銜多名“老人”馳援新江蘇隊,新賽季目標(biāo)沖乙

中國足球的那些事兒
2026-01-14 00:12:06
U23亞洲杯14日賽程!中國隊傳來3好消息和1壞消息,取勝=頭名出線

U23亞洲杯14日賽程!中國隊傳來3好消息和1壞消息,取勝=頭名出線

侃球熊弟
2026-01-14 00:25:03
2026有線電視殺回來了!免費換4K+無套路收費,全家都滿意

2026有線電視殺回來了!免費換4K+無套路收費,全家都滿意

李博世財經(jīng)
2026-01-12 14:09:58
特朗普“搶劫失敗”,兩艘中國油輪果斷掉頭,一桶高價石油也沒買

特朗普“搶劫失敗”,兩艘中國油輪果斷掉頭,一桶高價石油也沒買

南宮一二
2026-01-13 16:42:06
白俄羅斯媒體:白俄羅斯國防部長稱,邊境出現(xiàn)“前所未有”軍事集結(jié)

白俄羅斯媒體:白俄羅斯國防部長稱,邊境出現(xiàn)“前所未有”軍事集結(jié)

環(huán)球網(wǎng)資訊
2026-01-13 17:23:12
退休人員注意!2026年2月養(yǎng)老金發(fā)放時間或有變化,會提前發(fā)嗎?

退休人員注意!2026年2月養(yǎng)老金發(fā)放時間或有變化,會提前發(fā)嗎?

有范又有料
2026-01-12 16:16:26
許利民錯了:北京首鋼連敗并非因球員耍大牌,而是薪酬分配不公

許利民錯了:北京首鋼連敗并非因球員耍大牌,而是薪酬分配不公

姜大叔侃球
2026-01-13 11:05:33
需求激增近1000%,發(fā)布15年的手機突然爆紅,此前回收價格5元一個

需求激增近1000%,發(fā)布15年的手機突然爆紅,此前回收價格5元一個

環(huán)球網(wǎng)資訊
2026-01-13 15:17:55
對華承諾全作廢?中國又一伙伴背后捅刀子?攬走大單倒向日本?

對華承諾全作廢?中國又一伙伴背后捅刀子?攬走大單倒向日本?

阿褲趣聞君
2026-01-13 03:34:34
日本43歲女市長與已婚男下屬多次開房,辭職后再次當(dāng)選

日本43歲女市長與已婚男下屬多次開房,辭職后再次當(dāng)選

揚子晚報
2026-01-13 16:00:23
林昀儒教練喊上癮,張本智和退場,還喊一嗓子,氣的張本扭頭看他

林昀儒教練喊上癮,張本智和退場,還喊一嗓子,氣的張本扭頭看他

時間巡查
2026-01-14 00:08:57
詹姆斯經(jīng)紀(jì)公司有意將騎士隊德安德烈·亨特,交易至湖人或黃蜂

詹姆斯經(jīng)紀(jì)公司有意將騎士隊德安德烈·亨特,交易至湖人或黃蜂

好火子
2026-01-14 04:12:19
美國國務(wù)院要求美國公民立即離開伊朗

美國國務(wù)院要求美國公民立即離開伊朗

新華社
2026-01-13 08:09:03
G7華盛頓會議達成荒誕共識,減少進口中國稀土,這不針對任何一方

G7華盛頓會議達成荒誕共識,減少進口中國稀土,這不針對任何一方

大國知識局
2026-01-13 21:50:39
石破茂接受采訪說:“高市早苗已經(jīng)沒有撤回涉臺言論的必要了?!?>
    </a>
        <h3>
      <a href=回京歷史夢
2026-01-12 16:50:51
形勢危急:據(jù)稱,伊朗抗議活動的死亡人數(shù)急劇上升到500多人

形勢危急:據(jù)稱,伊朗抗議活動的死亡人數(shù)急劇上升到500多人

一種觀點
2026-01-12 08:13:06
高雄市長挺誰?最新深綠區(qū)街頭民調(diào)結(jié)果一面倒

高雄市長挺誰?最新深綠區(qū)街頭民調(diào)結(jié)果一面倒

新時光點滴
2026-01-13 03:37:40
商業(yè)航天概念跌麻了,火箭失利只是導(dǎo)火索,只等散戶進場接盤站崗

商業(yè)航天概念跌麻了,火箭失利只是導(dǎo)火索,只等散戶進場接盤站崗

眼光很亮
2026-01-13 17:20:07
森碟下巴后縮矯正成功!近照已成標(biāo)準(zhǔn)瓜子臉,正畸前后對比變化大

森碟下巴后縮矯正成功!近照已成標(biāo)準(zhǔn)瓜子臉,正畸前后對比變化大

章眽八卦
2026-01-12 12:25:08
朱雨玲奪冠不到24小時,惡心一幕發(fā)生,遭殃的何止孫穎莎、王曼昱

朱雨玲奪冠不到24小時,惡心一幕發(fā)生,遭殃的何止孫穎莎、王曼昱

李健政觀察
2026-01-13 11:01:43
2026-01-14 06:08:49
郝健說電車
郝健說電車
我真的叫郝健 新能源選車用車找郝科長 7年專業(yè)汽車媒體人 可能是全網(wǎng)首個測完100臺新能源汽車博主
148文章數(shù) 2關(guān)注度
往期回顧 全部

汽車要聞

限時9.99萬元起 2026款啟辰大V DD-i虎鯨上市

頭條要聞

委內(nèi)政部長:美國發(fā)動襲擊的真正理由是石油

頭條要聞

委內(nèi)政部長:美國發(fā)動襲擊的真正理由是石油

體育要聞

他帶出國乒世界冠軍,退休后為愛徒返場

娛樂要聞

蔡卓妍承認(rèn)新戀情,與男友林俊賢感情穩(wěn)定

財經(jīng)要聞

"天量存款"將到期 資金會否搬入股市?

科技要聞

每年10億美元!谷歌大模型注入Siri

態(tài)度原創(chuàng)

藝術(shù)
游戲
教育
旅游
軍事航空

藝術(shù)要聞

世界各地的男女廁所標(biāo)志, 看得都大笑了!

《生化危機 安魂曲》新發(fā)布會官宣 / Steam 推理游戲節(jié)開幕

教育要聞

2026上海美術(shù)聯(lián)考排名!高分段激增51人

旅游要聞

順義區(qū)將硬核打造“工業(yè)時尚游”

軍事要聞

美媒:美對伊朗行動選項"遠超傳統(tǒng)空襲"

無障礙瀏覽 進入關(guān)懷版