国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

看了小鵬的CVPR演講,才能真正明白G7的「野心」

0
分享至

6月11日,在小鵬G7上市發(fā)布會(huì)的同一天,小鵬汽車世界基座模型負(fù)責(zé)人劉先明博士在美國參加了AI頂會(huì)——CVPR 2025,并于CVPR WAD(Workshop on Autonomous Driving)上發(fā)表了演講。

他圍繞小鵬布局在云端的自動(dòng)駕駛基座模型,披露了其團(tuán)隊(duì)在模型預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)、模型車端部署、AI和數(shù)據(jù)基礎(chǔ)設(shè)施搭建等方面的前沿探索和實(shí)踐經(jīng)驗(yàn)。

此時(shí),距離來自中國的「端到端自動(dòng)駕駛」相關(guān)論文獲得CVPR Best paper已有兩年,智駕技術(shù)框架已從Rule-based全面進(jìn)化至Data-based,而后又發(fā)展出VLM、VLA、強(qiáng)化學(xué)習(xí)、,以及針對基礎(chǔ)模型的多種算法。

相比于2023年獲得殊榮的《以路徑規(guī)劃為導(dǎo)向的自動(dòng)駕駛》,再看小鵬的演講標(biāo)題《通過大規(guī)?;A(chǔ)模型實(shí)現(xiàn)自動(dòng)駕駛的規(guī)?;罚阋泽w現(xiàn)出自動(dòng)駕駛的發(fā)展之快,以及小鵬將前沿技術(shù)量產(chǎn)落地的執(zhí)行力。

盡管在大洋彼岸的小鵬G7發(fā)布會(huì)上,信息已經(jīng)非常豐富,但只有通過此次演講的內(nèi)容,才會(huì)意識(shí)到G7不只是何小鵬所說的「L3級(jí)算力的AI汽車」這么簡單。

Scaling Law在VLA上持續(xù)生效

在G7的發(fā)布會(huì)上,何小鵬指出了「L3級(jí)算力平臺(tái)」的兩大標(biāo)準(zhǔn):1、有效算力大于2000TOPS;2、搭載本地部署的「VLA+VLM模型」。

這兩大標(biāo)準(zhǔn),相當(dāng)于走向高階智駕的一種硬性門檻,也意味著一輛車能擁有更高的能力上限。

但是,在這樣的車端門檻背后,也需要不停探索上限的云端推手。小鵬的關(guān)鍵「推手」之一,就是劉先明團(tuán)隊(duì)研發(fā)的自動(dòng)駕駛基座模型——「物理世界大模型」。

據(jù)劉先明介紹,小鵬的下一代基座模型是以大語言模型為骨干網(wǎng)絡(luò),并使用海量優(yōu)質(zhì)駕駛數(shù)據(jù)訓(xùn)練的VLA大模型。

除了具備視覺理解能力、鏈?zhǔn)剿伎寄芰Γ–oT)和動(dòng)作生成能力,它還具備后訓(xùn)練階段的強(qiáng)化學(xué)習(xí)。

其中,CoT邏輯推理高度類人——先看清道路交通環(huán)境,關(guān)注到對自車行為有影響的關(guān)鍵目標(biāo)物,隨后分析交通信號(hào)燈的指示,并作出推理,生成下一步的軌跡。

為了達(dá)到理想的推理效果,小鵬自動(dòng)駕駛基座模型的訓(xùn)練數(shù)據(jù)包括了攝像頭信息、導(dǎo)航信息等關(guān)于物理世界的多模態(tài)數(shù)據(jù)。

“小鵬在云上訓(xùn)練了10億、30億、70億、720億等多個(gè)參數(shù)的模型,并持續(xù)向模型投喂更大規(guī)模的訓(xùn)練數(shù)據(jù),目前基座模型累計(jì)吃下了2000多萬條視頻片段(每條時(shí)長30秒)。”

劉先明表示,在此過程中,研發(fā)團(tuán)隊(duì)明確驗(yàn)證了Scaling Law在自動(dòng)駕駛VLA模型上持續(xù)生效。

值得注意的是,小鵬G7首發(fā)的VLA-OL模型,正式通過蒸餾技術(shù),將云端基模的能力部署到車端,同時(shí)還實(shí)現(xiàn)了全本地端運(yùn)行,無需依賴網(wǎng)絡(luò)連接,從而擺脫了網(wǎng)絡(luò)和地域限制,確保了無延遲的復(fù)雜判斷執(zhí)行。

RL:讓基模持續(xù)突破的神器

大家能留意到了,小鵬G7搭載的VLA多了個(gè)后綴——OL(Online Reinforcement Learning)。這也就意味著,自G7開始,小鵬的「持續(xù)強(qiáng)化學(xué)習(xí)」道路正式鋪開。而且何小鵬表示,這項(xiàng)能力在下一代會(huì)逐步進(jìn)化為自主強(qiáng)化學(xué)習(xí)。

“云端基座模型好比一個(gè)人天生的智商,強(qiáng)化學(xué)習(xí)則好比能力激化器?!眲⑾让鞅硎?,云端基座模型+強(qiáng)化學(xué)習(xí)的組合,是讓模型性能突破天際的最好方法。

這里還必須要提及如今業(yè)界最熱門的一種「評分方法」——強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)模型(Reward Model)。

據(jù)劉先明介紹,小鵬的基座模型在完成預(yù)訓(xùn)練、監(jiān)督精調(diào)(SFT)之后,就會(huì)進(jìn)入強(qiáng)化訓(xùn)練階段。而強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型主要從三個(gè)方面激發(fā)基模潛能:安全、效率、合規(guī),這也是人類駕駛行為中的幾個(gè)核心原則。

據(jù)劉先明介紹,目前,小鵬就已經(jīng)在后裝算力的車端上用小尺寸的基模實(shí)現(xiàn)了控車,在沒有任何規(guī)則代碼托底的情況下,新的「AI大腦」展現(xiàn)出令人驚喜的基礎(chǔ)駕車技能,能夠絲滑地加減速、變道繞行、轉(zhuǎn)彎掉頭、等待紅綠燈等等。

(提前變道,避讓施工區(qū);繼續(xù)通行,遇到從小路匯入主路的大貨車,減速應(yīng)對。)

“我們的基座模型不是靜態(tài)的,它在持續(xù)學(xué)習(xí)、循環(huán)進(jìn)化(Continued Online Learning)。”

模型的迭代過程分成內(nèi)、外兩個(gè)循環(huán):內(nèi)循環(huán)是指包含預(yù)訓(xùn)練、后訓(xùn)練(包括監(jiān)督精調(diào)SFT和強(qiáng)化學(xué)習(xí)RL)和蒸餾部署的模型訓(xùn)練過程;外循環(huán),是指模型在車端部署之后,持續(xù)獲取新的駕駛數(shù)據(jù)和用戶反饋,數(shù)據(jù)回流云端,繼續(xù)用于云端基模的訓(xùn)練?!?/p>

將這樣已經(jīng)形成訓(xùn)練閉環(huán)、并且能持續(xù)強(qiáng)化學(xué)習(xí)的云端基模「賦能」到車端,再加上高達(dá)2200 TOPS的天花板級(jí)算力,這意味著G7的車端智能輔助駕駛能力,將實(shí)現(xiàn)根本性的進(jìn)階——據(jù)官方介紹,G7的智駕輔助能力相比行業(yè)主流水平提高了10至100倍。

或許,也這可以解釋為何G7還是毅然選擇了純視覺路線,因?yàn)檫@在某些程度上,足以證明一款A(yù)I汽車對于其軟硬件能力的自信。

不過,這一切還只是剛剛開始。小鵬汽車自動(dòng)駕駛團(tuán)隊(duì)還在開發(fā)世界模型,未來會(huì)將其用作一種實(shí)時(shí)建模和反饋系統(tǒng),基于動(dòng)作信號(hào)模擬出真實(shí)環(huán)境狀態(tài),渲染場景,并生成場景內(nèi)其他智能體和交通參與者的響應(yīng),從而構(gòu)建一個(gè)閉環(huán)的反饋網(wǎng)絡(luò),幫助基座模型進(jìn)行強(qiáng)化學(xué)習(xí)等訓(xùn)練。

CoT的底氣:數(shù)據(jù)資本

“強(qiáng)化學(xué)習(xí)非常講究數(shù)據(jù)采樣,也非常依賴來自真實(shí)世界的數(shù)據(jù)?!?/p>

盡管目前整個(gè)具身智能行業(yè)都在強(qiáng)調(diào)數(shù)據(jù)的來之不易,以及仿真/合成數(shù)據(jù)的關(guān)鍵作用。但真值數(shù)據(jù)的意義顯然不容忽視,高效的世界模型+真實(shí)數(shù)據(jù),就像是「如虎添翼」。

劉先明表示,小鵬現(xiàn)有幾十萬輛輔助駕駛車輛跑在全國各地,包括也將規(guī)?;下返腉7,都會(huì)源源不斷地創(chuàng)造著新的訓(xùn)練數(shù)據(jù),包括大量的長尾場景數(shù)據(jù)。

“比如說,不久前我們收到福州的一位用戶發(fā)來的視頻:他開車來到一個(gè)紅綠燈路口,發(fā)現(xiàn)馬路對面的主干道上有兩棵大樹,一時(shí)看不明白車道在哪,仔細(xì)觀察才知道需要從兩棵樹之間的縫隙穿越而過?!?/p>

劉先明稱,這就屬于典型的CoT場景,需要模型做個(gè)實(shí)時(shí)推理:“我在哪?發(fā)生了什么?我要怎么走?第一原則是安全,也就是判斷車道線寬度,隨即待綠燈亮了之后,緩行通過。

硬核基建:云端模型工廠

為了研發(fā)下一代基模,小鵬的AI基礎(chǔ)設(shè)施堪稱「豪橫」——它建成了國內(nèi)汽車行業(yè)首個(gè)萬卡智算集群,用以支持基座模型的預(yù)訓(xùn)練、后訓(xùn)練、模型蒸餾、車端模型訓(xùn)練等任務(wù),小鵬將這套從云到端的生產(chǎn)流程稱為「云端模型工廠」。

目前,該「工廠」擁有10 EFLOPS的算力,集群運(yùn)行效率常年保持在90%以上,全鏈路迭代周期可達(dá)平均5天一次。

CVPR大會(huì)現(xiàn)場,劉先明首次展示了兩個(gè)核心數(shù)據(jù):

1.小鵬云上基模訓(xùn)練過程中,處理了超過40萬小時(shí)的視頻數(shù)據(jù);

2、流式多處理器的利用率(streaming multiprocessor utilization)達(dá)到85%。

前者代表數(shù)據(jù)處理能力,后者所說的流式多處理器是GPU的核心計(jì)算單元,其高并行計(jì)算能力對提升系統(tǒng)性能至關(guān)重要,也會(huì)對延時(shí)率產(chǎn)生直接影響。而85%的利用率堪稱行業(yè)天花板。

另外,他從云端模型訓(xùn)練和車端模型部署兩個(gè)層面,拆解了小鵬自動(dòng)駕駛團(tuán)隊(duì)提升模型訓(xùn)練效率的方法:

在模型訓(xùn)練層面,研發(fā)團(tuán)隊(duì)在CPU、GPU、容錯(cuò)性方面做了聯(lián)合優(yōu)化:“VLM、VLA等多模態(tài)模型不同于LLM,訓(xùn)練過程不只受限于計(jì)算瓶頸,還受到數(shù)據(jù)加載瓶頸、通信瓶頸的限制,大規(guī)模并行訓(xùn)練首先要解決這些問題。”

針對數(shù)據(jù)加載問題,研發(fā)團(tuán)隊(duì)對CPU的利用作了如下優(yōu)化:

  • 1.啟用額外的CPU節(jié)點(diǎn):分擔(dān)數(shù)據(jù)加載任務(wù),緩解GPU節(jié)點(diǎn)數(shù)據(jù)加載壓力,保障GPU計(jì)算資源能更專注于核心計(jì)算任務(wù);
  • 2.對PyTorch進(jìn)行定制化改造:減少框架內(nèi)部進(jìn)程間通信的冗余環(huán)節(jié),降低通信開銷,使數(shù)據(jù)傳輸更高效,減少性能損耗;
  • 3.激進(jìn)的數(shù)據(jù)物化策略:更徹底地預(yù)處理數(shù)據(jù),減少CPU在數(shù)據(jù)加載階段的實(shí)時(shí)處理負(fù)擔(dān),提升數(shù)據(jù)加載速度;
  • 4、優(yōu)化打亂(shuffling)模式:可增加模型訓(xùn)練的隨機(jī)性,防止過擬合,在速度與隨機(jī)性之間取得平衡。

另外,針對GPU計(jì)算資源的利用,研發(fā)團(tuán)隊(duì)首先通過FSDP 2實(shí)現(xiàn)模型分片使用FP8混合精度訓(xùn)練,并利用Flash Attention 3加快計(jì)算速度;同時(shí)也基于自定義Triton內(nèi)核,充分發(fā)揮GPU性能,提高計(jì)算效率。

模型的車端部署層面,自研圖靈芯片成為了小鵬「贏在起跑線」的優(yōu)勢:它專為大模型定制,模型、編譯器、芯片團(tuán)隊(duì)針對下一代模型開展了充分的聯(lián)合研發(fā)工作,「榨干」車端算力。

正如何小鵬所說的,自研圖靈芯片的核心不是為了降本,而是要解決通用芯片不難以發(fā)揮100%算力的短板。而圖靈芯片從一開始就是為AI大模型所定制的,因此能做到「一顆頂主流的三顆芯片」。

而搭載了3顆圖靈芯片的G7,比目前行業(yè)80-700TOPS的主流算力區(qū)間高出數(shù)倍,而且還是專門為AI大模型而生的原生芯片。所以,「算力充足」只是它的基礎(chǔ)部分,它的性能、先進(jìn)架構(gòu)設(shè)計(jì),以及走向高階自動(dòng)駕駛的「野心」,即將透過G7逐步展現(xiàn)出來。

除此之外,劉先明還介紹稱,小鵬還創(chuàng)新設(shè)計(jì)了針對車端VLA模型的token壓縮方法,可在不影響上下文長度的情況下,將token處理量壓縮70%(從5000壓縮至1500),降低計(jì)算延時(shí)。

綜合來看,在如此豐富、高效的云端基座大模型的加持下,其落地到終端的能力絕對值得行業(yè)關(guān)注。在此背景下誕生的小鵬G7,不僅算力爆表,還堪稱搭載前沿AI技術(shù)的「集大成者」——端側(cè)大腦的自我思考能力、持續(xù)強(qiáng)化學(xué)習(xí)的能力,以及定制AI芯片的高效發(fā)揮,注定G7可以實(shí)現(xiàn)高度類人的駕駛思維,以及極低延時(shí)的復(fù)雜判斷執(zhí)行。

如此看了,G7配得上Ultra的名字,它不僅代表了質(zhì)的飛躍,更預(yù)示著未來的迭代。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人都死了,才罰7.6萬?越看越不對勁

人都死了,才罰7.6萬?越看越不對勁

走讀新生
2026-04-09 15:37:03
遁入空門?遲重瑞寺廟誦經(jīng),送妻后被曝皈依,百億遺產(chǎn)說扔就扔

遁入空門?遲重瑞寺廟誦經(jīng),送妻后被曝皈依,百億遺產(chǎn)說扔就扔

李橑在北漂
2026-04-10 17:17:42
中國“撿錢”時(shí)代將要來臨:若手中只有10萬,試下死啃這兩條線

中國“撿錢”時(shí)代將要來臨:若手中只有10萬,試下死啃這兩條線

混沌錄
2026-04-03 17:28:23
樊振東自愿放棄倫敦世乒賽資格,國際乒聯(lián)主席回應(yīng)樊振東赴海外參訓(xùn):這是全新的歷練,選手打完聯(lián)賽依舊可回歸,所有賽事均保持開放

樊振東自愿放棄倫敦世乒賽資格,國際乒聯(lián)主席回應(yīng)樊振東赴海外參訓(xùn):這是全新的歷練,選手打完聯(lián)賽依舊可回歸,所有賽事均保持開放

極目新聞
2026-04-10 09:12:57
廣東官方緊急提醒!毒性極強(qiáng)可致命,很多深圳人天天吃

廣東官方緊急提醒!毒性極強(qiáng)可致命,很多深圳人天天吃

環(huán)球網(wǎng)資訊
2026-04-10 16:52:30
女子出軌被丈夫捉奸在床

女子出軌被丈夫捉奸在床

太陽來
2026-04-10 17:15:06
震驚!2025年收入216360.18元,一份南京小學(xué)教師個(gè)稅清單引熱議

震驚!2025年收入216360.18元,一份南京小學(xué)教師個(gè)稅清單引熱議

火山詩話
2026-04-10 15:51:39
小米全新入門低價(jià)新車曝光!這也太棒了

小米全新入門低價(jià)新車曝光!這也太棒了

XCiOS俱樂部
2026-04-10 18:38:08
湖人3配角價(jià)值突顯!肯納德攻守全輸出,史密斯連爆,布朗尼進(jìn)步

湖人3配角價(jià)值突顯!肯納德攻守全輸出,史密斯連爆,布朗尼進(jìn)步

籃球資訊達(dá)人
2026-04-10 13:52:22
中央一錘定音!6月1日起全國統(tǒng)一執(zhí)行,家家戶戶用水將迎7大變化

中央一錘定音!6月1日起全國統(tǒng)一執(zhí)行,家家戶戶用水將迎7大變化

三農(nóng)雷哥
2026-04-10 17:43:46
“這種人誰敢錄?”39歲華東師范考生舉報(bào)第一名,學(xué)校回應(yīng)來了

“這種人誰敢錄?”39歲華東師范考生舉報(bào)第一名,學(xué)校回應(yīng)來了

妍妍教育日記
2026-04-09 10:55:07
美國議員自曝患癌:壽命或只剩3個(gè)月,現(xiàn)在最放不下三個(gè)孩子

美國議員自曝患癌:壽命或只剩3個(gè)月,現(xiàn)在最放不下三個(gè)孩子

芭比衣櫥
2026-04-10 18:10:39
毛主席從不批評劉伯承和徐向前,一個(gè)是不忍批評,另一個(gè)無需批評

毛主席從不批評劉伯承和徐向前,一個(gè)是不忍批評,另一個(gè)無需批評

鶴羽說個(gè)事
2026-04-08 22:21:11
研究了5.6萬顆恒星后,天文學(xué)家發(fā)現(xiàn):太陽似乎被精心設(shè)計(jì)過

研究了5.6萬顆恒星后,天文學(xué)家發(fā)現(xiàn):太陽似乎被精心設(shè)計(jì)過

觀察宇宙
2026-04-08 20:32:34
丁俊暉深夜回信戳中萬人淚點(diǎn):8歲拿球桿那天就把命交給這張球桌

丁俊暉深夜回信戳中萬人淚點(diǎn):8歲拿球桿那天就把命交給這張球桌

林子說事
2026-04-10 12:34:19
一場戰(zhàn)爭徹底把中國打醒!美軍作戰(zhàn)最毒的是什么?中國用30年看清

一場戰(zhàn)爭徹底把中國打醒!美軍作戰(zhàn)最毒的是什么?中國用30年看清

共工之錨
2026-04-08 00:29:52
臺(tái)北市長滿意度近七成,國民黨支持率卻跌破三成。

臺(tái)北市長滿意度近七成,國民黨支持率卻跌破三成。

吃貨的分享
2026-04-09 17:48:49
601020,實(shí)際控制人變更,下周一復(fù)牌!

601020,實(shí)際控制人變更,下周一復(fù)牌!

數(shù)據(jù)寶
2026-04-10 21:23:37
6個(gè)進(jìn)球全是烏龍!10歲孩子為何踢假球?賽制安排不合理引發(fā)亂象

6個(gè)進(jìn)球全是烏龍!10歲孩子為何踢假球?賽制安排不合理引發(fā)亂象

中國足球的那些事兒
2026-04-10 13:16:45
央行數(shù)據(jù)曝光:41.5%家庭手握多套房,房價(jià)下跌后,他們有多難?

央行數(shù)據(jù)曝光:41.5%家庭手握多套房,房價(jià)下跌后,他們有多難?

老特有話說
2026-04-08 14:45:55
2026-04-11 00:03:00
RoboX
RoboX
關(guān)注智能汽車、機(jī)器人在內(nèi)的具身智能前沿科技
237文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

頭條要聞

73歲騎友抄近路摔倒身亡 女兒:賠償問題無法達(dá)成共識(shí)

頭條要聞

73歲騎友抄近路摔倒身亡 女兒:賠償問題無法達(dá)成共識(shí)

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

財(cái)經(jīng)要聞

李強(qiáng)主持召開經(jīng)濟(jì)形勢專家和企業(yè)家座談會(huì)

汽車要聞

搭載第二代刀片電池及閃充技術(shù) 騰勢N8L閃充版預(yù)售35萬起

態(tài)度原創(chuàng)

藝術(shù)
家居
房產(chǎn)
游戲
健康

藝術(shù)要聞

于小冬2026年4月油畫新作《花季》

家居要聞

復(fù)古風(fēng)格 自然簡約

房產(chǎn)要聞

28條新規(guī)落地!好房子,終于有了“廣州標(biāo)準(zhǔn)”!

數(shù)毛社點(diǎn)評批評XSS!《紅色沙漠》畫面糊成渣

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進(jìn)入關(guān)懷版