国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

自動駕駛汽車是如何進行“場景理解”的?

0
分享至

[首發(fā)于智駕最前沿微信公眾號]場景理解這個詞聽起來可能有點深奧,但在自動駕駛里,它其實就是指車輛“看到周圍環(huán)境之后,能不能真正搞明白正在發(fā)生什么”。要把這個概念講清楚,不能只停留在感知系統(tǒng)能識別出多少物體,關(guān)鍵在于怎么把“看到的東西”轉(zhuǎn)化為“有用的信息”,讓決策和控制模塊能基于這些信息做出安全、可靠的行動。



圖片源自:網(wǎng)絡(luò)

場景理解到底是什么?為什么它這么重要?

所謂場景理解,就是把路面上所有能觀察到的信息整合起來,形成對當(dāng)前情境的“理解”。它不只是檢測出行人、車輛、車道線、交通標(biāo)志等個體信息,還要弄清楚這些對象之間的關(guān)系、它們接下來的可能動向,以及哪些信息對下一步?jīng)Q策最關(guān)鍵。比如說,前方有個騎車人靠邊行駛,場景理解系統(tǒng)要能判斷他是準(zhǔn)備停車、要轉(zhuǎn)彎,還是有可能會突然逆行;遇到復(fù)雜路口,它得識別信號燈狀態(tài)、理解各方行駛意圖,并判斷哪些軌跡是安全可行的。

想達成更好的場景理解效果,決策層所做的每一個動作,都要依賴于上層提供的抽象信息。感知系統(tǒng)只負責(zé)把像素或點云變成“事實”,但如果這些事實沒有被組織成“世界模型”并附帶“不確定性評估”,規(guī)劃模塊就可能基于錯誤或不穩(wěn)定的信息做決定,從而帶來危險。一個好的場景理解系統(tǒng),能夠把嘈雜、部分缺失甚至?xí)簳r矛盾的感知輸出,轉(zhuǎn)化成穩(wěn)定、連貫、并帶有置信度的語義信息,供規(guī)劃和控制模塊使用。

如何描述這個世界——表示學(xué)習(xí)與多層次語義

場景理解首先要解決的是“怎么把這個世界描述出來”的問題。傳感器輸出的圖像、點云、雷達回波、IMU數(shù)據(jù)都太原始、太低層,直接用來決策既低效又危險。我們需要把它們抽象成適合自動駕駛的表示形式,這需要考慮多個維度。

空間幾何信息是基礎(chǔ)。物體的三維位置、速度、朝向和邊界框,是任何動作規(guī)劃都必需的信息。基于這些數(shù)據(jù)可以做碰撞檢測、車道保持和速度控制。點云和立體視覺/深度信息是構(gòu)建幾何表示的主要來源,而視覺系統(tǒng)也可以通過多視角和神經(jīng)網(wǎng)絡(luò)來估計深度。



圖片源自:網(wǎng)絡(luò)

語義信息是更高一層的表達。把“這是一輛車/行人/自行車”升級為“這是一輛正在并線的貨車/一位推嬰兒車的行人/一輛停在路邊的網(wǎng)約車”,會直接影響系統(tǒng)對它的處理方式。語義需要更細致,要能把行為模式(比如勻速、加速、減速、轉(zhuǎn)頭觀察)也考慮進來。

對象之間的關(guān)系與意圖也需要被表示出來。它們之間的相對位置、可能的遮擋關(guān)系、誰是相對被動的、誰具有較高危險性,都是場景理解的重點。例如,一輛停在路邊的車打開了車門,這時“車門”和“相鄰行人”之間的關(guān)系,就比單獨的“門”這個對象重要得多。意圖則是對對象未來行為的概率化預(yù)測,通常不是給出一個確定的軌跡,而是提供幾種可能性及各自的置信度。

時間維度的表示也非常關(guān)鍵。交通場景不是靜態(tài)的,而是連續(xù)演變的過程。利用歷史軌跡來估計物體的慣性和行為模式,能提高對未來動向的預(yù)測準(zhǔn)確性。很多系統(tǒng)會把表示設(shè)計成時序圖、軌跡簇或隱狀態(tài)向量,這樣規(guī)劃模塊就能看到“這個行人過去幾秒是怎么移動的,從而推測他接下來可能做什么”。

還有就是多模態(tài)融合的表示。不同傳感器在不同條件下的可靠性不一樣,場景表示需要融合這些信息并體現(xiàn)不確定性。一個理想的表示,既包含精確的幾何信息,也包含高層的語義標(biāo)簽和概率化的不確定性描述,并且能在實時性限制下快速更新。

從數(shù)據(jù)到推理——學(xué)習(xí)、預(yù)測與邏輯推理的結(jié)合

有了合適的表示方式,下一步就是如何從數(shù)據(jù)中訓(xùn)練出能生成這些表示的系統(tǒng),以及在推理時如何把學(xué)到的模式和邏輯規(guī)則結(jié)合起來。



圖片源自:網(wǎng)絡(luò)

在這個過程中,數(shù)據(jù)是基礎(chǔ),但數(shù)據(jù)本身不等于理解。標(biāo)注好的數(shù)據(jù)可以訓(xùn)練出物體檢測、分割和軌跡預(yù)測模型,但真實世界的場景千變?nèi)f化,數(shù)據(jù)不足或存在偏差會導(dǎo)致模型在邊緣場景中失效。因此需要真實道路數(shù)據(jù)、仿真生成數(shù)據(jù)、合成數(shù)據(jù),以及針對邊緣場景專門采集的數(shù)據(jù)等多源數(shù)據(jù)。自監(jiān)督學(xué)習(xí)和無監(jiān)督表示學(xué)習(xí)是降低對標(biāo)注依賴的方向,通過讓模型從未標(biāo)注的視頻中學(xué)習(xí)運動一致性、物體恒常性等規(guī)律,可以提升泛化能力。

模型選擇與架構(gòu)設(shè)計將直接影響理解能力。端到端的大模型可以學(xué)習(xí)從像素到控制的映射,但缺點是可解釋性和可驗證性差。模塊化架構(gòu)把感知、追蹤、預(yù)測、場景理解和決策分開,有利于工程化、故障排查和逐步驗證。因此在很多系統(tǒng)中會采用混合方案,用深度學(xué)習(xí)完成感知與短期預(yù)測,再用符號規(guī)則、行為樹或基于模型的推理來處理安全相關(guān)約束和長期規(guī)劃。

不確定性建模是必不可少的。場景理解不能只給出一個確定的答案,還必須提供置信度和可能的替代解釋。貝葉斯方法、概率圖模型、蒙特卡洛采樣、基于高斯過程的預(yù)測,或者利用神經(jīng)網(wǎng)絡(luò)輸出分布(比如預(yù)測多個可能模式并給出權(quán)重),都是常用的手段。規(guī)劃層會根據(jù)這些不確定性來調(diào)整保守程度,如在不確定程度高的路口減速、擴大安全距離。

因果推理和規(guī)則約束能提高系統(tǒng)的魯棒性。學(xué)習(xí)模型擅長捕捉統(tǒng)計相關(guān)性,但有時需要基于物理規(guī)律和交通規(guī)則來做判斷,比如在濕滑路面上剎車距離應(yīng)該更長,或者紅燈時在沒有特殊標(biāo)識的情況下不能右轉(zhuǎn)。把物理模型、交通法規(guī)和常識規(guī)則嵌入系統(tǒng),可以在學(xué)習(xí)模型失靈時充當(dāng)“最后一道防線”。

在線學(xué)習(xí)與閉環(huán)更新也非常重要。車輛會遇到新的場景,系統(tǒng)需要能夠回收失敗樣本、進行標(biāo)注并重新訓(xùn)練,或者采用更輕量的在線適應(yīng)方法快速調(diào)整模型。從工程角度看,這涉及到數(shù)據(jù)采集、標(biāo)注流程、仿真驗證與部署策略,是場景理解體系能否持續(xù)改進的關(guān)鍵。

工程實踐——實時性、魯棒性與可驗證性

就算場景理解在理論上有完美的表示方式和優(yōu)秀的模型,要真正落地到車輛上,還必須面對嚴(yán)苛的工程約束。場景理解的核心之一,就是如何在有限的計算資源和嚴(yán)格的實時性要求下,做到既準(zhǔn)確又可驗證。

實時性意味著系統(tǒng)必須在幾百毫秒甚至更短的時間內(nèi)完成感知、理解與預(yù)測,然后把結(jié)果交給規(guī)劃模塊。為此,表示方式和模型常常需要在工程上做折中,用稀疏表示來減少計算量,用候選采樣替代全空間搜索,用輕量級網(wǎng)絡(luò)做前置篩選,再把重點區(qū)域送到重模型做精細推理。硬件協(xié)同設(shè)計也很關(guān)鍵,把關(guān)鍵運算放在專用加速器或車規(guī)級SoC上,能顯著提升吞吐量和能效。



圖片源自:網(wǎng)絡(luò)

想提升場景理解的魯棒性,就要讓自動駕駛系統(tǒng)能輕松應(yīng)對傳感器故障、惡劣天氣、遮擋和對抗情況等多種挑戰(zhàn)。傳感器降級策略、傳感器之間的冗余備份,以及基于模型的不確定性檢測,都能提升整體魯棒性。如果視覺系統(tǒng)在濃霧中失效,毫米波雷達和激光雷達可以提供幾何信息;如果某個傳感器丟包,系統(tǒng)要能快速切換到備用策略,并通知規(guī)劃層收緊安全邊界。

可驗證性和可解釋性對安全至關(guān)重要。監(jiān)管和產(chǎn)品化都要求能夠證明系統(tǒng)在特定條件下是安全的。模塊化設(shè)計有利于形式化驗證,可以把一些安全關(guān)鍵判斷轉(zhuǎn)化成可檢驗的斷言(比如保持最小跟車距離),并用大量仿真和場景庫做覆蓋測試。同時,還需要建立故障日志和可追溯的診斷機制,當(dāng)場景理解出現(xiàn)錯誤判斷時,能快速定位是感知失誤、表示錯誤還是模型泛化問題。

仿真在工程實踐中發(fā)揮著巨大作用。現(xiàn)實世界中難以收集所有罕見的邊緣場景,通過高保真仿真可以構(gòu)造復(fù)雜交互、極端天氣和危險情況,驗證系統(tǒng)的反應(yīng)。把仿真和真實數(shù)據(jù)結(jié)合起來,并將仿真生成的數(shù)據(jù)用于訓(xùn)練或測試,能加速場景理解能力的提升。

最后還要關(guān)注驗證覆蓋率和數(shù)據(jù)分布偏差的問題。沒有任何系統(tǒng)能通過“所有場景”的驗證,但可以采取風(fēng)險優(yōu)先的方式,可以把驗證資源投入到最危險或最常見的失效模式上,建立一個動態(tài)更新的風(fēng)險目錄,持續(xù)把新出現(xiàn)的問題納入訓(xùn)練和測試流程。

最后的話

場景理解的核心不是某一個單點技術(shù),而是一組緊密耦合的能力,合適的世界表示、基于豐富數(shù)據(jù)與合理架構(gòu)的學(xué)習(xí)與推理、以及面向?qū)嶋H應(yīng)用的實時性、魯棒性與可驗證性。它既需要深度學(xué)習(xí)的表達能力,也需要物理模型與規(guī)則的約束,還需要完善的數(shù)據(jù)閉環(huán)來持續(xù)改進。

對工程團隊來說,場景理解是一項長期的、需要分階段推進的工作。每一次對表示的優(yōu)化、每一類邊緣場景的數(shù)據(jù)補采、每一次驗證覆蓋率的提升,都會直接改善車輛在真實道路上的表現(xiàn)。把“看見”變成“理解”,再把“理解”轉(zhuǎn)化為“可靠行動”,這是自動駕駛安全落地的核心路徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
下周北京升溫開場 周末將再迎降溫

下周北京升溫開場 周末將再迎降溫

北青網(wǎng)-北京青年報
2026-01-11 13:51:04
陳幸同重回世界前三!完勝蒯曼挺進女單決賽,奪冠希望比較大

陳幸同重回世界前三!完勝蒯曼挺進女單決賽,奪冠希望比較大

燒體壇
2026-01-11 18:57:37
又一CBA主帥要下課了!帶隊狂輸30分,比劉煒還差,戰(zhàn)術(shù)太單一了

又一CBA主帥要下課了!帶隊狂輸30分,比劉煒還差,戰(zhàn)術(shù)太單一了

籃球?qū)^(qū)
2026-01-10 22:18:10
博主:落選U23亞洲杯大名單的朱鵬宇將在今日前往國家隊報到

博主:落選U23亞洲杯大名單的朱鵬宇將在今日前往國家隊報到

懂球帝
2026-01-11 14:13:08
中國大媽回應(yīng)“開羅機場教外國人練八段錦”:他們很喜歡,結(jié)束后鼓掌,全程沒放音樂怕打擾其他旅客

中國大媽回應(yīng)“開羅機場教外國人練八段錦”:他們很喜歡,結(jié)束后鼓掌,全程沒放音樂怕打擾其他旅客

極目新聞
2026-01-11 12:38:05
馬上,70萬億美元!

馬上,70萬億美元!

路財主
2026-01-10 19:59:20
三球不滿被換下怒罵主帥 黃蜂想什么時候交易走他?

三球不滿被換下怒罵主帥 黃蜂想什么時候交易走他?

仰臥撐FTUer
2026-01-11 10:54:09
中國有源相控陣?yán)走_真實水平:并非世界第一,和美差距有多大

中國有源相控陣?yán)走_真實水平:并非世界第一,和美差距有多大

黑翼天使
2026-01-10 03:28:16
河南新蔡13歲學(xué)生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來了

河南新蔡13歲學(xué)生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來了

江山揮筆
2026-01-11 09:27:07
魅族,整了個新玩意

魅族,整了個新玩意

放毒
2026-01-10 19:51:00
徐達常遇春他們都是農(nóng)民,為何起義后卻成了軍事天才?原因很現(xiàn)實

徐達常遇春他們都是農(nóng)民,為何起義后卻成了軍事天才?原因很現(xiàn)實

銘記歷史呀
2026-01-10 13:09:37
回國了我才敢說:委內(nèi)瑞拉,是我去過的所有國家中,最被低估的!

回國了我才敢說:委內(nèi)瑞拉,是我去過的所有國家中,最被低估的!

另子維愛讀史
2026-01-09 21:09:05
大名鼎鼎的出局者,要重返牌桌?

大名鼎鼎的出局者,要重返牌桌?

中國新聞周刊
2026-01-10 18:43:15
王思聰送99朵玫瑰示愛,懶懶早搬進2億豪宅,倆人只差一張結(jié)婚證

王思聰送99朵玫瑰示愛,懶懶早搬進2億豪宅,倆人只差一張結(jié)婚證

瘋說時尚
2026-01-11 11:09:04
司馬懿臨終試探兒子:喝了毒藥讓你哥繼位!司馬昭反應(yīng)讓他愣了

司馬懿臨終試探兒子:喝了毒藥讓你哥繼位!司馬昭反應(yīng)讓他愣了

卡西莫多的故事
2026-01-07 10:52:26
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點
2025-11-22 10:36:39
傅首爾的困境有多難解?一露頭就全網(wǎng)抵制,她不再被網(wǎng)友寬容了?

傅首爾的困境有多難解?一露頭就全網(wǎng)抵制,她不再被網(wǎng)友寬容了?

小熊侃史
2026-01-09 07:35:03
足總杯火爆1幕!葡國腳廢人式飛鏟引2次沖突,熱刺維拉數(shù)十人干架

足總杯火爆1幕!葡國腳廢人式飛鏟引2次沖突,熱刺維拉數(shù)十人干架

我愛英超
2026-01-11 06:45:04
領(lǐng)導(dǎo)突然問你“要不要考慮去別的崗位”,千萬不要說“我考慮下”,高情商這么回,反客為主!

領(lǐng)導(dǎo)突然問你“要不要考慮去別的崗位”,千萬不要說“我考慮下”,高情商這么回,反客為主!

二胡的歲月如歌
2026-01-03 18:02:12
中華人民共和國和坦桑尼亞聯(lián)合共和國外交部長會談聯(lián)合新聞公報

中華人民共和國和坦桑尼亞聯(lián)合共和國外交部長會談聯(lián)合新聞公報

新華社
2026-01-11 00:13:05
2026-01-11 19:51:00
智駕最前沿
智駕最前沿
自動駕駛領(lǐng)域?qū)I(yè)的技術(shù)、資訊分享平臺。我們的slogan是:聚焦智能駕駛 ,緊盯行業(yè)前沿。
322文章數(shù) 11關(guān)注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

小學(xué)生留遺書在家中服藥自殺 母親起訴學(xué)校和英語老師

頭條要聞

小學(xué)生留遺書在家中服藥自殺 母親起訴學(xué)校和英語老師

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

時尚
游戲
本地
健康
家居

朱珠美上熱搜的老錢風(fēng)穿搭,太值得借鑒了!

《GTA6》注定創(chuàng)造歷史 但難復(fù)刻十年前午夜首發(fā)情懷

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

這些新療法,讓化療不再那么痛苦

家居要聞

木色留白 演繹現(xiàn)代自由

無障礙瀏覽 進入關(guān)懷版