国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

SkyDreamer-端到端視覺無人機(jī)競速的模型強(qiáng)化學(xué)習(xí)方法

0
分享至

文章來源:鼓搗AI。


一、研究動(dòng)機(jī) 現(xiàn)有方法的局限性

盡管自主無人機(jī)競速(ADR)已達(dá)到冠軍級水平,但存在三大核心問題:

  1. 1.高度專用化:依賴門角檢測、PnP算法、精確的相機(jī)標(biāo)定和手工調(diào)參的卡爾曼濾波器

  2. 2.泛化能力差:無法適應(yīng)未知賽道、不同無人機(jī)或非結(jié)構(gòu)化環(huán)境

  3. 3.端到端視覺方法的缺陷

  • ? 現(xiàn)有方法都需要外部輔助(如動(dòng)作捕捉系統(tǒng))

  • ?無法機(jī)載運(yùn)行

  • ?未達(dá)到冠軍級性能(加速度僅2-2.7g)

關(guān)鍵挑戰(zhàn)

挑戰(zhàn)

視覺現(xiàn)實(shí)差距

仿真圖像與真實(shí)圖像差異大

視覺歧義

相似場景需要不同飛行路徑

可解釋性

端到端黑盒模型難以調(diào)試

相機(jī)標(biāo)定

外參標(biāo)定耗時(shí)且易變化

論文鏈接:https://arxiv.org/pdf/2510.14783v1.pdf



  • ? 頂部圖片:真實(shí)飛行場景,展示MAVLab門和飛行軌跡

  • ? 底部左圖:使用的競速無人機(jī)(與A2RL x DCL 2025比賽相同)

  • ? 底部右圖:機(jī)載相機(jī)拍攝的圖像,紅色區(qū)域?yàn)镚ateNet生成的分割掩碼

二、核心方法 2.1 整體架構(gòu):基于Informed Dreamer

SkyDreamer的核心思想是將模型強(qiáng)化學(xué)習(xí)與特權(quán)信息(privileged information)巧妙結(jié)合。它基于DreamerV3的模型強(qiáng)化學(xué)習(xí)框架構(gòu)建,但做了關(guān)鍵擴(kuò)展:讓世界模型不僅預(yù)測未來,還要解碼出那些只在訓(xùn)練時(shí)可用的"特權(quán)信息"——包括精確的位置、速度、姿態(tài)角,以及相機(jī)外參和無人機(jī)動(dòng)力學(xué)參數(shù)。這個(gè)設(shè)計(jì)看似簡單,卻帶來了革命性的變化:世界模型不再是一個(gè)純粹的黑盒預(yù)測器,而是變成了一個(gè)隱式的狀態(tài)和參數(shù)估計(jì)器。

觀察 → 編碼器 → 隱藏狀態(tài) → 解碼器 → 特權(quán)信息
標(biāo)準(zhǔn)DreamerV3
  • ? 彩色方塊:編碼器輸入(觀察)

  • ? enc:編碼器

  • ? dec:解碼器

  • ? zt:離散潛在表示

  • ? ht:隱藏狀態(tài)

  • ? at:動(dòng)作

  • ? 紫色箭頭:序列模型的時(shí)序連接

關(guān)鍵組件

  1. 1.世界模型(World Model)

  • ?編碼器: 將分割掩碼、IMU、電機(jī)轉(zhuǎn)速編碼為離散表示zt

  • ?序列模型: GRU預(yù)測下一隱藏狀態(tài)h_{t+1}

  • ?動(dòng)態(tài)預(yù)測器: 純粹從ht預(yù)測?t(用于想象rollout)

  • ?解碼器: 從(ht, zt)解碼出真實(shí)狀態(tài)和參數(shù)

SkyDreamer世界模型學(xué)習(xí)
  • ? 齒輪+相機(jī)圖標(biāo):特權(quán)信息解碼輸出

  • ? dyn:動(dòng)態(tài)預(yù)測器

  1. 2.Actor-Critic

  • ? Actor直接輸出電機(jī)命令(非集體推力+姿態(tài)速率)

  • ? 添加平滑正則化防止bang-bang控制

SkyDreamer Actor-Critic學(xué)習(xí)
  • ? 想象rollout:僅使用動(dòng)態(tài)預(yù)測器,無環(huán)境反饋

2.3 關(guān)鍵技術(shù)創(chuàng)新 ① 飛行計(jì)劃向量(Flight Plan Vector)

解決視覺歧義問題:

f_i = [     p_g^i - p_g^{i-1},  # 相對位置差     ψ_g^i - ψ_g^{i-1},  # 相對偏航角     p_g^i, ψ_g^i,       # 絕對位置和偏航     ...,                 # 未來3個(gè)門的信息     p_g^{i+2}, ψ_g^{i+2} ]

觸發(fā)條件:當(dāng)估計(jì)的門相對位置x?_g > -0.15m時(shí)更新門索引

② 視覺增強(qiáng)(Visual Augmentation)

StochGAN + 數(shù)據(jù)增強(qiáng)

  1. 1.CycleGAN變體:將理想分割掩碼轉(zhuǎn)換為真實(shí)質(zhì)量掩碼

  2. 2.隨機(jī)腐蝕:50%概率腐蝕1像素模擬掩碼變薄

  3. 3.滾動(dòng)快門模擬

    A = [1,  -s·r_c,  W/2·s·r_c  ]     [0, 1+s·q_c, -H/2·s·q_c ]

    模擬水平剪切和垂直縮放

③ 相機(jī)內(nèi)參標(biāo)準(zhǔn)化 + 外參估計(jì)
  • ?內(nèi)參標(biāo)定:所有圖像映射到固定針孔模型

  • ?外參在線估計(jì):世界模型解碼相機(jī)俯仰角、橫滾角、偏航角

核心公式

K = [25W/64,    0,     0.5W ]     [   0,   25H/64,  0.5H ]     [   0,      0,      1   ]
三、實(shí)驗(yàn)結(jié)果與分析 3.1 性能表現(xiàn) 仿真實(shí)驗(yàn)(梯子倒環(huán)賽道)

指標(biāo)

數(shù)值

最高速度

13 m/s

最大加速度

6 g

飛行區(qū)域

6×4 m

位置估計(jì)誤差

±10-15 cm

速度估計(jì)誤差

±0.5 m/s


仿真梯子倒環(huán)賽道

左圖(俯視圖)

  • ? 黑色線:ground truth軌跡

  • ? 彩色線:SkyDreamer估計(jì)的位置和速度

  • ? 顏色編碼:速度大?。ㄗ仙?m/s → 黃色12m/s)

  • ? 黑色方塊:門位置(厚度夸張顯示)

  • ? 黑色箭頭:相機(jī)主軸方向

右圖(側(cè)視圖 + 3D渲染)

  • ? 彩色軌跡:ground truth位置和速度

  • ? 顏色條:速度刻度(0-12 m/s)

真實(shí)世界實(shí)驗(yàn)

賽道

成功率

平均圈速

最高速度

最大加速度

倒環(huán)(橙色門)

100% (25/25圈)

3.25±0.22s

13 m/s

6 g

梯子倒環(huán)

100% (25/25圈)

3.62±0.06s

6 g

倒環(huán)(MAVLab門)

100% (25/25圈)

2.97±0.08s

大賽道

83% (10/12圈)

21 m/s

6 g


真實(shí)世界倒環(huán)賽道(橙色門)

左側(cè)軌跡圖

  • ? 黑色線:MoCap ground truth

  • ? 彩色線:SkyDreamer估計(jì)

  • ? 顏色編碼:速度(紫色2m/s → 黃色12m/s)

  • ? 黑色方塊:門位置(厚度夸張)

  • ? 黑色箭頭:相機(jī)主軸方向

右側(cè)合成圖

  • ? 多條疊加軌跡:5圈飛行的疊加

  • ? 展示軌跡在門中心的匯聚

3.2 核心能力驗(yàn)證 ① 參數(shù)估計(jì)能力

成功估計(jì)的參數(shù)

  • ? ? 最大電機(jī)轉(zhuǎn)速ω_max(收斂快,誤差?。?/p>

  • ? ? 推力系數(shù)k_w

  • ? ? 電機(jī)響應(yīng)時(shí)間τ

  • ? ? 相機(jī)外參θ_c, φ_c, ψ_c(±1°)

難以估計(jì)的參數(shù)

  • ? ? 阻力系數(shù)k_x

  • ? ?? 單個(gè)螺旋槳響應(yīng)k_{p1}, k_{q1}(有漂移)

② 電池耗盡魯棒性

實(shí)驗(yàn)場景:電池從滿電到30%放電

  • ? 最大轉(zhuǎn)速下降:3200 → 2200 rad/s(降低30%,超出訓(xùn)練范圍±20%)

  • ?結(jié)果:SkyDreamer實(shí)時(shí)檢測并調(diào)整飛行路徑,仍完成所有圈數(shù)

③ 視覺Sim-to-Real Transfer

MAVLab門實(shí)驗(yàn)

  • ? 分割質(zhì)量差:門邊緣不完整、背景誤檢、形狀圓潤

  • ?結(jié)果:仍100%完成25圈,證明對感知噪聲魯棒

3.3 對比分析

方法

機(jī)載運(yùn)行

Sim-to-Real

冠軍級性能

可解釋性

Kaufmann等[1]

? (6g)

Geles等[4]

? (2g)

Xing等[5]

? (HIL)

? (2.7 TWR)

Romero等[6]

? (HIL)

??

Krinner等[7]

? (HIL)

SkyDreamer

? (6g)


四、技術(shù)細(xì)節(jié) 4.1 訓(xùn)練設(shè)置

三階段訓(xùn)練(1700萬步,約50小時(shí)):

  1. 1.預(yù)熱階段(0-800萬步):默認(rèn)DreamerV3設(shè)置

  2. 2.長序列階段(800-1300萬步):batch length從64→256

  3. 3.精調(diào)階段(1300-1700萬步):降低熵系數(shù)和學(xué)習(xí)率

關(guān)鍵超參數(shù)

γ = 0.997          # 折扣因子 λ_smooth = 0.002   # 平滑正則化系數(shù) control_freq = 90 Hz image_size = 64×64
4.2 獎(jiǎng)勵(lì)函數(shù)

r_t = 5·r_prog - r_rate + 30·r_gate r_prog = ||p_{t-1,g}||_2 - ||p_{t,g}||_2  # 進(jìn)度獎(jiǎng)勵(lì) r_rate = exp(min(||Ω_t||_1, 17))/2·f_c·10^5  # 角速度懲罰 r_gate = 1 - max(|y_g|, |z_g|)/d_g  # 穿門獎(jiǎng)勵(lì)(中心最大)

無感知獎(jiǎng)勵(lì):相機(jī)自然朝向門(涌現(xiàn)行為)

五、結(jié)論與啟示 主要貢獻(xiàn)

  1. 1.首個(gè)端到端視覺→電機(jī)命令的ADR策略

  2. 2.首次達(dá)到冠軍級性能(6g加速度,21 m/s速度)

  3. 3.首次實(shí)現(xiàn)全機(jī)載、無外部輔助的端到端視覺ADR

  4. 4. 通過解碼特權(quán)信息實(shí)現(xiàn)可解釋性

  5. 5. 無需外參標(biāo)定,可快速部署到不同無人機(jī)

局限性
  1. 1. ?? 參數(shù)估計(jì)存在漂移

  2. 2. ?? 狀態(tài)估計(jì)有高頻跳變

  3. 3. ?? 對分割假陽性仍敏感

  4. 4. ?? 訓(xùn)練成本高(50小時(shí))

未來方向
  • ? 擴(kuò)展到深度圖等更通用視覺輸入

  • ? 飛行未見賽道

  • ? 泛化到非結(jié)構(gòu)化環(huán)境

  • ? 結(jié)合障礙物避讓的混合任務(wù)

關(guān)鍵洞察
"通過讓世界模型解碼特權(quán)信息,我們將黑盒端到端策略轉(zhuǎn)變?yōu)殡[式狀態(tài)和參數(shù)估計(jì)器,在保持端到端學(xué)習(xí)優(yōu)勢的同時(shí)獲得了可解釋性。"

這項(xiàng)工作證明了模型強(qiáng)化學(xué)習(xí) + 特權(quán)信息解碼是實(shí)現(xiàn)高性能、可解釋、魯棒的端到端視覺機(jī)器人控制的有效范式。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
裝逼撞到你擅長的領(lǐng)域是啥體驗(yàn)?網(wǎng)友:我曾經(jīng)也干過這種事呀

裝逼撞到你擅長的領(lǐng)域是啥體驗(yàn)?網(wǎng)友:我曾經(jīng)也干過這種事呀

夜深愛雜談
2025-12-21 17:57:28
又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買了個(gè)牌子殼!

又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買了個(gè)牌子殼!

青眼財(cái)經(jīng)
2025-11-18 23:16:47
定居美國13年回國撈金遭驅(qū)逐,52歲被笑話

定居美國13年回國撈金遭驅(qū)逐,52歲被笑話

白日追夢人
2025-12-24 04:30:11
宗慶后被曝有7子,看了宗馥莉?yàn)樗⒌哪贡?,才知道她早就布局?>
    </a>
        <h3>
      <a href=麥大人
2025-07-18 12:05:16
紫牛頭條|下班遭車禍,接受公司賠償后他發(fā)現(xiàn)一份意外險(xiǎn)保單被公司隱瞞

紫牛頭條|下班遭車禍,接受公司賠償后他發(fā)現(xiàn)一份意外險(xiǎn)保單被公司隱瞞

揚(yáng)子晚報(bào)
2025-12-23 09:06:09
南京博物院又揭大瓜,前文物局局長曾問:賣幾個(gè)兵馬俑行不行?

南京博物院又揭大瓜,前文物局局長曾問:賣幾個(gè)兵馬俑行不行?

攬星河的筆記
2025-12-22 18:12:17
突發(fā)!法拉利撞上護(hù)欄后迅速起火,知名游戲大佬被困車內(nèi)身亡,警方通報(bào)!他被譽(yù)為“《使命召喚》之父”,眾多同行與玩家哀悼

突發(fā)!法拉利撞上護(hù)欄后迅速起火,知名游戲大佬被困車內(nèi)身亡,警方通報(bào)!他被譽(yù)為“《使命召喚》之父”,眾多同行與玩家哀悼

每日經(jīng)濟(jì)新聞
2025-12-23 15:06:07
受中國004核航母刺激太大,法國掀桌子了,砸鍋賣鐵也要建新航母

受中國004核航母刺激太大,法國掀桌子了,砸鍋賣鐵也要建新航母

云舟史策
2025-12-24 07:22:16
CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

弄月公子
2025-12-23 23:10:43
錢多有什么用?42歲離婚無兒無女的尼格買提,走上了另外一條道路

錢多有什么用?42歲離婚無兒無女的尼格買提,走上了另外一條道路

古事尋蹤記
2025-12-20 07:13:47
南京博物院盜賣文物,捐贈(zèng)后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國寶還有多少黑幕

南京博物院盜賣文物,捐贈(zèng)后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國寶還有多少黑幕

爆角追蹤
2025-12-18 15:36:33
他用藥7年換來肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

他用藥7年換來肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

健身迷
2025-12-22 10:19:04
轉(zhuǎn)告父母:這6種病屬于老年病,過度治療反而傷身,安然接受

轉(zhuǎn)告父母:這6種病屬于老年病,過度治療反而傷身,安然接受

讀懂世界歷史
2025-12-23 20:31:37
卷走53億!又一大佬帶全家跑路,欠中國銀行20億,投資者血本無歸

卷走53億!又一大佬帶全家跑路,欠中國銀行20億,投資者血本無歸

以茶帶書
2025-12-09 23:33:58
向大陸交底、對內(nèi)攤牌,鄭麗文把最怕被說破的那層窗戶紙,捅穿了

向大陸交底、對內(nèi)攤牌,鄭麗文把最怕被說破的那層窗戶紙,捅穿了

科普100克克
2025-12-24 00:10:32
哈佛大學(xué)研究:活過90歲的人29項(xiàng)共同特征

哈佛大學(xué)研究:活過90歲的人29項(xiàng)共同特征

尚曦讀史
2025-12-06 08:27:08
廣東5連勝,杜鋒:在廣東打球是幸福的!

廣東5連勝,杜鋒:在廣東打球是幸福的!

帶你領(lǐng)略快樂真諦
2025-12-24 02:50:13
黃金狂飆,一種交易正在悄悄進(jìn)行

黃金狂飆,一種交易正在悄悄進(jìn)行

鳳凰網(wǎng)財(cái)經(jīng)
2025-12-23 09:08:05
美國外交開始大洗牌

美國外交開始大洗牌

陸棄
2025-12-23 08:25:03
肥腸再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會(huì)出現(xiàn)6大變化

肥腸再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會(huì)出現(xiàn)6大變化

看世界的人
2025-12-04 10:51:31
2025-12-24 08:47:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5276文章數(shù) 64597關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

體育要聞

楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

娛樂要聞

朱孝天回應(yīng)阿信感謝,自曝沒再收到邀約

財(cái)經(jīng)要聞

快手到底惹了誰?

汽車要聞

四款新車集中發(fā)布 星途正式走進(jìn)3.0時(shí)代

態(tài)度原創(chuàng)

游戲
手機(jī)
數(shù)碼
房產(chǎn)
公開課

Epic公布第七款免費(fèi)游戲 ARPG《赤痕:夜之儀式》

手機(jī)要聞

三星籌備“寬折疊”新機(jī) 對標(biāo)蘋果2026年折疊iPhone

數(shù)碼要聞

華為鴻蒙智選小豚當(dāng)家智能攝像頭鯨瞳Max現(xiàn)身,功能強(qiáng)大價(jià)格揭曉

房產(chǎn)要聞

獨(dú)家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版