国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

LeCun在Meta還有論文:JEPA物理規(guī)劃的「終極指南」

0
分享至



編輯|Panda

長期以來,AI 領(lǐng)域一直懷揣著一個宏大的夢想:創(chuàng)造出能夠像人類一樣直觀理解物理世界,并在從未見過的任務(wù)和環(huán)境中游刃有余的智能體。

傳統(tǒng)的強化學(xué)習(xí)方法往往比較笨拙,需要通過無數(shù)次的試錯和海量的樣本才能學(xué)到一點皮毛,這在獎勵信號稀疏的現(xiàn)實環(huán)境中簡直是災(zāi)難。

為了打破這一僵局,研究者們提出了「世界模型」這一概念,即讓智能體在腦海中構(gòu)建一個物理模擬器,通過預(yù)測未來狀態(tài)來進行演練。

近年來,雖然能夠生成精美像素畫面的生成式模型層出不窮,但對于物理規(guī)劃而言,沉溺于無關(guān)緊要的細節(jié)(如背景煙霧的流動)往往是低效的。真正的挑戰(zhàn)在于,如何在錯綜復(fù)雜的原始視覺輸入中提取抽象精髓。

這便引出了本研究的主角:JEPA-WM(聯(lián)合嵌入預(yù)測世界模型)

從名字也能看出來,這個模型與 Yann LeCun 的JEPA(聯(lián)合嵌入預(yù)測架構(gòu))緊密相關(guān)。事實上也確實如此,并且 Yann LeCun 本人也是該論文的作者之一。更有意思的是,在這篇論文中,Yann LeCun 的所屬機構(gòu)為 Meta FAIR。不知道這是不是他在 Meta 的最后一篇論文?



  • 論文標題:What Drives Success in Physical Planning with Joint-Embedding Predictive World Models?
  • 論文地址:https://arxiv.org/abs/2512.24497

JEPA-WM 繼承了 JEPA 的衣缽,不再糾結(jié)于像素級的重建,而是在高度抽象的表征空間內(nèi)進行預(yù)判。在這項研究中,團隊試圖通過對架構(gòu)、目標函數(shù)和規(guī)劃算法的全方位掃描,揭示究竟是什么驅(qū)動了物理規(guī)劃的成功,并試圖為機器人裝上一個更理性的「大腦」。

JEPA-WM 核心方法

該團隊將 JEPA-WM 的訓(xùn)練與規(guī)劃流程形式化為一套統(tǒng)一的「終極指南」,重點在于如何在學(xué)習(xí)到的特征空間中模擬動力學(xué)。

1. 層次化的編碼與預(yù)測架構(gòu)



在訓(xùn)練階段,模型主要由四部分交織而成:



2. 多步展開與動作調(diào)節(jié)細節(jié)



在訓(xùn)練時,模型不僅要預(yù)測下一幀,還要學(xué)會在沒有真實觀測反饋的情況下,基于自己的預(yù)測結(jié)果遞歸生成后續(xù)狀態(tài)。為了提高效率,采用了截斷反向傳播(TBPTT),即只針對最后一步的預(yù)測誤差計算梯度,而切斷之前的累積梯度。

在動作信息如何干預(yù)預(yù)測過程上,該團隊對比了三種關(guān)鍵方案:

  • 特征調(diào)節(jié)(Feature Conditioning):將動作向量直接拼接到每一個視覺特征向量上,增加了預(yù)測器的隱藏層維度。
  • 序列調(diào)節(jié)(Sequence Conditioning):將動作作為一個獨立的 Token 插入到 ViT 的輸入序列中,通過注意力機制進行信息分發(fā)。
  • 自適應(yīng)層歸一化(AdaLN):動作嵌入被投影為縮放和偏移參數(shù),在每一個 Transformer 塊中動態(tài)調(diào)制歸一化統(tǒng)計量,這能有效防止動作信號在深層網(wǎng)絡(luò)中「淡出」。

3. 規(guī)劃邏輯:在嵌入空間中尋找最優(yōu)解



實驗與結(jié)果:從模擬器到真實機械臂

研究團隊在 Metaworld(42 個操縱任務(wù))、Push-T(物體推送)、PointMaze(導(dǎo)航)以及 DROID(真實機械臂數(shù)據(jù)集)上進行了評估。

1. 規(guī)劃器之爭:梯度 vs 采樣

實驗結(jié)果揭示了一個有趣的現(xiàn)象:在像 Metaworld 這種成本曲線相對平滑的任務(wù)中,基于梯度的 Adam 或 GD 優(yōu)化器表現(xiàn)驚人,因為它們能順著梯度迅速找到目標。但在 2D 導(dǎo)航(Wall, Maze)任務(wù)中,梯度法極易卡在局部極小值(例如對著墻猛撞而不懂得繞過門口),此時基于采樣的交叉熵方法(CEM)憑借其探索能力完勝。



此外,新引入的Nevergrad(NG)規(guī)劃器在無需調(diào)參的情況下展現(xiàn)了與 CEM 相當(dāng)?shù)膶嵙Γ绕溥m合跨任務(wù)遷移。

2. 關(guān)鍵因素的「貢獻度」

為了量化不同設(shè)計決策對智能體最終表現(xiàn)的影響,研究團隊采用了一種嚴謹?shù)目刂谱兞糠ā?/p>

他們以一個基礎(chǔ)配置(DINO-WM 結(jié)合 ViT-S 編碼器及 6 層預(yù)測器)為基準,獨立改變每一個核心組件,從而在復(fù)雜的系統(tǒng)工程中剝離出真正驅(qū)動性能增長的關(guān)鍵因子。通過在 Metaworld、Push-T 等多種異構(gòu)環(huán)境下進行數(shù)以萬計的幕(Episode)測試,實驗揭示了世界模型在處理物理邏輯時的內(nèi)在偏好。以下是影響物理規(guī)劃成敗的核心貢獻因素:

本體感受的顯著增益:引入機器人內(nèi)部狀態(tài)信息(如關(guān)節(jié)角度、末端位姿)能夠一致性地提高規(guī)劃成功率。在 Metaworld 任務(wù)中,這能有效減少機械臂在目標點附近震蕩的情況,提供更精準的距離感知。



編碼器架構(gòu):DINO 系列編碼器(DINOv2/v3)在所有任務(wù)中均表現(xiàn)出對 V-JEPA 等視頻編碼器的明顯優(yōu)勢。這歸功于 DINO 強大的細粒度目標分割能力,這對于需要精確感知物體位置的操縱和導(dǎo)航任務(wù)至關(guān)重要。在視覺復(fù)雜度更高的真實數(shù)據(jù)(DROID)中,DINOv3 的優(yōu)勢進一步擴大。

動作調(diào)節(jié)技術(shù)的微妙差異:實驗發(fā)現(xiàn) AdaLN(自適應(yīng)層歸一化)調(diào)節(jié)技術(shù)在平均性能上表現(xiàn)最強,且計算效率更高。它通過在 Transformer 的每一層注入動作信息,有效防止了控制信號在深層網(wǎng)絡(luò)傳遞過程中的消失,相比傳統(tǒng)的特征拼接(ftcond)或序列拼接(seqcond)更具穩(wěn)健性。



訓(xùn)練上下文長度的權(quán)衡:預(yù)測器需要至少 2 幀上下文來推斷速度信息,這在 W=1 與 W=2 之間的巨大性能鴻溝中得到了印證。然而,盲目增加上下文長度(如 W > 5)反而有害,因為這會減少訓(xùn)練中看到的獨特軌跡數(shù)量,并可能引入無用的梯度噪聲。



模型規(guī)模:這是一個令人意外的發(fā)現(xiàn):在簡單的模擬環(huán)境(如 Maze, Wall)中,增大模型規(guī)模(從 ViT-S 到 ViT-L)非但沒有幫助,反而可能由于嵌入空間過于復(fù)雜而導(dǎo)致規(guī)劃效率下降。但對于復(fù)雜的現(xiàn)實數(shù)據(jù)(DROID),大容量的編碼器和更深的預(yù)測器則展現(xiàn)出了明確的正相關(guān)收益,說明任務(wù)的物理復(fù)雜度決定了智能體所需的智力上限。

多步損失的對齊作用:在訓(xùn)練中加入 2 步展開損失能顯著改善預(yù)測器的長時穩(wěn)定性,使其訓(xùn)練任務(wù)與測試時的遞歸規(guī)劃任務(wù)更加對齊。對于最復(fù)雜的 DROID 任務(wù),最佳的展開步數(shù)甚至需要達到 6 步。

3. 提出的最優(yōu)解

研究最終匯總所有洞察,提出了針對不同任務(wù)的最優(yōu)配置:在模擬器中使用 ViT-S 配以 AdaLN,而在真實復(fù)雜場景中使用 DINOv3 ViT-L 配以 12 層深度的預(yù)測器。



在與 DINO-WM 和 V-JEPA-2-AC 的直接較量中,該模型在幾乎所有維度上均取得了領(lǐng)先。

更多詳情請參閱原論文。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
開拓者主帥再夸楊瀚森:他一直在為贏球而拼 過去兩場讓我很滿意

開拓者主帥再夸楊瀚森:他一直在為贏球而拼 過去兩場讓我很滿意

羅說NBA
2026-01-10 14:48:11
江西省共青城市委書記萬建明被查

江西省共青城市委書記萬建明被查

上觀新聞
2026-01-09 20:52:16
科爾:庫明加與巴特勒、追夢同時出場時,空間問題很難處理

科爾:庫明加與巴特勒、追夢同時出場時,空間問題很難處理

林子說事
2026-01-10 12:01:05
終于知道為啥要抓馬杜羅的夫人了!知道她厲害,沒想到這么厲害!

終于知道為啥要抓馬杜羅的夫人了!知道她厲害,沒想到這么厲害!

今日養(yǎng)生之道
2026-01-06 20:07:20
美國為何迫切想要格陵蘭島?格陵蘭島之爭將如何收場?

美國為何迫切想要格陵蘭島?格陵蘭島之爭將如何收場?

大象新聞
2026-01-10 14:33:05
商業(yè)航天僅此一家,固態(tài)電池唯一低估大龍頭,主力重倉殺入

商業(yè)航天僅此一家,固態(tài)電池唯一低估大龍頭,主力重倉殺入

財報翻譯官
2026-01-10 11:56:55
中東國家都意識到了,就算中國高端武器再多,也沒辦法保護他們!

中東國家都意識到了,就算中國高端武器再多,也沒辦法保護他們!

近史博覽
2026-01-05 20:40:01
哎呀!日本的雞蛋呢?

哎呀!日本的雞蛋呢?

中國經(jīng)濟網(wǎng)
2026-01-10 06:49:04
醫(yī)院在中藥液中添加安眠藥,60名患者反映喝完藥就發(fā)困!

醫(yī)院在中藥液中添加安眠藥,60名患者反映喝完藥就發(fā)困!

醫(yī)脈圈
2026-01-09 21:10:56
以為是假新聞其實是真新聞,從袁立到王星,件件離譜又驚人

以為是假新聞其實是真新聞,從袁立到王星,件件離譜又驚人

上官晚安
2026-01-06 08:08:35
霍啟剛主動公開身家:35套物業(yè)曝光,放租28房成全球包租公

霍啟剛主動公開身家:35套物業(yè)曝光,放租28房成全球包租公

橙星文娛
2026-01-10 16:27:26
新任市委書記低調(diào)參加家長會,班主任嘲諷他:你兒子不配進重點班

新任市委書記低調(diào)參加家長會,班主任嘲諷他:你兒子不配進重點班

紅豆講堂
2025-10-05 16:30:07
毛主席讀溥儀的《我的前半生》,看后評價:我覺得這本書寫得不好

毛主席讀溥儀的《我的前半生》,看后評價:我覺得這本書寫得不好

歷史龍元閣
2026-01-10 12:25:12
俄駐華大使館高調(diào)慶?!侗本l約》奪取外東北(海參崴)160周年

俄駐華大使館高調(diào)慶祝《北京條約》奪取外東北(海參崴)160周年

律法刑道
2025-12-30 08:34:47
葉帥讓胡耀邦送自己去機場,卻一把將他拉上飛機,當(dāng)即下令:起飛

葉帥讓胡耀邦送自己去機場,卻一把將他拉上飛機,當(dāng)即下令:起飛

潯陽咸魚
2026-01-08 06:35:06
破3000萬臺!三星Galaxy S25系列手機打破安卓魔咒

破3000萬臺!三星Galaxy S25系列手機打破安卓魔咒

IT之家
2026-01-10 15:41:19
趙家班直播被刷“酸黃瓜”!趙本山現(xiàn)身,三句話道破立身之本

趙家班直播被刷“酸黃瓜”!趙本山現(xiàn)身,三句話道破立身之本

西樓知趣雜談
2026-01-09 22:31:40
險遭暗殺,他“成了委內(nèi)瑞拉總督”

險遭暗殺,他“成了委內(nèi)瑞拉總督”

中國新聞周刊
2026-01-09 17:59:46
“女性偉哥”,來了

“女性偉哥”,來了

中國新聞周刊
2026-01-09 20:47:07
特朗普搶跑12小時 提前在社交媒體上發(fā)布官方尚未公開的就業(yè)數(shù)據(jù)

特朗普搶跑12小時 提前在社交媒體上發(fā)布官方尚未公開的就業(yè)數(shù)據(jù)

財聯(lián)社
2026-01-09 23:37:04
2026-01-10 17:16:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12088文章數(shù) 142534關(guān)注度
往期回顧 全部

科技要聞

傳DeepSeek準備第二次震驚全世界

頭條要聞

閆學(xué)晶"哭窮"后多賬號被禁止關(guān)注 其代言品牌:將索賠

頭條要聞

閆學(xué)晶"哭窮"后多賬號被禁止關(guān)注 其代言品牌:將索賠

體育要聞

怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

娛樂要聞

吳速玲曝兒子Joe是戀愛腦

財經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

寶馬25年全球銷量246.3萬臺 中國仍是第一大市場

態(tài)度原創(chuàng)

本地
時尚
旅游
數(shù)碼
公開課

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

專欄 |?做“主語”的體驗

旅游要聞

視點|點亮王四營鄉(xiāng)文旅新地標!朝悅茶村正式開業(yè)

數(shù)碼要聞

當(dāng)追覓讓泳池機器人長出了“手”,我擁有了真正“懂我的家”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版