国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

全球首個!機器人也有“高德”了,銀河通用聯(lián)合北大研發(fā)

0
分享至



銀河通用推出全球首個跨本體全域環(huán)視的導航基座大模型。

作者 | 許麗思

編輯 | 漠影

機器人前瞻11月5日報道,今天,銀河通用聯(lián)合北京大學、阿德萊德大學、浙江大學等團隊,推出了全球首個跨本體全域環(huán)視的導航基座大模型——NavFoM(Navigation Foundation Model)。

在今年6月,銀河通用發(fā)布端到端導航大模型TrackVLA,讓機器狗在未訓練過的真實場景跟隨用戶,完成自主移動、避障、轉向,并能聽懂語音語音指令。而這次發(fā)布的NavFoM則是讓機器人具備了更強的自主性,在完全未知的環(huán)境中自己決定去哪、怎么走。


比如,在執(zhí)行送甜點的任務時,NavFoM能夠讓機器狗跟隨用戶行動,遇到人流密集的情況,自主避開;而當跟隨的人員從視線消失后,它可以自主分析尋找。


機器狗支持從跟隨模式切換至導航模式,自主規(guī)劃路線,知道過馬路要走斑馬線,避開可移動物體,遵守交規(guī);導航讓走過街天橋,機器狗也是說一不二,穩(wěn)妥地完成上樓梯、下樓梯的過程,最終將物品送抵目的地。



01.

模型支持適配多種不同本體,

讓機器人學會自己找路

NavFoM作為基座大模型,具有以下三大亮點:

全場景:同時支持室內和室外場景,未見過的場景Zero-Shot運行,無需建圖和額外采集訓練數據;

多任務:支持自然語言指令驅動的目標跟隨和自主導航等不同細分導航任務;

跨本體:可快速低成本適配機器狗、輪式人形、腿式人形、無人機、甚至汽車等不同尺寸的異構本體。

除此之外,該模型允許開發(fā)人員以之為基座,通過后訓練,進一步進化成滿足特定導航要求的應用模型。

而這背后,是NavFoM重新定義了機器人導航的底層邏輯。過去,導航任務往往被拆分成識別、定位、規(guī)劃等獨立模塊,模型之間缺乏統(tǒng)一語言。

NavFoM則建立了一個新的通用范式:“視頻流+文本指令→動作軌跡”。無論是“跟著那個人走”,還是“找到門口的紅車”,在NavFoM里都是同一種輸入輸出形式。模型不再依賴模塊化拼接,而是端到端地完成“看到—理解—行動”的全過程。


NavFoM通過兩項關鍵技術創(chuàng)新構建統(tǒng)一學習范式,讓機器人不僅看得懂、記得住、學得會,還能聯(lián)合利用不同本體、不同任務和不同場景的數據實現知識共享:

1、TVI Tokens(Temporal-Viewpoint-Indexed Tokens)——讓模型理解時間與方向

不同相機、不同角度、不同時間拍到的畫面,常常讓模型“迷失”。TVI Tokens就像時間軸與方向羅盤,給每一幀畫面加上時間和視角的標記,讓模型知道這幅圖像來自哪個角度、哪個時刻,從而理解空間的連續(xù)變化。它讓模型同時兼容單目、環(huán)視、無人機等多種視覺輸入方式,具備“世界在變化”的時空理解能力。


2、BATS策略(Budget-Aware Token Sampling)——讓模型在算力受限下依然聰明

導航時的視頻數據極其龐大,不可能每一幀都處理。BATS策略像人類的注意力系統(tǒng),會動態(tài)判斷哪些畫面是“關鍵幀”,哪些可以略過。越靠近當前時刻、越重要的場景,采樣概率越高,從而節(jié)省算力又不損失判斷準確性。這一機制讓 NavFoM,這一7B參數級別的基座模型也能在真實機器人上毫秒級響應,兼顧實時性與精度。


▲左為給定Token上限,在不同幀數下的采樣分布;右為給定視頻幀數,在不同Token上限下的采樣分布

02.

以千萬級高質量數據為基礎,一個模型驅動所有形態(tài)

銀河通用構建了一個跨任務數據集:包含八百萬條跨任務、跨本體導航數據,覆蓋視覺語言導航,目標導航,目標跟蹤,自動駕駛,網絡導航數據等多種任務;以及四百萬條開放問答數據,讓模型具備語言與空間之間的語義理解能力,這一訓練量約為以往工作的兩倍左右。


▲訓練數據量對比

為降低訓練對硬件的需求并支持更大規(guī)模訓練,團隊還對圖像數據采用了視覺特征緩存(cache)機制,從而減少在線計算開銷、提升訓練效率,這些數據覆蓋了四足、人形、輪式、無人機等多種機器人形態(tài)。


▲數據預處理

NavFoM在多個國際公開基準上均達到或刷新SOTA水平:在VLN-CE、HM3D-OVON、NavSim等任務中表現領先;在目標搜索、視覺語言導航、自動駕駛等任務上均展現強大的跨任務泛化能力。更重要的是,它能在真實機器人上直接部署,無需針對任務微調,只需修改自然語言指令或相機配置即可。

在實測中,NavFoM能夠驅動多種形態(tài)機器人執(zhí)行復雜任務:四足機器人長程自主跟隨、輪式機器人室內外混合導航、無人機復雜地形規(guī)劃飛行、自動駕駛系統(tǒng)的路徑推理與避障決策。

03.

針對不同場景需求,已發(fā)布三個應用模型

以NavFoM的統(tǒng)一架構為基石,銀河通用針對不同的落地需求,訓練并發(fā)布了三個的應用模型:

TrackVLA++:其能力相對于TrackVLA顯著升級,能實現30分鐘以上穩(wěn)定的長程自主跟隨,室內和室外均不在話下、并能適應多種更復雜路況和地形。


UrbanVLA:針對室外場景應用需求,和第三方地圖軟件打通,可根據地圖指引,自主規(guī)劃最優(yōu)路線并行至目的地,在街道、天橋、單元樓等各種環(huán)境中穿梭自如。


MM-Nav:支持360°無死角厘米級純視覺避障,解決了躲避玻璃、細線等難題。


04.

結語:機器人具有方向感,是未來具身智能大規(guī)模落地的關鍵

像NavFoM這樣的基座模型的出現,讓機器人具備理解空間、適應變化、自主行走的能力,是未來具身智能大規(guī)模落地的關鍵。

當機器人能夠在陌生街區(qū)中找路、在人群中穿行、在復雜空間中預測障礙,擁有了像人類一樣的方向感時,就能進一步突破固定場景作業(yè)的限制,融入更多核心應用領域,加速人機協(xié)同時代的到來。


2025中國具身智能機器人大會預告


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
寶馬網紅銷冠張增威回應試行“一口價”賣車:10天定出15臺,壓縮利潤但省時

寶馬網紅銷冠張增威回應試行“一口價”賣車:10天定出15臺,壓縮利潤但省時

紅星資本局
2025-12-28 21:39:13
換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

藍色海邊
2025-12-27 07:14:15
《老舅》收官,演技大洗牌:郭京飛9.6分倒數,第一當之無愧

《老舅》收官,演技大洗牌:郭京飛9.6分倒數,第一當之無愧

白面書誏
2025-12-26 16:04:00
豆瓣幾乎零差評的15本書,你看過其中幾本?

豆瓣幾乎零差評的15本書,你看過其中幾本?

北大博雅講壇
2025-12-28 09:04:40
人類正在毀掉自己,2026年將是世界的臨界點

人類正在毀掉自己,2026年將是世界的臨界點

水木然
2025-12-26 22:02:16
收受“好處費”126萬,一落馬衛(wèi)健局局長退出全部違法所得,獲刑4年

收受“好處費”126萬,一落馬衛(wèi)健局局長退出全部違法所得,獲刑4年

紅星新聞
2025-12-28 14:09:11
終于明白了!為啥農民寧愿斷繳醫(yī)保,也不愿再掏這400塊錢?

終于明白了!為啥農民寧愿斷繳醫(yī)保,也不愿再掏這400塊錢?

復轉這些年
2025-12-25 23:30:29
江蘇“呼啦圈西施”顏倩離世!3歲兒子目睹全程,去年被搶救20天

江蘇“呼啦圈西施”顏倩離世!3歲兒子目睹全程,去年被搶救20天

寒士之言本尊
2025-12-28 18:09:24
婚姻里的“哄”,是最高級的浪漫

婚姻里的“哄”,是最高級的浪漫

青蘋果sht
2025-12-27 05:12:18
中方禁止入境后,美聯(lián)邦國務院怒了,我使館警告:島內恐成火藥桶

中方禁止入境后,美聯(lián)邦國務院怒了,我使館警告:島內恐成火藥桶

面包夾知識
2025-12-28 22:51:02
零跑發(fā)布全新車型D99,定位科技豪華旗艦MPV

零跑發(fā)布全新車型D99,定位科技豪華旗艦MPV

財聞
2025-12-28 21:04:55
97年毛新宇在京結婚,300位老將軍齊刷刷到場,輪椅上那位老人一露面,全場眼眶都紅了

97年毛新宇在京結婚,300位老將軍齊刷刷到場,輪椅上那位老人一露面,全場眼眶都紅了

清風鑒史
2025-12-18 20:10:17
吃他汀猝死的人增多?醫(yī)生含淚告誡:天冷吃他汀,必須多關注8點

吃他汀猝死的人增多?醫(yī)生含淚告誡:天冷吃他汀,必須多關注8點

全球軍事記
2025-12-27 17:24:58
杜鋒有使用說明書!薩林杰9分15板10助5斷 末節(jié)關鍵跳投殺死比賽

杜鋒有使用說明書!薩林杰9分15板10助5斷 末節(jié)關鍵跳投殺死比賽

狼叔評論
2025-12-28 22:42:11
情況有變,中俄后院出現叛徒,公然支持日本入常,我們不得不防

情況有變,中俄后院出現叛徒,公然支持日本入常,我們不得不防

boss外傳
2025-12-28 00:00:03
紫牛頭條|年輕人流行去超市生鮮區(qū)“趕?!?,零門檻擁有繽紛"海底世界"

紫牛頭條|年輕人流行去超市生鮮區(qū)“趕海” ,零門檻擁有繽紛"海底世界"

揚子晚報
2025-12-28 22:36:04
普京警告澤連斯基

普京警告澤連斯基

新京報政事兒
2025-12-28 07:17:38
票房會破20億!寧浩《用武之地》首輪口碑出爐,徐崢的話又應驗了

票房會破20億!寧浩《用武之地》首輪口碑出爐,徐崢的話又應驗了

小丸子的娛樂圈
2025-12-26 17:59:11
日本媒體繃不住了!中國大型CP32漫展,宣布禁止日本動漫參展

日本媒體繃不住了!中國大型CP32漫展,宣布禁止日本動漫參展

扶蘇聊歷史
2025-12-27 14:05:24
一個家比窮更可怕的,是三大隱性負債

一個家比窮更可怕的,是三大隱性負債

洞見
2025-12-27 21:54:07
2025-12-29 00:19:00
機器人前瞻
機器人前瞻
專注于機器人報道的媒體
278文章數 5關注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

澤連斯基:若要烏就領土問題讓步 "和平計劃"應全民公投

頭條要聞

澤連斯基:若要烏就領土問題讓步 "和平計劃"應全民公投

體育要聞

MVP概率達82.5%!約基奇連超大鳥喬丹

娛樂要聞

白敬亭現身冰雪大世界 拍視頻還翻車了

財經要聞

英偉達的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

健康
數碼
手機
本地
公開課

這些新療法,讓化療不再那么痛苦

數碼要聞

曝光的AirPods原型機顯示,蘋果曾計劃推出多彩配色方案!

手機要聞

澎湃OS 3正式版再次擴容:15款設備喜提升級,你收到了嗎?

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版