国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

馬普所&谷歌等提出AnyUp:無(wú)需再訓(xùn)練的通用特征上采樣,推理即用,效果SOTA!

0
分享至

文章來(lái)源:我愛(ài)計(jì)算機(jī)視覺(jué)(ID:aicvml)

今天和大家聊一篇非常有意思的新工作,來(lái)自馬克斯·普朗克計(jì)算機(jī)科學(xué)研究所、谷歌、蘇黎世聯(lián)邦理工學(xué)院和慕尼黑工業(yè)大學(xué)的研究者們聯(lián)手打造的 AnyUp。

顧名思義,“AnyUp”就是“任意上采樣”的意思。它的核心亮點(diǎn)在于,這是一個(gè)通用的特征上采樣模型,能夠處理來(lái)自任意視覺(jué)編碼器(比如DINO、CLIP)的特征,在任意分辨率之間進(jìn)行上采樣,而且最關(guān)鍵的是——無(wú)需為特定的編碼器進(jìn)行重新訓(xùn)練。這解決了現(xiàn)有方法一個(gè)很大的痛點(diǎn)。


一起來(lái)看看這項(xiàng)工作的基本信息:

  • 論文標(biāo)題 : AnyUp: Universal Feature Upsampling

  • 作者 : Thomas Wimmer, Prune Truong, Marie-Julie Rakotosaona, Michael Oechsle, Federico Tombari, Bernt Schiele, Jan Eric Lenssen

  • 機(jī)構(gòu) : 馬克斯·普朗克計(jì)算機(jī)科學(xué)研究所, 蘇黎世聯(lián)邦理工學(xué)院, 谷歌, 慕尼黑工業(yè)大學(xué)

  • 論文地址 : https://arxiv.org/abs/2510.12764

  • 項(xiàng)目主頁(yè) : https://wimmerth.github.io/anyup/

  • 代碼倉(cāng)庫(kù) : https://github.com/wimmerth/anyup

研究背景

大家知道,像DINO、CLIP這類(lèi)強(qiáng)大的預(yù)訓(xùn)練視覺(jué)模型,已經(jīng)成為計(jì)算機(jī)視覺(jué)領(lǐng)域的基石。但它們通?;赥ransformer架構(gòu),為了計(jì)算效率,輸出的特征圖分辨率往往比較低(比如16x16或32x32)。這對(duì)于需要像素級(jí)預(yù)測(cè)的下游任務(wù),如語(yǔ)義分割、深度估計(jì)等,是一個(gè)天然的限制。


為了解決這個(gè)問(wèn)題,學(xué)術(shù)界提出了不少特征上采樣的方法。但現(xiàn)有方法,特別是那些基于學(xué)習(xí)的方法(如FeatUp, LoftUp, JAFAR),通常存在一個(gè)“綁定”問(wèn)題:它們需要針對(duì)某一個(gè)特定的特征提取器(encoder)進(jìn)行訓(xùn)練。如果你想換一個(gè)編碼器,比如從DINOv2換到SigLIP,對(duì)不起,請(qǐng)重新訓(xùn)練你的上采樣模型。這不僅耗時(shí)耗力,有時(shí)甚至不可行(比如最新的大模型沒(méi)有開(kāi)放訓(xùn)練接口)。


AnyUp的出現(xiàn),就是為了打破這種“一對(duì)一”的束縛,目標(biāo)是創(chuàng)建一個(gè)“萬(wàn)能”的上采樣器,訓(xùn)練一次,就能服務(wù)于所有視覺(jué)模型。

AnyUp的核心方法

AnyUp的整體架構(gòu)基于一個(gè)Attention機(jī)制,這和近期的JAFAR、LoftUp等工作思路相似。但它通過(guò)幾個(gè)關(guān)鍵設(shè)計(jì),實(shí)現(xiàn)了“編碼器無(wú)關(guān)”(encoder-agnostic)的特性。


特征無(wú)關(guān)層 (Feature-Agnostic Layer)

這是實(shí)現(xiàn)通用性的核心。傳統(tǒng)的上采樣模型在處理輸入特征時(shí),通常會(huì)用一個(gè)卷積層,但這個(gè)卷積層的輸入通道數(shù)是固定的,所以只能處理特定維度的特征。

AnyUp設(shè)計(jì)了一個(gè)巧妙的“特征無(wú)關(guān)層”。它的工作方式是:

  1. 對(duì)輸入特征的 每一個(gè)通道 (channel) 都獨(dú)立地與一組共享的、可學(xué)習(xí)的卷積核 (basis filters) 進(jìn)行卷積。

  2. 對(duì)每個(gè)通道的卷積結(jié)果,在“卷積核維度”上進(jìn)行Softmax歸一化。

  3. 最后,將 所有通道 的結(jié)果進(jìn)行平均,得到最終的輸出。

通過(guò)這種方式,無(wú)論輸入特征有多少個(gè)通道(維度),輸出的維度都是固定的,并且模型能夠?qū)W習(xí)到跨通道的通用結(jié)構(gòu)信息,而不是綁定在特定特征的語(yǔ)義上。CV君認(rèn)為這個(gè)設(shè)計(jì)非常簡(jiǎn)潔且有效。

局部窗口注意力 (Local Window Attention)

之前的方法(如JAFAR)使用全局注意力,即高分辨率圖像中的每個(gè)像素可以關(guān)注到低分辨率特征圖中的任何一個(gè)位置。作者發(fā)現(xiàn),這有時(shí)會(huì)導(dǎo)致模型錯(cuò)誤地關(guān)聯(lián)上圖像中距離很遠(yuǎn)且不相關(guān)的區(qū)域,產(chǎn)生偽影。


AnyUp對(duì)此進(jìn)行了簡(jiǎn)化,將注意力計(jì)算限制在一個(gè) 局部窗口 內(nèi)。這樣做不僅提升了效率,也讓模型的學(xué)習(xí)任務(wù)變得更簡(jiǎn)單,因?yàn)樗恍枰P(guān)注局部信息,從而避免了不必要的“遠(yuǎn)距離聯(lián)想”,使得上采樣結(jié)果更穩(wěn)定。

基于圖像塊的訓(xùn)練策略

在訓(xùn)練中如何獲得用于監(jiān)督訓(xùn)練的“真值”高分辨率特征呢?直接用大尺寸圖像輸入編碼器計(jì)算,成本太高。AnyUp采用了一種高效的策略:

  1. 從一張高分辨率圖像 I 中,隨機(jī)裁剪出一個(gè)小塊 I'

  2. 將完整圖像 I 縮放到與 I' 同樣的分辨率,并提取低分辨率特征 p 。

  3. p 通過(guò)AnyUp上采樣到目標(biāo)分辨率,得到 q 。

  4. 同時(shí),直接從圖像塊 I' 提取“真值”特征 ?

  5. 監(jiān)督信號(hào)來(lái)自于上采樣結(jié)果 q 中對(duì)應(yīng) I' 的區(qū)域 q'? 之間的差異。

這個(gè)策略非常高效,因?yàn)樗苊饬藢?duì)超大分辨率圖像進(jìn)行特征提取。

實(shí)驗(yàn)效果如何?

AnyUp在多個(gè)下游任務(wù)上都展示了卓越的性能和泛化能力。

視覺(jué)質(zhì)量對(duì)比

從PCA可視化的特征圖可以看出,相比之前的方法(如LoftUp、JAFAR、FeatUp),AnyUp生成的特征圖邊緣更銳利,細(xì)節(jié)保留得更好,并且沒(méi)有出現(xiàn)明顯的偽影或特征分布偏移。


下游任務(wù)性能

在語(yǔ)義分割、深度估計(jì)和表面法線估計(jì)等任務(wù)上,AnyUp全面超越了之前的SOTA方法。

  • 語(yǔ)義分割 : 在ADE20k數(shù)據(jù)集上取得了SOTA表現(xiàn)。

  • 深度和法線估計(jì) : 同樣達(dá)到了SOTA,這表明AnyUp很好地保留了特征的局部幾何信息,而這正是LoftUp等方法所欠缺的。

下面是更多在語(yǔ)義分割和深度估計(jì)任務(wù)上的定性結(jié)果,可以看到AnyUp的結(jié)果在細(xì)節(jié)和邊界上都非常出色。



強(qiáng)大的泛化能力

這是AnyUp最令人印象深刻的地方。

  • 跨模型泛化 : 一個(gè)僅在DINOv2特征上訓(xùn)練的AnyUp模型,可以直接用于上采樣SigLIP、DINOv3等完全不同的編碼器特征,并且性能依然強(qiáng)大,甚至接近或超過(guò)了為這些特定模型專門(mén)訓(xùn)練的上采樣器。

  • 跨分辨率泛化 : AnyUp支持從任意分辨率到任意分辨率的上采樣,在各種分辨率組合下都保持了強(qiáng)大的性能。

  • 特征空間保持 : 實(shí)驗(yàn)證明,AnyUp上采樣后的特征很好地保留了原始低分辨率特征的分布,這意味著一個(gè)在低分辨率特征上訓(xùn)練好的線性分類(lèi)器(probe)可以直接用在高分辨率特征上,性能幾乎無(wú)損,甚至有所提升。

消融實(shí)驗(yàn)

消融研究證實(shí)了AnyUp每個(gè)設(shè)計(jì)的重要性,無(wú)論是特征無(wú)關(guān)層、局部窗口注意力還是數(shù)據(jù)采樣策略,都對(duì)最終性能有顯著貢獻(xiàn)。


總結(jié)

總而言之,AnyUp通過(guò)簡(jiǎn)潔而創(chuàng)新的設(shè)計(jì),實(shí)現(xiàn)了一個(gè)真正意義上的“即插即用”的通用特征上采樣器。它不僅性能達(dá)到了SOTA,更重要的是其出色的泛化能力,極大地提升了預(yù)訓(xùn)練視覺(jué)模型在下游任務(wù)中的易用性和靈活性。作者已經(jīng)開(kāi)源了代碼,感興趣的同學(xué)可以去試試看!

大家對(duì)這個(gè)“萬(wàn)能”上采樣方法怎么看?歡迎在評(píng)論區(qū)留下你的看法!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
黨史上最復(fù)雜離奇的懸案,毛主席被困擾18年,其中究竟有何隱情?

黨史上最復(fù)雜離奇的懸案,毛主席被困擾18年,其中究竟有何隱情?

貓眼觀史
2024-11-19 09:10:02
一位在巴西開(kāi)超市十年的老鄉(xiāng)說(shuō):當(dāng)?shù)厝撕尬覀儯皇且驗(yàn)闁|西便宜

一位在巴西開(kāi)超市十年的老鄉(xiāng)說(shuō):當(dāng)?shù)厝撕尬覀儯皇且驗(yàn)闁|西便宜

南權(quán)先生
2025-12-13 16:51:47
笑岔氣了!果然斷句是中國(guó)人一生的宿敵,只能說(shuō)中國(guó)文化博大精深

笑岔氣了!果然斷句是中國(guó)人一生的宿敵,只能說(shuō)中國(guó)文化博大精深

夜深?lèi)?ài)雜談
2025-12-19 16:39:58
比爾·西蒙斯轉(zhuǎn)述里弗斯的消息,詹姆斯·哈登加盟雄鹿的希望破滅

比爾·西蒙斯轉(zhuǎn)述里弗斯的消息,詹姆斯·哈登加盟雄鹿的希望破滅

好火子
2025-12-24 03:40:12
2026城鄉(xiāng)居民養(yǎng)老金將迎第八次上漲!明年有望突破160元?

2026城鄉(xiāng)居民養(yǎng)老金將迎第八次上漲!明年有望突破160元?

貓叔東山再起
2025-12-24 08:20:07
又一個(gè)巨頭崛起!年入8715億,超越華為,成第三民營(yíng)企業(yè)!

又一個(gè)巨頭崛起!年入8715億,超越華為,成第三民營(yíng)企業(yè)!

牛牛叨史
2025-12-23 23:07:38
方媛坐月子頓頓六菜一湯四樣肉,郭富城精打細(xì)算,請(qǐng)來(lái)岳父當(dāng)主廚

方媛坐月子頓頓六菜一湯四樣肉,郭富城精打細(xì)算,請(qǐng)來(lái)岳父當(dāng)主廚

娛圈小愚
2025-12-24 10:21:00
廣東一女子背著小孩在校門(mén)口執(zhí)勤?校方回應(yīng):非本校學(xué)生家長(zhǎng)!

廣東一女子背著小孩在校門(mén)口執(zhí)勤?校方回應(yīng):非本校學(xué)生家長(zhǎng)!

廣東吃喝玩樂(lè)
2025-12-23 12:02:21
Lisa舞臺(tái)爭(zhēng)議:藝術(shù)表達(dá)還是低俗表演?

Lisa舞臺(tái)爭(zhēng)議:藝術(shù)表達(dá)還是低俗表演?

娛曉曉
2025-12-22 17:02:07
去了一趟社保局,把大家最關(guān)心的社保問(wèn)題問(wèn)清楚了,全是大白話!

去了一趟社保局,把大家最關(guān)心的社保問(wèn)題問(wèn)清楚了,全是大白話!

匹夫來(lái)搞笑
2025-12-24 07:31:55
臺(tái)北高校唇槍舌戰(zhàn),大陸救星爭(zhēng)議炸翻全場(chǎng),血脈真相誰(shuí)敢直面?

臺(tái)北高校唇槍舌戰(zhàn),大陸救星爭(zhēng)議炸翻全場(chǎng),血脈真相誰(shuí)敢直面?

今日美食分享
2025-12-24 03:41:47
特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

證券時(shí)報(bào)e公司
2025-12-23 23:25:39
中俄為啥不結(jié)盟?俄專家坦言:中國(guó)拒絕與俄結(jié)盟,原因有3個(gè)

中俄為啥不結(jié)盟?俄專家坦言:中國(guó)拒絕與俄結(jié)盟,原因有3個(gè)

蜉蝣說(shuō)
2025-12-12 23:59:34
華子38分森林狼力克尼克斯 唐斯40+13蘭德?tīng)?5分

華子38分森林狼力克尼克斯 唐斯40+13蘭德?tīng)?5分

醉臥浮生
2025-12-24 11:35:38
痛心!何晴家族病史曝光!表弟奔喪訴內(nèi)情,最怕兒子重蹈覆轍

痛心!何晴家族病史曝光!表弟奔喪訴內(nèi)情,最怕兒子重蹈覆轍

粵語(yǔ)經(jīng)典歌單
2025-12-24 10:51:11
上海兩大“巨無(wú)霸”商業(yè)體年底壓軸登場(chǎng),面積超42萬(wàn)平方米,擁抱產(chǎn)城融合!

上海兩大“巨無(wú)霸”商業(yè)體年底壓軸登場(chǎng),面積超42萬(wàn)平方米,擁抱產(chǎn)城融合!

上觀新聞
2025-12-23 21:37:05
92歲母親熬走了大哥二哥,才明白!老人超過(guò)85歲一定守住三個(gè)原則

92歲母親熬走了大哥二哥,才明白!老人超過(guò)85歲一定守住三個(gè)原則

風(fēng)起見(jiàn)你
2025-12-13 10:07:47
中共中央:分類(lèi)推進(jìn)高校改革

中共中央:分類(lèi)推進(jìn)高校改革

麥可思研究
2025-12-23 18:50:53
“網(wǎng)紅熱度”與“賽場(chǎng)空白”如何破局?吳艷妮的冠軍密碼藏在哪?

“網(wǎng)紅熱度”與“賽場(chǎng)空白”如何破局?吳艷妮的冠軍密碼藏在哪?

阿晞體育
2025-12-24 10:51:12
三分絕殺!中國(guó)男籃又一21歲前鋒崛起:場(chǎng)均17+6,郭士強(qiáng)重用他?

三分絕殺!中國(guó)男籃又一21歲前鋒崛起:場(chǎng)均17+6,郭士強(qiáng)重用他?

李喜林籃球絕殺
2025-12-23 11:17:13
2025-12-24 11:51:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5276文章數(shù) 64598關(guān)注度
往期回顧 全部

科技要聞

黑產(chǎn)大軍壓境 快手"拔網(wǎng)線"為何慢了兩小時(shí)

頭條要聞

一名歐洲男子捐精生197娃 攜帶致癌基因已致死多人

頭條要聞

一名歐洲男子捐精生197娃 攜帶致癌基因已致死多人

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂(lè)要聞

曝闞清子女兒早產(chǎn)但沒(méi)保住

財(cái)經(jīng)要聞

快手到底惹了誰(shuí)?

汽車(chē)要聞

將于明年一季度上市 零跑D19內(nèi)飾官圖發(fā)布

態(tài)度原創(chuàng)

本地
藝術(shù)
健康
房產(chǎn)
軍事航空

本地新聞

云游安徽|一川江水潤(rùn)安慶,一塔一戲一城史

藝術(shù)要聞

砸了20億的恒大“五國(guó)溫泉”小鎮(zhèn),如今泡池冷清,別墅荒了?

這些新療法,讓化療不再那么痛苦

房產(chǎn)要聞

硬核!央企??谝痪€江景頂流紅盤(pán),上演超預(yù)期交付!

軍事要聞

俄烏沖突關(guān)鍵人物在莫斯科被炸死 烏方尚未公開(kāi)認(rèn)領(lǐng)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版