国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

通過注意力熵最小化實現測試時自適應

0
分享至

LookSharp:通過注意力熵最小化實現測試時自適應

LOOKSHARP: ATTENTION ENTROPYMINIMIZATION FOR TEST-TIME ADAPTATION

https://www.arxiv.org/pdf/2511.18925


摘要

測試時自適應(TTA)旨在推理過程中更新模型,以減少因數據分布偏移而產生的誤差。雖然對輸出分布進行熵最小化已被證明是一種有效的TTA損失函數,但我們轉而研究利用Transformer在注意力機制中計算的中間分布。我們提出了LookSharp方法,該方法將最后一層中CLS令牌對圖像塊的注意力熵最小化作為新的TTA目標,促使模型在遇到偏移數據時仍能保持聚焦的注意力。我們證明,注意力熵最小化能夠提高模型在ImageNet-C數據集上的魯棒性。同時,我們還展示了該方法與輸出熵最小化互為補充,并能保持模型在干凈數據上的性能。

1 引言與相關工作

深度網絡在符合訓練分布的數據上表現優(yōu)異,但在部署于存在分布偏移的數據時,往往會遭遇災難性的性能下降。最近的測試時自適應方法探索了對輸出分布進行熵最小化,這有助于促使模型在測試時做出更自信的預測。盡管這種方法有效,但它將特征提取器視為一個黑盒,忽略了那些本可指導自適應的內部表征。視覺Transformer因其可擴展性,已成為視覺識別領域的主流架構,它提供了圖像塊上的注意力分布,能夠明確捕捉空間關系和特征重要性。

我們利用這些注意力分布進行測試時自適應,將視覺Transformer中注意力分布的熵最小化作為一種無監(jiān)督損失來更新模型參數。由于這種方法能使注意力分布變得“銳利”,更集中于更少的令牌上,我們將其命名為LookSharp。具體來說,我們最小化由最后一層注意力頭中CLS令牌對圖像塊令牌的注意力分數所定義的分布的熵。我們的方法主要基于兩個關鍵觀察。首先,如圖1(b)所示,如果注意力熵過于分散,模型的準確率會急劇下降。其次,像DINOv3這樣的現代視覺Transformer,通過互聯(lián)網規(guī)模的自監(jiān)督訓練,已經學會了可解釋且以目標為中心的注意力圖。


我們在ImageNet-C數據集上,采用批量情節(jié)性設置來演示我們的自適應方法應對圖像損壞的效果。即,模型在每個批次上更新,然后重置。我們還展示了結合注意力熵和輸出熵可以帶來進一步的性能提升。

自適應中的熵最小化。測試時自適應常常依賴于熵最小化。Tent方法更新歸一化層的統(tǒng)計量和參數以最小化輸出熵。MEMO通過使用測試時增強從單個樣本創(chuàng)建批次,并采用與Tent相同的損失情節(jié)性地更新所有參數,從而擴展了該方法。其他工作如SAR和EATA則將輸出熵與銳度感知最小化、數據篩選以及通過參數正則化錨定源模型相結合。

自適應中的注意力機制。利用注意力機制進行更新的研究相對較少。Attent方法將測試時的注意力統(tǒng)計量與存儲的源域統(tǒng)計量進行對齊。與Attent不同,我們的方法是純粹的測試時自適應,不需要存儲源域統(tǒng)計量。相反,它僅依賴于推理過程中注意力的置信度。因此,我們只與其他完全在測試時進行更新的方法進行比較。

2 方法:注意力熵最小化



我們排除了CLS令牌對自身以及對寄存器令牌的注意力分數,因為我們希望關注的是圖像的空間塊,而非全局信息。最小化此損失函數可以鼓勵每個注意力頭將其注意力集中(低熵地)放在一個較小的圖像塊令牌子集上,而不是分散地關注更多令牌。我們也嘗試了先對分布進行平均再計算其熵的方法,但效果較差。這結果是合理的,因為各個注意力頭往往會趨向于特化。我們利用最后一層的注意力分數,因為它們是最成熟的。

我們發(fā)現,將(Wang等人,2021)中使用的標準輸出熵最小化與注意力熵最小化相結合,可以進一步提升性能。我們使用的標準輸出熵最小化損失函數如下:



3 實驗與結果

我們使用一種通用架構和最新的自監(jiān)督骨干網絡,在圖像分類任務上采用標準的測試時自適應基準進行實驗。我們考慮的是按批次進行情節(jié)性測試時自適應的設置,即每個批次處理后參數會被重置(Zhang 等人,2022),同時我們也與在線(無重置)方法(Wang 等人,2021)進行了比較。

數據集:我們使用 ImageNet-C(Hendrycks & Dietterich,2019)進行評估,該數據集在標準的 ImageNet 驗證集基礎上,增加了 15 種不同類型的 corruption,每種有 5 個嚴重級別。我們僅在最嚴重的第 5 級上進行評估。同時,我們也在干凈數據上進行 TTA,以確保我們的方法在沒有分布偏移的情況下仍能保持性能。

模型:我們使用 DINOv3-Base(Siméon 等人,2025),該模型在互聯(lián)網規(guī)模的數據集上進行了預訓練。我們在源數據(ImageNet 訓練集)上,使用標準的交叉熵損失函數(即線性探測)訓練了一個線性分類頭。這在驗證集上達到了 83.57% 的 top-1 準確率。圖像按照 Krizhevsky 等人(2012)的方法,被預處理為標準的 ImageNet 尺寸(224×224)。


基線方法:我們評估了不進行任何測試時更新的情況,以衡量源模型的魯棒性。我們還將所提方法與 Tent(Wang 等人,2021)進行了比較,Tent 方法僅更新歸一化層的參數,分別在情節(jié)性和在線兩種情況下進行。

結果。表1顯示,與未經過自適應的源模型相比,我們的方法在ImageNet-C上提高了平均準確率。單獨使用輸出頭熵損失的效果優(yōu)于單獨使用注意力熵損失,但將兩者結合使用能取得更佳的結果。在干凈數據上,僅使用注意力損失會輕微損害性能(83.57% → 82.95%),而使用組合損失則能略微提升準確率(83.57% → 83.80%)。

總體而言,我們的組合目標函數實現了最佳的平均corruption準確率,將平均準確率從47.54%(源模型)提升到了54.02%(提升了6.48個百分點)。基于注意力的熵最小化方法在處理模糊類及類似模糊的corruption(如彈性變換)時效果最好。從圖2可以看出,這是因為模糊圖像會使注意力圖變得更加分散,而這正是注意力熵損失()直接解決的問題。注意力損失的可視化效果見附錄A。


在我們的實驗中,我們發(fā)現Tent(在線)方法對學習率高度敏感,這與Zhao等人(2023)的觀察一致。較大的學習率能提升在某些corruption上的性能,但會導致模型在其他corruption上崩潰,使得平均準確率低于源模型。我們選擇的學習率是在第5級測試集上能達到最大平均準確率的值。

4 結論與未來工作

我們提出了LookSharp,一種簡單的測試時自適應方法,該方法通過最小化CLS令牌到圖像塊令牌的注意力熵來實現,并在ImageNet-C上展示了一致的性能提升,尤其是在處理模糊類corruption時。將注意力熵與輸出熵相結合能獲得最佳的整體準確率,這表明這兩種信號是互補的。

局限性。本方法由于需要進行前向-反向-前向傳播,會帶來額外的計算開銷,并且要求模型架構中包含自注意力機制。基于注意力的自適應很可能也依賴于學習到的注意力圖的質量,而注意力圖的質量會因不同的架構和預訓練方式而異。

盡管本工作側重于通過簡潔的實驗來展示注意力熵作為一種無監(jiān)督TTA損失函數的有效性,但未來的工作可以探索根據輸入特征對注意力熵和輸出熵進行動態(tài)加權,或者利用從淺層到深層的多層注意力損失,以期進一步提升性能。

原文鏈接:https://www.arxiv.org/pdf/2511.18925

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
寧波銀行發(fā)布貴金屬業(yè)務市場風險提示

寧波銀行發(fā)布貴金屬業(yè)務市場風險提示

財經網
2026-03-26 18:32:12
中美衛(wèi)星導航用戶數量懸殊:GPS用戶數超60億,中國北斗令人意外

中美衛(wèi)星導航用戶數量懸殊:GPS用戶數超60億,中國北斗令人意外

混沌錄
2026-03-18 23:54:31
告別聲剛落,大陸強音起蔡正元今日入獄,國臺辦這句狠話破防綠營

告別聲剛落,大陸強音起蔡正元今日入獄,國臺辦這句狠話破防綠營

阿離家居
2026-03-27 04:34:34
日媒在報道張雪峰的時候,用了一個詞,我覺得太恰當了

日媒在報道張雪峰的時候,用了一個詞,我覺得太恰當了

輝哥說動漫
2026-03-27 07:12:50
廣東男子掃墓時發(fā)現“黑色巨物”在動!湊近一看,瞬間頭皮發(fā)麻……

廣東男子掃墓時發(fā)現“黑色巨物”在動!湊近一看,瞬間頭皮發(fā)麻……

珠海消防
2026-03-25 20:08:08
46 歲張柏芝三亞生圖流出,肚子上的軟肉,打了整個內娛的臉

46 歲張柏芝三亞生圖流出,肚子上的軟肉,打了整個內娛的臉

橙星文娛
2026-03-26 13:40:27
為嫁給美國人,56歲南京大媽奔赴美國,2年后嫁給70歲美國老頭

為嫁給美國人,56歲南京大媽奔赴美國,2年后嫁給70歲美國老頭

情感藝術家
2026-03-08 22:07:38
拒絕回歸WCBA!李月汝再赴美國,官宣重磅決定,韓旭也要這么干了

拒絕回歸WCBA!李月汝再赴美國,官宣重磅決定,韓旭也要這么干了

萌蘭聊個球
2026-03-26 13:09:33
中國的隱忍,正在延緩第三次世界大戰(zhàn)!

中國的隱忍,正在延緩第三次世界大戰(zhàn)!

南權先生
2026-03-23 15:11:48
徐昕拼下兩雙卻輸球,是廣州最大悲哀?劉維偉賽后發(fā)言更扎心

徐昕拼下兩雙卻輸球,是廣州最大悲哀?劉維偉賽后發(fā)言更扎心

林子說事
2026-03-27 00:33:44
廈門一女子長期遭家暴離家不敢歸,丈夫向法院申請宣告其死亡,十多年后決心離婚才知道自己“死了”!

廈門一女子長期遭家暴離家不敢歸,丈夫向法院申請宣告其死亡,十多年后決心離婚才知道自己“死了”!

環(huán)球網資訊
2026-03-26 14:44:08
少一人也能贏!姆巴佩滿血歸來先拔頭籌,法國2-1力克巴西

少一人也能贏!姆巴佩滿血歸來先拔頭籌,法國2-1力克巴西

仰臥撐FTUer
2026-03-27 07:58:03
你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
你見過天才嗎?網友:有些領域,努力在天賦面前,一文不值

你見過天才嗎?網友:有些領域,努力在天賦面前,一文不值

帶你感受人間冷暖
2026-03-20 00:47:24
蘇州市人民商場龍鳳珠寶品牌店涉嫌銷售“假大牌” 品牌總部回應

蘇州市人民商場龍鳳珠寶品牌店涉嫌銷售“假大牌” 品牌總部回應

生活視覺攝影
2026-03-26 13:33:29
新華社消息|伊朗官員:美以襲擊已造成伊朗至少1750人死亡

新華社消息|伊朗官員:美以襲擊已造成伊朗至少1750人死亡

新華社
2026-03-26 10:06:18
唯一不含草酸的蔬菜!比薺菜、韭菜還鮮嫩,鮮嫩營養(yǎng)正當時,好吃

唯一不含草酸的蔬菜!比薺菜、韭菜還鮮嫩,鮮嫩營養(yǎng)正當時,好吃

阿龍美食記
2026-03-24 09:50:48
中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

健康之光
2026-03-23 20:10:05
美空軍雜志:美軍戰(zhàn)損2架F-35、9架F-15、6架F-16、7架加油機!

美空軍雜志:美軍戰(zhàn)損2架F-35、9架F-15、6架F-16、7架加油機!

勝研集
2026-03-25 00:02:51
國產筆記本CPU偷梁換柱翻車!官方終于回應:生產失誤、全額退款

國產筆記本CPU偷梁換柱翻車!官方終于回應:生產失誤、全額退款

快科技
2026-03-25 10:14:04
2026-03-27 08:55:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1305文章數 18關注度
往期回顧 全部

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產力

頭條要聞

牛彈琴:一直贏的特朗普心里更慌了 又給自己續(xù)了10天

頭條要聞

牛彈琴:一直贏的特朗普心里更慌了 又給自己續(xù)了10天

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經要聞

很反常!油價向上,黃金向下

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

健康
游戲
教育
旅游
軍事航空

轉頭就暈的耳石癥,能開車上班嗎?

任天堂加持!FS社新作或成為Switch 2永久獨占

教育要聞

老師最大的管理能力,是處理情緒的能力!

旅游要聞

中國旅游研究院院長戴斌:一些意想不到的場景正成為旅游新空間

軍事要聞

擔心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設施

無障礙瀏覽 進入關懷版