国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI對抗遷移性評估的「撥亂反正」:那些年效果虛高的攻防算法們

0
分享至



本文第一作者 / 通訊作者趙正宇來自西安交通大學(xué),共同第一作者張焓韡、李仞玨分別來自德國薩爾大學(xué)、中科工業(yè)人工智能研究院。其他合作者分別來自法國馬賽中央理工、法國 INRIA 國家信息與自動化研究所、德國 CISPA 亥姆霍茲信息安全中心、清華大學(xué)、武漢大學(xué)、西安交通大學(xué)。

對抗樣本(adversarial examples)的遷移性(transferability)—— 在某個模型上生成的對抗樣本能夠同樣誤導(dǎo)其他未知模型 —— 被認(rèn)為是威脅現(xiàn)實黑盒深度學(xué)習(xí)系統(tǒng)安全的核心因素。盡管現(xiàn)有研究已提出復(fù)雜多樣的遷移攻擊方法,卻仍缺乏系統(tǒng)且公平的方法對比分析:(1)針對攻擊遷移性,未采用公平超參設(shè)置的同類攻擊對比分析;(2)針對攻擊隱蔽性,缺乏多樣指標(biāo)。

為了解決上述問題,本文依據(jù)通用機器學(xué)習(xí)全周期階段,將遷移攻擊方法系統(tǒng)性劃分為五大類,并首次針對 23 種代表性攻擊與 11 種代表性防御方法(包括針對遷移的防御與現(xiàn)實世界的視覺系統(tǒng) API),在 ImageNet 數(shù)據(jù)集上開展對抗遷移性綜合評估,并通過大規(guī)模用戶實驗評估對抗隱蔽性。

本文證實上述評估缺陷確實導(dǎo)致了理解盲區(qū)甚至誤導(dǎo)性結(jié)論,而解決這些缺陷后帶來一系列新見解,例如:(1)早期攻擊方法 DI 性能反而超越所有后續(xù)同類攻擊;(2) 原本聲稱白盒防御方法 DiffPure 卻極易被(黑盒)遷移方法攻破;(3)幾乎所有攻擊方法在提升遷移性的同時,實則犧牲了(通過多樣化指標(biāo)量化的)攻擊隱蔽性。



  • 論文題目:Revisiting Transferable Adversarial Images: Systemization, Evaluation, and New Insights
  • 接收期刊:TPAMI 2025
  • 預(yù)印本鏈接:https://arxiv.org/abs/2310.11850
  • 代碼鏈接:https://github.com/ZhengyuZhao/TransferAttackEval

研究現(xiàn)狀

對抗樣本的遷移性是研究深度學(xué)習(xí)系統(tǒng)魯棒性的重要課題。在真實世界中,攻擊者往往無法訪問目標(biāo)模型的內(nèi)部參數(shù)或訓(xùn)練集(黑盒情形)。攻擊在一個 / 一類模型上生成后能否在另一個未知模型上保持效力(即攻擊遷移性),直接決定了攻擊的實際威脅水平與防御的有效性。

當(dāng)前相關(guān)研究存在兩個長期被忽略但是影響深遠(yuǎn)的問題:

  • 攻擊遷移性(transferability)評估缺乏系統(tǒng)的一對一比較與公平的超參數(shù)設(shè)定:不同方法常在不同或不對等的超參數(shù)下對比,導(dǎo)致結(jié)論不可比或誤導(dǎo)性強。
  • 攻擊隱蔽性(stealthiness)幾乎沒有被系統(tǒng)評估: 許多工作只報告 Lp 約束下的成功率,而忽略了視覺 / 感知質(zhì)量和攻擊可溯源特性的差異;也就是說,攻擊「看上去」是否真實不可察覺并未被充分衡量。

這種不嚴(yán)格的比較與不完整的度量導(dǎo)致使得某些方法被高估或低估,進而誤導(dǎo)防御設(shè)計與研究方向。



創(chuàng)新發(fā)現(xiàn)


依托前文所建立的評估框架,我們得以從實驗結(jié)果中更清晰地分析對抗魯棒性的內(nèi)在因素。以下部分將概述主要發(fā)現(xiàn)與啟發(fā)性結(jié)論:

1.在公平的超參數(shù)設(shè)定下,早期方法 DI 竟優(yōu)于后續(xù)眾多所謂改進方法:許多后來被認(rèn)為更強的遷移攻擊,實則得益于更有利的實驗設(shè)定。一旦把超參數(shù)公平化,DI 類的早期方法便會遙遙領(lǐng)先。因此,我們需要公平對比來避免誤導(dǎo)性結(jié)論。這不僅關(guān)系到學(xué)術(shù)層面的研究,更關(guān)系到實際系統(tǒng)對抗威脅的判斷與防御優(yōu)先級的設(shè)定。

2.擴散(diffusion)類防御方法依賴 “虛假安全感”:基于擴散原理進行去噪的防御方法雖然聲稱在白盒或某些自適應(yīng)攻擊下表現(xiàn)很強,但黑盒(遷移)攻擊反而可以很大程度上繞過這些防御。因此,此類防御方法只是由于評估不完善帶來的 “虛假安全感”

3.相同 Lp 約束下,不同攻擊在隱蔽性上有巨大差異,且隱蔽性與遷移性之間呈負(fù)相關(guān):即便所有攻擊都受同一 Lp 限制,在視覺感知度量(PSNR/SSIM/LPIPS 等)上依然差距很大。因此,除了常用 Lp 約束外,需要同時報告遷移性與多維度隱蔽性指標(biāo),以便合理權(quán)衡攻擊遷移性與隱蔽性。

具體評估建議與攻防設(shè)計參考如下:



評估框架與結(jié)果


本文依據(jù)通用機器學(xué)習(xí)全周期階段,將遷移攻擊方法系統(tǒng)性劃分為五大類,如下圖所示:



本文涉及了 23 種代表性攻擊與 11 種代表性防御方法,如下表所示:





針對攻擊遷移性,本文從兩個維度入手修正與完善現(xiàn)有評估基準(zhǔn):(1)引入完整的遷移攻擊方法分類,并進行公平的類內(nèi)(intra-category)比較;(2)從 “攻擊溯源(attack traceback)” 角度設(shè)計隱蔽性評估。更具體地說,本文拋棄了將不同類攻擊方法直接對比的傳統(tǒng)策略,而是對同類攻擊進行一對一、超參數(shù)公平化的對比實驗:統(tǒng)一攻擊強度約束(相同 Lp 限制)、統(tǒng)一優(yōu)化 / 迭代預(yù)算,并在同一組目標(biāo)模型 / 防御上逐項比較。



針對攻擊隱蔽性,本工作不再僅依靠單一 Lp 值來進行衡量,而是引入多樣化的感知質(zhì)量指標(biāo)(例如常用的 PSNR/SSIM/LPIPS 等)并結(jié)合更細(xì)粒度的隱蔽性特征。另外,本文創(chuàng)新性地引入 “攻擊溯源” 視角,分析攻擊是如何產(chǎn)生可見 / 可追溯的擾動(例如是否集中于圖像某些高頻區(qū)域、是否具有結(jié)構(gòu)化模式、擾動是否容易被現(xiàn)有檢測器或去噪機制識別)。









未來展望

我們呼吁研究界在對比任何(攻防)方法時務(wù)必采用一對一、超參數(shù)合理的公平設(shè)計;報告遷移性時同時報告多種感知 / 隱蔽性指標(biāo)(不僅是 Lp),并分析攻擊的可追溯性特征;在評估防御有效性時,必須納入可遷移黑盒攻擊的考驗,尤其是對擴散 / 去噪類防御要采用更全面的測試;公開代碼、超參數(shù)與評估腳本,以便社區(qū)復(fù)現(xiàn)與累積真實進展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
到底得有多壞,才能做出這么喪盡天良的事!

到底得有多壞,才能做出這么喪盡天良的事!

胖胖說他不胖
2026-04-19 09:00:30
我的腿長嗎:從問別人到不再問,我走了很遠(yuǎn)的路

我的腿長嗎:從問別人到不再問,我走了很遠(yuǎn)的路

疾跑的小蝸牛
2026-04-20 21:38:06
這個90后女演員憑什么擊敗章子怡、馬麗,奪得金像影后桂冠

這個90后女演員憑什么擊敗章子怡、馬麗,奪得金像影后桂冠

新民周刊
2026-04-20 11:37:22
日本乒壇內(nèi)訌:松島輝空當(dāng)眾炮轟張本智和:你不守時,我特別討厭你!

日本乒壇內(nèi)訌:松島輝空當(dāng)眾炮轟張本智和:你不守時,我特別討厭你!

最愛乒乓球
2026-04-20 00:07:44
雷軍在服務(wù)區(qū)被堵車?yán)锞S權(quán)?小米徐潔云回應(yīng):現(xiàn)場是車友朋友們,雷總在車?yán)镉涗浬弦欢蔚睦锍毯湍芎?,那些捏造謠言惡意傳播的,可以等著了

雷軍在服務(wù)區(qū)被堵車?yán)锞S權(quán)?小米徐潔云回應(yīng):現(xiàn)場是車友朋友們,雷總在車?yán)镉涗浬弦欢蔚睦锍毯湍芎?,那些捏造謠言惡意傳播的,可以等著了

魯中晨報
2026-04-20 07:32:08
拼多多暴力抗法震驚全網(wǎng),市值萬億巨頭為何如此囂張

拼多多暴力抗法震驚全網(wǎng),市值萬億巨頭為何如此囂張

燕梳樓頻道
2026-04-20 21:12:04
魏建軍提議私家車10年后再年檢,用OBD和車聯(lián)網(wǎng)替代實地檢測

魏建軍提議私家車10年后再年檢,用OBD和車聯(lián)網(wǎng)替代實地檢測

快科技
2026-04-19 08:19:03
看到張云旗夫婦的下場,才知丁玉嬌為什么愿意忍受親人的背叛

看到張云旗夫婦的下場,才知丁玉嬌為什么愿意忍受親人的背叛

陳意小可愛
2026-04-20 20:54:03
國際油價,大漲

國際油價,大漲

南方都市報
2026-04-20 10:34:02
12萬!大衣哥商演最新報價,網(wǎng)友:沒想到這么多年,價格沒怎么漲

12萬!大衣哥商演最新報價,網(wǎng)友:沒想到這么多年,價格沒怎么漲

火山詩話
2026-04-20 16:19:35
廣東輸10分!遼寧慘敗34分,寧波贏19分,四川41連敗,排名大變

廣東輸10分!遼寧慘敗34分,寧波贏19分,四川41連敗,排名大變

老吳說體育
2026-04-20 21:41:18
234萬平方公里大國,海岸線僅37公里:準(zhǔn)內(nèi)陸國到底有多憋屈

234萬平方公里大國,海岸線僅37公里:準(zhǔn)內(nèi)陸國到底有多憋屈

兔斯基聊科學(xué)
2026-04-18 10:45:36
小S首談大S赴日旅行原因,至今自責(zé)靠酒精麻痹,酒后在家大哭大鬧

小S首談大S赴日旅行原因,至今自責(zé)靠酒精麻痹,酒后在家大哭大鬧

開開森森
2026-04-20 20:03:09
“國營媒體是謊言工廠”,這位總理上臺就宣布關(guān)閉

“國營媒體是謊言工廠”,這位總理上臺就宣布關(guān)閉

法經(jīng)社
2026-04-19 12:34:54
郭德綱發(fā)文,德云社再變動,釋放3個強烈信號,岳云鵬地位又變了

郭德綱發(fā)文,德云社再變動,釋放3個強烈信號,岳云鵬地位又變了

阿纂看事
2026-04-20 16:35:53
79年計劃生育,一家只準(zhǔn)生一個,陳云:搞不好要被罵斷子絕孫!

79年計劃生育,一家只準(zhǔn)生一個,陳云:搞不好要被罵斷子絕孫!

老范談史
2026-04-20 14:02:16
看到如今的伊朗,才懂左宗棠當(dāng)年多偉大!沒有他,西北或無險可守

看到如今的伊朗,才懂左宗棠當(dāng)年多偉大!沒有他,西北或無險可守

賤議你讀史
2026-04-17 01:48:21
全場嘩然!29歲女子在相親舞臺稱“娶我一定讓你爽”,王婆也懵了

全場嘩然!29歲女子在相親舞臺稱“娶我一定讓你爽”,王婆也懵了

火山詩話
2026-04-19 06:42:57
重大轉(zhuǎn)折!特朗普官宣:伊朗同意交出濃縮鈾,自己將親赴伊斯蘭堡

重大轉(zhuǎn)折!特朗普官宣:伊朗同意交出濃縮鈾,自己將親赴伊斯蘭堡

矚望云霄
2026-04-20 17:47:22
文章面館開業(yè)4天后,終于有藝人到場!網(wǎng)友:這對比太心酸了

文章面館開業(yè)4天后,終于有藝人到場!網(wǎng)友:這對比太心酸了

娛小余
2026-04-19 23:21:33
2026-04-20 22:51:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12813文章數(shù) 142633關(guān)注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

歐洲或再迎一位親俄領(lǐng)導(dǎo)人 曾與澤連斯基發(fā)生公開沖突

頭條要聞

歐洲或再迎一位親俄領(lǐng)導(dǎo)人 曾與澤連斯基發(fā)生公開沖突

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

家居
本地
親子
房產(chǎn)
公開課

家居要聞

自然慢調(diào) 慢享時光

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

親子要聞

【孤獨癥科普】啥是孤獨癥,哪些孩子易發(fā)生,如何應(yīng)對?

房產(chǎn)要聞

大規(guī)模商改住!??谖骱0?,這波項目要贏麻了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版