国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

中科院SNELLA:視覺(jué)模型微調(diào)新范式,性能超越SOTA,內(nèi)存占用降低近40%

0
分享至

文章來(lái)源:我愛(ài)計(jì)算機(jī)視覺(jué)(ID:aicvml)

當(dāng)我們?cè)谡務(wù)撐⒄{(diào)巨大的預(yù)訓(xùn)練視覺(jué)模型時(shí),計(jì)算資源和內(nèi)存總是繞不開(kāi)的話題。為了讓這些“大塊頭”能更輕巧地適應(yīng)下游任務(wù),參數(shù)高效微調(diào)(PEFT)技術(shù)應(yīng)運(yùn)而生。而在眾多PEFT方法中,稀疏微調(diào)(只調(diào)整模型中最關(guān)鍵的一部分權(quán)重)因其出色的性能備受關(guān)注。不過(guò),傳統(tǒng)方法通常采用“兩步走”策略:先定位、再更新,這不僅過(guò)程繁瑣,還特別耗內(nèi)存。

今天,我們介紹一項(xiàng)來(lái)自中國(guó)科學(xué)院和中國(guó)科學(xué)院大學(xué)的最新研究,他們提出了一種名為 SNELLA 的全新方法,徹底改變了這一現(xiàn)狀。它將稀疏微調(diào)變成了一個(gè)優(yōu)雅的“一步式”端到端過(guò)程,不僅性能達(dá)到了新的SOTA,還實(shí)現(xiàn)了高達(dá) 31.1%-39.9% 的內(nèi)存節(jié)省。



  • 論文標(biāo)題 : Kernelized Sparse Fine-Tuning with Bi-level Parameter Competition for Vision Models

  • 作者 : Shufan Shen, Junshu Sun, Shuhui Wang, Qingming Huang

  • 機(jī)構(gòu) : 中國(guó)科學(xué)院, 中國(guó)科學(xué)院大學(xué)

  • 論文地址 : https://arxiv.org/abs/2510.24037

  • 代碼倉(cāng)庫(kù) : https://github.com/ssfgunner/SNELL

現(xiàn)有方法的局限

讓我們先看看老路子是怎么走的。傳統(tǒng)的稀疏微調(diào)方法通常分兩步:

  1. 定位權(quán)重 :首先根據(jù)梯度信息,找出與下游任務(wù)最相關(guān)的那些權(quán)重。但這個(gè)過(guò)程忽略了微調(diào)過(guò)程中參數(shù)本身的變化,有點(diǎn)“刻舟求劍”的意思,限制了最終的性能。

  2. 更新權(quán)重 :找到權(quán)重后,通過(guò)一個(gè)稀疏掩碼(sparse mask)只更新這些被選中的權(quán)重。問(wèn)題在于,優(yōu)化器為了計(jì)算梯度,仍然需要存儲(chǔ)整個(gè)模型的全量權(quán)重矩陣,導(dǎo)致內(nèi)存開(kāi)銷居高不下。


上圖直觀展示了傳統(tǒng)兩階段范式與SNELLA一體化方法的區(qū)別。

SNELLA:一步到位的優(yōu)雅解決方案

SNELLA巧妙地將權(quán)重的定位和更新融合在一個(gè)端到端的框架中,既省內(nèi)存,又提性能。它的核心思想可以分解為兩大創(chuàng)新點(diǎn)。


核化低秩適應(yīng)(Kernelized Low-Rank Adaptation)

為了降低內(nèi)存,SNELLA并沒(méi)有直接更新龐大的權(quán)重矩陣,而是通過(guò)加上一個(gè)稀疏的“增量矩陣”來(lái)實(shí)現(xiàn)。這個(gè)增量矩陣本身不是直接學(xué)習(xí)的,而是由兩個(gè)更小的低秩矩陣通過(guò)一個(gè)非線性核函數(shù)(non-linear kernel function)合成的。

這有點(diǎn)像LoRA的升級(jí)版。傳統(tǒng)的LoRA用兩個(gè)低秩矩陣的乘積來(lái)近似權(quán)重的更新,但表達(dá)能力有限。SNELLA引入的核函數(shù),相當(dāng)于將低秩矩陣映射到更高維的空間再做運(yùn)算,極大地增強(qiáng)了模型的表達(dá)能力,讓權(quán)重的更新更加靈活和強(qiáng)大,從而更好地適應(yīng)下游任務(wù)。


上圖展示了不同核函數(shù)的表達(dá)能力,可以看出非線性核(如Mix-K)能夠更好地?cái)M合復(fù)雜的稀疏矩陣。

自適應(yīng)雙層稀疏分配(Adaptive Bi-level Sparsity Allocation)

那么,模型如何智能地決定哪些權(quán)重“值得”更新呢?SNELLA設(shè)計(jì)了一套精妙的“競(jìng)爭(zhēng)上崗”機(jī)制。

  • 層間競(jìng)爭(zhēng) :首先,模型中的不同層會(huì)根據(jù)各自的“重要性”來(lái)競(jìng)爭(zhēng)可調(diào)整的參數(shù)預(yù)算。這個(gè)重要性分?jǐn)?shù)綜合了該層對(duì)任務(wù)損失的敏感性(sensitivity)和不確定性(uncertainty),越重要的層能分到越多的更新名額。

  • 層內(nèi)競(jìng)爭(zhēng) :在每一層內(nèi)部,所有權(quán)重更新的重要性也會(huì)被評(píng)估,只有那些得分最高的“優(yōu)勝者”才會(huì)被保留,其余的則被置為零。

這套雙層競(jìng)爭(zhēng)機(jī)制是完全自適應(yīng)的,并且貫穿整個(gè)訓(xùn)練過(guò)程,確保了最寶貴的計(jì)算資源總是花在最關(guān)鍵的參數(shù)上。

實(shí)驗(yàn)效果:性能與效率的雙重勝利

SNELLA在圖像分類、息肉分割和文生圖等多種任務(wù)上都進(jìn)行了廣泛驗(yàn)證,并與多種主流PEFT方法進(jìn)行了對(duì)比。

在標(biāo)準(zhǔn)的FGVC和VTAB-1k分類基準(zhǔn)測(cè)試中,SNELLA全面超越了之前的方法。特別是在細(xì)粒度視覺(jué)分類(FGVC)任務(wù)上,相比強(qiáng)大的SPT-LoRA,SNELLA的Top-1準(zhǔn)確率提升了整整 1.8%(從90.1%提升到91.9%),這是一個(gè)非常顯著的進(jìn)步。


更令人印象深刻的是它的內(nèi)存效率。實(shí)驗(yàn)表明,隨著模型參數(shù)規(guī)模從86M增長(zhǎng)到632M,SNELLA相比全量微調(diào)等方法,能夠節(jié)省 31.1%到39.9% 的內(nèi)存。這意味著我們可以在消費(fèi)級(jí)硬件上微調(diào)更大、更強(qiáng)的模型。


在下游任務(wù)的定性評(píng)估中,SNELLA同樣表現(xiàn)出色。例如,在醫(yī)療影像的息肉分割任務(wù)中,它能更準(zhǔn)確地識(shí)別和分割出病變區(qū)域。


在個(gè)性化的文生圖任務(wù)中,SNELLA也能更好地學(xué)習(xí)和還原特定概念的視覺(jué)特征,生成與文本描述更一致的圖像。


總結(jié)

CV君認(rèn)為,SNELLA提出的這種將核方法與動(dòng)態(tài)稀疏性結(jié)合的思路非常新穎,它不僅解決了現(xiàn)有稀疏微調(diào)方法的痛點(diǎn),也為未來(lái)如何更高效地利用大模型提供了寶貴的啟發(fā)。作者已經(jīng)開(kāi)源了代碼,強(qiáng)烈推薦感興趣的同學(xué)去嘗試和探索。

大家對(duì)這種端到端的稀疏微調(diào)方法怎么看?歡迎在評(píng)論區(qū)一起交流!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
裝逼撞到你擅長(zhǎng)的領(lǐng)域是啥體驗(yàn)?網(wǎng)友:我曾經(jīng)也干過(guò)這種事呀

裝逼撞到你擅長(zhǎng)的領(lǐng)域是啥體驗(yàn)?網(wǎng)友:我曾經(jīng)也干過(guò)這種事呀

夜深愛(ài)雜談
2025-12-21 17:57:28
又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買了個(gè)牌子殼!

又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買了個(gè)牌子殼!

青眼財(cái)經(jīng)
2025-11-18 23:16:47
定居美國(guó)13年回國(guó)撈金遭驅(qū)逐,52歲被笑話

定居美國(guó)13年回國(guó)撈金遭驅(qū)逐,52歲被笑話

白日追夢(mèng)人
2025-12-24 04:30:11
宗慶后被曝有7子,看了宗馥莉?yàn)樗⒌哪贡胖浪缇筒季至?>
    </a>
        <h3>
      <a href=麥大人
2025-07-18 12:05:16
紫牛頭條|下班遭車禍,接受公司賠償后他發(fā)現(xiàn)一份意外險(xiǎn)保單被公司隱瞞

紫牛頭條|下班遭車禍,接受公司賠償后他發(fā)現(xiàn)一份意外險(xiǎn)保單被公司隱瞞

揚(yáng)子晚報(bào)
2025-12-23 09:06:09
南京博物院又揭大瓜,前文物局局長(zhǎng)曾問(wèn):賣幾個(gè)兵馬俑行不行?

南京博物院又揭大瓜,前文物局局長(zhǎng)曾問(wèn):賣幾個(gè)兵馬俑行不行?

攬星河的筆記
2025-12-22 18:12:17
突發(fā)!法拉利撞上護(hù)欄后迅速起火,知名游戲大佬被困車內(nèi)身亡,警方通報(bào)!他被譽(yù)為“《使命召喚》之父”,眾多同行與玩家哀悼

突發(fā)!法拉利撞上護(hù)欄后迅速起火,知名游戲大佬被困車內(nèi)身亡,警方通報(bào)!他被譽(yù)為“《使命召喚》之父”,眾多同行與玩家哀悼

每日經(jīng)濟(jì)新聞
2025-12-23 15:06:07
受中國(guó)004核航母刺激太大,法國(guó)掀桌子了,砸鍋賣鐵也要建新航母

受中國(guó)004核航母刺激太大,法國(guó)掀桌子了,砸鍋賣鐵也要建新航母

云舟史策
2025-12-24 07:22:16
CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

弄月公子
2025-12-23 23:10:43
錢多有什么用?42歲離婚無(wú)兒無(wú)女的尼格買提,走上了另外一條道路

錢多有什么用?42歲離婚無(wú)兒無(wú)女的尼格買提,走上了另外一條道路

古事尋蹤記
2025-12-20 07:13:47
南京博物院盜賣文物,捐贈(zèng)后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國(guó)寶還有多少黑幕

南京博物院盜賣文物,捐贈(zèng)后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國(guó)寶還有多少黑幕

爆角追蹤
2025-12-18 15:36:33
他用藥7年換來(lái)肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

他用藥7年換來(lái)肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

健身迷
2025-12-22 10:19:04
轉(zhuǎn)告父母:這6種病屬于老年病,過(guò)度治療反而傷身,安然接受

轉(zhuǎn)告父母:這6種病屬于老年病,過(guò)度治療反而傷身,安然接受

讀懂世界歷史
2025-12-23 20:31:37
卷走53億!又一大佬帶全家跑路,欠中國(guó)銀行20億,投資者血本無(wú)歸

卷走53億!又一大佬帶全家跑路,欠中國(guó)銀行20億,投資者血本無(wú)歸

以茶帶書
2025-12-09 23:33:58
向大陸交底、對(duì)內(nèi)攤牌,鄭麗文把最怕被說(shuō)破的那層窗戶紙,捅穿了

向大陸交底、對(duì)內(nèi)攤牌,鄭麗文把最怕被說(shuō)破的那層窗戶紙,捅穿了

科普100克克
2025-12-24 00:10:32
哈佛大學(xué)研究:活過(guò)90歲的人29項(xiàng)共同特征

哈佛大學(xué)研究:活過(guò)90歲的人29項(xiàng)共同特征

尚曦讀史
2025-12-06 08:27:08
廣東5連勝,杜鋒:在廣東打球是幸福的!

廣東5連勝,杜鋒:在廣東打球是幸福的!

帶你領(lǐng)略快樂(lè)真諦
2025-12-24 02:50:13
黃金狂飆,一種交易正在悄悄進(jìn)行

黃金狂飆,一種交易正在悄悄進(jìn)行

鳳凰網(wǎng)財(cái)經(jīng)
2025-12-23 09:08:05
美國(guó)外交開(kāi)始大洗牌

美國(guó)外交開(kāi)始大洗牌

陸棄
2025-12-23 08:25:03
肥腸再次成為關(guān)注對(duì)象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會(huì)出現(xiàn)6大變化

肥腸再次成為關(guān)注對(duì)象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會(huì)出現(xiàn)6大變化

看世界的人
2025-12-04 10:51:31
2025-12-24 08:47:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5276文章數(shù) 64597關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

體育要聞

楊瀚森連續(xù)5場(chǎng)DNP!開(kāi)拓者遭活塞雙殺

娛樂(lè)要聞

朱孝天回應(yīng)阿信感謝,自曝沒(méi)再收到邀約

財(cái)經(jīng)要聞

快手到底惹了誰(shuí)?

汽車要聞

四款新車集中發(fā)布 星途正式走進(jìn)3.0時(shí)代

態(tài)度原創(chuàng)

親子
本地
房產(chǎn)
手機(jī)
公開(kāi)課

親子要聞

嚴(yán)禁引入第三方,管住幼兒園亂收費(fèi)|新京報(bào)快評(píng)

本地新聞

云游安徽|宣城何以動(dòng)人心,百年塔影一城徽韻

房產(chǎn)要聞

獨(dú)家猛料!16.1億,浙江老板搶下雅居樂(lè)清水灣261畝重磅宅地!

手機(jī)要聞

三星籌備“寬折疊”新機(jī) 對(duì)標(biāo)蘋果2026年折疊iPhone

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版