国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

TMM 2025 | 頂刊方案:DMSI 融合圖像 - 特征級(jí)掩碼,半監(jiān)督語義分割性能與魯棒性雙提升

0
分享至

在自動(dòng)駕駛的視覺系統(tǒng)中,如何讓AI準(zhǔn)確識(shí)別出街景中"卡車的窗戶"而不是誤判為"汽車"?在醫(yī)療影像分析時(shí),怎樣讓模型僅憑部分圖像就能推斷出完整的病灶區(qū)域?今天要給大家介紹的這項(xiàng)研究,或許能給出完美答案。

來自國內(nèi)高校的研究團(tuán)隊(duì)提出了一種名為DMSI(雙級(jí)掩碼語義推理)的全新框架,在半監(jiān)督語義分割任務(wù)中刷新了多項(xiàng)SOTA記錄。更厲害的是,它讓模型真正學(xué)會(huì)了"上下文推理"——就像人類看到半遮半掩的物體時(shí),能根據(jù)周圍環(huán)境猜出全貌一樣。

論文信息 題目:Dual-Level Masked Semantic Inference for Semi-Supervised Semantic Segmentation 半監(jiān)督語義分割的雙層掩碼語義推理 作者:Qiankun Ma, Ziyao Zhang, Pengchong Qiao, Yu Wang, Rongrong Ji, Chang Liu, Jie Chen 為什么現(xiàn)有模型總是"犯糊涂"?

傳統(tǒng)的半監(jiān)督語義分割方法有個(gè)致命弱點(diǎn):它們只關(guān)注單個(gè)像素的預(yù)測是否穩(wěn)定,卻忽略了像素之間的"鄰里關(guān)系"。

就像下面這個(gè)例子,普通模型會(huì)把卡車的窗戶誤判為汽車,因?yàn)樗豢淳植肯袼氐念伾图y理,沒意識(shí)到"窗戶"周圍都是"卡車"的部件。這種"只見樹木不見森林"的認(rèn)知方式,在復(fù)雜場景中很容易出錯(cuò)。


而人類在識(shí)別物體時(shí),總會(huì)不自覺地利用上下文信息:看到車輪就想到汽車,看到枝葉就聯(lián)想到樹木。DMSI的核心創(chuàng)新,就是讓AI也具備這種"聯(lián)想推理"能力。

DMSI框架:讓模型學(xué)會(huì)"猜謎"的三大絕招

研究團(tuán)隊(duì)提出的DMSI框架,用"掩碼后推理"的思路徹底改變了模型的學(xué)習(xí)方式。簡單說就是:故意遮住圖像的一部分,逼模型根據(jù)剩下的部分猜被遮住的內(nèi)容。整個(gè)框架就像一個(gè)嚴(yán)格的老師,通過不斷"出題考學(xué)生",讓模型逐漸學(xué)會(huì)利用上下文線索。

絕招一:雙級(jí)掩碼一致性正則化(DMCR)

這個(gè)機(jī)制就像給模型布置兩種難度的"填空題":

  • 圖像級(jí)掩碼 :直接在原圖上遮掉一塊,讓模型根據(jù)剩余像素猜被遮區(qū)域(類似我們玩的"看圖猜物")

  • 特征級(jí)掩碼 :在模型處理圖像的中間特征層遮掉一部分,迫使模型從高層語義中找線索

通過這兩種訓(xùn)練方式,模型既能學(xué)到顏色、紋理等低級(jí)特征,又能掌握物體關(guān)系等高級(jí)語義。實(shí)驗(yàn)證明,這種雙管齊下的方法比單一掩碼方式性能提升1.5%。

絕招二:自適應(yīng)掩碼位置(AMP)——專挑"重點(diǎn)區(qū)域"考

普通的掩碼方法隨機(jī)遮圖,經(jīng)常把無關(guān)緊要的背景區(qū)域遮住,白費(fèi)功夫。AMP則像個(gè)精明的老師,專挑"難點(diǎn)"考:

  1. 先把圖像分成若干個(gè)小補(bǔ)丁

  2. 計(jì)算每個(gè)補(bǔ)丁的"不確定性"(模型最容易認(rèn)錯(cuò)的區(qū)域)

  3. 優(yōu)先遮掉那些語義豐富的前景區(qū)域(比如汽車、行人)

從下面的對(duì)比可以看出,AMP會(huì)智能地避開天空、道路等簡單背景,專門針對(duì)卡車、公交車等難識(shí)別的物體進(jìn)行掩碼訓(xùn)練。


絕招三:自適應(yīng)掩碼比例(AMR)——因材施教的智慧

就像老師不會(huì)給差生出太難的題,AMR會(huì)根據(jù)圖像的"難易程度"調(diào)整掩碼比例:

  • 對(duì)容易識(shí)別的圖像(模型預(yù)測準(zhǔn)確度高):遮得多一點(diǎn),逼模型挑戰(zhàn)極限

  • 對(duì)難識(shí)別的圖像(模型經(jīng)常出錯(cuò)):遮得少一點(diǎn),避免打擊學(xué)習(xí)積極性

隨著訓(xùn)練進(jìn)展,當(dāng)模型對(duì)某張圖的識(shí)別越來越準(zhǔn),AMR會(huì)自動(dòng)提高掩碼比例,就像學(xué)生進(jìn)步了,老師會(huì)增加作業(yè)難度一樣。


方法全貌:DMSI的工作流程

整個(gè)框架采用師生訓(xùn)練模式,通過四個(gè)關(guān)鍵步驟實(shí)現(xiàn)語義推理能力的培養(yǎng):

  1. 教師模型對(duì)原圖進(jìn)行完整預(yù)測,生成高置信度的"參考答案"

  2. AdaMask根據(jù)圖像特點(diǎn),智能生成掩碼位置和比例

  3. 學(xué)生模型分別對(duì)"掩碼圖像"和"掩碼特征"進(jìn)行預(yù)測

  4. 通過損失函數(shù)讓學(xué)生的預(yù)測結(jié)果與教師的"參考答案"對(duì)齊

這種訓(xùn)練方式讓模型被迫養(yǎng)成"找上下文線索"的習(xí)慣,就像我們做填空題時(shí)會(huì)下意識(shí)地聯(lián)系前后文一樣。


實(shí)驗(yàn)結(jié)果:刷新四大數(shù)據(jù)集SOTA

在多個(gè)權(quán)威數(shù)據(jù)集上,DMSI都展現(xiàn)出壓倒性優(yōu)勢:

  • PASCAL VOC 2012 :在僅用92張標(biāo)注圖像的極端情況下,比之前最好的方法高出3.7%

  • Cityscapes :使用ResNet-101作為骨干網(wǎng)絡(luò)時(shí),所有劃分協(xié)議下均領(lǐng)先2%左右

  • MS COCO :在這個(gè)包含81類物體的復(fù)雜數(shù)據(jù)集上,全面超越PseudoSeg和UniMatch

  • ADE20K :在150個(gè)類別的場景解析任務(wù)中,顯著優(yōu)于AEL等現(xiàn)有方法

特別值得注意的是,在標(biāo)注數(shù)據(jù)越少的情況下,DMSI的優(yōu)勢越明顯,這意味著它能大幅降低對(duì)標(biāo)注數(shù)據(jù)的依賴,在實(shí)際應(yīng)用中能節(jié)省大量標(biāo)注成本。

為什么DMSI如此強(qiáng)大?

通過深入分析,研究團(tuán)隊(duì)發(fā)現(xiàn)了DMSI性能飛躍的兩個(gè)關(guān)鍵原因:

1. 像素間的"信息交流"更頻繁

用互信息(MI)指標(biāo)衡量發(fā)現(xiàn),DMSI模型中像素之間的信息交互明顯增強(qiáng)。同類像素(比如卡車的各個(gè)部件)之間的"默契度"更高,能互相提供識(shí)別線索。


2. 抗干擾能力顯著提升

在加入高斯噪聲、對(duì)抗性噪聲甚至隨機(jī)掩碼的情況下,DMSI的性能下降幅度遠(yuǎn)小于傳統(tǒng)方法。這是因?yàn)樗皇且蕾噯蝹€(gè)像素的特征,而是綜合了周圍像素的上下文信息,就像多人作證比單人作證更可靠一樣。


實(shí)際應(yīng)用價(jià)值與局限

DMSI的創(chuàng)新思路不僅限于語義分割,還能應(yīng)用到更廣泛的領(lǐng)域:

  • 自動(dòng)駕駛:在雨天、逆光等惡劣條件下,仍能通過上下文推理準(zhǔn)確識(shí)別物體

  • 醫(yī)療影像:僅憑部分清晰區(qū)域就能推斷完整病灶,減少漏診誤診

  • 遙感圖像分析:在云層遮擋情況下,仍能識(shí)別地面目標(biāo)

當(dāng)然,這個(gè)方法也有局限性——由于需要進(jìn)行兩次前向傳播,訓(xùn)練時(shí)間比傳統(tǒng)方法增加約15%。但考慮到性能的巨大提升,這點(diǎn)代價(jià)在大多數(shù)場景下是值得的。

結(jié)語:從"看見"到"理解"的跨越

DMSI的成功證明了一個(gè)重要觀點(diǎn):計(jì)算機(jī)視覺不僅要讓模型"看見"像素,更要讓它"理解"場景中各元素的關(guān)系。這種從"語義理解"到"語義推理"的跨越,或許是AI視覺系統(tǒng)走向真正智能的關(guān)鍵一步。

未來,研究團(tuán)隊(duì)計(jì)劃將這種上下文推理能力擴(kuò)展到跨圖像場景,讓模型能從多張圖片中學(xué)習(xí)更復(fù)雜的語義關(guān)系。讓我們期待這個(gè)方向能帶來更多突破性進(jìn)展!

文章來源:計(jì)算機(jī)書童。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
黨史上最復(fù)雜離奇的懸案,毛主席被困擾18年,其中究竟有何隱情?

黨史上最復(fù)雜離奇的懸案,毛主席被困擾18年,其中究竟有何隱情?

貓眼觀史
2024-11-19 09:10:02
一位在巴西開超市十年的老鄉(xiāng)說:當(dāng)?shù)厝撕尬覀?,不是因?yàn)闁|西便宜

一位在巴西開超市十年的老鄉(xiāng)說:當(dāng)?shù)厝撕尬覀儯皇且驗(yàn)闁|西便宜

南權(quán)先生
2025-12-13 16:51:47
笑岔氣了!果然斷句是中國人一生的宿敵,只能說中國文化博大精深

笑岔氣了!果然斷句是中國人一生的宿敵,只能說中國文化博大精深

夜深愛雜談
2025-12-19 16:39:58
比爾·西蒙斯轉(zhuǎn)述里弗斯的消息,詹姆斯·哈登加盟雄鹿的希望破滅

比爾·西蒙斯轉(zhuǎn)述里弗斯的消息,詹姆斯·哈登加盟雄鹿的希望破滅

好火子
2025-12-24 03:40:12
2026城鄉(xiāng)居民養(yǎng)老金將迎第八次上漲!明年有望突破160元?

2026城鄉(xiāng)居民養(yǎng)老金將迎第八次上漲!明年有望突破160元?

貓叔東山再起
2025-12-24 08:20:07
又一個(gè)巨頭崛起!年入8715億,超越華為,成第三民營企業(yè)!

又一個(gè)巨頭崛起!年入8715億,超越華為,成第三民營企業(yè)!

牛牛叨史
2025-12-23 23:07:38
方媛坐月子頓頓六菜一湯四樣肉,郭富城精打細(xì)算,請來岳父當(dāng)主廚

方媛坐月子頓頓六菜一湯四樣肉,郭富城精打細(xì)算,請來岳父當(dāng)主廚

娛圈小愚
2025-12-24 10:21:00
廣東一女子背著小孩在校門口執(zhí)勤?校方回應(yīng):非本校學(xué)生家長!

廣東一女子背著小孩在校門口執(zhí)勤?校方回應(yīng):非本校學(xué)生家長!

廣東吃喝玩樂
2025-12-23 12:02:21
Lisa舞臺(tái)爭議:藝術(shù)表達(dá)還是低俗表演?

Lisa舞臺(tái)爭議:藝術(shù)表達(dá)還是低俗表演?

娛曉曉
2025-12-22 17:02:07
去了一趟社保局,把大家最關(guān)心的社保問題問清楚了,全是大白話!

去了一趟社保局,把大家最關(guān)心的社保問題問清楚了,全是大白話!

匹夫來搞笑
2025-12-24 07:31:55
臺(tái)北高校唇槍舌戰(zhàn),大陸救星爭議炸翻全場,血脈真相誰敢直面?

臺(tái)北高校唇槍舌戰(zhàn),大陸救星爭議炸翻全場,血脈真相誰敢直面?

今日美食分享
2025-12-24 03:41:47
特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

證券時(shí)報(bào)e公司
2025-12-23 23:25:39
中俄為啥不結(jié)盟?俄專家坦言:中國拒絕與俄結(jié)盟,原因有3個(gè)

中俄為啥不結(jié)盟?俄專家坦言:中國拒絕與俄結(jié)盟,原因有3個(gè)

蜉蝣說
2025-12-12 23:59:34
華子38分森林狼力克尼克斯 唐斯40+13蘭德爾25分

華子38分森林狼力克尼克斯 唐斯40+13蘭德爾25分

醉臥浮生
2025-12-24 11:35:38
痛心!何晴家族病史曝光!表弟奔喪訴內(nèi)情,最怕兒子重蹈覆轍

痛心!何晴家族病史曝光!表弟奔喪訴內(nèi)情,最怕兒子重蹈覆轍

粵語經(jīng)典歌單
2025-12-24 10:51:11
上海兩大“巨無霸”商業(yè)體年底壓軸登場,面積超42萬平方米,擁抱產(chǎn)城融合!

上海兩大“巨無霸”商業(yè)體年底壓軸登場,面積超42萬平方米,擁抱產(chǎn)城融合!

上觀新聞
2025-12-23 21:37:05
92歲母親熬走了大哥二哥,才明白!老人超過85歲一定守住三個(gè)原則

92歲母親熬走了大哥二哥,才明白!老人超過85歲一定守住三個(gè)原則

風(fēng)起見你
2025-12-13 10:07:47
中共中央:分類推進(jìn)高校改革

中共中央:分類推進(jìn)高校改革

麥可思研究
2025-12-23 18:50:53
“網(wǎng)紅熱度”與“賽場空白”如何破局?吳艷妮的冠軍密碼藏在哪?

“網(wǎng)紅熱度”與“賽場空白”如何破局?吳艷妮的冠軍密碼藏在哪?

阿晞體育
2025-12-24 10:51:12
三分絕殺!中國男籃又一21歲前鋒崛起:場均17+6,郭士強(qiáng)重用他?

三分絕殺!中國男籃又一21歲前鋒崛起:場均17+6,郭士強(qiáng)重用他?

李喜林籃球絕殺
2025-12-23 11:17:13
2025-12-24 11:51:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5276文章數(shù) 64598關(guān)注度
往期回顧 全部

科技要聞

黑產(chǎn)大軍壓境 快手"拔網(wǎng)線"為何慢了兩小時(shí)

頭條要聞

一名歐洲男子捐精生197娃 攜帶致癌基因已致死多人

頭條要聞

一名歐洲男子捐精生197娃 攜帶致癌基因已致死多人

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

財(cái)經(jīng)要聞

快手到底惹了誰?

汽車要聞

將于明年一季度上市 零跑D19內(nèi)飾官圖發(fā)布

態(tài)度原創(chuàng)

教育
房產(chǎn)
數(shù)碼
家居
藝術(shù)

教育要聞

已知正方形的面積是18,求圓的面積

房產(chǎn)要聞

硬核!央企海口一線江景頂流紅盤,上演超預(yù)期交付!

數(shù)碼要聞

日本企業(yè)中林推出綜合性輸入設(shè)備:剪刀腳鍵盤上方集成軌跡球鼠標(biāo)

家居要聞

法式大平層 智能家居添彩

藝術(shù)要聞

砸了20億的恒大“五國溫泉”小鎮(zhèn),如今泡池冷清,別墅荒了?

無障礙瀏覽 進(jìn)入關(guān)懷版