国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

反直覺!擴(kuò)散模型「跨界」復(fù)原: 只用臥室模型,竟能復(fù)原人臉

0
分享至



自擴(kuò)散模型提出以來,它不僅在圖像、視頻和音頻生成方面取得了優(yōu)異效果,也正逐漸成為解決圖像復(fù)原、超分辨率、去模糊等逆問題的重要工具。

這個(gè)領(lǐng)域長期以來普遍認(rèn)為,作為先驗(yàn)的擴(kuò)散模型必須足夠強(qiáng),且其訓(xùn)練圖像分布需要與目標(biāo)圖像分布高度匹配。因此,經(jīng)典算法通常會(huì)采用在目標(biāo)領(lǐng)域上充分訓(xùn)練的擴(kuò)散模型來進(jìn)行圖像恢復(fù),否則恢復(fù)質(zhì)量往往會(huì)明顯下降。

然而,近期來自羅格斯大學(xué)、杜克大學(xué)和密歇根大學(xué)的一項(xiàng)最新研究表明,即使是「弱」擴(kuò)散先驗(yàn)和完全不匹配的數(shù)據(jù)分布,也可以實(shí)現(xiàn)高質(zhì)量圖像重建。

這篇題為《Weak Diffusion Priors Can Still Achieve Strong Inverse-Problem Performance》的工作不僅展示了這種反直覺的實(shí)驗(yàn)現(xiàn)象,還首次從理論和實(shí)驗(yàn)層面解釋了這種「弱先驗(yàn)依然有效」的機(jī)制。



  • 論文地址:https://arxiv.org/abs/2601.22443

一個(gè)反直覺的實(shí)驗(yàn):臥室擴(kuò)散模型重構(gòu)人臉



僅使用 3 步 DDIM 擴(kuò)散模型作為先驗(yàn)進(jìn)行圖像重建:匹配先驗(yàn)(上)與不匹配先驗(yàn)(下)的對(duì)比。在底部左圖(或底部右圖)中,可以看到在臥室圖像(或人臉圖像)上訓(xùn)練的擴(kuò)散模型依然能夠重建人臉圖像(或臥室圖像)。從左到右展示的是優(yōu)化迭代過程中不同階段的中間重建結(jié)果?!窻eference」列表示干凈的真實(shí)圖像,「Measurement」列表示帶噪聲的觀測圖像。

首先展示一組很有沖擊力的實(shí)驗(yàn)。如上圖左下所示,在優(yōu)化初始噪聲(initial noise optimization)的框架下,使用只在 LSUN-bedroom 數(shù)據(jù)集上訓(xùn)練的 3 步 DDIM 擴(kuò)散模型可以重構(gòu) CelebA-HQ 數(shù)據(jù)集中的人臉圖像。

擴(kuò)散模型在初始階段只能生成模糊的臥室圖像,但隨著優(yōu)化不斷推進(jìn),原本只能生成臥室圖像的模型逐漸擺脫了低質(zhì)量結(jié)果和「臥室結(jié)構(gòu)」偏好,最終恢復(fù)出清晰且高質(zhì)量的人臉圖像。

同樣的,用只能生成人臉的擴(kuò)散模型,也可以有效重建臥室圖像??梢詮南旅娴膭?dòng)圖看到這個(gè)「臥室變臉」的過程。



這個(gè)現(xiàn)象在 X 上也引發(fā)了討論。有網(wǎng)友感嘆道:「一個(gè)只用臥室圖片訓(xùn)練的擴(kuò)散模型竟然能生成人臉,真的太嚇人了!」



這些現(xiàn)象進(jìn)一步引導(dǎo)團(tuán)隊(duì)思考這樣一個(gè)問題:在擴(kuò)散先驗(yàn)較弱且訓(xùn)練分布與目標(biāo)分布不匹配的情況下,圖像復(fù)原成功的機(jī)制究竟是什么?

現(xiàn)實(shí)問題:強(qiáng)先驗(yàn)并不總是存在

這樣的問題并不只是來自一些看起來「反直覺」的實(shí)驗(yàn)結(jié)果,更有明確的實(shí)際背景。在實(shí)際應(yīng)用中,并不總是有一個(gè)高質(zhì)量和數(shù)據(jù)匹配的先驗(yàn)?zāi)P停?/p>

  • 內(nèi)存和計(jì)算限制使得擴(kuò)散模型步數(shù)被截?cái)啵?/li>
  • 醫(yī)學(xué)成像、遙感成像、科學(xué)成像等場景中,目標(biāo)數(shù)據(jù)往往稀缺且分布特殊,很難專門訓(xùn)練一個(gè)完全匹配的生成模型。

這項(xiàng)研究旨在回答三個(gè)問題:

  • When(何時(shí)有效):弱 / 不匹配先驗(yàn)在什么條件下仍能實(shí)現(xiàn)高質(zhì)量重建?
  • Why(內(nèi)在機(jī)制):這種超越分布的魯棒性源自何處?
  • Limitations(失效邊界):這種能力在何時(shí)會(huì)達(dá)到極限?

核心結(jié)論:重建常是觀測主導(dǎo)的

當(dāng)觀測數(shù)據(jù)本身提供足夠充足的信息時(shí),重建過程將由觀測驅(qū)動(dòng)(observation-dominant)而非先驗(yàn)驅(qū)動(dòng)。因此,模型對(duì)先驗(yàn)的強(qiáng)弱和匹配度表現(xiàn)出顯著的不敏感性。

簡單來說,當(dāng)觀測數(shù)據(jù)維度高、強(qiáng)可辨識(shí)性、有效像素?cái)?shù)量多時(shí),后驗(yàn)分布會(huì)集中到真實(shí)解附近,即便先驗(yàn)較弱,也不會(huì)顯著影響最終結(jié)果。

這一觀點(diǎn)與傳統(tǒng)「先驗(yàn)決定一切」的觀點(diǎn)形成鮮明對(duì)比。

多任務(wù)實(shí)驗(yàn)全面驗(yàn)證

團(tuán)隊(duì)在圖像復(fù)原(inpainting)、高斯去模糊(Gaussian debluring)、超分辨率(super-resolution)、非線性去模糊(nonlinear debluring)等經(jīng)典圖像逆問題上進(jìn)行了大量的實(shí)驗(yàn),采用的擴(kuò)散模型和數(shù)據(jù)集包括 LSUN-bedroom、LSUN-church 和 CelebA-HQ。

實(shí)驗(yàn)結(jié)果顯示:

  • 在優(yōu)化初始噪聲的框架下,僅使用 3 步 DDIM 的弱先驗(yàn)擴(kuò)散模型在 PSNR、SSIM、LPIPS 等各項(xiàng)指標(biāo)上超過使用 1000 步模型的 baseline 方法;
  • 即使模型訓(xùn)練數(shù)據(jù)領(lǐng)域與圖像重建目標(biāo)領(lǐng)域完全不一樣,性能的下降也非常有限,甚至能夠超越領(lǐng)域一致和使用 1000 步模型的 baseline 方法。



跨數(shù)據(jù)領(lǐng)域的圖像修復(fù)與超分辨率結(jié)果對(duì)比。「Model」表示擴(kuò)散模型的訓(xùn)練數(shù)據(jù)來源(即先驗(yàn)的源領(lǐng)域),「CelebA」「Bedroom」「Church」表示被重建圖像的目標(biāo)領(lǐng)域。需要說明的是,baseline 方法 DPS 始終采用與目標(biāo)數(shù)據(jù)一致的領(lǐng)域內(nèi)模型。

理論突破:從貝葉斯后驗(yàn)集中 (Posterior Concentration) 解釋現(xiàn)象

為了理解這種現(xiàn)象,團(tuán)隊(duì)從貝葉斯視角出發(fā),基于高斯混合模型建立了一個(gè)高維逆問題的分析框架,在滿足一定的假設(shè)條件時(shí):

  • 后驗(yàn)分布會(huì)以維度的指數(shù)級(jí)速度集中在最匹配的重建圖像附近;
  • 當(dāng)觀測數(shù)據(jù)維度足夠高、包含信息足夠充分時(shí)(例如觀測到的像素、邊緣、紋理多),即使非常不同的先驗(yàn)分布,都會(huì)得到相似的重建圖像。

另外,團(tuán)隊(duì)在 LSUN-bedroom、LSUN-church 和 CelabA-HQ 等數(shù)據(jù)集上進(jìn)行了數(shù)據(jù)模擬,證明了上述理論分析的假設(shè)在實(shí)際數(shù)據(jù)和問題中的有效性。

弱先驗(yàn)?zāi)P偷氖н吔?/p>

值得注意的是,弱先驗(yàn)并非萬能,團(tuán)隊(duì)系統(tǒng)分析了其失敗場景。在觀測圖像信息不充分時(shí),例如大面積連續(xù)遮擋(box inpainting)和極端超分辨率(16x super-resolution)這些低信息量任務(wù)中,重建圖像將重新變得由先驗(yàn)主導(dǎo)(prior-dominant),在這種情況下強(qiáng)先驗(yàn)依然重要。

例如下圖最后一列,使用人臉模型重建的教堂圖像會(huì)出現(xiàn)明顯的人臉特征。



上半部分:60% x 60% 連續(xù)遮擋;下半部分:16 倍超分辨率。

結(jié)論

團(tuán)隊(duì)系統(tǒng)地研究了弱先驗(yàn)擴(kuò)散模型在逆問題中的應(yīng)用,從實(shí)驗(yàn)和理論上證明了其有效性,并展示了其典型的失敗模式,指出了清晰的應(yīng)用邊界,避免誤用。

這項(xiàng)工作為社區(qū)帶來的啟示可能遠(yuǎn)超算法本身:

  • 在觀測數(shù)據(jù)信息充分的情況下,弱先驗(yàn)比傳統(tǒng)認(rèn)知中更有效。當(dāng)使用者沒有一個(gè)非常匹配的強(qiáng)先驗(yàn)時(shí),可以使用弱先驗(yàn)進(jìn)行圖像重建;
  • 在未來的研究中,研究者或?qū)⒏嗟仃P(guān)注弱先驗(yàn),特別是少步數(shù)擴(kuò)散模型先驗(yàn)的相關(guān)算法,同時(shí)考慮將初始噪聲優(yōu)化和傳統(tǒng)算法結(jié)合。

作者介紹

本文共同第一作者為羅格斯大學(xué)計(jì)算機(jī)系博士生賈婧、統(tǒng)計(jì)系博士生袁偉。

其他作者包括杜克大學(xué)劉思繁、密歇根大學(xué)申荔月、羅格斯大學(xué)王冠揚(yáng)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
男籃3喜訊:徐杰打破新紀(jì)錄,郭士強(qiáng)看好3人,雙中鋒有望沖冠軍

男籃3喜訊:徐杰打破新紀(jì)錄,郭士強(qiáng)看好3人,雙中鋒有望沖冠軍

阿信點(diǎn)評(píng)
2026-03-10 00:06:14
從網(wǎng)絡(luò)中的伊朗,到人性下限的徹骨惡寒!

從網(wǎng)絡(luò)中的伊朗,到人性下限的徹骨惡寒!

胖胖說他不胖
2026-03-08 12:05:08
魯迅家是如何衰敗的?魯迅肯定不會(huì)告訴你,因?yàn)閷?shí)在“太丟人”

魯迅家是如何衰敗的?魯迅肯定不會(huì)告訴你,因?yàn)閷?shí)在“太丟人”

顧史
2026-03-02 10:46:01
14分完勝!騎士6人上雙復(fù)蘇:全場開心歡呼,哈登21+5迎里程碑

14分完勝!騎士6人上雙復(fù)蘇:全場開心歡呼,哈登21+5迎里程碑

體壇小李
2026-03-10 09:29:35
凱迪拉克凱威德預(yù)計(jì)4月底上市!網(wǎng)友:價(jià)格合適必火

凱迪拉克凱威德預(yù)計(jì)4月底上市!網(wǎng)友:價(jià)格合適必火

汽車網(wǎng)評(píng)
2026-03-09 21:34:33
繁華后的凄涼:耗資近34億的鳥巢,如今被用來干嘛了?回本了嗎?

繁華后的凄涼:耗資近34億的鳥巢,如今被用來干嘛了?回本了嗎?

小李子體育
2026-03-09 20:33:29
特朗普終于攤牌了:?;饡r(shí)間我和內(nèi)塔尼亞胡商量著辦但我最后拍板

特朗普終于攤牌了:停火時(shí)間我和內(nèi)塔尼亞胡商量著辦但我最后拍板

浯江孤舟
2026-03-10 09:40:22
羅永浩評(píng)三星S26 Ultra防窺屏:手機(jī)行業(yè)久違的創(chuàng)新

羅永浩評(píng)三星S26 Ultra防窺屏:手機(jī)行業(yè)久違的創(chuàng)新

CNMO科技
2026-03-09 13:37:17
G7會(huì)后稱暫不釋放油儲(chǔ),但“隨時(shí)準(zhǔn)備”采取必要措施支持全球能源供應(yīng)

G7會(huì)后稱暫不釋放油儲(chǔ),但“隨時(shí)準(zhǔn)備”采取必要措施支持全球能源供應(yīng)

華爾街見聞官方
2026-03-10 01:12:33
文身執(zhí)槍,為弟出征:三個(gè)孩子的母親,把悲痛活成鎧甲

文身執(zhí)槍,為弟出征:三個(gè)孩子的母親,把悲痛活成鎧甲

老馬拉車莫少裝
2026-03-09 13:23:02
大風(fēng)+降溫+降雨!冷空氣已到廣西,局地最低氣溫跌至個(gè)位數(shù)!陰冷持續(xù)多久?

大風(fēng)+降溫+降雨!冷空氣已到廣西,局地最低氣溫跌至個(gè)位數(shù)!陰冷持續(xù)多久?

南國今報(bào)
2026-03-09 17:52:05
國際油價(jià)反彈,WTI原油期貨漲幅擴(kuò)大至4%

國際油價(jià)反彈,WTI原油期貨漲幅擴(kuò)大至4%

每日經(jīng)濟(jì)新聞
2026-03-10 06:25:17
41萬ModelY新款上市,特斯拉嚇了車圈一跳!

41萬ModelY新款上市,特斯拉嚇了車圈一跳!

財(cái)經(jīng)三分鐘pro
2026-03-09 12:52:24
足總杯8強(qiáng)抽簽:軍城大戰(zhàn)!阿森納曼城預(yù)熱四線爭霸

足總杯8強(qiáng)抽簽:軍城大戰(zhàn)!阿森納曼城預(yù)熱四線爭霸

體壇周報(bào)
2026-03-10 07:31:17
哈梅內(nèi)伊兒子接班最高領(lǐng)袖,三種可能走勢,被斬首概率不高

哈梅內(nèi)伊兒子接班最高領(lǐng)袖,三種可能走勢,被斬首概率不高

黔有虎
2026-03-09 10:47:30
湯鎮(zhèn)業(yè)現(xiàn)狀:住青島20年,直言比香港好太多,如今一家8口很幸福

湯鎮(zhèn)業(yè)現(xiàn)狀:住青島20年,直言比香港好太多,如今一家8口很幸福

卷史
2026-03-09 16:20:22
韓國宣布實(shí)施“石油價(jià)格上限制度”

韓國宣布實(shí)施“石油價(jià)格上限制度”

界面新聞
2026-03-09 20:49:09
伊各方誓言贏得戰(zhàn)爭,美總統(tǒng)發(fā)出矛盾信息,哈梅內(nèi)伊次子當(dāng)選伊朗最高領(lǐng)袖

伊各方誓言贏得戰(zhàn)爭,美總統(tǒng)發(fā)出矛盾信息,哈梅內(nèi)伊次子當(dāng)選伊朗最高領(lǐng)袖

環(huán)球網(wǎng)資訊
2026-03-10 06:43:10
新疆昌吉州呼圖壁縣發(fā)生3.8級(jí)地震,震源深度19千米

新疆昌吉州呼圖壁縣發(fā)生3.8級(jí)地震,震源深度19千米

界面新聞
2026-03-10 08:16:42
伊朗網(wǎng)紅吐槽中國網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭的殘酷

伊朗網(wǎng)紅吐槽中國網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭的殘酷

世界圈
2026-03-08 10:20:26
2026-03-10 10:24:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12455文章數(shù) 142579關(guān)注度
往期回顧 全部

科技要聞

“龍蝦”狂歡,賣“飼料”的先掙錢了

頭條要聞

業(yè)主舉報(bào)違建次日接"鄰居"電話:連我媽在哪打拳都知道

頭條要聞

業(yè)主舉報(bào)違建次日接"鄰居"電話:連我媽在哪打拳都知道

體育要聞

韓國女足羨慕的奢侈品,為何選擇中國女足

娛樂要聞

薛之謙老婆懷二胎,現(xiàn)身產(chǎn)檢心情愉快

財(cái)經(jīng)要聞

全民"養(yǎng)龍蝦"背后 第一批受害者浮出水面

汽車要聞

對(duì)標(biāo)奔馳小號(hào)G級(jí) 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

游戲
手機(jī)
藝術(shù)
本地
公開課

《怪物獵人物語3:命運(yùn)雙龍》評(píng)測9分:融為一體

手機(jī)要聞

先導(dǎo)智能成為OPPO Find N6核心部件供應(yīng)商 芯片級(jí)高分子3D打印首次進(jìn)入手機(jī)量產(chǎn)

藝術(shù)要聞

30000畝杏花開了,才知道原來新疆的春天這么美!

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版