国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AdaGen: 讓圖像生成模型學(xué)會(huì)自適應(yīng)策略

0
分享至



當(dāng)前主流的圖像生成模型——擴(kuò)散模型(如 DiT)、自回歸模型(如 VAR)、掩碼生成模型(如 MaskGIT)、流模型(如 SiT)——都遵循一個(gè)共同范式:將復(fù)雜的圖像生成任務(wù)拆解為多個(gè)可控的子步驟,逐步迭代完成。然而,這種多步策略引入了一個(gè)不可忽視的問(wèn)題:每一步都需配置大量超參數(shù)(如噪聲水平、采樣溫度、引導(dǎo)尺度等),而現(xiàn)有方法普遍依賴(lài)手工設(shè)計(jì)的靜態(tài)調(diào)度規(guī)則來(lái)管理這些參數(shù)。

這種做法存在兩個(gè)重要缺陷:一是需要大量專(zhuān)家知識(shí)和反復(fù)調(diào)參,二是"一刀切"的靜態(tài)策略無(wú)法適配每個(gè)樣本的獨(dú)特特性。

本文提出AdaGen——一個(gè)通用的、可學(xué)習(xí)的、樣本自適應(yīng)的生成策略框架。通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)輕量級(jí)策略網(wǎng)絡(luò),AdaGen 能根據(jù)當(dāng)前生成狀態(tài)自動(dòng)為每個(gè)樣本定制最優(yōu)的生成策略,在四大主流生成范式上均實(shí)現(xiàn)了顯著的性能提升與效率優(yōu)化。

  • 論文標(biāo)題:
  • AdaGen: Learning Adaptive Policy for Image Synthesis
  • 論文鏈接:
  • https://arxiv.org/abs/2603.06993
  • 論文代碼:
  • https://github.com/LeapLabTHU/AdaGen

核心動(dòng)機(jī):從"靜態(tài)一刀切"到"動(dòng)態(tài)因材施教"



圖:AdaGen的核心思想?,F(xiàn)有方法使用預(yù)定義的靜態(tài)策略,所有樣本共享相同調(diào)度規(guī)則;AdaGen則通過(guò)RL訓(xùn)練的策略網(wǎng)絡(luò),為每個(gè)樣本自適應(yīng)地產(chǎn)生定制化的生成策略。

現(xiàn)有的多步生成模型在推理時(shí),所有樣本共享同一套預(yù)定義的調(diào)度規(guī)則。以 MaskGIT 為例,即使生成步數(shù)為 T = 16,也需要配置 64 個(gè)策略參數(shù)(每步 4 個(gè)參數(shù)),實(shí)際操作中極度依賴(lài)人工經(jīng)驗(yàn)。更關(guān)鍵的是,一張簡(jiǎn)單的風(fēng)景圖和一張復(fù)雜的人物肖像,真的應(yīng)該用完全相同的生成策略嗎?

AdaGen 的核心思想非常直觀:引入一個(gè)通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的策略網(wǎng)絡(luò)(Policy Network),讓它觀察當(dāng)前的生成狀態(tài),自動(dòng)且自適應(yīng)地為每個(gè)樣本決定最優(yōu)的生成參數(shù)。

統(tǒng)一 MDP 建模:一個(gè)框架統(tǒng)一四大生成范式







狀態(tài)轉(zhuǎn)移 (Transition):由預(yù)訓(xùn)練的生成模型決定。擴(kuò)散模型和流模型的轉(zhuǎn)移由 ODE 求解器確定,是確定性的;MaskGIT 和自回歸模型的轉(zhuǎn)移則是隨機(jī)的





對(duì)抗獎(jiǎng)勵(lì)建模:不讓策略"投機(jī)取巧"

訓(xùn)練策略網(wǎng)絡(luò)的另一個(gè)核心挑戰(zhàn)在于:如何設(shè)計(jì)有效的獎(jiǎng)勵(lì)信號(hào)?論文探索了三種方案,揭示了一個(gè)重要發(fā)現(xiàn):



圖:三種獎(jiǎng)勵(lì)設(shè)計(jì)的對(duì)比。(a) 用FID作獎(jiǎng)勵(lì):FID雖低至2.56,但圖像質(zhì)量差,保真度不達(dá)標(biāo);(b) 用預(yù)訓(xùn)練獎(jiǎng)勵(lì)模型:保真度好了但樣本多樣性嚴(yán)重不足;(c) AdaGen的對(duì)抗獎(jiǎng)勵(lì)建模:保真度與多樣性兼顧。

(a) 用 FID 作獎(jiǎng)勵(lì):雖然 FID 數(shù)值可以被優(yōu)化到很低(2.56),但生成圖像的視覺(jué)質(zhì)量反而很差。策略網(wǎng)絡(luò)學(xué)會(huì)了"刷"指標(biāo)的捷徑,犧牲了視覺(jué)保真度。

(b) 用預(yù)訓(xùn)練獎(jiǎng)勵(lì)模型:保真度上去了,但生成樣本趨于同質(zhì)化,多樣性嚴(yán)重不足。策略過(guò)擬合于獎(jiǎng)勵(lì)模型的偏好。

(c) 對(duì)抗獎(jiǎng)勵(lì)建模(AdaGen 的方案):引入一個(gè)判別器作為獎(jiǎng)勵(lì)模型,與策略網(wǎng)絡(luò)進(jìn)行對(duì)抗訓(xùn)練。策略網(wǎng)絡(luò)試圖最大化獎(jiǎng)勵(lì),而判別器則不斷提高區(qū)分真假圖像的標(biāo)準(zhǔn),有效防止策略過(guò)擬合。最終實(shí)現(xiàn)了保真度與多樣性的良好平衡。



圖:AdaGen的訓(xùn)練流程。策略網(wǎng)絡(luò)控制生成過(guò)程產(chǎn)生圖像,對(duì)抗獎(jiǎng)勵(lì)模型同時(shí)評(píng)估生成結(jié)果并不斷自我進(jìn)化。預(yù)訓(xùn)練生成模型在整個(gè)過(guò)程中保持凍結(jié)。

訓(xùn)練算法簡(jiǎn)潔優(yōu)雅,核心循環(huán)僅包含兩步:(1) 策略網(wǎng)絡(luò)優(yōu)化:生成圖像,用 PPO 算法更新策略網(wǎng)絡(luò)使獎(jiǎng)勵(lì)最大化;(2) 獎(jiǎng)勵(lì)模型優(yōu)化:同時(shí)采樣真實(shí)和生成圖像,訓(xùn)練判別器更好地區(qū)分兩者。兩者交替進(jìn)行,形成類(lèi)似 GAN 的博弈過(guò)程。

動(dòng)作平滑:馴服高維動(dòng)作空間的探索





圖:優(yōu)化過(guò)程。當(dāng)生成步數(shù)從T=8增加到T=32時(shí)(黃色曲線(xiàn)),優(yōu)化變得不穩(wěn)定且性能下降。引入動(dòng)作平滑后(紅色曲線(xiàn)),訓(xùn)練恢復(fù)穩(wěn)定且性能超越T=8基線(xiàn)。

論文發(fā)現(xiàn),不穩(wěn)定性的根源在于 PPO 探索時(shí)對(duì)每步獨(dú)立添加高斯噪聲,導(dǎo)致動(dòng)作序列出現(xiàn)劇烈且不必要的高頻波動(dòng)。而對(duì)于逐步推進(jìn)的迭代生成過(guò)程,最優(yōu)策略往往是平滑變化的。為此,論文提出動(dòng)作平滑技術(shù)——對(duì)策略輸出施加指數(shù)移動(dòng)平均(EMA)濾波:







圖:動(dòng)作平滑前后的對(duì)比。左側(cè)未平滑時(shí),動(dòng)作序列劇烈抖動(dòng)(FID=3.5);右側(cè)引入平滑后,序列合理平穩(wěn)(FID=2.3)。

上圖直觀對(duì)比了平滑前后的效果:從雜亂無(wú)章的鋸齒波到平滑有序的下降曲線(xiàn),F(xiàn)ID 也從 3.5 降至 2.3。

實(shí)驗(yàn)結(jié)果:四大范式全面提升

跨范式有效性驗(yàn)證

AdaGen 在 ImageNet 256×256 上跨越四大生成范式、六個(gè)模型進(jìn)行了驗(yàn)證。在所有范式和推理步數(shù)下,AdaGen 均一致超越對(duì)應(yīng)的基線(xiàn)方法,且性能增益在推理步數(shù)較少時(shí)更為顯著:



表:AdaGen 在 ImageNet 256×256 上的 FID-50K 結(jié)果(↓越低越好),覆蓋四大生成范式。注:MaskGIT、DiT、SiT 在不同推理步數(shù) T 下評(píng)測(cè);VAR 采用固定的 10 步生成,因此僅在 T=10 列報(bào)告結(jié)果。

效率優(yōu)勢(shì)



圖:AdaGen在四種模型上的質(zhì)量-效率權(quán)衡。無(wú)論是理論計(jì)算量(TFLOPs)還是實(shí)際GPU/CPU推理時(shí)延,AdaGen均能推進(jìn)質(zhì)量-效率前沿,實(shí)現(xiàn)1.6×到3.6×的推理加速。

上圖系統(tǒng)展示了 AdaGen 在四種生成模型上的質(zhì)量-效率權(quán)衡。無(wú)論是理論計(jì)算量還是實(shí)際推理延遲,AdaGen 均一致推進(jìn)了質(zhì)量-效率前沿,實(shí)現(xiàn)1.6× 到 3.6×的推理加速。

極低的額外開(kāi)銷(xiāo)

AdaGen 的策略網(wǎng)絡(luò)僅為生成器增加0.07% 到 0.40%的額外推理計(jì)算量,因此其性能提升并不以增大推理開(kāi)銷(xiāo)為代價(jià):



表:AdaGen 策略網(wǎng)絡(luò)的推理開(kāi)銷(xiāo)占生成器總計(jì)算量的比例。

結(jié)語(yǔ)

AdaGen 將生成策略的設(shè)計(jì)從"手工藝術(shù)"轉(zhuǎn)變?yōu)?數(shù)據(jù)驅(qū)動(dòng)的優(yōu)化問(wèn)題"。通過(guò)統(tǒng)一的 MDP 建模、對(duì)抗獎(jiǎng)勵(lì)設(shè)計(jì)和動(dòng)作平滑技術(shù),AdaGen 以一種輕量、通用的方式,在四大主流生成范式上實(shí)現(xiàn)了 17% 到 54% 的性能提升,或 1.6× 到 3.6× 的推理加速。這一工作表明,多步生成模型的潛力遠(yuǎn)未被充分挖掘——一個(gè)好的"調(diào)度策略",和模型架構(gòu)本身同樣重要。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
李雨桐被拘!官方下場(chǎng),曾自曝背后靠山大,拘留10天,逾期還罰款

李雨桐被拘!官方下場(chǎng),曾自曝背后靠山大,拘留10天,逾期還罰款

離離言幾許
2026-04-19 17:49:44
綠軍123-91大勝76人!我不得不承認(rèn)5個(gè)現(xiàn)實(shí):東部冠軍懸念不大

綠軍123-91大勝76人!我不得不承認(rèn)5個(gè)現(xiàn)實(shí):東部冠軍懸念不大

毒舌NBA
2026-04-20 04:55:07
珠海家長(zhǎng):自家孩子趴桌睡,憑啥先給別人捐躺椅?官方回應(yīng)

珠海家長(zhǎng):自家孩子趴桌睡,憑啥先給別人捐躺椅?官方回應(yīng)

南方都市報(bào)
2026-04-17 15:48:13
金像獎(jiǎng)獲獎(jiǎng)名單出爐:梁家輝五封影帝,章子怡馬麗坐了一晚冷板凳

金像獎(jiǎng)獲獎(jiǎng)名單出爐:梁家輝五封影帝,章子怡馬麗坐了一晚冷板凳

萌神木木
2026-04-19 22:54:32
寵物食品品牌“誠(chéng)實(shí)一口”翻車(chē),創(chuàng)始人深夜致歉!其公司注冊(cè)資本3年增長(zhǎng)137倍

寵物食品品牌“誠(chéng)實(shí)一口”翻車(chē),創(chuàng)始人深夜致歉!其公司注冊(cè)資本3年增長(zhǎng)137倍

半島官網(wǎng)
2026-04-18 05:58:14
5月1日起物業(yè)行業(yè)徹底大變天!新規(guī)落地,業(yè)主終于不用再忍氣吞聲

5月1日起物業(yè)行業(yè)徹底大變天!新規(guī)落地,業(yè)主終于不用再忍氣吞聲

另子維愛(ài)讀史
2026-04-19 19:37:43
57歲好萊塢女星太敢說(shuō):自曝生猛夫妻生活,不用生娃更盡興

57歲好萊塢女星太敢說(shuō):自曝生猛夫妻生活,不用生娃更盡興

橙星文娛
2026-04-18 16:47:02
以色列已失控?以軍炮打聯(lián)合國(guó)維和部隊(duì),法軍犧牲,馬克龍表態(tài)

以色列已失控?以軍炮打聯(lián)合國(guó)維和部隊(duì),法軍犧牲,馬克龍表態(tài)

來(lái)科點(diǎn)譜
2026-04-19 07:15:46
馬蹄露自薦做團(tuán)長(zhǎng)后續(xù)!張敬軒粉絲不忍了,開(kāi)始發(fā)文攻擊了

馬蹄露自薦做團(tuán)長(zhǎng)后續(xù)!張敬軒粉絲不忍了,開(kāi)始發(fā)文攻擊了

小徐講八卦
2026-04-19 11:27:40
印度油輪霍爾木茲海峽遭炮擊,船員喊話(huà)錄音:你們批準(zhǔn)我們通行,卻又向我們開(kāi)火

印度油輪霍爾木茲海峽遭炮擊,船員喊話(huà)錄音:你們批準(zhǔn)我們通行,卻又向我們開(kāi)火

紅星新聞
2026-04-19 17:03:18
4月19日最新油價(jià),國(guó)際油價(jià)大降21.8%,國(guó)內(nèi)汽柴油“顯著”下跌中

4月19日最新油價(jià),國(guó)際油價(jià)大降21.8%,國(guó)內(nèi)汽柴油“顯著”下跌中

豬友巴巴
2026-04-19 17:30:03
河南周口鄲城,又出現(xiàn)“資金盤(pán)暴雷”,全國(guó)涉案金額幾百億。

河南周口鄲城,又出現(xiàn)“資金盤(pán)暴雷”,全國(guó)涉案金額幾百億。

火山雜談
2026-04-18 22:59:15
特朗普:美軍武力攔截并控制一艘伊朗貨船

特朗普:美軍武力攔截并控制一艘伊朗貨船

新華社
2026-04-20 04:31:03
胡錫進(jìn)以安全代言沃爾沃,是整個(gè)社會(huì)的恥辱

胡錫進(jìn)以安全代言沃爾沃,是整個(gè)社會(huì)的恥辱

黔有虎
2026-04-19 17:34:12
為什么腦梗逐年增多?提醒:與肥肉無(wú)關(guān),有一樣?xùn)|西要少碰

為什么腦梗逐年增多?提醒:與肥肉無(wú)關(guān),有一樣?xùn)|西要少碰

芹姐說(shuō)生活
2026-04-19 08:33:41
廣西欽州一女子后悔砌墻,多次舉報(bào)自己違建,當(dāng)事人:70多歲了上下樓吃力,想在樓后加裝電梯,但因左右建了墻,根本無(wú)法施工

廣西欽州一女子后悔砌墻,多次舉報(bào)自己違建,當(dāng)事人:70多歲了上下樓吃力,想在樓后加裝電梯,但因左右建了墻,根本無(wú)法施工

觀威海
2026-04-19 14:28:11
越南百億高鐵訂單給德國(guó),來(lái)華體驗(yàn)12小時(shí)高鐵,背后算計(jì)太明顯

越南百億高鐵訂單給德國(guó),來(lái)華體驗(yàn)12小時(shí)高鐵,背后算計(jì)太明顯

混沌錄
2026-04-19 17:27:06
10倍牛股爆雷 ,虛增營(yíng)收和利潤(rùn) ,涉及商業(yè)航天概念,股票將被ST

10倍牛股爆雷 ,虛增營(yíng)收和利潤(rùn) ,涉及商業(yè)航天概念,股票將被ST

每日經(jīng)濟(jì)新聞
2026-04-19 20:03:49
全國(guó)各地區(qū)人均居民存款排行:北京領(lǐng)跑,浙江亮眼,東北三省也很高

全國(guó)各地區(qū)人均居民存款排行:北京領(lǐng)跑,浙江亮眼,東北三省也很高

戶(hù)外釣魚(yú)哥阿旱
2026-04-18 12:49:37
文班首場(chǎng)季后賽14分3帽!兩節(jié)就把聯(lián)盟未來(lái)扛肩上

文班首場(chǎng)季后賽14分3帽!兩節(jié)就把聯(lián)盟未來(lái)扛肩上

茅塞盾開(kāi)本尊
2026-04-19 20:31:44
2026-04-20 06:48:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12795文章數(shù) 142632關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類(lèi)紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂(lè)要聞

何潤(rùn)東漲粉百萬(wàn)!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車(chē)要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買(mǎi)?

態(tài)度原創(chuàng)

游戲
家居
藝術(shù)
手機(jī)
公開(kāi)課

"二次元GTA"直播爆了:疑似貼臉嘲諷其他二游!

家居要聞

法式線(xiàn)條 時(shí)光靜淌

藝術(shù)要聞

蒲華寫(xiě)水仙,清健嫵媚

手機(jī)要聞

8.8英寸小鋼炮!REDMI K Pad 2核心配置揭曉

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版