国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

QVGen讓「超低比特視頻生成量化」真正可用!

0
分享至



視頻生成擴(kuò)散模型越做越大:2B、5B、14B…… 效果提升很快,但訓(xùn)練與推理的成本也隨之飆升。社區(qū)一直希望用量化把模型 “壓小”,把顯存和算力成本打下來(lái),真正落到更多卡、更便宜的機(jī)器、更多真實(shí)應(yīng)用中?涩F(xiàn)實(shí)很殘酷:一到 3/4 bit,視頻生成的量化感知訓(xùn)練(QAT)往往比圖像更難訓(xùn)、更不穩(wěn)定,質(zhì)量掉得更狠 —— 不是 “略降一點(diǎn)”,而是直接不可用。



圖表 1 在 CogVideoX-2B 模型上 4-bit 逐通道權(quán)重量化與逐 token 激活量化的效果對(duì)比。(a)原始模型;(b)該論文所提出方案;(c-e)已有的量化感知訓(xùn)練方案;(f)已有的后訓(xùn)練量化方案。

香港科技大學(xué) & 北航 & 商湯等提出了一個(gè)專(zhuān)門(mén)面向視頻生成擴(kuò)散模型的 QAT 范式 ——QVGen,在 3-bit / 4-bit 都能把質(zhì)量拉回來(lái),并且讓 4-bit 首次接近全精度表現(xiàn)成為現(xiàn)實(shí)。該論文現(xiàn)已被 ICLR 高分接收:rebuttal 前 88666(top 1.4%),rebuttal 后 88886 (top 0.5%)。



  • 論文地址:https://arxiv.org/pdf/2505.11497
  • 代碼地址:https://github.com/ModelTC/QVGen
  • 模型地址:https://huggingface.co/collections/Harahan/qvgen



圖表 2 QVGen 論文框架圖。

為什么視頻擴(kuò)散模型一量化就容易 “崩”?

QVGen 的切入點(diǎn)很直接:視頻生成的 QAT 并不是把圖像擴(kuò)散的配方照搬過(guò)來(lái)就行。作者在論文里給了一個(gè)關(guān)鍵觀(guān)察(見(jiàn)圖表 3):在相近規(guī)模、相似訓(xùn)練設(shè)置下,視頻擴(kuò)散模型的梯度范數(shù)明顯更大,這會(huì)讓優(yōu)化過(guò)程更不穩(wěn)定,最終導(dǎo)致低比特訓(xùn)練難以收斂、生成質(zhì)量難以維持。

換句話(huà)說(shuō),如果不先解決 “訓(xùn)練不穩(wěn)” 這個(gè)根因,只靠常見(jiàn)量化技巧做修補(bǔ),視頻生成很難真正落地。



圖表 3 第一行為已有方案(藍(lán)色)與論文方案(黃色)在量化感知訓(xùn)練中的梯度范數(shù)比較;第二行為損失比較。左右分別為 CogVideoX-2B 和 Wan 1.3B 模型上的可視化。

QVGen 做對(duì)了什么:先把訓(xùn)練救穩(wěn),再把推理成本 “還回去”


QVGen 的核心思路是 “訓(xùn)練期做增強(qiáng)、推理期不背包袱”,它把一個(gè)看似矛盾的目標(biāo)拆成了兩步來(lái)解決 (見(jiàn)圖表 2)。

第一步,訓(xùn)練階段引入一個(gè)輔助模塊 Φ。這個(gè)模塊不是為了讓推理更重,而是為了在低比特條件下降低梯度范數(shù)、提升訓(xùn)練穩(wěn)定性,讓 3/4-bit 的 QAT 先 “訓(xùn)得動(dòng)、訓(xùn)得好”。此外,除了圖表 3 中的實(shí)驗(yàn)論證,在論文中還提供了詳細(xì)的理論證明。

第二步,訓(xùn)練過(guò)程中逐步移除 Φ,讓最終推理階段不再依賴(lài)這個(gè)模塊。作者的觀(guān)察是:隨著訓(xùn)練推進(jìn),Φ 的參數(shù)里會(huì)逐漸出現(xiàn)越來(lái)越多 “貢獻(xiàn)很小” 的成分。于是論文設(shè)計(jì)了 rank-decay:反復(fù)做分解,識(shí)別低影響的分量,并用基于秩的正則把這些分量逐步衰減到 0,直到 Φ 被完全消掉。最終效果是:推理階段幾乎不增加額外開(kāi)銷(xiāo),但訓(xùn)練階段又能獲得穩(wěn)定性紅利。

結(jié)果有多硬:4-bit 接近全精度,3-bit 也把指標(biāo)拉回 “可用區(qū)間”


在主實(shí)驗(yàn)中,QVGen 在 W4A4/W3A3 的設(shè)置下對(duì)比了多類(lèi)量化方法。論文給出的結(jié)論很清晰:很多方法在 4-bit 下仍有明顯退化,到了 3-bit 更加明顯;QVGen 在 3-bit 能大幅恢復(fù)質(zhì)量,在 4-bit 則可以做到接近全精度(見(jiàn)圖表 4)。

更關(guān)鍵的是,它不只在小模型上有效。論文還展示了在更大的視頻生成模型上(例如 5B、14B 級(jí)別,以及更高分辨率設(shè)置),4-bit 仍能保持接近全精度的總體水平(見(jiàn)圖表 5-6)。

該論文同時(shí)給出了大量定性樣例證明 “不是只在指標(biāo)上好看” (見(jiàn)圖表 7-8)。



圖表 4 對(duì)于 Wan 1.3B 和 CogVideoX-2B 模型,QVGen 與已有方案在 VBench 上的性能比較。



圖表 5 QVGen 在 Wan 14B 和 CogVideoX-5B 模型上的 VBench 結(jié)果。



圖表 6 QVGen 在 Wan 14B 和 CogVideoX-5B 模型上的 VBench-2.0 結(jié)果。



圖表 7 QVGen 與已有方案在 Wan 1.3B 上的可視化結(jié)果對(duì)比。



圖表 8 QVGen 在 Wan 14B 上的可視化結(jié)果。

不只是省顯存:它能帶來(lái)真實(shí)加速,還能和其他加速方法疊加


對(duì)部署來(lái)說(shuō),低比特的直接好處是顯存下降。論文報(bào)告量化后能夠帶來(lái)大幅的內(nèi)存節(jié)。ɡ 4× 級(jí)別的壓縮量級(jí)),從而讓同樣的模型更容易跑在更小的卡上,或者把 batch、分辨率等配置拉高。

更實(shí)際的一點(diǎn)是:QVGen 使用標(biāo)準(zhǔn)的均勻量化思路,意味著它可以更容易對(duì)接現(xiàn)有的 W4A4 推理內(nèi)核。論文也強(qiáng)調(diào)它和其他視頻生成加速方向是正交的:例如與某些 3D attention 加速方案疊加后,推理速度還能進(jìn)一步提升(見(jiàn)圖表 9)。



圖表 9 (左)模型大小對(duì)比; (中)模型加速對(duì)比;(右)與 attention 加速方案結(jié)合后加速對(duì)比。其中藍(lán)色代表 Wan 1.3B 模型,黃色代表 Wan 14B 模型。

訓(xùn)練成本會(huì)不會(huì)更高?論文給出的答案是 “幾乎不多花”

很多讀者會(huì)擔(dān)心:訓(xùn)練期加了 Φ、還要做 rank-decay,會(huì)不會(huì)導(dǎo)致訓(xùn)練成本暴漲?論文做了訓(xùn)練效率分析,結(jié)論是:相對(duì)一些蒸餾式 QAT 基線(xiàn),QVGen 的額外訓(xùn)練開(kāi)銷(xiāo)很。ɡ GPU-days、峰值顯存幾乎不變的量級(jí)),但在最終生成質(zhì)量上仍能拉開(kāi)明顯差距(見(jiàn)圖表 10)。



圖表 10 QVGen 與已有方法的訓(xùn)練時(shí)間和訓(xùn)練顯存開(kāi)銷(xiāo)對(duì)比。

總結(jié):視頻擴(kuò)散也能 4bit 接近滿(mǎn)血,先穩(wěn)訓(xùn)練再輕推理!


當(dāng)下視頻生成擴(kuò)散模型越來(lái)越大,但 3/4-bit 量化一落到視頻上,常見(jiàn)問(wèn)題是:QAT 訓(xùn)練不穩(wěn)定、收斂困難、畫(huà)質(zhì)明顯下滑。QVGen 的核心判斷很直接:視頻低比特量化的關(guān)鍵不只是 “怎么量化”,而是先把訓(xùn)練穩(wěn)定性問(wèn)題解決,否則再好的量化細(xì)節(jié)也很難落地。

在這一點(diǎn)上,QVGen 給出了一套完整范式,主要包括:

  • 訓(xùn)練期引入輔助模塊 Φ:用于降低梯度范數(shù)、提升低比特 QAT 的穩(wěn)定性,讓 3/4-bit 訓(xùn)練 “跑得起來(lái)、訓(xùn)得下去”;
  • rank-decay 逐步移除 Φ:訓(xùn)練過(guò)程中識(shí)別并衰減低貢獻(xiàn)成分,最終把 Φ 完全去掉,使推理階段幾乎不背額外負(fù)擔(dān);
  • 面向部署的低比特設(shè)置:支持 W4A4/W3A3,并強(qiáng)調(diào)可對(duì)接現(xiàn)有推理實(shí)現(xiàn);在顯存上帶來(lái)明顯下降,同時(shí)還能與其他推理加速方法疊加。

總體來(lái)看,QVGen 在 CogVideoX、Wan 等視頻擴(kuò)散模型上實(shí)現(xiàn)了 4-bit 接近全精度、3-bit 也能把質(zhì)量拉回可用區(qū)間的結(jié)果,并且訓(xùn)練額外開(kāi)銷(xiāo)很小。對(duì)希望把視頻生成模型從 “貴且難跑” 推進(jìn)到 “更省、更快、更好用” 的場(chǎng)景,這是一條很實(shí)用的路線(xiàn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗議會(huì)要員:伊朗已決定繼續(xù)與美國(guó)進(jìn)行談判

伊朗議會(huì)要員:伊朗已決定繼續(xù)與美國(guó)進(jìn)行談判

界面新聞
2026-04-20 15:20:30
米蘭賣(mài)淫網(wǎng)絡(luò)被端!高級(jí)應(yīng)召陪侍丑聞,波及冬奧運(yùn)動(dòng)員,涉50余意甲球員

米蘭賣(mài)淫網(wǎng)絡(luò)被端!高級(jí)應(yīng)召陪侍丑聞,波及冬奧運(yùn)動(dòng)員,涉50余意甲球員

意訊
2026-04-22 00:04:40
內(nèi)行人預(yù)測(cè):今年五一,或許會(huì)出現(xiàn)5大“怪現(xiàn)象”,個(gè)個(gè)很現(xiàn)實(shí)

內(nèi)行人預(yù)測(cè):今年五一,或許會(huì)出現(xiàn)5大“怪現(xiàn)象”,個(gè)個(gè)很現(xiàn)實(shí)

小談食刻美食
2026-04-19 08:33:31
雞排哥親戚全員上陣擺攤賣(mài)雞排,如今生意慘淡無(wú)人問(wèn)津

雞排哥親戚全員上陣擺攤賣(mài)雞排,如今生意慘淡無(wú)人問(wèn)津

映射生活的身影
2026-04-21 10:34:26
克雷桑險(xiǎn)被廢!楊帆飛鏟逃紅 ,媒體人集體開(kāi)炮:砸人飯碗該嚴(yán)打

克雷桑險(xiǎn)被廢!楊帆飛鏟逃紅 ,媒體人集體開(kāi)炮:砸人飯碗該嚴(yán)打

奧拜爾
2026-04-21 22:24:55
卡利巴夫抨擊伊朗強(qiáng)硬派,擔(dān)心自己被罷免,外長(zhǎng)阿拉格奇被趕下臺(tái)

卡利巴夫抨擊伊朗強(qiáng)硬派,擔(dān)心自己被罷免,外長(zhǎng)阿拉格奇被趕下臺(tái)

山河路口
2026-04-20 21:44:07
接替庫(kù)克!蘋(píng)果新任CEO特努斯是誰(shuí)?憑什么他能執(zhí)掌萬(wàn)億帝國(guó)?

接替庫(kù)克!蘋(píng)果新任CEO特努斯是誰(shuí)?憑什么他能執(zhí)掌萬(wàn)億帝國(guó)?

王爺說(shuō)圖表
2026-04-21 10:21:08
霍爾木茲海峽,重磅消息!特朗普,突發(fā)威脅!黃金、白銀,集體跳水!美股拉升

霍爾木茲海峽,重磅消息!特朗普,突發(fā)威脅!黃金、白銀,集體跳水!美股拉升

證券時(shí)報(bào)e公司
2026-04-21 22:24:27
我在中東教漢語(yǔ),娶了三個(gè)本地女孩,雖然年入百萬(wàn),卻并不幸福

我在中東教漢語(yǔ),娶了三個(gè)本地女孩,雖然年入百萬(wàn),卻并不幸福

千秋文化
2026-04-20 19:55:30
原來(lái)如此!張雪峰去世當(dāng)天吃午飯和搶救畫(huà)面流出!更多細(xì)節(jié)曝光

原來(lái)如此!張雪峰去世當(dāng)天吃午飯和搶救畫(huà)面流出!更多細(xì)節(jié)曝光

華人星光
2026-04-21 11:58:09
為什么國(guó)內(nèi)傾向選擇電動(dòng)自行車(chē),不傾向選擇摩托車(chē)?網(wǎng)友真相了

為什么國(guó)內(nèi)傾向選擇電動(dòng)自行車(chē),不傾向選擇摩托車(chē)?網(wǎng)友真相了

另子維愛(ài)讀史
2026-04-21 20:08:21
“葉祖新的臉怎么了”沖上熱搜,當(dāng)事人深夜發(fā)文:春天易敏,已無(wú)大礙,此前李現(xiàn)也中招

“葉祖新的臉怎么了”沖上熱搜,當(dāng)事人深夜發(fā)文:春天易敏,已無(wú)大礙,此前李現(xiàn)也中招

極目新聞
2026-04-21 09:09:59
鄭麗文對(duì)這個(gè)大陸姑娘“念念不忘”!

鄭麗文對(duì)這個(gè)大陸姑娘“念念不忘”!

新動(dòng)察
2026-04-21 10:17:57
美方扣押一艘中國(guó)駛來(lái)伊朗貨船,外交部:對(duì)美方強(qiáng)制截停有關(guān)船只表示關(guān)切

美方扣押一艘中國(guó)駛來(lái)伊朗貨船,外交部:對(duì)美方強(qiáng)制截停有關(guān)船只表示關(guān)切

澎湃新聞
2026-04-20 15:42:26
伊朗拒絕參與第二輪談判,萬(wàn)斯行程被擱置;特朗普認(rèn)為會(huì)達(dá)成協(xié)議

伊朗拒絕參與第二輪談判,萬(wàn)斯行程被擱置;特朗普認(rèn)為會(huì)達(dá)成協(xié)議

山河路口
2026-04-21 23:55:59
沖鋒衣含有PFAS到底是指什么?有哪些風(fēng)險(xiǎn)?

沖鋒衣含有PFAS到底是指什么?有哪些風(fēng)險(xiǎn)?

澎湃新聞
2026-04-20 23:02:09
長(zhǎng)得漂亮卻壞事做盡,3次入獄,被摘除4處器官的她,如今過(guò)得怎樣

長(zhǎng)得漂亮卻壞事做盡,3次入獄,被摘除4處器官的她,如今過(guò)得怎樣

夢(mèng)錄的西方史話(huà)
2026-04-21 14:45:18
40 集《蜜語(yǔ)紀(jì)》大結(jié)局!魯貞貞生下混血寶寶,聶予誠(chéng)徹底崩潰了

40 集《蜜語(yǔ)紀(jì)》大結(jié)局!魯貞貞生下混血寶寶,聶予誠(chéng)徹底崩潰了

小貓追劇
2026-04-20 12:01:42
普通家庭千萬(wàn)不要買(mǎi)“小聯(lián)排別墅”,看著很高級(jí),住著卻難受!

普通家庭千萬(wàn)不要買(mǎi)“小聯(lián)排別墅”,看著很高級(jí),住著卻難受!

裝修秀
2026-04-20 10:50:03
西蒙尼夫婦在馬德里投資房地產(chǎn)大賺,二人身家合計(jì)約4000萬(wàn)歐

西蒙尼夫婦在馬德里投資房地產(chǎn)大賺,二人身家合計(jì)約4000萬(wàn)歐

懂球帝
2026-04-21 09:39:09
2026-04-22 01:20:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12822文章數(shù) 142633關(guān)注度
往期回顧 全部

科技要聞

創(chuàng)造4萬(wàn)億帝國(guó)、訪(fǎng)華20次,庫(kù)克留下了什么

頭條要聞

三國(guó)取消飛航許可 賴(lài)清德無(wú)法竄訪(fǎng)斯威士蘭

頭條要聞

三國(guó)取消飛航許可 賴(lài)清德無(wú)法竄訪(fǎng)斯威士蘭

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂(lè)要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財(cái)經(jīng)要聞

現(xiàn)實(shí)是最大的荒誕:千億平臺(tái)的沖突始末

汽車(chē)要聞

全新坦克700正式上市 售價(jià)42.8萬(wàn)-50.8萬(wàn)元

態(tài)度原創(chuàng)

家居
藝術(shù)
時(shí)尚
房產(chǎn)
旅游

家居要聞

詩(shī)意光影 窺見(jiàn)自然之境

藝術(shù)要聞

任伯年寫(xiě)竹,真帶勁

頂流復(fù)工,已判若兩人

房產(chǎn)要聞

年薪40-50萬(wàn)!海南地產(chǎn)圈還在猛招人

旅游要聞

京城今春“濱水+”玩法迭代

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版