国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

單卡2秒生成一個(gè)視頻!清華聯(lián)手生數(shù)開源TurboDiffusion

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

現(xiàn)在生成一個(gè)視頻,比你刷視頻還要快。

因?yàn)橐粋€(gè)開源新框架,竟能讓視頻生成在保證質(zhì)量的情況下,最高提速200多倍!

而且還是單張顯卡就能hold住的那種,來感受一下這個(gè)feel:



沒錯(cuò),原先1.3B-480P在單張RTX 5090生成一個(gè)5秒的視頻,需要的時(shí)間大概是184秒。

而現(xiàn)在,只需要1.9秒,速度足足提升97倍!

這背后,便是清華大學(xué)TSAIL實(shí)驗(yàn)室和生數(shù)科技聯(lián)合開源的視頻生成加速新框架——TurboDiffusion



新框架一出,網(wǎng)友們也是不淡定了,直呼:

  • 我們已經(jīng)進(jìn)入到了生成的視頻比看的視頻還多的時(shí)代。



包括Meta研究員和伯克利教授也站臺(tái)打call:



2秒就能生成一個(gè)視頻

過去,視頻生成雖然驚艷,但慢,一直是個(gè)老大難的痛點(diǎn)問題。

想生成一段幾秒的高質(zhì)量視頻,模型往往需要在大顯存高端顯卡上吭哧吭哧跑上幾分鐘到幾十分鐘。這種延遲,極大限制了創(chuàng)作者的靈感爆發(fā)和實(shí)時(shí)交互的可能性。

TurboDiffusion的出現(xiàn),就是為了解決這個(gè)問題。

咱們直接看一組數(shù)據(jù)。

在單張RTX 5090上,針對(duì)1.3B大小的文生視頻模型:

  • 原始生成:生成一段480P視頻需要約184秒(超過3分鐘)。
  • TurboDiffusion:僅需1.9秒。



算下來,相對(duì)于原始模型,TurboDiffusion實(shí)現(xiàn)了約97倍的加速!

若是模型再大一些,例如14B的圖生視頻模型,清晰度為720P,效果也是立竿見影,僅需38秒就能搞定:



同樣是720P的文生視頻模型,所需要的時(shí)間也僅僅24秒:



圖生視頻中14B的480P則需9.9秒:



更重要的是,這種提速是幾乎無損的。

在生數(shù)科技自研的Vidu模型上,使用了TurboDiffusion之后,視頻的動(dòng)態(tài)流暢度、光影質(zhì)感以及指令遵循能力依然保持了極高水準(zhǔn)。

在生成1080P分辨率、8秒時(shí)長的高質(zhì)量視頻時(shí),相比沒有任何推理加速優(yōu)化的視頻生成,TurboDiffusion可以將端到端的生成延遲從900s提速到8s



視頻地址:https://mp.weixin.qq.com/s/AQ3c0Jewh1k2FRmLkWF2TQ

不同大小和清晰度,TurboDiffusion加速的效果可以總結(jié)如下:



并且TurboDiffusion操作起來也是非常簡單,它針對(duì)目前主流的視頻生成模型提供了開箱即用的優(yōu)化方案。

在GitHub中,TurboDiffusion項(xiàng)目也給出了具體的操作細(xì)節(jié)和方式:



那么問題來了,這種速度到底是如何做到的?

四個(gè)步驟極限壓縮時(shí)間

視頻生成模型(通常是Diffusion Transformer架構(gòu))之所以慢,主要卡在步數(shù)多(采樣循環(huán))、算力重(Attention計(jì)算)、顯存窄(權(quán)重搬運(yùn))。

為此,TurboDiffusion團(tuán)隊(duì)整合了四項(xiàng)關(guān)鍵技術(shù),每一項(xiàng)都精準(zhǔn)打擊擴(kuò)散模型推理的性能瓶頸。

首先就是SageAttention。

注意力機(jī)制可以說是擴(kuò)散模型中最耗時(shí)的部分之一,傳統(tǒng)實(shí)現(xiàn)使用 FP16(半精度浮點(diǎn)),計(jì)算量大、顯存占用高。

TurboDiffusion引入了團(tuán)隊(duì)自研的SageAttention2++,一種低比特量化注意力方案。

它將權(quán)重和激活值壓縮到INT8甚至INT4,同時(shí)通過異常值平滑和線程級(jí)量化技術(shù),避免精度崩塌。

從結(jié)果上來看,注意力計(jì)算速度提升3–5倍,顯存占用減半,而圖像質(zhì)量幾乎不變。

其次是Sparse-Linear Attention(SLA)

如果說 SageAttention 是在單次計(jì)算上提速,那么SLA就是從算法邏輯上減負(fù)。

SLA結(jié)合了稀疏性(只關(guān)注重要的像素點(diǎn))和線性復(fù)雜度(讓計(jì)算量不隨分辨率爆炸增長)。

最絕的一點(diǎn)是:稀疏計(jì)算與低比特加速是正交的。這意味著 SLA 可以直接疊在 SageAttention 之上使用,強(qiáng)強(qiáng)聯(lián)手,在推理過程中又榨出了數(shù)倍的額外加速空間。

第三招是rCM步數(shù)蒸餾。

傳統(tǒng)的擴(kuò)散模型需要經(jīng)過幾十甚至上百步的迭代才能去噪生成圖像。

TurboDiffusion引入了rCM(Score-regularized Continuous-time Consistency Models) 進(jìn)行步數(shù)蒸餾。

rCM是目前最先進(jìn)的蒸餾方案之一。通過它,原本需要幾十步才能生成的視頻,現(xiàn)在只需要1-4步就能達(dá)到幾乎相同的質(zhì)量。

最后便是W8A8 量化+自定義算子

除了注意力,模型中的線性層(Linear Layer)也占大量計(jì)算。TurboDiffusion對(duì)其采用W8A8量化(權(quán)重8位,激活8位),并在128×128的塊粒度上分塊處理,充分利用RTX 5090的INT8 Tensor Core。

此外,團(tuán)隊(duì)還用Triton/CUDA重寫了LayerNorm、RMSNorm等基礎(chǔ)算子,消除PyTorch默認(rèn)實(shí)現(xiàn)的overhead。

這四項(xiàng)技術(shù)環(huán)環(huán)相扣:蒸餾減步數(shù),量化減負(fù)載,SLA和SageAttention減算力。最終匯聚成了那驚人的200倍加速。



這4項(xiàng)核心技術(shù)均由清華大學(xué)TSAIL團(tuán)隊(duì)聯(lián)合生數(shù)科技自主研發(fā),它的意義遠(yuǎn)不止于技術(shù)指標(biāo)的躍升,更在于它打通了視頻生成模型從研究到落地的最后一公里:

  • 消費(fèi)級(jí)部署成為可能:在單張RTX 5090上,720P視頻生成時(shí)間從幾百秒降至幾十秒,真正實(shí)現(xiàn)秒級(jí)出片,為個(gè)人創(chuàng)作者、中小企業(yè)提供可用工具。
  • 云端推理成本驟降:推理時(shí)延降低100倍,意味著同等算力可服務(wù)100倍用戶,大幅降低云廠商與SaaS平臺(tái)的運(yùn)營成本。
  • 推動(dòng) AIGC 產(chǎn)品創(chuàng)新:實(shí)時(shí)視頻編輯、交互式視頻生成、AI 短劇自動(dòng)制作等新場(chǎng)景成為可能,催生全新產(chǎn)品形態(tài)。
  • 國產(chǎn)芯片友好:低比特、稀疏化、算子定制等特性天然適配國產(chǎn)AI芯片架構(gòu),助力中國AI基礎(chǔ)設(shè)施自主可控。

其中,SageAttention更是全球首個(gè)實(shí)現(xiàn)注意力計(jì)算量化加速的技術(shù)方案,已被工業(yè)界大規(guī)模部署應(yīng)用。

例如,SageAttention已成功集成至NVIDIA推理引擎Tensor RT,同時(shí)完成在華為昇騰、摩爾線程S6000等主流GPU平臺(tái)的部署與落地。

此外,騰訊混元、字節(jié)豆包、阿里Tora、生數(shù)Vidu、智譜清影、百度飛槳、昆侖萬維、Google Veo3、商湯、vLLM 等國內(nèi)外頭部科技企業(yè)及團(tuán)隊(duì),均已在核心產(chǎn)品中應(yīng)用該技術(shù),憑借其卓越性能創(chuàng)造了可觀的經(jīng)濟(jì)效益。

視頻生成,離實(shí)時(shí)更近了

從1小時(shí)到2秒,TurboDiffusion完成的不僅是一次技術(shù)突破,更是一次范式轉(zhuǎn)移。

它證明了高質(zhì)量 AI 視頻,不必以犧牲效率為代價(jià)。當(dāng)生成速度進(jìn)入人類反應(yīng)時(shí)間范圍(<5秒),AI 就不再是后期工具,而成為創(chuàng)作伙伴——你說話,它就動(dòng);你畫草圖,它就演故事。

這或許就是實(shí)時(shí)生成時(shí)代的真正含義:創(chuàng)作的延遲被抹平,想象力成為唯一的限制。

而現(xiàn)在,我們離那個(gè)時(shí)代,只有2秒。

項(xiàng)目地址放下面了,感興趣的小伙伴抓緊體驗(yàn)一下吧~

TurboDiffusion項(xiàng)目地址:
https://github.com/thu-ml/TurboDiffusion?tab=readme-ov-file

論文地址:
https://arxiv.org/pdf/2512.16093

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我70歲才明白:孩子不尊重你,無需翻臉,用“烏鴉定律”就行

我70歲才明白:孩子不尊重你,無需翻臉,用“烏鴉定律”就行

蘭姐說故事
2026-01-03 17:40:03
美國扣押俄羅斯油輪

美國扣押俄羅斯油輪

新華社
2026-01-07 22:25:03
冷空氣馬上到,廣東最低-4℃!寒潮帽子這樣戴,護(hù)好腦血管

冷空氣馬上到,廣東最低-4℃!寒潮帽子這樣戴,護(hù)好腦血管

城事特搜
2026-01-07 19:25:53
徐靜蕾素顏買菜像大媽,黃立行全白頭,16年不婚活成贏家

徐靜蕾素顏買菜像大媽,黃立行全白頭,16年不婚活成贏家

阿廢冷眼觀察所
2026-01-07 09:31:49
項(xiàng)立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

項(xiàng)立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

讀鬼筆記
2026-01-06 19:42:20
剪短頭發(fā)并染回黑色,呂焯毅:進(jìn)入國家隊(duì),精神面貌很重要

剪短頭發(fā)并染回黑色,呂焯毅:進(jìn)入國家隊(duì),精神面貌很重要

懂球帝
2026-01-07 12:56:05
事件升級(jí)!司曉迪曬開房記錄,16個(gè)男頂流被錘!內(nèi)娛徹底玩完

事件升級(jí)!司曉迪曬開房記錄,16個(gè)男頂流被錘!內(nèi)娛徹底玩完

小玡說故事
2026-01-06 10:02:21
閆學(xué)晶報(bào)應(yīng)來了!代言品牌或要解約,評(píng)論區(qū)淪陷,春晚節(jié)目疑落空

閆學(xué)晶報(bào)應(yīng)來了!代言品牌或要解約,評(píng)論區(qū)淪陷,春晚節(jié)目疑落空

小徐講八卦
2026-01-06 08:32:20
美以打擊伊朗“鐵拳行動(dòng)”進(jìn)入倒計(jì)時(shí),哈梅內(nèi)衣欲逃往莫斯科

美以打擊伊朗“鐵拳行動(dòng)”進(jìn)入倒計(jì)時(shí),哈梅內(nèi)衣欲逃往莫斯科

史政先鋒
2026-01-06 22:31:31
廣東5分險(xiǎn)勝深圳引熱議!徐杰關(guān)鍵拋投殺死比賽引媒體人狂贊

廣東5分險(xiǎn)勝深圳引熱議!徐杰關(guān)鍵拋投殺死比賽引媒體人狂贊

狼叔評(píng)論
2026-01-07 22:30:11
為什么紅軍到了陜北,就安全了?原因很現(xiàn)實(shí),6個(gè)原因

為什么紅軍到了陜北,就安全了?原因很現(xiàn)實(shí),6個(gè)原因

沈言論
2026-01-01 15:40:03
大陸博主曝光“臺(tái)獨(dú)”頑固分子沈伯洋住處和工作場(chǎng)所,國臺(tái)辦回應(yīng)

大陸博主曝光“臺(tái)獨(dú)”頑固分子沈伯洋住處和工作場(chǎng)所,國臺(tái)辦回應(yīng)

界面新聞
2026-01-07 10:59:20
特朗普強(qiáng)硬表態(tài),誰敢攔截對(duì)臺(tái)軍售就對(duì)誰開戰(zhàn),美國軍工股暴漲

特朗普強(qiáng)硬表態(tài),誰敢攔截對(duì)臺(tái)軍售就對(duì)誰開戰(zhàn),美國軍工股暴漲

我心縱橫天地間
2026-01-07 16:57:21
芬蘭公司宣布量產(chǎn)全球首款全固態(tài)電池,5分鐘可充滿,能量密度400Wh/kg

芬蘭公司宣布量產(chǎn)全球首款全固態(tài)電池,5分鐘可充滿,能量密度400Wh/kg

金融界
2026-01-06 14:03:20
又是全球銷冠!特斯拉Model Y:他們都不看好你,可你偏偏最爭氣

又是全球銷冠!特斯拉Model Y:他們都不看好你,可你偏偏最爭氣

鄰章
2026-01-05 10:32:05
新年第一瓜,老王的小嬌妻留不住了!

新年第一瓜,老王的小嬌妻留不住了!

仕道
2026-01-07 10:29:10
3厘米厚的保命門竟敞開!馬杜羅最絕望的瞬間,不是美軍兵臨城下

3厘米厚的保命門竟敞開!馬杜羅最絕望的瞬間,不是美軍兵臨城下

達(dá)文西看世界
2026-01-07 16:49:37
文件下發(fā)已逾半月,多地觀望小貸公司12%“降息”指引,執(zhí)行節(jié)奏將成關(guān)鍵

文件下發(fā)已逾半月,多地觀望小貸公司12%“降息”指引,執(zhí)行節(jié)奏將成關(guān)鍵

財(cái)聯(lián)社
2026-01-07 21:26:04
風(fēng)向不對(duì)!網(wǎng)上現(xiàn)大量“美國只斬首,不傷平民”言論,值得警惕

風(fēng)向不對(duì)!網(wǎng)上現(xiàn)大量“美國只斬首,不傷平民”言論,值得警惕

消失的電波
2026-01-06 14:11:46
河北被看見了,希望河北不僅僅是被看見

河北被看見了,希望河北不僅僅是被看見

林中木白
2026-01-06 15:16:30
2026-01-08 00:15:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11983文章數(shù) 176356關(guān)注度
往期回顧 全部

數(shù)碼要聞

全球首款模塊化手機(jī)手柄,蓋世小雞聯(lián)合Hyperkin推出X5 Alteron

頭條要聞

委向美移交5000萬桶原油有部分原本銷往中國 中方回應(yīng)

頭條要聞

委向美移交5000萬桶原油有部分原本銷往中國 中方回應(yīng)

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

《馬背搖籃》首播,革命的樂觀主義故事

財(cái)經(jīng)要聞

農(nóng)大教授科普:無需過度擔(dān)憂蔬菜農(nóng)殘

科技要聞

精華!黃仁勛CES記者會(huì):揭秘新款大殺器

汽車要聞

燃油駕趣+智能電感雙Buff 試駕全新奧迪Q5L

態(tài)度原創(chuàng)

教育
家居
健康
游戲
時(shí)尚

教育要聞

中等生的“勤奮”,為何毫無回報(bào)

家居要聞

寧靜不單調(diào) 恰到好處的美

這些新療法,讓化療不再那么痛苦

這女婿也太會(huì)了!岳父是游戲搭子 手搓雕像送禮

李夢(mèng)系穿搭,就這么養(yǎng)成了

無障礙瀏覽 進(jìn)入關(guān)懷版