国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ViT一作盛贊:這個(gè)中國開源“PS模型”強(qiáng)過Nano Banana

0
分享至

夢瑤 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

太香了太香了,妥妥完爆ChatGPT和Nano Banana!

剛剛,ViT核心作者、Meta超級(jí)智能團(tuán)隊(duì)成員Lucas Beyer連發(fā)三條帖子,怒贊通義千問不久前發(fā)布的開源模型Qwen—Image—Layered。

在他看來,這才是圖像生成的正確打開方式~



他還順便自補(bǔ)了一句:這個(gè)模型方向自己其實(shí)也想做來著,只是太忙,一直沒來得及動(dòng)手……(笑)

實(shí)話實(shí)說,Qwen—Image—Layered模型確實(shí)不一般,因?yàn)樗梢宰屛覀冋嬲龑?shí)現(xiàn)ps級(jí)別的拆圖自由。

也就是說現(xiàn)在圖片元素也支持精細(xì)化修改了:



連網(wǎng)友們看了模型效果后都不禁感嘆:咋有種開源PhotoShop的感覺,amazing啊~



所以,這套讓Lucas Beyer反復(fù)點(diǎn)贊的模型到底強(qiáng)在哪兒,咱一起來看!

圖片也能像PS一樣拆拆拆了

如果說Nano Banana技能點(diǎn)在生圖,那Qwen—Image—Layered模型則厲害在:《拆圖》

相信大家都有過類似的經(jīng)歷,我們平時(shí)用大模型生圖時(shí)總會(huì)碰的到一個(gè)抓狂問題,那就是圖片生成so easy,細(xì)節(jié)修改so抓狂?。?!

AI生出來的圖片里,經(jīng)常會(huì)有一些小細(xì)節(jié)不太到位,但我們又沒法只改局部,只能整張丟回模型重新生成,結(jié)果往往還不如上一版…



Qwen—Image—Layered模型的核心能力,就是專治「一圖定生死」這事兒的。

它能將一張普通圖片分解成多個(gè)包含透明度信息的RGBA分離圖層,實(shí)現(xiàn)真正意義上的圖片素材的可編輯性。

光說概念有點(diǎn)抽象,咱直接看例子~



在官方案例中,一張完整圖片輸入之后,模型會(huì)自動(dòng)把畫面拆成6個(gè)包含不同元素的圖層,背景是背景,人物是人物,裝飾是裝飾,互不干擾。

看到這兒大家是不是突然感覺,這個(gè)非常適合用在海報(bào)制作等細(xì)節(jié)較多的圖片上??(雀實(shí)

但是Qwen—Image—Layered模型能做的還不止只是分離圖層這么簡單,我們還可以對(duì)圖層進(jìn)行二次編輯修改。

比如最基礎(chǔ)的:改背景,不動(dòng)主體

只替換背景圖層的顏色,一張橙色背景的海報(bào),瞬間就能換成藍(lán)色版本:



再比如,直接換主體。

保持構(gòu)圖不變,把原圖里的長發(fā)女孩,換成短發(fā)女孩,幾乎看不出拼接修改痕跡:



再來看下面這個(gè)——文字編輯。

我們可以只修改圖片中的局部文字,哪怕第一次生成的文字有幻覺問題也不怕了:



除了基本的替換編輯功能外,Qwen—Image—Layered模型還支持調(diào)整元素的大小、刪除不想要的元素等等。

例如像這樣,我們可以刪除掉畫面中不想要的元素對(duì)象,只保留自己想留的畫面元素:



又或者在不拉伸、不失真的前提下,輕松調(diào)整元素的大小比例,其實(shí)有點(diǎn)像PS里的自由縮放功能:



值得注意的是,Qwen—Image—Layered模型分層不限于固定的圖層數(shù)量,支持可變層分解,例如我們可以根據(jù)需要將圖像分解為3層或8層:



這個(gè)能力非常適合我們在不同的編輯需求場景下使用,可以根據(jù)我們想局部編輯的元素?cái)?shù)量多或少而定。

當(dāng)然,如果只是想改文字,差不多兩三層就夠了,如果修改需求比較多比較復(fù)雜,多拆幾層反而更好操作~

除了剛才說的這些,模型還支持在已分解的圖層基礎(chǔ)上做進(jìn)一步分解,進(jìn)而實(shí)現(xiàn)無限分解,聽上去很像無限套娃…



像下面這位網(wǎng)友,用Qwen—Image—Layered把人物元素進(jìn)行一次性分層處理,最后甚至可以一路拆到只剩下一個(gè)線稿層:



再來看這位網(wǎng)友,原本人物和背景完全糊在一起的一張圖,被模型直接拆成了主體和背景兩個(gè)獨(dú)立元素:



簡單說就是:只要畫面里不止一個(gè)元素,它就能拆、還能一直拆……

拆圖的本事來自于擴(kuò)散模型

有朋友看到這兒該問了,小小模型背后能有這PS一般的能力,用的是啥神奇魔法?

不藏著掖著,Qwen—Image—Layered的核心技術(shù),本質(zhì)上是一套端到端的「擴(kuò)散模型」

它并不是用來生成圖片的那種擴(kuò)散模型,而是專門為「拆圖片」這件事設(shè)計(jì)的——

模型直接輸入一張完整的RGB照片,通過擴(kuò)散過程,一步步預(yù)測出多個(gè)帶透明度信息的RGBA圖層。

這里有一個(gè)繞不開的前提是:

我們平時(shí)看到的圖片其實(shí)只有RGB三個(gè)通道,但真正的圖層編輯,離不開Alpha(透明度)通道。

為此,Qwen—Image—Layered專門設(shè)計(jì)了一套四通道的RGBA-VAE,把RGB輸入和RGBA輸出,統(tǒng)一壓縮到同一個(gè)隱藏空間中:



具體來說,當(dāng)輸入是一張普通RGB圖片時(shí),模型會(huì)自動(dòng)把Alpha通道補(bǔ)成1(完全不透明),在初始化階段還會(huì)聰明地復(fù)用預(yù)訓(xùn)練參數(shù),避免在透明度建模時(shí)出錯(cuò)。

這樣一來,模型從一開始就「懂透明」,不同圖層也就不會(huì)被混在一起。

而且在結(jié)構(gòu)上模型也不是死板拆層,它的核心Transformer—VLD-MMDiT會(huì)根據(jù)圖片復(fù)雜度,自動(dòng)決定需要拆成多少層。

為了避免前一層把后一層蓋住的問題,模型還加了一套Layer3D RoPE(三維位置編碼),簡單說就是給不同圖層打上明確的層級(jí)標(biāo)簽,讓模型在空間和順序上都分得清楚~



還不止如此,在隱藏空間里中,模型能夠被逐步「引導(dǎo)」去學(xué)會(huì):哪些像素該屬于哪一層、哪些區(qū)域需要保留透明度、哪些內(nèi)容應(yīng)該被分離開來。

這樣一來哪怕圖層再多對(duì)模型來說也都是小case了~

并且在訓(xùn)練策略上模型也不是從零教的,而是基于Qwen-Image預(yù)訓(xùn)練生成模型逐步升級(jí):

第一階段讓模型學(xué)會(huì)文本生成單RGBA圖層,第二階段讓模型學(xué)會(huì)擴(kuò)展到多圖層合成,第三階段讓模型真正學(xué)會(huì)從圖片反向拆解多圖層。

每階段幾百K步訓(xùn)練,加上重建損失和感知損失,確保語義分離干凈、不冗余。



這樣一來好處很直接,以前方法(如LayerD)要遞歸摳前景再補(bǔ)背景,容易積累錯(cuò)誤,或者用分割+修復(fù),遮擋區(qū)補(bǔ)不好。

Qwen—Image—Layered模型直接實(shí)現(xiàn)端到端生成完整RGBA層,避免這些問題,尤其擅長復(fù)雜遮擋、半透明和文字。

相較于Nano Banana的“一次抽圖定生死”,Qwen—Image—Layered的拆圖能力能讓Lucas Beyer這么喜歡,也就不奇怪了…

目前模型已經(jīng)開源,感興趣的朋友可以試試~

github開源地址:https://github.com/QwenLM/Qwen-Image-Layered

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
原子彈炸后百年內(nèi)寸草不生!今廣島卻住滿了人,看看專家怎么說?

原子彈炸后百年內(nèi)寸草不生!今廣島卻住滿了人,看看專家怎么說?

興趣知識(shí)
2025-12-12 19:33:40
突傳!河北主持雪莉去世!僅38歲,前一天還發(fā)自拍,好友透露死因

突傳!河北主持雪莉去世!僅38歲,前一天還發(fā)自拍,好友透露死因

千言娛樂記
2025-12-28 20:01:31
闞清子面臨巨額違約索賠,未婚夫一家變臉,孩子去世后豪門夢破碎

闞清子面臨巨額違約索賠,未婚夫一家變臉,孩子去世后豪門夢破碎

花哥扒娛樂
2025-12-28 19:49:42
特朗普恐怕沒料到,大批軍火還沒運(yùn)抵臺(tái)島,中方一招直打美國七寸

特朗普恐怕沒料到,大批軍火還沒運(yùn)抵臺(tái)島,中方一招直打美國七寸

面包夾知識(shí)
2025-12-27 00:00:32
闞清子生子風(fēng)波的后續(xù)瓜!

闞清子生子風(fēng)波的后續(xù)瓜!

八卦瘋叔
2025-12-29 10:59:58
柬埔寨的打法越來越像哈馬斯了

柬埔寨的打法越來越像哈馬斯了

歷史總在押韻
2025-12-27 12:26:25
央視怒批,國務(wù)院點(diǎn)名封殺!這幾位蒙騙老百姓的大網(wǎng)紅,徹底涼涼

央視怒批,國務(wù)院點(diǎn)名封殺!這幾位蒙騙老百姓的大網(wǎng)紅,徹底涼涼

大魚簡科
2025-09-02 19:34:00
拋“對(duì)等論”后24小時(shí),鄭麗文遭遇重大失利,韓國瑜相助也沒用?

拋“對(duì)等論”后24小時(shí),鄭麗文遭遇重大失利,韓國瑜相助也沒用?

奉壹數(shù)碼
2025-12-29 14:20:48
多地嚴(yán)查體制內(nèi)“關(guān)系崗”,為啥偏偏這時(shí)候動(dòng)真格?原因太現(xiàn)實(shí)了

多地嚴(yán)查體制內(nèi)“關(guān)系崗”,為啥偏偏這時(shí)候動(dòng)真格?原因太現(xiàn)實(shí)了

社會(huì)日日鮮
2025-12-29 11:01:55
微信回應(yīng)安裝包體積膨脹,辟謠不會(huì)重復(fù)存儲(chǔ)用戶文件

微信回應(yīng)安裝包體積膨脹,辟謠不會(huì)重復(fù)存儲(chǔ)用戶文件

揚(yáng)子晚報(bào)
2025-12-29 12:29:08
魔術(shù)讓火箭成功避坑班切羅!史密斯已成優(yōu)質(zhì)空間四號(hào)位,上限更高

魔術(shù)讓火箭成功避坑班切羅!史密斯已成優(yōu)質(zhì)空間四號(hào)位,上限更高

金風(fēng)說
2025-12-29 13:50:11
遺憾 23歲美女朱易再次失誤+無緣米蘭冬奧會(huì) 3年前曾出戰(zhàn)北京冬奧

遺憾 23歲美女朱易再次失誤+無緣米蘭冬奧會(huì) 3年前曾出戰(zhàn)北京冬奧

風(fēng)過鄉(xiāng)
2025-12-29 08:24:49
小卡55分刷紀(jì)錄!快船更衣室狂歡曝光:哈登帶頭為他瘋狂潑水慶祝

小卡55分刷紀(jì)錄!快船更衣室狂歡曝光:哈登帶頭為他瘋狂潑水慶祝

追球者
2025-12-29 14:11:54
國民黨中央委員選舉結(jié)果出爐,朱立倫狂喜,要拿捏鄭麗文?

國民黨中央委員選舉結(jié)果出爐,朱立倫狂喜,要拿捏鄭麗文?

叮當(dāng)當(dāng)科技
2025-12-28 04:57:08
72歲腫瘤專家患癌,抗癌一年病逝,他臨終前的2個(gè)后悔,引以為戒

72歲腫瘤專家患癌,抗癌一年病逝,他臨終前的2個(gè)后悔,引以為戒

39健康網(wǎng)
2025-12-26 16:09:48
從美元到黃金:全球資產(chǎn)“安全遷徙”,A股五大黃金龍頭迎來重估

從美元到黃金:全球資產(chǎn)“安全遷徙”,A股五大黃金龍頭迎來重估

小白鴿財(cái)經(jīng)
2025-12-29 07:05:02
乒超衛(wèi)冕后,球迷偶遇王楚欽離開南京,贊揚(yáng):意氣風(fēng)發(fā)少年郎

乒超衛(wèi)冕后,球迷偶遇王楚欽離開南京,贊揚(yáng):意氣風(fēng)發(fā)少年郎

鳳幻洋
2025-12-29 14:13:38
這8種東西不能用酒精擦,一擦就壞,再也修復(fù)不回來了!

這8種東西不能用酒精擦,一擦就壞,再也修復(fù)不回來了!

裝修秀
2025-11-13 11:50:03
鐵道部長丁關(guān)根不知王震要來,跑步下樓接,王震:我來打土豪來了

鐵道部長丁關(guān)根不知王震要來,跑步下樓接,王震:我來打土豪來了

浩渺青史
2025-12-23 20:05:39
交大附中嚴(yán)正聲明!很多嘉定家長都收到了!

交大附中嚴(yán)正聲明!很多嘉定家長都收到了!

尚虹橋
2025-12-28 20:33:43
2025-12-29 15:59:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11939文章數(shù) 176346關(guān)注度
往期回顧 全部

科技要聞

肉搏非洲,傳音不想只當(dāng)個(gè)賣手機(jī)的

頭條要聞

外交部:美在中國實(shí)現(xiàn)完全統(tǒng)一問題上是欠了中國債的

頭條要聞

外交部:美在中國實(shí)現(xiàn)完全統(tǒng)一問題上是欠了中國債的

體育要聞

“史上最貴”的世界杯,球迷成了韭菜

娛樂要聞

譚松韻扛劇能力被質(zhì)疑 趙麗穎成女主?

財(cái)經(jīng)要聞

白銀驚魂過山車 貴金屬牛站在懸崖邊?

汽車要聞

一汽正式“入股”零跑,總金額超37億元!

態(tài)度原創(chuàng)

本地
時(shí)尚
數(shù)碼
旅游
健康

本地新聞

即將過去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

“勃肯鞋”今年冬天爆火!這幾雙怎么搭都好看

數(shù)碼要聞

CES 2026前瞻:海信或?qū)l(fā)布新一代RGB-Mini LED技術(shù)

旅游要聞

探索銀發(fā)療養(yǎng)新范式!野鴨湖推出森林療養(yǎng)系列產(chǎn)品

這些新療法,讓化療不再那么痛苦

無障礙瀏覽 進(jìn)入關(guān)懷版