国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

階躍星辰新圖像編輯模型來了!2分錢一張、0.7秒出圖,實測海報風格遷移出彩

0
分享至


智東西
作者 高遠矚
編輯 程茜

智東西4月29日消息,今天,階躍星辰正式發(fā)布新一代圖像編輯生成模型Step Image Edit 2。

該模型參數(shù)量僅3.5B,在輕量級圖像編輯評測基準KRIS-Bench中綜合排名第一,支持文生圖、中英文渲染、局部編輯、視覺推理、主體一致性及風格遷移,可廣泛用于IP創(chuàng)作、海報設(shè)計、漫畫生成、人像美顏、旅游修圖等場景。

API定價0.02元/張,公測期(4月28日至5月5日)限免體驗。

在官方放出的速度對比視頻中,Step Image Edit 2完成一次文生圖片僅需0.7秒,而國內(nèi)閉源SOTA模型耗時7秒,開源20B級模型耗時12秒,開源同量級4B模型則耗時0.6秒。


▲各模型文生圖速度對比(來源:階躍星辰官方視頻)

智東西第一時間上手實測。總體來看,Step Image Edit 2在風格遷移的品牌VI排版上有驚喜,但在中文漢字渲染、空間方位理解、復(fù)雜指令執(zhí)行穩(wěn)定性上存在明顯不足。

官方體驗入口:https://platform.stepfun.com/console-tools

一、架構(gòu)數(shù)據(jù)雙突破:小參數(shù)如何挑戰(zhàn)大模型?

Step Image Edit 2主打“小身材、大能力、快響應(yīng)”,參數(shù)量雖小,Step Image Edit 2在技術(shù)層面下了功夫。

據(jù)階躍星辰介紹,核心支撐來自兩項創(chuàng)新:

一是多專家驅(qū)動的自演化學習。思路可概括為“分頭探索、集中聚合”。先從基座模型衍生多個細分任務(wù)專家分支進行差異化訓(xùn)練,再通過迭代式自蒸餾將知識聚合回基座,在不增加參數(shù)量的前提下逼近大模型的表現(xiàn)水平。

二是分布匹配強化學習(DARL)。傳統(tǒng)強化學習依賴稀疏獎勵信號,模型容易跑偏。階躍的做法是讓模型當前的輸出分布與參考分布對齊,以分布差距作為稠密獎勵信號,使訓(xùn)練更平穩(wěn)、泛化能力更強。

數(shù)據(jù)層面,Step Image Edit 2在圖像編輯能力上投入了超五千萬規(guī)模的專項訓(xùn)練數(shù)據(jù),融合真實場景挖掘、定向合成與高質(zhì)量開源數(shù)據(jù)三路來源,并針對文字編輯這一行業(yè)難點,自研排版系統(tǒng)生成約兩千萬條專項數(shù)據(jù)。

數(shù)據(jù)質(zhì)控上構(gòu)建了“智能體自動清洗—大模型全局評估—人工精細篩選”三級體系。

二、中文海報極限測試:4個文字區(qū)域同時排版,模型沒完全接住

我們通過階躍星辰開放平臺在線體驗,首先復(fù)現(xiàn)了官方演示中最具挑戰(zhàn)性的中文海報排版任務(wù)。官方視頻中展示了兩個復(fù)雜的中文海報案例,效果相當驚艷。



▲Step Image Edit 2的中文海報極限測試(來源:階躍星辰官方視頻)

但實際測試下來,情況要復(fù)雜得多。

實測案例:陶罐變手袋 + 四行文字混排

提示詞:

一張黑白線稿風格但帶高光質(zhì)感的海報。畫面左側(cè)擺放三個傳統(tǒng)陶罐,其中中間的那個陶罐被替換成一個奢侈品牌手袋(造型像陶罐但表面有皮革紋理和高光)。所有物品使用黑色雕刻線條表現(xiàn),但在手袋和蔬菜部分加入細膩的高光。構(gòu)圖:頂部居中粗體大寫標題「LUXURY DAILY」;底部居中副標題「CRAFTING VALUE FROM NOTHING」;右側(cè)豎排文字「日常即奢侈」;右下角有一個超大漢字「物」。整體要求:傳統(tǒng)與奢侈的視覺沖突,線條硬朗,高光精致。

實測結(jié)果:

我們針對這個提示詞連續(xù)生成了三次,耗時分別為11.33秒、7.98秒和21.31秒,三次生成暴露了模型三個維度的反復(fù)偏差:

偏差一:方位理解錯誤(三次全錯)
提示詞明確要求將“中間的那個陶罐”替換為手袋,但三次生成中,模型每次都將最右邊的陶罐變成了手袋。左、中、右的空間方位關(guān)系,模型完全沒有理解。


▲Step Image Edit 2第一次執(zhí)行中文海報極限測試

偏差二:“華”字錯筆(三次全錯)
三次生成的圖片中,第二個“奢華”里的“華”字,下方都多出了一橫,說明模型存在漢字生成缺陷。

偏差三:蔬菜缺失(僅第一次)
第一次生成的畫面中完全沒有出現(xiàn)提示詞要求的“蔬菜”,后兩次生成則成功補上了蔬菜。說明模型在執(zhí)行多要素的復(fù)雜指令時,生成的結(jié)果并不穩(wěn)定


▲Step Image Edit 2第二、三次執(zhí)行中文海報極限測試

小結(jié):

后兩次生成雖然補齊了蔬菜,文字布局也基本完整,但方位錯誤和“華”字錯筆在所有三次結(jié)果中持續(xù)出現(xiàn),未得到修正。

綜合來看,官方視頻中展示的中文海報極限測試效果,在實際測試中打了折扣。模型在空間定位和漢字生成時,能力仍不穩(wěn)定。

三、跨物種身份遷移?“貓變?nèi)恕蔽宕尾懦烧?/p>

官方演示中有一個很有趣的任務(wù):上傳一只貓的照片,并輸入“這是我的貓,年齡3歲,13斤,女。請將以上信息,按照將貓咪替換成對應(yīng)的人類女生形象!



▲Step Image Edit 2執(zhí)行“貓變?nèi)恕比蝿?wù)(來源:階躍星辰官方視頻)

我們用不同的貓圖實測了這個任務(wù),提示詞與官方一樣,卻連續(xù)生成了五次才成功。

第一次生成:畫面中只有原貓,完全沒有人的出現(xiàn),模型忽略了替換的指令。


第二次生成:模型直接將人的臉“安”在了貓的身體上,輸出了一個貓身人面的怪異形象。


第三次生成:輸出了一張人抱著貓的合影,人倒是正常了,但懷里抱的正是原圖中的那只貓,并沒有實現(xiàn)“貓咪替換成人類女生”。


第四次生成:依然是人與貓合影,但這次貓的品種與原圖不一致,仍然沒有完成替換。


第五次生成:終于成功,模型輸出了一張完整的人類女生形象,人物姿態(tài)自然,無貓元素殘留。


小結(jié):
五次嘗試才成功一次,成功率20%。前四次失敗分別暴露了不同層面的理解偏差:完全忽略指令、把“替換”理解成“融合”(人面貓身)、把“替換”理解成“抱著原貓”、把“替換”理解成“換一只貓抱著”。

這說明模型在執(zhí)行需要多層語義理解的復(fù)雜指令時,穩(wěn)定性遠遠不夠,往往需要反復(fù)嘗試才能出現(xiàn)理想效果。

四、10種風格一鍵切換+品牌VI設(shè)計:漢字再出錯?

我們固定一張風景照片,分別輸入“轉(zhuǎn)成水墨風格”“轉(zhuǎn)成賽博朋克風格”“轉(zhuǎn)成油畫風格”。


▲Step Image Edit 2執(zhí)行風格遷移(來源:階躍星辰官方視頻)

平均生成耗時約12秒,高于官方宣稱的0.5-2秒范圍,推測與1024分辨率及復(fù)雜場景有關(guān)。


▲Step Image Edit 2執(zhí)行三種風格遷移

不過模型在三者之間切換流暢,水墨風格的留白與暈染、賽博朋克的霓虹色調(diào)、油畫的筆觸質(zhì)感均較為明顯,主體內(nèi)容保持一致。

同時,我們嘗試了品牌VI設(shè)計任務(wù)。


▲Step Image Edit 2進行品牌VI設(shè)計(來源:階躍星辰官方視頻)

提示詞為:為品牌“太陽咖啡”設(shè)計一套品牌VI,包括標志、名片、包裝袋,風格為極簡現(xiàn)代。

模型生成了一張包含包裝袋(袋身印有品牌標志)和名片的多元素畫面,但未出現(xiàn)官方視頻示例中的咖啡杯,并且名片上本應(yīng)是“太陽”二字被生成了“大陽”,又是漢字錯誤。整體風格為極簡現(xiàn)代,符合提示詞的基本要求,生成耗時6.59秒。


▲Step Image Edit 2執(zhí)行品牌VI設(shè)計

結(jié)語:技術(shù)架構(gòu)有亮點,但實際表現(xiàn)稍遜

從技術(shù)層面看,Step Image Edit 2在多專家自演化學習和分布匹配強化學習上的探索值得關(guān)注。這兩項創(chuàng)新理論上確實可能實現(xiàn)“輕量級模型逼近大模型效果”,思路本身有可取之處。超五千萬專項訓(xùn)練數(shù)據(jù)、約兩千萬條文字編輯數(shù)據(jù)的投入,也體現(xiàn)了階躍對這項任務(wù)的重視。

輕量高效是行業(yè)發(fā)展的正確方向,但Step Image Edit 2的技術(shù)成熟度仍需打磨。期待其后續(xù)版本能在漢字書寫能力和復(fù)雜指令理解的穩(wěn)定性上補齊短板,真正兌現(xiàn)“小身材、大能力、快響應(yīng)”的承諾。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
伊朗政壇開始反抗,261人力挺卡利巴夫,革命衛(wèi)隊的難題來了?

伊朗政壇開始反抗,261人力挺卡利巴夫,革命衛(wèi)隊的難題來了?

起喜電影
2026-04-29 21:29:04
10歲男童村里消失!監(jiān)控曝光,前后幾分鐘,跟安徽女童案如出一轍

10歲男童村里消失!監(jiān)控曝光,前后幾分鐘,跟安徽女童案如出一轍

奇思妙想草葉君
2026-04-29 18:16:14
國乒新大敵來了!14歲新星U15世界第1:聯(lián)手妹妹奪冠看齊張本智和

國乒新大敵來了!14歲新星U15世界第1:聯(lián)手妹妹奪冠看齊張本智和

李喜林籃球絕殺
2026-04-29 17:14:52
王小洪在全國公安機關(guān)常態(tài)化開展掃黑除惡斗爭推進會議上強調(diào)  以為人民出政績以實干出政績的使命擔當  堅決抓好常態(tài)化掃黑除惡斗爭

王小洪在全國公安機關(guān)常態(tài)化開展掃黑除惡斗爭推進會議上強調(diào)  以為人民出政績以實干出政績的使命擔當  堅決抓好常態(tài)化掃黑除惡斗爭

新華社
2026-04-29 18:21:03
善惡到頭終有報,如今73歲的唐國強,已經(jīng)走上了一條不歸路!

善惡到頭終有報,如今73歲的唐國強,已經(jīng)走上了一條不歸路!

吳蒂旅行ing
2026-03-20 05:20:46
最強Mate來了!華為Mate 90提前亮相

最強Mate來了!華為Mate 90提前亮相

科技堡壘
2026-04-28 13:38:00
民進黨當局揚言懲戒,呂禮詩不退讓:威武不能屈

民進黨當局揚言懲戒,呂禮詩不退讓:威武不能屈

海峽導(dǎo)報社
2026-04-28 21:46:07
仰望U9X是性能怪獸,更是頂級奢侈品

仰望U9X是性能怪獸,更是頂級奢侈品

值言說
2026-04-29 22:57:09
郭濤全家拍婚紗照,倆兒女太驚艷,兒子1米85很帥,女兒神似父親

郭濤全家拍婚紗照,倆兒女太驚艷,兒子1米85很帥,女兒神似父親

一娛三分地
2026-04-29 19:14:50
深圳樓市:全線爆發(fā)

深圳樓市:全線爆發(fā)

樓市諸葛
2026-04-29 14:01:18
劉潔任黔西南州人民政府副州長

劉潔任黔西南州人民政府副州長

貴陽網(wǎng)
2026-04-29 09:30:12
iPhone Ultra 確定!預(yù)計 15999 元起

iPhone Ultra 確定!預(yù)計 15999 元起

花果科技
2026-04-29 14:14:20
跌落神壇!40歲諾伊爾全場0撲救 讓大巴黎5次射正進5球 僅獲5.2分

跌落神壇!40歲諾伊爾全場0撲救 讓大巴黎5次射正進5球 僅獲5.2分

我愛英超
2026-04-29 05:22:10
云南婆婆阻攔雙胞胎兒媳臨盆,娘家人怒接走,3小時后生下孩子!

云南婆婆阻攔雙胞胎兒媳臨盆,娘家人怒接走,3小時后生下孩子!

一絲不茍的法律人
2026-04-29 16:52:22
清朝對中國領(lǐng)土的貢獻不可磨滅!沒有清朝完成一統(tǒng),后果不堪設(shè)想

清朝對中國領(lǐng)土的貢獻不可磨滅!沒有清朝完成一統(tǒng),后果不堪設(shè)想

文史道
2024-11-25 06:45:02
Meta被曝決定撤銷對Manus的收購!

Meta被曝決定撤銷對Manus的收購!

穿透
2026-04-29 13:16:12
失去主力位置,斯基拉:舍瓦利耶可能在夏窗離開大巴黎

失去主力位置,斯基拉:舍瓦利耶可能在夏窗離開大巴黎

懂球帝
2026-04-29 10:01:05
村東頭砍到村西頭,砍死砍傷12名村霸,郝吉壽直言:他們都該死!

村東頭砍到村西頭,砍死砍傷12名村霸,郝吉壽直言:他們都該死!

易玄
2026-04-27 19:48:46
27歲皇馬舊將宣布退役:“這最終擊垮了我”

27歲皇馬舊將宣布退役:“這最終擊垮了我”

綠茵情報局
2026-04-29 00:15:56
特魯姆普:我現(xiàn)在配不上世界第一,世錦賽墨菲比趙心童更有望奪冠

特魯姆普:我現(xiàn)在配不上世界第一,世錦賽墨菲比趙心童更有望奪冠

楊華評論
2026-04-28 21:48:25
2026-04-29 23:35:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11724文章數(shù) 117057關(guān)注度
往期回顧 全部

科技要聞

今晨庭審紀實|馬斯克當庭講述OpenAI被偷走

頭條要聞

院長兒子被指"吃空餉"涉百萬獎金 醫(yī)院調(diào)查稱其拿2萬

頭條要聞

院長兒子被指"吃空餉"涉百萬獎金 醫(yī)院調(diào)查稱其拿2萬

體育要聞

一場九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節(jié)目組2小時

財經(jīng)要聞

蘇州,率先進入牛市

汽車要聞

技術(shù)天花板再摸高 全能型的奕境X9首秀

態(tài)度原創(chuàng)

游戲
時尚
家居
旅游
手機

《黎明行者之血》開發(fā)商還計劃打造第二個原創(chuàng)IP

除了“薄底鞋”,今年最流行這5雙鞋,怎么搭都好看!

家居要聞

寂然無界 簡潔風格

旅游要聞

開往春天的列車抵達成都!2026重慶文旅(成都)推介舉行

手機要聞

子系迭代旗艦集體漲價:標準版起步就是4000元 機圈變天了

無障礙瀏覽 進入關(guān)懷版