国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實測千問 App 生圖、生視頻功能:國產(chǎn)實用主義的突圍

0
分享至



Sora 2 的與奧特曼對話的音畫同步視頻生成,還有 Nano Banana Pro 的風格化生圖狂歡熱潮還沒過去,多模態(tài) AI 領域又有重磅更新上場:

阿里的千問 APP 在 12 月初悄然完成了一次關鍵版本更新,接入國內(nèi)最強 AI 生視頻模型 Wan 2.5,以及全球開源領先 AI 生圖模型的特供滿血版 Qwen-Image 2511,更重要的是,生圖功能直接拉滿免費不限次,徹底降低用戶的使用門檻。

在此之前,我們曾深度測評過 Wan 2.5 的網(wǎng)頁版(詳見網(wǎng)頁鏈接{從 SD 到 Wan2.5-Preview,AI 視頻 2025 質(zhì)變啟示錄}),當時就覺得這模型實用到不像當下 AI 圈的東西:沒有追 1 分鐘長視頻的噱頭,也沒講各種用戶根本看不懂的參數(shù)。就專注一件事:把 10 秒內(nèi)的音畫同步、細節(jié)還原做到了極致。

如今它下放到手機端,再配上 Qwen-Image 2511 這張 免王牌」一同下放到千問 APP,可以說,這是阿里將 B 端沉淀的多模態(tài)技術向 C 端場景落地的重要嘗試。

那么 APP 端視頻生成的體驗究竟是否能像此前網(wǎng)頁端一樣驚艷?還有,卷了這么多年的圖片生成大模型,這次千問+ Qwen-Image 2511 又能帶來什么驚喜?

帶著兩個核心疑問,我們用一周時間把這兩個功能用到了極致,試圖為大家解決以下問題:

Qwen-Image 2511 是否能真正解決傳統(tǒng) AI 生圖的人物崩臉、中文亂碼等行業(yè)痛點?Wan 2.5 在音畫同步、長視頻敘事上與國際主流模型的差距是否縮???免費模式背后,阿里又在構(gòu)建怎樣的 AI 生態(tài)閉環(huán)?

01

視頻能力實測

Wan 2.5背后國產(chǎn)模型的實用主義路線

Wan 2.5 是誰,相信很多了解過 AI 視頻生成的朋友已經(jīng)對此并不陌生。

作為為數(shù)不多能夠?qū)斯雀鑆eo3 的視頻生成大模型,Wan 2.5 核心突破在于音畫同步與 10 秒長視頻生成以及更精細、好看的畫面。

說的更直白一點,Wan2.5 不僅是 2025 年國內(nèi)最先進的多模態(tài)生成模型之一,絕對也是你用過最具性價比的一梯隊 AI 視頻生成產(chǎn)品。

接下來,我們從音畫同步、場景化功能、細節(jié)表現(xiàn)三個層面,解析其實際表現(xiàn)。

測試一音畫同步、時長

音畫不同步、短時長限制、細節(jié)不突出,是過去國產(chǎn)視頻模型與 Sora、Veo3 等國際模型的主要差距。針對以上問題,我們直接讓 Wan2.5 生成:在復雜場景中,生成兩個不同風格人物對話的劇情。

提示詞如下:

暮春午后,石質(zhì)柱廊蜿蜒延伸,青灰色石板映著斑駁光影,階前青草點綴,風拂過荀子身著玄色寬袍腰束素帶,與身披淺灰亞麻袍、赤足踏石的蘇格拉底相對而立。鏡頭先以全景定格,隨即推進至荀子中近景,他廣袖一揚,特寫中眼神如炬,沉凝有力地擲出:「人性本惡!爭則亂,亂則窮!」鏡頭橫切至蘇格拉底,中近景里他雙手自然攤開,指尖輕叩石面,眉宇從容,溫和卻帶鋒芒地反駁:「人性本善,無人有意作惡?!棺詈箸R頭從兩人面部拉遠,回歸全景,柱廊光影流轉(zhuǎn),風拂衣袂,兩人對立的身影在古意場景中定格。

看似簡單,但這段提示詞里,實際埋了三個坑:

第一,風格沖突:需兼顧古風與西方兩種人物風格,避免不同穿著人物實際共用一張臉的情況;

第二,音畫同步:兩個角色的臺詞「人性本惡!爭則亂,亂則窮」「人性本善,無人有意作惡」要對口型,還要匹配動作,并且兩人的語氣與神情各不相同。

第三,復雜畫面,元素不丟:石質(zhì)柱廊,青灰色石板、斑駁光影、階前青草點綴,不能隨著鏡頭的切換憑空消失。

最終生成效果如下:

網(wǎng)頁鏈接

可以看到,Wan2.5 的音畫同步準確率相當不錯,而且我們一開始擔心各種問題,Wan2.5 都解決的很好。首先是高度一致的音畫同步,細節(jié)上,不僅人物揮動衣袖的動作、身體、音畫同步自然流暢,就連場景也有很高的一致性,整體畫面切換調(diào)度也頗有動畫電影的水平。

測試二細節(jié)控制

如果說卡通測試是基礎題,那電影級寫實測試就是附加題。

此前在 Wan2.5-Preview 時期,我們就已經(jīng)見識到了它在細節(jié)還原、氛圍打造上的厲害之處。不過這次,我們讓難度再升級,從黃昏樹林中靜止的男生,變成真實復雜場景中,兩個運動中的主角。

提示詞:【風格設定】電影級寫實風格,畫面干凈通透,兼具溫柔氛圍感與高級電影感;線條細膩,質(zhì)感真實?!救宋?+ 動物+動作設定】

人物:20 歲年輕白人女孩,輪廓分明,皮膚白皙,長發(fā)微卷,眼神清澈帶一絲溫柔沉思;穿著米白色棉麻長裙(領口微敞,袖口隨意卷起),衣料有自然褶皺,質(zhì)感輕薄透氣。

動物:一只溫順的小鹿(毛色淺棕帶白色斑點,鹿角短小圓潤),頭部輕靠女子左臂,眼神柔和,耳朵偶爾輕微晃動,與女子互動自然不僵硬。

動作:女孩牽著鹿從森林中緩緩走來

【場景設定】黃昏稀疏落葉林,樹干筆直修長,樹葉泛黃帶綠(秋夏交替質(zhì)感),地面覆蓋少量淺棕色落葉;時間為日落前 1 小時,天色呈暖橙與淡紫漸變,空氣通透無霧氣。

【鏡頭與光影核心要求】

鏡頭參數(shù):長鏡頭(無切換),中景構(gòu)圖(人物 + 小鹿占畫面 60%),中心構(gòu)圖(人物與小鹿位于畫面正中心),干凈單人 + 動物鏡頭(無多余路人 / 雜物);背景虛化(景深 f/2.8),突出主體,虛化后背景呈斑駁圓形光斑。

光影層次:

逆光:太陽位于人物后方偏左側(cè),形成金色輪廓光(勾勒發(fā)絲、肩膀、襯衫邊緣),輪廓光寬度 1-2cm,柔和不刺眼;

側(cè)光:右側(cè)補柔和側(cè)光,照亮人物半張臉,避免面部全黑,形成「半明半暗」的層次感;

柔光:整體光線經(jīng)過樹葉過濾,呈漫射效果,無硬邊陰影。

網(wǎng)頁鏈接

先說結(jié)論,這是最近各種 AI 視頻測試中,最讓我感到驚喜的一個。

先看必答題:女孩的棉麻長裙,袖口卷起的地方有自然的褶皺,不是熨燙平整的假質(zhì)感;小鹿的頭靠在女孩手臂上時,耳朵會輕輕晃動,不是 焊死在頭上;逆光的金色輪廓光,剛好勾勒在發(fā)絲和肩膀邊緣,沒有糊成一片。女孩轉(zhuǎn)彎前真實的眼神變化,走路時自然飄動的發(fā)絲,真實到仿佛電影畫面。背景虛化后的光斑是圓形斑駁,不是呆板的圓形光斑,這細節(jié)已經(jīng)能吊打不少 老法師了。

然后是彩蛋:我忘記了在提示詞里寫任何聲音,但視頻里居然有 咔嚓咔嚓女孩和小鹿踩過落葉時的腳步聲,聲音會隨著步伐的快慢變化;背景里還有清脆且有空間遠近層進的鳥叫聲。

據(jù)了解,這種畫面審美突破的核心在于,Wan 2.5 通過引入人類反饋的強化學習(RLHF),把用戶對畫面質(zhì)感、動態(tài)效果、指令匹配度的反饋用于優(yōu)化模型,從而徹底讓 AI 視頻生成擺脫了過去詭異中帶著點賽博丑陋的標簽。

測試三場景化功能體驗

不同于國際模型側(cè)重各種技術極限,Wan 2.5 更注重實用場景適配,此前通義推出的全民舞王一度讓全中國的奶牛貓都突然站立開始跳印度舞,雖然魔性,但直指普通用戶的創(chuàng)作痛點。

這里的測試,我們不再采用固定的模版,而是玩了個 腦洞測試:上傳一張小貓的照片,讓它馱著孫悟空在非洲大草原狂奔。

這個需求的難點在于雙重動態(tài):小貓跑步時的肌肉形變、孫悟空的絲帶飄動,還要保持小貓的原長相。畢竟,很多 AI 處理圖生視頻 + 復雜動作時,會把主體搞成橡皮泥,要么肌肉不動,要么臉崩了。

效果如下:

網(wǎng)頁鏈接

可以看到,這里的測試效果依然很穩(wěn)定,小貓已經(jīng)馱著孫悟空在非洲大草原奔馳,會有肌肉的運動,孫悟空的絲帶飄向風的方向,不是 360 度亂轉(zhuǎn);最關鍵的是,小貓的臉和我上傳的照片幾乎一致——耳朵的弧度、眼睛的顏色,甚至額頭的精細花紋全都沒丟。

02

生圖實測

免費工具的專業(yè)度上限有多高

原本測完視頻能力之后,我已經(jīng)覺得不會有更多超出的驚喜出現(xiàn)了,但萬萬沒想到 Qwen-Image 2511 模型的能力,同樣打了我個措手不及。

官方資料顯示,Qwen-Image 2511 模型在 Huggingface 趨勢榜登頂數(shù)周,開源生態(tài)貢獻度全球第一,AI arena 競技場排名僅次于閉源模型 nano banana 與 seedream 4.0。

不過這些數(shù)據(jù)對用戶而言,其實價值意義不大,還需轉(zhuǎn)化為實際使用體驗才能被認可,我們依然通過三組核心測試驗證其落地能力。

測試一連續(xù)創(chuàng)作過程中的人物一致性。

AI 生圖的核心痛點之一,是無法在多輪生成中保持人物特征穩(wěn)定性,經(jīng)常是更換場景、調(diào)整動作后,人物面部特征易出現(xiàn)崩臉、換臉問題。這就導致,AI 出神圖容易,但是用在生產(chǎn)環(huán)境穩(wěn)定出圖反而是個問題,而 Qwen-Image 2511 很好的解決了這個問題。

我們以同一人物(動物)多場景生成為測試場景,來「嫁禍」一只小貓咪:

輸入素材:一張金漸層小貓的照片

生成指令:給小貓穿上粉色裙子、給小貓面前放個花瓶小貓推花瓶、讓花瓶碎在小貓面前

可以看到,Qwen-Image 2511 完整保留了測試對象也就是金漸層的面部特征之外,穿上的衣服也與小貓的身形完美符合,一個有些有意思的細節(jié)是,每次 Qwen-Image 2511 生圖都是四張,而這四組圖片中,小貓的裙子顏色、花的顏色與款式,都是完全一一對應的,細節(jié)滿分。

網(wǎng)頁鏈接

測試二中文文字+商用場景適配

對中小商家而言,AI 生圖的核心價值在于降低商用素材制作成本——能否生成符合平臺規(guī)范的商品圖、海報圖,直接決定工具的實用價值。

此外,中文場景下,當前市面上的其他 AI 生圖常出現(xiàn)文字亂碼、字體錯位問題,說白了就是像鬼畫符。其中,表現(xiàn)差一點的,完全看不出來文字到底是什么;表現(xiàn)稍好一點的,也會出現(xiàn)某個字少個偏旁,缺了一橫,或者多了一豎??傊?,模型對中文語義與排版邏輯的理解始終弱于英文。

這次,我們測試直接上難度,不只要能寫漢字,還要有排版,寫的好看,并且還要搭配復雜商用級別畫面。

提示詞:做一個海報,核心主題「天然無谷狗糧 | 狗狗健康成長的能量源泉」

視覺主體:純種金毛,6-12 個月幼犬,毛發(fā)蓬松有光澤,眼神靈動,正低頭大口啃食狗糧(嘴角帶少量糧屑,呈現(xiàn)「適口性極佳」的真實感),姿態(tài)放松愉悅(如趴在草地 / 地毯上,尾巴輕搖)

產(chǎn)品呈現(xiàn):打開的狗糧包裝袋(透明開窗設計,可見顆粒分明的狗糧,顆粒呈不規(guī)則六邊形,顏色為淺棕 + 深棕漸變),袋身斜靠在木質(zhì)托盤上,,標注「無谷配方」「鮮肉含量≥85%」「益生菌添加」核心賣點。輔助元素為:旁邊擺放 1 個陶瓷食盆(裝滿狗糧,少量顆粒散落在食盆邊緣),1 片新鮮胡蘿卜 / 西蘭花(呼應「天然食材」),1 滴透明魚油(暗示「美毛護膚」功效)

場景氛圍:戶外場景:青翠草地 + 藍天白云,狗狗趴在野餐墊上進食,周圍點綴幾朵小雛菊,遠處有模糊的樹木輪廓,整體色調(diào)清新自然

風格與質(zhì)感:超寫實質(zhì)感,細節(jié)拉滿(狗狗毛發(fā)根根分明,狗糧顆粒的紋理、油脂光澤,食盆的陶瓷磨砂質(zhì)感均清晰可見),避免卡通化或模糊處理

色彩搭配:暖橙色(傳遞「溫暖」「食欲」)+ 淺草綠(呼應「天然」)+ 原木色(增強「安全」「質(zhì)樸」感)



測試結(jié)果顯示,Qwen-Image 2511 在基礎測試中完全規(guī)避了文字截斷、字體混淆問題,不僅實現(xiàn)了海報標題的精準呈現(xiàn),畫中畫的狗糧包裝袋上文字依然精準呈現(xiàn)。此外,畫面中胡蘿卜的大小、狗糧的質(zhì)感,幼犬的形態(tài)、狗毛的真實毛絨質(zhì)感還原也非常到位,可以直接用于電商平臺上架。

此外,更驚喜的是,Qwen-Image 2511 生圖時支持一鍵調(diào)整比例(1:1/2:3/3:4/9:16/4:3/16:9/3:2),無需借助第三方工具裁剪。此外在后期,Qwen-Image 2511 還支持局部改字/改色、擴圖、修改尺寸等等修改,而這對生產(chǎn)級場景來說,非常重要:畢竟 AI 生圖,一次性得到滿意結(jié)果的概率并不大,往往需要非常精細、復雜的后期修改。而現(xiàn)在這件事情,已經(jīng)可以徹底交給 AI,精準修改。



對比一些付費生圖工具,Qwen-Image 2511 不僅在紋理還原度上表現(xiàn)更優(yōu),而且成本直接降為零,這對需批量制作素材的中小商家而言,具備極強的實用價值。

03

國產(chǎn) AI 的實用主義突圍

測完千問 APP 的兩個新功能,我突然明白阿里這次升級的 野心:

無論是 Qwen-Image 2511 解決中文生圖痛點,還是 Wan 2.5 補齊國產(chǎn)視頻音畫同步短板,千問的此次升級,其實背后正是國產(chǎn) AI 模型的差異化突圍范本:

Wan 2.5 的環(huán)境音自適應、元素 ID 鎖定,不僅能用于阿里電商的 短視頻帶貨場景,也能讓普通人享受和家里寵物跨物種對話的神奇;

Qwen-Image 2511 的 中文渲染以及精細控制能力,不僅能夠造福各種中小商家,也能讓沒有作圖能力的手殘黨感受創(chuàng)作的快樂。

當這些 B 端技術被改造成 C 端用戶能輕松上手甚至免費的功能時,AI 才真正從實驗室走進了日常生活。而伴隨創(chuàng)作成本大幅降低,國產(chǎn) AI 工具也才有了成為新時代內(nèi)容創(chuàng)作的標準的可能,而這才是真正的 AI 普惠。

*頭圖來源:視覺中國

本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
罕見!法德英等國一致“強烈譴責”美國

罕見!法德英等國一致“強烈譴責”美國

環(huán)球時報國際
2025-12-26 08:58:18
中山佳能又來了!工會出場給解散員工再發(fā)福利,稱沒來領的寄過去

中山佳能又來了!工會出場給解散員工再發(fā)福利,稱沒來領的寄過去

火山詩話
2025-12-26 08:45:06
馬刺3殺雷霆!文班19+11!一戰(zhàn)認清5個現(xiàn)實:雷霆從寵兒淪為棄子

馬刺3殺雷霆!文班19+11!一戰(zhàn)認清5個現(xiàn)實:雷霆從寵兒淪為棄子

毒舌NBA
2025-12-26 06:14:50
悲催!惠州一年入10億工廠停工,是三星、華為、小米等巨頭供應商

悲催!惠州一年入10億工廠停工,是三星、華為、小米等巨頭供應商

火山詩話
2025-12-26 06:39:54
瘋了?朱孝天舉報五月天勾結(jié)黃牛洗錢、假唱?還曝F4合體背后隱情

瘋了?朱孝天舉報五月天勾結(jié)黃牛洗錢、假唱?還曝F4合體背后隱情

烏娛子醬
2025-12-25 14:32:18
剛剛!人民幣匯率正式破7,五大影響

剛剛!人民幣匯率正式破7,五大影響

說財貓
2025-12-25 12:21:19
福建艦一路北上,目的地果然不簡單,雙航母戰(zhàn)斗群又要現(xiàn)身了?

福建艦一路北上,目的地果然不簡單,雙航母戰(zhàn)斗群又要現(xiàn)身了?

空天力量
2025-12-25 19:27:45
49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當年小燕子徹底涼透了

49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當年小燕子徹底涼透了

阿纂看事
2025-12-12 09:18:29
最新 | 雷軍突發(fā)!全網(wǎng)禁評!

最新 | 雷軍突發(fā)!全網(wǎng)禁評!

天津廣播
2025-12-25 22:55:42
突發(fā)!多地博物館因各種原因閉館,網(wǎng)友:估計是在開展自查自糾…

突發(fā)!多地博物館因各種原因閉館,網(wǎng)友:估計是在開展自查自糾…

火山詩話
2025-12-26 05:48:20
剛上任就突然訪華!北京迎來一位“稀客”!中方高規(guī)格接待

剛上任就突然訪華!北京迎來一位“稀客”!中方高規(guī)格接待

瞳哥視界
2025-12-25 20:48:48
阿維塔宣稱南極-50℃極寒測試,被網(wǎng)友打假:南極現(xiàn)在是夏季

阿維塔宣稱南極-50℃極寒測試,被網(wǎng)友打假:南極現(xiàn)在是夏季

玩車專家1
2025-12-25 17:24:33
今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

好賢觀史記
2025-12-25 10:07:03
面對抗議參拜靖國神社,高市選擇充耳不聞

面對抗議參拜靖國神社,高市選擇充耳不聞

中國日報網(wǎng)
2025-12-25 09:52:05
姜昆翻車,美國境內(nèi)唱紅歌,早年抵制洋節(jié)掛在嘴邊,回應未移民!

姜昆翻車,美國境內(nèi)唱紅歌,早年抵制洋節(jié)掛在嘴邊,回應未移民!

你食不食油餅
2025-12-26 06:13:35
徐湖平夫妻被帶走!紅二代身份曝光,一家三口精密布局盜寶

徐湖平夫妻被帶走!紅二代身份曝光,一家三口精密布局盜寶

西門老爹
2025-12-25 18:42:42
人民幣大漲,背后的頂級陽謀!

人民幣大漲,背后的頂級陽謀!

柏年說政經(jīng)
2025-12-25 11:57:19
美國始料未及:日本防衛(wèi)開支若達到GDP3%,意味著《日美安保條約》作廢

美國始料未及:日本防衛(wèi)開支若達到GDP3%,意味著《日美安保條約》作廢

上觀新聞
2025-12-26 04:22:07
美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

楓冷慕詩
2025-12-25 14:39:02
文班19+11馬刺三殺雷霆豪取8連勝 ??怂?9分亞歷山大22分

文班19+11馬刺三殺雷霆豪取8連勝 ??怂?9分亞歷山大22分

醉臥浮生
2025-12-26 06:05:28
2025-12-26 10:39:00
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
11696文章數(shù) 78745關注度
往期回顧 全部

科技要聞

豆包新模型,閃電發(fā)布,閃電“下架”

頭條要聞

媒體:讓美中產(chǎn)無法翻身的"斬殺線" 震碎中國網(wǎng)友三觀

頭條要聞

媒體:讓美中產(chǎn)無法翻身的"斬殺線" 震碎中國網(wǎng)友三觀

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當球踢!

財經(jīng)要聞

涉案近300億元 多方圍剿金融“黑灰產(chǎn)”

汽車要聞

速來!智界在上海西岸準備了年末潮流盛典

態(tài)度原創(chuàng)

藝術
家居
本地
教育
數(shù)碼

藝術要聞

毛主席草書作品展現(xiàn)清雅詩句,藝苑中熠熠生輝

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

教育要聞

請留言:你認同孩子的想法嗎?

數(shù)碼要聞

NuPhy推出Node100機械鍵盤:延續(xù)點陣美學,高/矮軸可選

無障礙瀏覽 進入關懷版