国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

可靈3.0加入AI拜年戰(zhàn)場!人在工位搓好萊塢大片,分鏡邏輯封神

0
分享至

夢瑤 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

不是,誰也沒跟我說今年的AI春節(jié)大戰(zhàn)搞得這么猛猛猛啊?。?!

年還沒到呢,可靈就超絕不經(jīng)意甩出一個「過大年計劃」:推出可靈3.0多模態(tài)全家桶。

讓每個人,都能上桌當(dāng)——大導(dǎo)演



我主打一個先嘗為快!先看我導(dǎo)的這出《拳王》(賽博版)動作大戲,10秒鐘狂切6個分鏡頭:



好萊塢大片也是手拿把掐,10秒鐘切換7個鏡頭,從引擎轟鳴火花飛濺,再到男女主激烈爭執(zhí),讓我這個導(dǎo)演有點汗流浹背了...

災(zāi)難片自然我也不在怕的,濃霧封城、街道廢棄、廣告牌瘋狂搖晃……咋樣,是不是有點《后天》內(nèi)味兒了:

不光我一個人玩嗨了,各位腦洞大開的網(wǎng)友們也紛紛share自己的大作了,下面這小哥直接搓出來了個超燃籃球賽大片,并直言夠逼真?。?!



還有網(wǎng)友感慨,以后拍電影怕是都不用找真人演員了,這不嘛,人家直接找AI演了波超抽象的家庭大戲,腦洞太大了…



反正這波實測下來我最直觀感受就是:

智能分鏡能力確實夯,模型確實更能理解鏡頭語言了,像文字和人物的一致性上表現(xiàn)也蠻超出預(yù)期。

具體哪些功能最好用、適合啥樣的使用場景,我也幫友友們整理好了(省流版):

1)智能分鏡|音畫同步|主體一致性:特別適合做多鏡頭多對話的AIGC視頻,在AI短劇、影視這類場景非常適用。

2)文字一致性:賊適合處理AI電商廣告等場景的文字信息,文本形態(tài)基本能做到1:1還原!

具體實測效果咱往下看,順帶也歡迎大家來評評我這幾部春節(jié)檔大片,導(dǎo)的水平到底行不行?

先來測測:視頻3.0

跟手動拆分鏡說byebye

咱們?nèi)粘I梢曨l時,一直不停反復(fù)抽卡的主要原因之一便是——提示詞太長、鏡頭太多,視頻模型接不住。

尤其是經(jīng)常做AI短劇、AIGC自媒體的朋友,對鏡頭切換的數(shù)量和質(zhì)量要求都比較高,這類問題就更明顯了……

好消息是,在全新的可靈視頻3.0生成頁面中,直接給模型安排上了個「分鏡」小版塊,長下面zhei樣:



平臺一共給咱提供了兩種形式:智能分鏡自定義分鏡

我在智能分鏡中,我們可以直接把一整段包含多鏡頭、多動作、多角色的提示詞一股腦丟進去,AI會自動幫我們分成不同的鏡頭。

我最近正好在重溫《甄嬛傳》,但光看劇已經(jīng)有點不過癮了,索性直接讓AI來一段后宮宮斗cut,于是我給它喂了一大段帶雙人對話、明確鏡頭切換的復(fù)雜提示詞:



于是乎,一個陰雨夜貴妃貓娘娘和大臣小狗對峙的宮斗片段的畫面就新鮮出爐了,別說還真有點緊張刺激那味兒了?

我給出的提示詞中涉及了一個場景,四個鏡頭,兩段角色對話和一個背景音樂。

先說優(yōu)點,我只能說這智能分鏡確實挺智能,涉及到的鏡頭、臺詞全部1:1地還原了,respect??!

在音頻處理上,小貓和小狗的語氣、情緒和臺詞匹配度很高,發(fā)音里的輕重緩急也處理得不錯,角色的表情和眼神跟對白對得也很準(zhǔn)。

唯一的大bug:背景音樂沒給我生成要,是能再來一段BGM就更對味兒了……

咱再玩點有意思的,來點跨界融合看看效果,我給出的提示詞如下:



大明星貓貓一個眼神給出去,直接現(xiàn)場教學(xué)啥叫“身體成了一個X型”,別說這小身材搭配這小眼神整的還挺曼妙:

角色情緒和眼神動作都完全拿捏到位,而且貓貓的特寫鏡頭給的特別好,看來這AI是懂點鏡頭語言的。

唯一的小bug出現(xiàn)在了臺詞上。

原本提示詞里明確是小狗說“老師”,但模型在生成時把這句臺詞順帶分給了小貓,導(dǎo)致角色說話的對應(yīng)關(guān)系被打亂,整體臺詞邏輯出現(xiàn)了點偏差~

(我猜可能跟我提示詞的動詞太多有關(guān)系……)

總的來說,智能分鏡本身是靠譜的,多鏡頭結(jié)構(gòu)基本不會出大問題,只是在臺詞和音頻分配上偶爾會冒出一些小bug~

人物一致性更穩(wěn)了

咱平日里只要生成涉及「主體角色」的AI視頻,有個幾乎90%都會遇到的問題——

角色明明只是換了個動作,結(jié)果上一秒和下一秒長得就已經(jīng)不是同一個人了……



也不知道可靈這回受了啥啟發(fā),在視頻3.0中直接搞了個多圖或視頻的主體參考功能。

我們可以直接綁定人物角色形象,并上傳不同視角的參考圖,這樣一來模型在主體識別上就更穩(wěn)穩(wěn)穩(wěn)了。

當(dāng)然,穩(wěn)不穩(wěn)還得——實測說了算!

為了更好考察模型的主體遵循能力,這次我喂給AI的是一段包含人物多視角、多動作的提示詞,并上傳了兩個不同視角的人物形象照:



一個火急火燎、趕著打卡的上班牛馬,在馬路上橫沖直撞的名場面視頻,這不就到手了嘛(doge):



為了讓友友們更清楚地做對比,我把我輸入和輸出的角色形象截取對比了一下,大家覺得主體一致性表現(xiàn)如何???



emm…我是覺得鏡頭1和3和我給的原參考形象是近乎1:1還原的,但是鏡頭2就明顯出現(xiàn)了問題。

人物的膚色明顯變深了,發(fā)型也從原本的斜偏,直接變成了寸頭……

我懷疑這里頭的原因可能是因為我喂給AI的本身沒有嚴(yán)格意義上的正面形象,所以AI自己腦補了一下?

整體來說可以給個80分內(nèi)樣。



字形穩(wěn)得住,方言還得再練

這次,可靈視頻3.0打的第三個招牌就是——字形保留高保真。(翻譯:俺們AI生出來的字兒不變形

好大的口氣,大家都要知道,相比角色一致性,文字一致性其實更難。

那我就不客氣了,這次我給出AI的需求指令中,明確提到了光影變化、鏡頭切換以及旁白配合的多鏡頭場景,這就要求AI在不斷運動和切換的過程中,依然能保持較高的文字一致性:



大家伙快來看看,AI給我搓出來了個近乎達到「商用水平」的香水廣告宣傳片demo:

即便鏡頭處在持續(xù)旋轉(zhuǎn)運動中,香水瓶身的logo文字依舊保持清晰、不變形。

這其實也說明了模型在文字結(jié)構(gòu)理解、空間變換下的穩(wěn)定渲染以及跨鏡頭一致性保持上的能力已經(jīng)相當(dāng)扎實了。



最后,咱再來試一個可靈3.0視頻模型中我自認為非常有意思的一個能力——說方言

按照官方的說法,模型支持中、英、日、韓、西多語種生成,四川話、粵語等地道方言與各地口音。

要是這樣的話,我有個大膽的想法,咱讓奧特曼和馬斯克跑天津來吃煎餅果子,順便來一段地地道道的“貫口”:



倆人大褲衩子大背心一穿,吃大餅吃的那叫一個香啊,你別說,還挺入鄉(xiāng)隨俗???

畫面這塊基本沒啥可挑的,直接給滿分,人物主體一致性也確實還原得很到位,馬斯克和奧特曼本人看了估計都得一愣!??!

但問題也很明顯,咱這一題考的其實是方言能力,事實上,兩位一個天津話沒說對,一個北京話也沒對上,反倒普通話說得相當(dāng)標(biāo)準(zhǔn)……

我一度懷疑是不是AI對北京話、天津話不太熟,于是我索性再加一道題,讓AI再生成了一個兵馬俑說四川方言的視頻:

這回對味兒了,雖然兵馬俑長相有點驚悚,但是這四川話說的倒是蠻厲害的。

(有沒有四川的朋友點評一下,這口音說的正宗不??)

再來測測:視頻O3 OMNI

除了O3視頻模型,可靈這次還順手上新了另一位全能視頻選手——O3 OMNI,那這OMNI具體能干點啥呢:

  • 主體相似度上了一個level,模型對復(fù)雜提示詞的理解更到位了,用在多鏡頭、多動作場景里更穩(wěn)。
  • 上傳一段3–8秒的角色視頻就能提取外觀和聲音,多圖主體模式下再補一段3秒以上人聲就能綁定固定聲線
  • 支持原生自定義分鏡,視頻時長也升級到15秒,很適合需要講清楚一段故事、或者做中長視頻內(nèi)容的友友。



咱先來看對復(fù)雜文本指令的遵循能力如何~

這次我喂給AI一段同時考察主體一致性、連續(xù)加減速的運動理解,以及多區(qū)域切換時的鏡頭跟隨與時序控制的提示詞:



10秒內(nèi),萬圣節(jié)的小兔子完成了跳躍動作,并依次穿過落葉地面、南瓜燈和墓碑三個區(qū)域,自動補全了參考圖中未給出的萌萌視頻,不戳不戳??!

接下來玩玩分鏡頭敘事功能。

在全新的「O3 OMNI」模型里,我們可以直接自定義分鏡,這次我上傳了兩張參考圖(香蕉貓+優(yōu)雅企鵝),然后把分鏡腳本也一并塞了進去:



然后我就會得到一個香蕉貓和優(yōu)雅企鵝在紐約街頭盤算著吃豆腐腦的「抽象抓馬」大戲:暴露出來的問題也不少:第一幀背景白底直接出錯,后半段香蕉貓的嘴形沒對上,角色和背景的融合度也偏低,整體看下來,這是這輪里生成效果最差的一個……

(我是覺得不如智能分鏡的效果好)

而且說實話,對我來說這種需要自定義鏡頭的方式也略微麻煩。

既要上傳參考圖,又要自己拆分鏡頭、逐一標(biāo)注每個鏡頭的主體,如果折騰這么一圈,最后生成效果還不理想,u1s1,多少會有點難受……

感覺「自定義分鏡」功能還是更適合對提示詞和分鏡腳本比較熟的朋友去用。

如果需求沒那么高、又像我一樣對提示詞不算精通的話,還是更推薦大家直接用「智能分鏡」。



突然想起來,我上一次用可靈還是在測試O1模型,這次實測下來,能明顯感覺到3.0相比O1好用、也好玩了不少。

bug確實也有,但大部分也是現(xiàn)在多模態(tài)模型的通病,模型對于咱日常工作娛樂來說足夠用了。

可靈的黑金會員可以先在Web端體驗一波,非黑金用戶也不用急,感覺全面開放應(yīng)該很快就會來~

(期待一下叭)

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
WTT大滿貫!女單8強賽對陣,世界亞軍1-3出局,王曼昱肩負重任

WTT大滿貫!女單8強賽對陣,世界亞軍1-3出局,王曼昱肩負重任

以茶帶書
2026-02-25 19:20:55
中國游客親歷莫斯科機場關(guān)閉:滯留時很焦慮,后續(xù)行程全打亂

中國游客親歷莫斯科機場關(guān)閉:滯留時很焦慮,后續(xù)行程全打亂

南方都市報
2026-02-25 16:52:10
為什么奉勸老人不要去跳交誼舞?63歲阿姨說道:交誼舞害人不淺

為什么奉勸老人不要去跳交誼舞?63歲阿姨說道:交誼舞害人不淺

烙任情感
2026-02-25 10:47:33
外交部:中方一貫反對沒有國際法依據(jù)、未經(jīng)聯(lián)合國安理會授權(quán)的單邊制裁

外交部:中方一貫反對沒有國際法依據(jù)、未經(jīng)聯(lián)合國安理會授權(quán)的單邊制裁

環(huán)球網(wǎng)資訊
2026-02-25 15:30:23
“霍金與比基尼女性同游照”現(xiàn)愛潑斯坦檔案 ,曾被“辟謠”稱系偽造

“霍金與比基尼女性同游照”現(xiàn)愛潑斯坦檔案 ,曾被“辟謠”稱系偽造

揚子晚報
2026-02-26 10:09:32
見義勇為的平頂山抱孩子大姐找見了,平頂山的口碑,大姐一個人扛起

見義勇為的平頂山抱孩子大姐找見了,平頂山的口碑,大姐一個人扛起

觀察鑒娛
2026-02-25 10:29:44
我外公是位風(fēng)水先生,他常說,人最好的風(fēng)水一定要記?。?>
    </a>
        <h3>
      <a href=我外公是位風(fēng)水先生,他常說,人最好的風(fēng)水一定要記?。?/a> 楓紅染山徑
2026-02-26 09:05:17
朝鮮“新星女將軍”金主愛:下一代領(lǐng)導(dǎo)者?她頻頻露面原因為何?

朝鮮“新星女將軍”金主愛:下一代領(lǐng)導(dǎo)者?她頻頻露面原因為何?

洞鑒歷史
2024-04-24 15:10:54
春節(jié)后,這4種蔬菜不要隨便買!菜販子:我從來不吃,顧客搶著買

春節(jié)后,這4種蔬菜不要隨便買!菜販子:我從來不吃,顧客搶著買

阿龍美食記
2026-02-26 10:37:19
正在熱播的3部爛劇,沒有最爛只有更爛,一部沒看算你慧眼識珠!

正在熱播的3部爛劇,沒有最爛只有更爛,一部沒看算你慧眼識珠!

觀察鑒娛
2026-02-26 09:21:30
碧桂園7000億項目爛尾

碧桂園7000億項目爛尾

地產(chǎn)微資訊
2026-02-23 21:46:01
孩子走丟到小賣鋪求助,老板好心給其父母打電話,卻被5人按倒

孩子走丟到小賣鋪求助,老板好心給其父母打電話,卻被5人按倒

另子維愛讀史
2026-02-25 23:35:20
男籃VS日本隊!郭士強想要贏球,需要少用2人,重用3人

男籃VS日本隊!郭士強想要贏球,需要少用2人,重用3人

體育哲人
2026-02-26 08:01:51
34歲東北姑娘拿下81歲全球首富,長的很漂亮,一年抱倆娃身價上億

34歲東北姑娘拿下81歲全球首富,長的很漂亮,一年抱倆娃身價上億

云舟史策
2025-09-13 07:37:04
宇樹機器人去年只賣了5500多臺,普通家庭基本沒有買的

宇樹機器人去年只賣了5500多臺,普通家庭基本沒有買的

爆角追蹤
2026-02-25 10:08:50
上海一日料店,倆女子誤認為是自助餐,專門撿貴的點,結(jié)賬時4302

上海一日料店,倆女子誤認為是自助餐,專門撿貴的點,結(jié)賬時4302

苗苗情感說
2026-02-26 04:31:53
安史之亂八年里,叛軍為何死戰(zhàn)不降?不是安祿山想反,他也很無奈

安史之亂八年里,叛軍為何死戰(zhàn)不降?不是安祿山想反,他也很無奈

今日養(yǎng)生之道
2026-02-22 16:18:50
挪威前首相被曝自殺未遂,目前生命情況危急,此前被指控犯有與愛潑斯坦相關(guān)的“嚴(yán)重腐敗”罪名

挪威前首相被曝自殺未遂,目前生命情況危急,此前被指控犯有與愛潑斯坦相關(guān)的“嚴(yán)重腐敗”罪名

每日經(jīng)濟新聞
2026-02-26 10:13:33
俞飛鴻竇文濤二十年相伴不結(jié)婚,抵押房產(chǎn)賠光四千萬他仍守在身邊

俞飛鴻竇文濤二十年相伴不結(jié)婚,抵押房產(chǎn)賠光四千萬他仍守在身邊

動物奇奇怪怪
2026-02-25 19:00:15
放棄爭奪260億遺產(chǎn),帶著女兒遠赴美國,如今才知她是人間清醒

放棄爭奪260億遺產(chǎn),帶著女兒遠赴美國,如今才知她是人間清醒

林輕吟
2026-01-31 11:44:55
2026-02-26 11:12:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12203文章數(shù) 176394關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

"花壇白骨案"2名兇手因4萬元殺人埋尸 受害人兒子發(fā)聲

頭條要聞

"花壇白骨案"2名兇手因4萬元殺人埋尸 受害人兒子發(fā)聲

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

短劇市場風(fēng)云突變!有人投百萬賠得精光

汽車要聞

雷克薩斯ES雙色特別版上市 售30.79萬元起

態(tài)度原創(chuàng)

數(shù)碼
親子
本地
房產(chǎn)
公開課

數(shù)碼要聞

華碩驍龍X2-E94-100版Zenbook A16筆記本定價近34萬日元

親子要聞

筱梅沉浸當(dāng)母親喜悅!分享小寶睜眼吃奶照!箖箖看弟弟一舉動被贊

本地新聞

津南好·四時總相宜

房產(chǎn)要聞

海南樓市春節(jié)熱銷地圖曝光!三亞、陵水又殺瘋了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版