国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

告別“剪映模式”:一位前字節(jié)負責人對 AI 視頻產(chǎn)品的終極思考

0
分享至


短視頻平臺把創(chuàng)作門檻壓進手機屏幕,完成了一次“即創(chuàng)即消”的效率革命。

生成式 AI 的到來,則正在把視頻創(chuàng)作從“操作工具”,推向“直接表達想象”。

從“現(xiàn)實切片”走向“虛擬構(gòu)建”,創(chuàng)作范式正在換擋。站在這個轉(zhuǎn)折點上,前字節(jié)跳動智能創(chuàng)作工程與研發(fā)負責人黃嚴,給出了自己的答案。

今年10月,他創(chuàng)辦的 ArtArch 發(fā)布了首款產(chǎn)品——Skira。在Skira中,復雜的剪輯與編排被封裝成“玩法”(Gameplay)。用戶只需輸入簡單指令或素材,就能調(diào)用底層能力,一鍵生成爆款作品。

Skira 的目標只有一個:讓 AI 創(chuàng)作真正走向平權(quán),實現(xiàn)“所想即所得”。

2025 年初,ArtArch 已完成種子輪融資,投資方包括錦秋基金、九合創(chuàng)投和 BV 百度風投。

從即創(chuàng)即消,到所想即所得

硅基君:Skira的核心定位是什么?

黃嚴:我們想做的是一個AI Native(AI原生)的創(chuàng)作者社區(qū)。

以前的創(chuàng)作叫 NLE(Non-Linear Editing,非線性編輯)。無論是 Photoshop,還是手機時代的剪映、快手,本質(zhì)都是NLE——基于軌道、圖層進行編輯。

NLE 時代有三個角色:需求方(甲方)、設計師(操作者)、工具。這導致創(chuàng)作門檻很高,你需要先學工具。短視頻時代把 NLE 搬到了手機上,同時加強了分發(fā)能力,實現(xiàn)了“即創(chuàng)即消”,大大加速了循環(huán)。

但AI Native 時代,由于 AI 拓展了從現(xiàn)實到虛擬的想象力空間,過去的創(chuàng)作更多基于現(xiàn)實,而現(xiàn)在創(chuàng)作空間可以完全基于一個想象的虛擬空間,比如爆改甄嬛。一個服務于現(xiàn)實,一個服務于想象力

而且,現(xiàn)在我們不再需要一個專門學工具的“設計師”角色,工具可以直接服務于“想象力”。我們做的 Image Engine(想象力引擎),就是要讓創(chuàng)作平權(quán),即所想即所得。

硅基君:具體的變革體現(xiàn)在哪里?

黃嚴:以前我們拍片子,原素材必須來自現(xiàn)實(拍攝),后期再去拼接?,F(xiàn)在,任何素材都可以由AI 生成或加持。本質(zhì)變了:從“如何操作工具”轉(zhuǎn)變?yōu)椤叭绾尾鸾鈩?chuàng)意”。

為了讓創(chuàng)作更順滑,我們把創(chuàng)作過程變成了一套Workflow(工作流)。

第一步,讓AI先理解創(chuàng)作者的“語境”與“世界觀”。創(chuàng)作者心里其實有畫面、有情緒、有氛圍,但用語言說出來就困難。

AI 要解決的是:讓機器理解“創(chuàng)作者真正想表達的內(nèi)容”,而不是理解字面意思。這是整個系統(tǒng)最重要的一步。這就是他們說的 “所想即所得”。

第二步,用AI 把“想法”轉(zhuǎn)成結(jié)構(gòu)化的創(chuàng)作藍圖。比如拍一個 30 秒短片,傳統(tǒng)流程包含:劇本結(jié)構(gòu)、分鏡、主體角色、背景轉(zhuǎn)場、特效聲音、音樂節(jié)奏、剪輯。

這些原本需要專業(yè)團隊逐步完成的環(huán)節(jié),現(xiàn)在在系統(tǒng)里是“一盤棋”編排的。你可以像編輯思維導圖一樣調(diào)整每個步驟。

硅基君:能不能展開講講用Skira和直接用視頻模型有什么區(qū)別?

黃嚴區(qū)別在于表現(xiàn)力,而這背后就是“理解語境”能力的差異。大模型生成的視頻往往是“千人一面”的,它理解的是概率上的共識。

但創(chuàng)作往往需要“特異性”。比如,編劇寫劇本:“一個男人回家,快速劃掉手機屏幕?!边@一句話就暗示了出軌、緊張、心虛,這是語境。

如果你直接把這句話給大模型,它可能就真生成一個男人劃手機,平鋪直敘。我們的系統(tǒng)里有導演Agent。它會理解這個語境,然后設計分鏡:


鏡頭A:特寫男人的汗珠。

鏡頭B:手機屏幕的特寫,手指慌亂的動作。

配合心跳聲的音效、昏暗的濾鏡。這就是我們做的:把“語境”翻譯成具有表現(xiàn)力的“視聽語言”,而不僅僅是生成一個畫面,用最大化的表現(xiàn)方式去擊中觀眾。

硅基君:聽起來很厲害,從技術(shù)上是怎么實現(xiàn)的?

黃嚴:我們底層構(gòu)建了一套Image DSL(領(lǐng)域特定語言)。你可以理解為,我們?yōu)橐曨l創(chuàng)作發(fā)明了一套編程語言。

這套語言里包含了生成類、主體類、渲染類、特效類等各種定義。通過這套語言,我們把一個感性的“劇本”,編譯成了一套可執(zhí)行的計算機程序。

在這個架構(gòu)之上,我們有執(zhí)行工作流的Agent 引擎。這里面有不同的 Agent 角色:


編劇Agent: 理解你的意圖,生成世界觀和敘事結(jié)構(gòu)。

導演Agent: 負責分鏡設計、鏡頭調(diào)度。

演員Agent: 負責角色的演繹和互動。

最上層是玩法引擎。玩法可以理解為一種特定剪輯方式,比如A/B Transfer(轉(zhuǎn)場特效)或者比較火AI寵物視頻。

我們把這些復雜的編排封裝成“玩法”(Gameplay),用戶只需要輸入簡單的指令或圖片,就能調(diào)用這套復雜的底層能力。

硅基君:這里的Agent,具體是如何工作的,比如編劇 Agent?

黃嚴:每個Agent 都有獨特的 ID 和背后的領(lǐng)域知識庫,不僅僅是靠 Prompt 驅(qū)動。在訓練過程中,也會通過強化學習,根據(jù)反饋(這個生成得好不好)來更新自己的策略。

硅基君:如果未來視頻大模型(如Sora)變強了,還需要這套工程架構(gòu)嗎?

黃嚴:這涉及到一個核心判斷:大模型變強,能解決局部復雜度,但解決不了整體創(chuàng)作的復雜度。

舉個例子,主體保持(Consistency) 目前大模型做得還不夠好。為了讓一個角色在不同鏡頭里長得一樣,我需要在模型周圍打很多“補丁”,用工程化手段(比如特有的渲染引擎、LoRA等)去約束它。

如果大模型變強了,這部分工作會被簡化。但是,人的審美天花板永遠在提升。就像小時候看《大鬧天宮》覺得很牛,現(xiàn)在覺得太簡單了。當模型能力提升,人類會要求更復雜的敘事、更精細的控制(比如希區(qū)柯克式變焦、蒙太奇剪輯)。

所以,工程架構(gòu)是連接“人類無限的復雜想象力”和“模型有限的能力”之間的橋梁。這種沉淀下來的系統(tǒng)設計能力,才是壁壘。

硅基君:所以,工程也是一種壁壘?

黃嚴:短期來看,工程不是壁壘,工程師只是負責實現(xiàn)。工具本身可以很快做出來。

長期來看,隨著時間積累,構(gòu)建起來的這套體系和沉淀會成為壁壘。只有當系統(tǒng)跑起來,隨著服務的人群越來越廣、時間越來越長、場景越來越復雜,你沉淀下來的那套“如何支持復雜創(chuàng)作”的經(jīng)驗,才是真正的技術(shù)核心。

剪映之外:一個面向“表達”的 AI 原生創(chuàng)作社區(qū)

硅基君:Skira的用戶是誰?

黃嚴:我們把用戶分為兩層,形成一個對流:

P層(Producers,制作人): 技術(shù)流大神、藝術(shù)家。他們懂鏡頭、懂審美、甚至懂一點技術(shù)。他們利用我們的底層工具(DSL、工作流)去創(chuàng)作“玩法”和“模版”。

C層(Creators,普通創(chuàng)作者): 大眾用戶。他們有表達欲,但不想學復雜工具。他們直接使用 P 層創(chuàng)造的“玩法”,上傳自己的照片或素材,快速生成高質(zhì)量內(nèi)容。

我們作為平臺,連接這兩端,讓大家的思想、創(chuàng)意流轉(zhuǎn)起來。

硅基君:怎么實現(xiàn)這種流轉(zhuǎn)?

黃嚴:核心在于平臺如何分配利益,我們通過“收益流轉(zhuǎn)”來解決這個問題。

平臺會給制作人提供收益:越多人使用你開發(fā)的“玩法”,你就能拿到越多的收益。


1. 經(jīng)濟收益:包括平臺的基礎點數(shù)(Credit),以及未來的分傭分成。

2. 聲譽歸屬:這個玩法是屬于該制作人的,他的 Profile(個人主頁)會展示這些成就。

所以,無論是制作人還是C 端用戶,他們都在同一個社群里。制作人通過提供玩法獲得分成和聲譽,大眾通過使用玩法獲得流量和表達。平臺則作為一個放大器,讓熱點和創(chuàng)意在兩者之間高效流轉(zhuǎn)。

硅基君:目前,這個創(chuàng)作者群體夠大嗎?

黃嚴:AI硬核創(chuàng)作者是小眾的,但“泛創(chuàng)作者”(發(fā)抖音、做號的人)體量已經(jīng)很大了。這些泛創(chuàng)作者沒有平臺忠誠度,哪里能幫他們“快、好、追熱點”,他們就去哪里。

硅基君:Skira的付費模式是什么?

黃嚴:C端為算力付費,為高級玩法付費。P 端則為創(chuàng)作工具付費,但目前更多是不僅不付費,我們還會給他們分成,因為他們是生態(tài)的供給方。

硅基君:在Skira上,有哪些內(nèi)容會比較火?

黃嚴:從我觀察來說,目前主要有三類內(nèi)容比較火:

一類是AI萌寵類:擬人化的寵物內(nèi)容;第二類是AI Me(AI自我): 平行世界的變裝、風格化,展示“外人眼中的我”;第三輪是虛幻/IP共創(chuàng):基于某種IP或意識形態(tài)的延展(比如基于《甄嬛傳》或《三國》改出的幽默/奇怪劇情)。

硅基君:這些火了的“玩法”,如果大平臺復刻,我們的護城河在哪?

黃嚴:第一,供給的多樣性,比如“瘋狂動物城”熱點,抖音上可能只有 2-3 種官方玩法,但我們平臺上有海量制作人提供各種不同的風格。

第二,交互形式的演進?!巴娣ā辈粌H僅是模板,還在進化出新的交互形式。比如,用戶與 AI IP 的互動(@某個角色)、合拍、共創(chuàng)。這些帶有社交屬性的新玩法,大平臺不一定能迅速兼容或覆蓋。

第三,定位的不同。大平臺需要關(guān)注最廣大基數(shù)用戶的基本訴求(如剪輯工具的易用性)。而我們可以作為一個創(chuàng)作社區(qū),專注于創(chuàng)作范式和玩法的獨立演變,把我們作為“生產(chǎn)端”,大平臺作為“分發(fā)/消費端”。我們是連接的橋梁,不完全沖突。

硅基君:市面上很多AI公司也在做“一站式創(chuàng)作平臺”,Skira和他們的差異在哪里?

黃嚴:“一站式”是行業(yè)趨勢,大家都在往自動化方向走。但我們的本質(zhì)區(qū)別在于對“創(chuàng)作”本身的理解深度。

我們不僅僅是做自動化,而是深入到創(chuàng)作者語境、元素拆解、表現(xiàn)力合成。如果只是單純的工程自動化,做出來的東西往往“牛頭不對馬嘴”,缺乏靈魂。

硅基君:作為一個AI產(chǎn)品,您最關(guān)心的指標是什么?

黃嚴:是創(chuàng)作量,或者叫Creation DAU(日均創(chuàng)作用戶數(shù))。這是一個基于工具演化出的創(chuàng)作社區(qū),最核心的是大家來這里產(chǎn)生創(chuàng)作行為。如果用戶來了只是看而不創(chuàng)作,那他們應該去消費社區(qū)(如抖音/小紅書)。

硅基君:關(guān)于用戶心智(User Mindset),比如提到剪映大家就想到“剪輯”。你們希望占據(jù)什么樣戶心智?

黃嚴:如果用一句話概括,Skira 是一個以“表達”為起點的 AI 原生創(chuàng)作社區(qū)。

當用戶腦子里出現(xiàn)一個畫面、一個情緒、一個想法,卻不知道該怎么把它變成內(nèi)容時,他會想到 Skira。Skira核心的Slogan就是“Worlds in your mind”


文/林白

PS:如果你對AI大模型領(lǐng)域有獨特的看法,歡迎掃碼加入我們的大模型交流群。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
全球貨幣支付排名:美元跌至49.25%,歐元漲到22.82%,人民幣呢

全球貨幣支付排名:美元跌至49.25%,歐元漲到22.82%,人民幣呢

張嘴說財經(jīng)
2026-03-26 20:56:17
廣東今日早報!球迷熱議楊鳴替杜鋒,徐杰深夜發(fā)聲,崔永熙回首發(fā)

廣東今日早報!球迷熱議楊鳴替杜鋒,徐杰深夜發(fā)聲,崔永熙回首發(fā)

多特體育說
2026-03-27 09:27:26
巴西1-2法國,賽后評分:不是維尼修斯第一,法國10號排第一

巴西1-2法國,賽后評分:不是維尼修斯第一,法國10號排第一

側(cè)身凌空斬
2026-03-27 06:06:57
瑞典3-1淘汰烏克蘭!將與波蘭爭世界杯門票 阿森納6500萬鋒霸戴帽

瑞典3-1淘汰烏克蘭!將與波蘭爭世界杯門票 阿森納6500萬鋒霸戴帽

我愛英超
2026-03-27 06:21:47
拼多多成立“新拼姆”開啟品牌自營,聯(lián)席CEO趙佳臻:利潤率波動會是常態(tài)

拼多多成立“新拼姆”開啟品牌自營,聯(lián)席CEO趙佳臻:利潤率波動會是常態(tài)

澎湃新聞
2026-03-26 08:38:26
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
伊朗新最高領(lǐng)袖莫賈塔巴哈梅內(nèi)伊已同意與美國進行談判并達成協(xié)議

伊朗新最高領(lǐng)袖莫賈塔巴哈梅內(nèi)伊已同意與美國進行談判并達成協(xié)議

深度報
2026-03-25 22:47:08
安徽一女護士回娘家路上失蹤,15年后給哥哥托夢:我在院子里

安徽一女護士回娘家路上失蹤,15年后給哥哥托夢:我在院子里

清茶淺談
2025-02-27 14:55:55
金融才女朱麗麗:一頓飯百萬,八年斂財十四億終落網(wǎng)

金融才女朱麗麗:一頓飯百萬,八年斂財十四億終落網(wǎng)

大眼妹妹
2026-03-27 01:38:29
重慶一大學生因兼職送校內(nèi)外賣被學校違紀處分,學?;貞禾幏至鞒桃呀?jīng)中止,沒有對該學生作出實際處罰

重慶一大學生因兼職送校內(nèi)外賣被學校違紀處分,學?;貞禾幏至鞒桃呀?jīng)中止,沒有對該學生作出實際處罰

臺州交通廣播
2026-03-27 00:42:16
CBA最新排名:青島準絕殺廣州重返前8 北控主場不敵同曦送溫暖

CBA最新排名:青島準絕殺廣州重返前8 北控主場不敵同曦送溫暖

狼叔評論
2026-03-26 22:22:04
Manus兩名高管禁止離境? 外交部回應

Manus兩名高管禁止離境? 外交部回應

每日經(jīng)濟新聞
2026-03-26 16:36:02
有一種貧窮人格:習慣性否定

有一種貧窮人格:習慣性否定

洞見
2026-03-26 09:14:24
創(chuàng)歷史!克努佩爾解鎖最年輕單季250三分紀錄 領(lǐng)跑本季三分榜

創(chuàng)歷史!克努佩爾解鎖最年輕單季250三分紀錄 領(lǐng)跑本季三分榜

醉臥浮生
2026-03-27 08:38:07
官宣了!國足比賽央視CCTV5 直播 周末又能看申花跟海港王牌了

官宣了!國足比賽央視CCTV5 直播 周末又能看申花跟海港王牌了

80后體育大蜀黍
2026-03-26 20:24:35
14億人集體買房,為什么最后買出了一個爛攤子?

14億人集體買房,為什么最后買出了一個爛攤子?

流蘇晚晴
2026-03-25 18:14:02
日本青森縣以東海域發(fā)生4.7級地震

日本青森縣以東海域發(fā)生4.7級地震

環(huán)球網(wǎng)資訊
2026-03-26 15:58:07
魔術(shù)連續(xù)兩季橫掃國王終結(jié)6連敗 班凱羅30+9+7德羅贊33+6+11

魔術(shù)連續(xù)兩季橫掃國王終結(jié)6連敗 班凱羅30+9+7德羅贊33+6+11

醉臥浮生
2026-03-27 09:36:26
兩岸統(tǒng)一的風向:賴清德由獨轉(zhuǎn)統(tǒng),或能成就統(tǒng)一功績

兩岸統(tǒng)一的風向:賴清德由獨轉(zhuǎn)統(tǒng),或能成就統(tǒng)一功績

三石記
2026-03-27 07:07:26
社評:持刀闖館事件,日方休想蒙混過關(guān)

社評:持刀闖館事件,日方休想蒙混過關(guān)

環(huán)球網(wǎng)資訊
2026-03-26 23:51:47
2026-03-27 11:12:49
硅基觀察Pro incentive-icons
硅基觀察Pro
人工智能新時代的商業(yè)智庫和價值燈塔
868文章數(shù) 65關(guān)注度
往期回顧 全部

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產(chǎn)力

頭條要聞

媒體:內(nèi)塔尼亞胡夫人為兩個兒子訴苦 加沙兒童怎么看

頭條要聞

媒體:內(nèi)塔尼亞胡夫人為兩個兒子訴苦 加沙兒童怎么看

體育要聞

近29戰(zhàn)23勝!這支黃蜂有多強?

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

很反常!油價向上,黃金向下

汽車要聞

線控底盤+千問上車 智己LS8預售權(quán)益價25.98萬起

態(tài)度原創(chuàng)

游戲
本地
教育
數(shù)碼
親子

大的要來了!IGN 10分超好評游戲官宣大更新

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復仇了一萬遍

教育要聞

從72分到141分!數(shù)學提分的關(guān)鍵,不是天賦,更不是題海

數(shù)碼要聞

新款Meta雷朋聯(lián)名智能眼鏡現(xiàn)身美國FCC認證文件,提供雙版本

親子要聞

原生家庭真的是會傷害子女嗎?

無障礙瀏覽 進入關(guān)懷版