国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從Sora到可靈,視頻AI還沒到GPT時刻

0
分享至



文 / 道哥

來源 / 智百道

視頻大模型的競速還在持續(xù)。

作為國內(nèi)視頻生成大模型的代表,快手旗下的可靈AI近日宣布,其核心產(chǎn)品可靈O1正式上線“主體庫”與“對比模板”兩大重要功能,旨在提升AI創(chuàng)作的效率與作品展示效果。

但與此同時,在大洋彼岸,OpenAI旗下的Sora2,卻開始陷入新的困境。根據(jù)a16z合伙人前段時間貼出的一組對比,Sora留存率遠不如TikTok,首日留存率只有10%,30天留存率只有1%。對比來看,TikTok對應的留存率分別是50%和32%,差距明顯。

在9月底OpenAI正式發(fā)布Sora 2及獨立App時,不少預言家當時甚至集體狂歡,“Sora App將吞噬TikTok和Instagram上的網(wǎng)紅,一場由AI主導的視頻革命即將到來”。

OpenAI自己也說,我們可能迎來視頻領(lǐng)域的GPT-3.5時刻。

然而,到了2026年年末,現(xiàn)實還是比概念更骨感。

在這一輪AI泡沫論底層,實際上是資本市場與產(chǎn)業(yè)界開始冷靜審視這條賽道:所謂的“視頻GPT時刻”似乎并未如期而至。相反,高昂的推理成本、難以閉環(huán)的商業(yè)模式以及尚不穩(wěn)定的技術(shù)表現(xiàn),正在構(gòu)成一道道難以逾越的“嘆息之墻”。

無論是谷歌被寄予厚望的Veo,還是曾驚艷全球的Sora,亦或是國內(nèi)卷出天際的可靈、即夢,此刻都站在了一個尷尬的十字路口:技術(shù)看起來固然很炫酷,但到底誰能真正靠它賺到大錢?

01 模型競速



時間需要回到2024年。

彼時隨著Sora憑借60秒長視頻、多角度鏡頭切換以及驚人的物理世界模擬能力震驚世界后,當年被科技圈定義為“視頻生成元年”。

隨后Runway推出了Gen-3 Alpha,Luma AI發(fā)布了Dream Machine,谷歌則在I/O大會上祭出了Veo;而在國內(nèi),字節(jié)跳動的即夢(Jimeng)、快手的可靈(Kling)、生數(shù)科技的Vidu等模型如雨后春筍般涌現(xiàn)

這一年的主旋律,無疑是中美兩大科技陣營在視頻模型上的瘋狂競速。這種競速不僅體現(xiàn)在發(fā)布頻率上,更體現(xiàn)在參數(shù)規(guī)模與生成質(zhì)量的軍備競賽中。

但很快,這種競速呈現(xiàn)出一種明顯的“同質(zhì)化內(nèi)卷”趨勢。現(xiàn)在的視頻模型,大多采用了DiT(Diffusion Transformer)架構(gòu),這一架構(gòu)有效地結(jié)合了Transformer處理序列數(shù)據(jù)的能力與Diffusion生成高質(zhì)量圖像的能力。

因為技術(shù)路徑的趨同,各家比拼的焦點迅速轉(zhuǎn)移到了數(shù)據(jù)質(zhì)量、上下文長度以及對物理規(guī)律的理解上。

以國內(nèi)戰(zhàn)場為例,可靈AI的突圍極具代表性。依托快手龐大的短視頻生態(tài),可靈在視頻數(shù)據(jù)的理解上擁有天然優(yōu)勢,其生成的視頻在運動幅度與邏輯連貫性上,一度被評測為“最接近Sora”的產(chǎn)品之一。而字節(jié)跳動的即夢則背靠抖音,在審美風格與運鏡語言上更懂C端用戶的偏好。

但問題是,作為視頻模型代表的Sora,都正在陷入爭議之中。前文提及的留存率,其實只是結(jié)果,真正的原因是,號稱打造AI短視頻的Sora2,其用戶體驗卻非常差。

目前的模型競速,更像是一場“演示片”的戰(zhàn)爭。哪怕是Sora2也同樣如此。

官方放出的Demo往往是百里挑一的結(jié)果,而當普通用戶上手時,人物肢體扭曲、物體憑空消失、物理邏輯崩壞(如倒出的水往天上流)等“抽卡失敗”的現(xiàn)象比比皆是。這種“Demo與實物不符”的現(xiàn)狀,直接導致了用戶體驗的斷層。

目前的模型能力,雖然已經(jīng)從“不可用”跨越到了“偶爾驚艷”,但距離ChatGPT那樣“穩(wěn)定且通用”的GPT-3.5時刻,仍有巨大的鴻溝。

大家都在卷時長、卷分辨率,卻很少有人能徹底解決“可控性”這一導演與創(chuàng)作者最在意的核心命題。

02 算力黑洞



如果說模型能力的不足是可以通過時間解決的“軟傷”,那么算力成本則是懸在所有視頻AI公司頭頂?shù)摹斑_摩克利斯之劍”。

視頻生成是目前所有AI模態(tài)中,對算力消耗最為恐怖的領(lǐng)域,沒有之一。

這不僅是因為視頻增加了“時間”這一維度,導致數(shù)據(jù)量呈幾何級數(shù)增長,更因為為了保證視頻的連貫性與物理邏輯,模型需要在極短時間內(nèi)進行海量的推理計算。

我們可以算一筆賬。

在文本模態(tài)下,ChatGPT生成一段文字的成本雖然不低,但已經(jīng)可以通過訂閱費覆蓋并實現(xiàn)盈利。然而,視頻生成的算力需求是文本的成百上千倍。生成一秒鐘的高清視頻,其所需的GPU算力,足以生成數(shù)萬字的文本或數(shù)十張高質(zhì)量圖片。

Sora之所以采用“切片”的方式處理視頻數(shù)據(jù),正是為了在Transformer架構(gòu)下盡可能地壓縮計算量,但即便如此,其推理成本依然高得令人咋舌。

這就是“算力黑洞”。

對于谷歌、OpenAI這樣的巨頭來說,或許還能通過燒錢來維持戰(zhàn)略卡位,利用自身的云服務設(shè)施進行內(nèi)部補貼。但對于Runway、Luma以及國內(nèi)眾多創(chuàng)業(yè)公司而言,每一幀視頻的生成都是在燃燒真金白銀。

更可怕的是,視頻模型似乎還沒有摸到“Scaling Law”(縮放定律)的邊界,或者說,繼續(xù)Scaling的邊際收益正在遞減,而邊際成本卻在指數(shù)級上升。

為了追求更好的物理模擬效果,模型參數(shù)量需要進一步擴大,訓練所需的高質(zhì)量視頻數(shù)據(jù)(如電影級素材、高幀率實拍)卻比文本數(shù)據(jù)更加稀缺且版權(quán)復雜。

互聯(lián)網(wǎng)上雖然有海量視頻,但大部分是低質(zhì)量、高壓縮、缺乏標注的“垃圾數(shù)據(jù)”,清洗和標注這些數(shù)據(jù)的成本遠高于文本。

用戶的使用習慣也加劇了這一困境。在ChatGPT中,用戶輸入Query,得到答案,流程是線性的。而在視頻生成中,由于結(jié)果的不可控,用戶往往需要反復生成、反復修改,就像玩“老虎機”一樣,直到搖出滿意的畫面。

這意味著,一個最終可用的視頻片段背后,可能伴隨著十幾次甚至幾十次的廢片生成。這些廢片消耗的算力,全部是沉沒成本。

目前,無論是國內(nèi)的可靈、即夢,還是國外的Sora、Veo,都在面臨同一個拷問:這把火到底能燒多久?

如果無法在算力成本與生成效果之間找到一個具備正向經(jīng)濟效益的平衡點,那么視頻生成極有可能成為一個“叫好不叫座”的富人游戲。

在硬件架構(gòu)出現(xiàn)革命性突破之前,算力瓶頸將死死卡住視頻AI大規(guī)模普及的咽喉。

03 商業(yè)困境



其實說到底,技術(shù)競速與算力成本最終都要回歸到一個終極問題:商業(yè)模式。

為什么ChatGPT能迅速成為殺手級應用?因為它直接解決了信息檢索、代碼編寫、文案撰寫等具有明確“生產(chǎn)力屬性”的剛需,且交付結(jié)果相對確定。

反觀視頻生成,目前的定位極其模糊。

在C端市場,視頻AI陷入了“玩具化”的陷阱。絕大多數(shù)用戶下載Sora或可靈,更多是出于獵奇心理。他們生成幾個搞怪視頻發(fā)朋友圈,獲得社交貨幣后,新鮮感便迅速消退。這解釋了為什么首日留存率尚可,但30天留存率會暴跌至1%。

對于普通人而言,制作視頻并非高頻剛需,且目前AI視頻生成的精細度遠未達到替代拍攝的程度,更無法提供TikTok那種基于算法推薦的娛樂消費體驗。

指望AI生成工具去取代TikTok,在現(xiàn)階段無異于癡人說夢——一個是生產(chǎn)工具,一個是內(nèi)容消費平臺,兩者的底層邏輯截然不同。

在B端專業(yè)市場,視頻AI其實同樣面臨著“不可控”的致命傷。對于影視制作、廣告營銷等專業(yè)領(lǐng)域,核心訴求是“精確控制”——導演需要指定角色的微表情、光影的具體走向、物體運動的精確軌跡。

目前的視頻大模型,雖然能生成“看起來很美”的畫面,但本質(zhì)上還是基于概率的“抽卡”。好萊塢大亨泰勒·佩里雖然因為看了Sora的演示而暫停了影視基地的擴建,但這更多是一種對未來的防御性恐慌,而非當下的實際替代。

真正的影視工作流中,由于AI生成內(nèi)容難以保持角色一致性和場景連續(xù)性,導致其目前只能充當“動態(tài)分鏡腳本”或“靈感參考”,很難直接輸出成品素材。

最后也是最為關(guān)鍵的,還是變現(xiàn)路徑的狹窄。

目前主流的商業(yè)模式依然是Sora、Runway采用的SaaS訂閱制,即賣點數(shù)、賣時長。但在高昂的推理成本面前,這種訂閱費往往只能勉強覆蓋成本,甚至虧本賺吆喝。如果為了覆蓋成本而提高定價,又會將大量中小用戶拒之門外,限制了規(guī)模效應的形成。

國內(nèi)市場的情況更為復雜。

可靈、即夢等背靠短視頻巨頭,它們的算盤或許不是直接賣會員賺錢,而是將AI能力融入到自家的短視頻生態(tài)中,降低創(chuàng)作者門檻,從而維持內(nèi)容生態(tài)的繁榮,最終通過廣告和電商變現(xiàn)。

這是一種“羊毛出在豬身上”的策略。但問題在于,如果AI生成的視頻內(nèi)容泛濫且質(zhì)量參差不齊,反而可能稀釋平臺的內(nèi)容質(zhì)量,導致用戶審美疲勞。

從這個角度來看,視頻AI目前正處于Gartner技術(shù)成熟度曲線的“期望膨脹期”頂峰滑落向“泡沫破裂谷底期”的階段。

雖然谷歌、OpenAI、快手、字節(jié)都在全力以赴,但視頻AI距離“GPT時刻”,也就是要成為一個低門檻、高可用、全行業(yè)通用的基礎(chǔ)設(shè)施,目前看,無論硅谷還是國內(nèi)大廠,都還有很長的路要走。

這不僅需要算法層面的突破來解決“可控性”難題,更需要算力成本的數(shù)量級下降,以及一個能真正能夠跑通ROI的殺手級應用場景。

在此之前,視頻AI注定依然是一場還得繼續(xù)海量燒錢的馬拉松。

*題圖由AI生成

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
張雪峰離世后,峰學蔚來接班人終于曝光

張雪峰離世后,峰學蔚來接班人終于曝光

陳意小可愛
2026-03-25 18:07:07
多名醫(yī)生建議:血糖不超過這個值,該吃吃該喝喝,吃點甜的更健康

多名醫(yī)生建議:血糖不超過這個值,該吃吃該喝喝,吃點甜的更健康

健康之光
2026-03-24 22:20:04
全網(wǎng)動容!兄弟哭曝張雪峰往事,人民日報發(fā)聲,衛(wèi)健委嚴查

全網(wǎng)動容!兄弟哭曝張雪峰往事,人民日報發(fā)聲,衛(wèi)健委嚴查

海闊山遙YAO
2026-03-26 05:46:42
地球上最牛比、最搞笑、最奇葩、最屌爆的武裝:非洲叛軍

地球上最牛比、最搞笑、最奇葩、最屌爆的武裝:非洲叛軍

年代回憶
2026-03-25 20:30:16
謝苗新片火出國外了!爛番茄100分封神,已定檔5月上映

謝苗新片火出國外了!爛番茄100分封神,已定檔5月上映

喜歡歷史的阿繁
2026-03-26 01:17:02
炸穿阿瓦士!美以聯(lián)手端掉伊朗革命衛(wèi)隊總部,現(xiàn)場夷成白地

炸穿阿瓦士!美以聯(lián)手端掉伊朗革命衛(wèi)隊總部,現(xiàn)場夷成白地

老馬拉車莫少裝
2026-03-23 13:00:44
內(nèi)部人士:NBA或?qū)⑷∠齑牽茟选惣{德的“無效”合同

內(nèi)部人士:NBA或?qū)⑷∠齑牽茟选惣{德的“無效”合同

好火子
2026-03-25 23:51:43
微軟前CTO長文控訴:Windows被搞成一鍋粥!14年14次轉(zhuǎn)變、17種GUI共存

微軟前CTO長文控訴:Windows被搞成一鍋粥!14年14次轉(zhuǎn)變、17種GUI共存

快科技
2026-03-25 15:13:32
徹底涼涼!世界第一右后衛(wèi)空降皇馬,阿諾德伯納烏生涯懸了

徹底涼涼!世界第一右后衛(wèi)空降皇馬,阿諾德伯納烏生涯懸了

奶蓋熊本熊
2026-03-25 03:54:43
爽,公司全員裁撤,就地解散!

爽,公司全員裁撤,就地解散!

黯泉
2026-03-21 12:20:16
伊朗復仇,美國最害怕的事情發(fā)生!戰(zhàn)爭令人想起這位累死的大人物

伊朗復仇,美國最害怕的事情發(fā)生!戰(zhàn)爭令人想起這位累死的大人物

華人星光
2026-03-20 11:48:15
史上最大反轉(zhuǎn)!《紅色沙漠》開發(fā)商股價跌后暴漲27%

史上最大反轉(zhuǎn)!《紅色沙漠》開發(fā)商股價跌后暴漲27%

3DM游戲
2026-03-25 16:26:05
滿月宴風波升級!汪小菲一句話當場“打臉”,馬筱梅瞬間尷尬

滿月宴風波升級!汪小菲一句話當場“打臉”,馬筱梅瞬間尷尬

橙星文娛
2026-03-23 10:20:57
科威特逮捕六名涉嫌暗殺計劃的嫌疑人 - 與伊朗支持的真主黨有關(guān)

科威特逮捕六名涉嫌暗殺計劃的嫌疑人 - 與伊朗支持的真主黨有關(guān)

一種觀點
2026-03-26 08:22:43
成都寶媽近一年狂掃5套“老破小”!地鐵口+軟裝實現(xiàn)以租養(yǎng)貸

成都寶媽近一年狂掃5套“老破小”!地鐵口+軟裝實現(xiàn)以租養(yǎng)貸

封面新聞
2026-03-25 21:28:05
以色列打不動了想?;?,伊朗說不:47年的賬,今天得算清

以色列打不動了想停火,伊朗說不:47年的賬,今天得算清

阿傖說事
2026-03-26 03:58:41
長期不住的房子,物業(yè)費能少交嗎?民法典早說了,別再交冤枉錢!

長期不住的房子,物業(yè)費能少交嗎?民法典早說了,別再交冤枉錢!

老特有話說
2026-03-11 14:47:30
“戲混子”又來嚯嚯央視?。侩p眼無神、演技拉夸,還不如7歲孩子

“戲混子”又來嚯嚯央視???雙眼無神、演技拉夸,還不如7歲孩子

科普100克克
2026-03-26 00:45:32
江蘇銀行,正在甩賣地產(chǎn)壞賬

江蘇銀行,正在甩賣地產(chǎn)壞賬

牛刀財經(jīng)
2026-03-25 13:07:54
張雪峰公司對聯(lián)已拆!一個月前注冊近40枚“姩菡”商標,捐款千萬

張雪峰公司對聯(lián)已拆!一個月前注冊近40枚“姩菡”商標,捐款千萬

離離言幾許
2026-03-25 15:07:06
2026-03-26 09:03:00
節(jié)點AI incentive-icons
節(jié)點AI
專注于人工智能領(lǐng)域的產(chǎn)業(yè)媒體
107文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

硅谷因AI大裁員?一線工程師戳破真相

頭條要聞

"10元手沖咖啡"阿姨曾1天賣1000杯 如今只賣兩三杯

頭條要聞

"10元手沖咖啡"阿姨曾1天賣1000杯 如今只賣兩三杯

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產(chǎn)分割復雜!是否立遺囑成關(guān)鍵

財經(jīng)要聞

黃仁勛:芯片公司的時代已經(jīng)結(jié)束了

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

數(shù)碼
房產(chǎn)
親子
健康
游戲

數(shù)碼要聞

開源隱私平板open_slate發(fā)布:獨立物理開關(guān)可切斷傳感器電源

房產(chǎn)要聞

41億!259畝!建學校…三亞這個大城更,最新方案曝光!

親子要聞

四歲萌娃歐洲街頭挑戰(zhàn)街舞,圍觀路人紛紛為小萌娃鼓掌

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

啊?GameStop推叛逃套餐:用PS5換Xbox 倒貼你69刀

無障礙瀏覽 進入關(guān)懷版