国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話智象未來CTO姚霆:當(dāng)Sora退場后,世界模型的終局是"輪回"

0
分享至

以Sora的發(fā)布和關(guān)停為時間節(jié)點,AI視頻生成產(chǎn)業(yè)分為兩個世界。

2024年春節(jié),OpenAI發(fā)布Sora,一石激起千層浪,當(dāng)年5月17日,智象未來旗下vivago平臺上線,這個時間點比快手可靈還早了兩周,這家核心班底來自微軟亞研院的多模態(tài)大模型創(chuàng)企,并不缺少對技術(shù)的敏銳嗅覺。

一年后,OpenAI驟然宣布關(guān)停了Sora的獨立服務(wù),將視頻生成功能并入ChatGPT的付費體系,留給行業(yè)是一些未有明確答案的思考,多模態(tài)大模型的技術(shù)和商業(yè)化會走向何處,創(chuàng)業(yè)企業(yè)又該如何在窗口關(guān)閉前找到自己的空間。

在智象未來聯(lián)合創(chuàng)始人兼CTO姚霆看來,Sora的退場并非偶然,而是通用視頻生成這門好技術(shù)在商業(yè)化面前的必然結(jié)局,對于當(dāng)前火爆的世界模型賽道,他給出了一個頗具哲學(xué)意味的答案:輪回。

據(jù)了解,智象未來的 ARR(年度經(jīng)常性收入)達(dá)到數(shù)千萬美元量級,B輪融資正在最后 Close階段,持續(xù)獲得產(chǎn)業(yè)資本加持。這家公司的路線選擇,或許代表了中國 AIGC 創(chuàng)業(yè)公司在多模態(tài)賽道上的一種生存策略。


通用視頻生成是一門好技術(shù),不是Sora的好生意

對話伊始,姚霆便開門見山地給出了自己的判斷。在他看來,Sora的“失敗”可以從三個維度來理解。

"第一,Sora想做的是非常通用的視頻生成,但這與垂直領(lǐng)域的應(yīng)用需求相對脫離。"姚霆分析道,"OpenAI天然沒有視頻相關(guān)的業(yè)務(wù),也沒有那樣的生態(tài)。"

第二,成本是不可忽視的現(xiàn)實問題。"今天跟互聯(lián)網(wǎng)時代不一樣,所有的服務(wù)上線背后都在跑GPU,成本還是很昂貴的。"姚霆坦言,智象每一次模型迭代,推理成本都是首要考量因素,做模型架構(gòu)本身就要考慮成本,否則后面就沒法做大量服務(wù)。

第三,Sora缺乏商業(yè)化的土壤。對比字節(jié)跳動的Seedance和快手的可靈,這兩家公司的視頻生成產(chǎn)品都能與主營業(yè)務(wù)形成協(xié)同,而OpenAI并沒有這樣的業(yè)務(wù)場景來承接技術(shù)能力。

Sora的退場,也折射出國內(nèi)外視頻生成路線的差異。

"國外更看重模型架構(gòu)的創(chuàng)新,國內(nèi)則傾向于做大而全的平臺鏈路。"姚霆觀察道。對于智象來說,這兩條路都不是唯一選擇。

"我們是從技術(shù)出身的,以前在微軟的時候,大家想做全世界最好的模型,對標(biāo)谷歌、Facebook、CMU、伯克利。"姚霆回憶,"做視頻理解的模型,這種基因天然就是希望模型上有架構(gòu)創(chuàng)新。"

智象也的確在踐行這一點。從2023年的Unet架構(gòu),到DiT,再到自回歸+DiT的融合,直到今天全新的全模態(tài)架構(gòu),智象每一次迭代都試圖在技術(shù)層面做更多的創(chuàng)新,而且每次還是精準(zhǔn)的踩住了整個技術(shù)迭代的突破口。

"但同時,在中國做這件事,肯定還是要以垂直領(lǐng)域的商業(yè)化作為導(dǎo)向。"姚霆強調(diào),"不是為了做模型炫技,而是要有商業(yè)化落地的指標(biāo)。"

世界模型的五個等級——從靜態(tài)復(fù)刻到"輪回"

世界模型的概念在過去一年里經(jīng)歷了劇烈的收斂過程,也是當(dāng)前多數(shù)大模型相關(guān)企業(yè)想要講述的故事。

"世界模型的定義一直很廣,早期可以分成三個類別。"姚霆解釋道,"第一類是以語言模型為主,屬于高層知識的提煉和壓縮;第二類是Yann LeCun做的JEPA,偏中層的表達(dá)學(xué)習(xí);第三類是底層的像素生成,也就是視頻生成。"

但如今,世界模型的定義正在收斂。姚霆認(rèn)為,今天的世界模型可以大致分為三類:在視頻生成模型中融入因果關(guān)系和物理規(guī)律;根據(jù)用戶指令實時生成場景(如Genie-3);以及跟具身智能強相關(guān)的World Action Model。

對于智象而言,姚霆更看重兩個維度的突破。

"第一個是模型側(cè),要用一個神經(jīng)網(wǎng)絡(luò)同時理解和生成文本、圖像、視頻、3D以及動作。"姚霆強調(diào),"它一定是端到端的全模態(tài)架構(gòu),各個模態(tài)之間不會單獨編碼,而是統(tǒng)一的tokenization。"

為什么要追求"全模態(tài)"而非"多模態(tài)"?姚霆的解釋很直接:"世界模型好歹要跟物理世界打通,如果不打通憑什么叫世界模型?從這個角度來說肯定要有具身的數(shù)據(jù),不然就是割裂的數(shù)字世界模型。"

在他看來,世界模型的底座是基于視頻訓(xùn)練出來的,還是基于VLA(視覺-語言-動作)訓(xùn)練出來的,其實并不重要,最終的形態(tài)一定是任意輸入,任意輸出,想怎么輸入,想它輸出什么它就可以輸出什么。

但這還不是終局。


"從宏觀角度,我對世界模型分了幾個等級。"姚霆說,"第一級是靜態(tài)復(fù)刻,就是一幅圖;第二級是視頻,有三維有時間域;第三級是交互;第四級加入物理規(guī)律和因果關(guān)系;第五級,終局是輪回。"

他進(jìn)一步解釋道,"輪回是什么?是完美的因果關(guān)系。比如蝴蝶效應(yīng),今天我在這兒扇了一下翅膀,明天那個地方就應(yīng)該出現(xiàn)海嘯。再往上一級,才是真正的世界模型,才是真正的推理。"

這個說法聽起來有些哲學(xué)意味,但姚霆很快將其拉回到產(chǎn)品層面。

"第二個維度是Agent。"他說,"所有的Agentic App等于一個平臺(可能是PC或手機)乘以Harness(對底層skills的管理、適配和組合),再加上底層的skills(可能是OS或OpenAI)。"

姚霆舉例說明:用戶想做一個VLOG,只需要輸入"我想賺錢"這一句話,Agent就能自動搜索、調(diào)用、編排各種skills,完成從腳本撰寫到視頻制作的全流程。

"這需要全模態(tài)的支持。"姚霆強調(diào),"底層有文本、視頻、圖像、語音,全打通了,才能知道誰跟誰該怎么組合。"

大廠環(huán)伺,創(chuàng)業(yè)公司如何出牌?

快手可靈月收入突破兩千萬美元,即夢背靠字節(jié)過億的生態(tài)日活。在這樣的雙寡頭格局下,智象這樣的創(chuàng)業(yè)公司如何找到出路?

"大廠在資本、人才、算力上都有優(yōu)勢,包括入口。"姚霆坦率表示,但在某些條件下,它的束縛也會比較多,難免對主營業(yè)務(wù)有所妥協(xié)。相比之下,創(chuàng)業(yè)公司的團(tuán)隊架構(gòu)更加靈活。

"AI時代,機會是相對平等的。"姚霆說,"但作為初創(chuàng)公司,有幾點還是要做好。"

第一,認(rèn)知要新。

"首先要對整個趨勢有充分的預(yù)判,不能等大廠做到什么樣我們再復(fù)制,這樣基本就沒機會。"姚霆強調(diào),"還要有堅持,要做正確但很難的事情。智象的產(chǎn)品經(jīng)理現(xiàn)在必須會用vibe-coding(AI輔助編程)。"

第二,速度要快。

"AI產(chǎn)品的穩(wěn)定版本,產(chǎn)品推上線,用戶用兩次能成功得到一次想要的結(jié)果,這就是穩(wěn)定版本。"姚霆說,"讓用戶使用、反饋、迭代,這樣才能形成壁壘。"

第三,架構(gòu)要靈活。

"產(chǎn)品和技術(shù)的邊界越來越模糊,因為產(chǎn)品也可以通過vibe-coding寫前端。"姚霆打了個比方,"有點像打牌,上手一副牌很難改變,但出牌方式可以調(diào)整,有些‘王炸’是要拆掉的。"

面對大廠競爭,智象的應(yīng)對策略已經(jīng)明確:2026年的核心戰(zhàn)略是搭建"1+1+3"的架構(gòu)體系。

"第一個'1'是全模態(tài)底座大模型,這是最重要的。"姚霆解釋道,"第二個'1'是HiHarness平臺,可以理解為中間的Harness層,負(fù)責(zé)打通各種skills。'3'是優(yōu)先級最高的三個Agent:專業(yè)創(chuàng)作者智能體、商業(yè)營銷內(nèi)容生成智能體、AI影視智能體。未來還會拓展出更多方向,比如具身智能、游戲引擎等。"


這個架構(gòu)的核心邏輯,是從"分而治之"轉(zhuǎn)向"并而治之"。

姚霆說,"以前不同創(chuàng)作用不同方式,可能是工具可能是內(nèi)容,今天會變成一個并而治之。底座是Agent,上面根據(jù)不同場景去實例化。"

他把這個邏輯比作搜索引擎:"當(dāng)年做搜索引擎,下面有眾多網(wǎng)頁,今天網(wǎng)頁變成skills,如何在海量里面尋找、定位、編排,這是核心問題。"

全模態(tài)底座的價值就在于此,如果全模態(tài)模型天然把這些模態(tài)之間打通,那么只要建一套索引就可以解決所有模態(tài)的事情,不管用戶輸入什么,想要得到什么,都可以給到用戶最終結(jié)果。(本文作者 | 張帥,編輯 | 楊林)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
意大利、挪威、西班牙等15國外長發(fā)表聯(lián)合聲明:以色列在黎軍事行動和真主黨襲擊都必須停止

意大利、挪威、西班牙等15國外長發(fā)表聯(lián)合聲明:以色列在黎軍事行動和真主黨襲擊都必須停止

環(huán)球網(wǎng)資訊
2026-04-02 10:45:12
40年來最慘重?fù)p失,美媒:以軍尸橫遍野,1天內(nèi)報銷21輛坦克

40年來最慘重?fù)p失,美媒:以軍尸橫遍野,1天內(nèi)報銷21輛坦克

深析古今
2026-04-01 16:15:43
中國男足一度壓著巴西打 U16國少雖敗猶榮:0-1惜敗 教練被批太菜

中國男足一度壓著巴西打 U16國少雖敗猶榮:0-1惜敗 教練被批太菜

風(fēng)過鄉(xiāng)
2026-04-03 06:14:28
美媒:若中國不償還百年前的債務(wù),美國也將不承認(rèn)欠華8600億美元

美媒:若中國不償還百年前的債務(wù),美國也將不承認(rèn)欠華8600億美元

文史達(dá)觀
2025-03-18 12:54:58
日本熱議美和無緣8強!疲勞成要因 中國仍乒壇高墻 王藝迪太強

日本熱議美和無緣8強!疲勞成要因 中國仍乒壇高墻 王藝迪太強

顏小白的籃球夢
2026-04-03 10:26:30
拒絕爆冷!哈登關(guān)鍵球殺死比賽!騎士鎖定季后賽,悍將飆6三分

拒絕爆冷!哈登關(guān)鍵球殺死比賽!騎士鎖定季后賽,悍將飆6三分

體壇小李
2026-04-03 13:06:26
官宣!2026深圳粵B牌搖號新規(guī)公布!

官宣!2026深圳粵B牌搖號新規(guī)公布!

深圳本地寶
2026-04-03 10:56:29
蘭迪·喬治被要求辭職并立即退休

蘭迪·喬治被要求辭職并立即退休

南方都市報
2026-04-03 11:28:32
上海交大校慶宣傳片引爭議,校方緊急致歉!

上海交大校慶宣傳片引爭議,校方緊急致歉!

品牌新
2026-04-02 10:40:05
莫迪發(fā)布命令,允許進(jìn)口中國設(shè)備,美媒:印度無法成為另一個中國

莫迪發(fā)布命令,允許進(jìn)口中國設(shè)備,美媒:印度無法成為另一個中國

動漫里的童話
2026-04-03 11:21:08
伊拉克前主帥曾表示球隊進(jìn)世界杯自己就跳樓,如今球迷催其兌現(xiàn)諾言

伊拉克前主帥曾表示球隊進(jìn)世界杯自己就跳樓,如今球迷催其兌現(xiàn)諾言

懂球帝
2026-04-03 01:26:11
德轉(zhuǎn)列缺席世界杯時間最長國家:古巴88年居首,國足上榜

德轉(zhuǎn)列缺席世界杯時間最長國家:古巴88年居首,國足上榜

懂球帝
2026-04-03 12:15:20
有種預(yù)感,洪秀柱這次是真豁出去了!

有種預(yù)感,洪秀柱這次是真豁出去了!

達(dá)文西看世界
2026-04-02 16:51:59
意大利足協(xié)主席、布馮相繼辭職,多名球員痛斥“花錢才能出場”

意大利足協(xié)主席、布馮相繼辭職,多名球員痛斥“花錢才能出場”

澎湃新聞
2026-04-03 10:07:08
張雪峰三大遺憾!50萬沒留住父親、對不起妻子,還有誤女兒前程

張雪峰三大遺憾!50萬沒留住父親、對不起妻子,還有誤女兒前程

八斗小先生
2026-03-27 16:18:15
這種“偶像”被年輕人擁躉,貽害無窮!

這種“偶像”被年輕人擁躉,貽害無窮!

胖胖說他不胖
2026-04-03 11:50:12
女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

青蘋果sht
2026-02-22 06:58:10
中方還是晚了一步,五點倡議剛發(fā),海灣國家將參戰(zhàn),特朗普倒計時

中方還是晚了一步,五點倡議剛發(fā),海灣國家將參戰(zhàn),特朗普倒計時

面包夾知識
2026-04-03 13:30:29
26688分!得分榜第17位啊,36歲還在破紀(jì)錄,北境之王,真的強

26688分!得分榜第17位啊,36歲還在破紀(jì)錄,北境之王,真的強

球童無忌
2026-04-02 21:35:59
晚飯七分飽被推翻了?醫(yī)生提醒:過了56歲,吃飯盡量要做到這幾點

晚飯七分飽被推翻了?醫(yī)生提醒:過了56歲,吃飯盡量要做到這幾點

荊醫(yī)生科普
2026-04-03 13:35:03
2026-04-03 14:16:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
131766文章數(shù) 862051關(guān)注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

牛彈琴:美國干了一件令人發(fā)指的事 全世界都無法接受

頭條要聞

牛彈琴:美國干了一件令人發(fā)指的事 全世界都無法接受

體育要聞

沖擊世界杯失敗,80歲老帥一氣之下病倒了

娛樂要聞

《浪姐7》最新人氣TOP 曾沛慈斷層第一

財經(jīng)要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠(yuǎn)房親戚長得很像嗎?

態(tài)度原創(chuàng)

健康
手機
親子
數(shù)碼
公開課

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

手機要聞

榮耀600系列海外開啟預(yù)熱 設(shè)計影像AI三大突破

親子要聞

清明假期,想更快的療愈躺平孩子,一定要這樣做!

數(shù)碼要聞

瘋狂!Intel CPU今年將漲價30%:還好有AMD

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版