国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛!阿里開放世界模型“快樂生蠔”來了,從視頻到一個(gè)新世界

0
分享至


智東西
作者|王涵
編輯|李水青

智東西4月16日?qǐng)?bào)道,剛剛,阿里ATH創(chuàng)新事業(yè)部也發(fā)布了其首款開放式世界模型HappyOyster(快樂生蠔)

基于原生多模態(tài)架構(gòu),該模型支持多模態(tài)理解、音視頻聯(lián)合生成以及實(shí)時(shí)世界構(gòu)建與交互。

▲一個(gè)自由行走的伐木棕熊,角色與場(chǎng)景在轉(zhuǎn)向后都可以保持一致性

在HappyOyster中,僅憑一行文本或一張圖片,用戶就可以生成一個(gè)完整的物理世界。并且,其生成的并非僅僅是視頻片段,而是一個(gè)持續(xù)運(yùn)行的物理世界。在這個(gè)世界里,光照、重力、角色動(dòng)作以及場(chǎng)景間的因果關(guān)系都保持時(shí)間和邏輯上的連續(xù)一致。

▲真實(shí)還原梵高畫作風(fēng)格和細(xì)節(jié),元素依照物理規(guī)律放置,隨著視角轉(zhuǎn)換無畸變現(xiàn)象

與傳統(tǒng)的「寫提示詞—等待渲染—收到成片」一次性工作流的AI視頻工具不同,在整個(gè)生成過程中HappyOyster可以實(shí)時(shí)接收指令,場(chǎng)景會(huì)實(shí)時(shí)作出反應(yīng),并隨著用戶的持續(xù)指令不斷演化。同時(shí),用戶生成的數(shù)字世界,不僅能被完整保存,還能開放給其他用戶進(jìn)行二次創(chuàng)作。

▲用戶可以創(chuàng)造出一個(gè)實(shí)時(shí)滑雪的場(chǎng)景,角色轉(zhuǎn)向自如,雪地上的滑板印清晰明顯

智東西第一時(shí)間獲取了邀請(qǐng)碼,體驗(yàn)后發(fā)現(xiàn)HappyOyster在“世界一致性”上確實(shí)帶來了驚喜,主角形象、場(chǎng)景風(fēng)格和物體位置都可以保持穩(wěn)定,沒有出現(xiàn)常見的畸變或錯(cuò)亂。同時(shí),實(shí)時(shí)修改指令后,世界畫面能夠立刻響應(yīng)。不過目前,模型的流暢度還有待提升,控制人物移動(dòng)與鏡頭旋轉(zhuǎn),都能感知到卡頓。

自3月阿里巴巴CEO吳泳銘帶隊(duì)組建ATH以來,團(tuán)隊(duì)動(dòng)作不斷。此前在開發(fā)者圈引發(fā)熱潮的HappyHorse尚未登場(chǎng),HappyOyster就已試圖將布局拓展至更遠(yuǎn):從 “生成視頻”,正式邁向AI領(lǐng)域?qū)<依铒w飛所提出的 “生成世界” 全新高地。

該模型于今日開啟內(nèi)測(cè),內(nèi)測(cè)名額還在持續(xù)釋放中。

體驗(yàn)地址:https://www.happyoyster.cn/

一、親測(cè)生成世界:人物不畸變、場(chǎng)景絲滑切換,但視角切換有卡頓

據(jù)HappyOyster官網(wǎng)介紹,目前該模型具備導(dǎo)演模式漫游模式。其中,導(dǎo)演模式生成的世界最多可以有3分鐘,分辨率可以選擇480p或720p;漫游模式則至多生成1分鐘的世界,且清晰度只有480p。兩種模式下,世界都是聲畫同時(shí)生成的。


▲導(dǎo)演模式與漫游模式參數(shù)

在導(dǎo)演模式中,用戶可以隨時(shí)介入所生成的世界,通過文本、語(yǔ)音或圖像來切換鏡頭角度、指導(dǎo)角色行動(dòng),或改變故事的走向,世界會(huì)立即響應(yīng),并按照這些指令繼續(xù)展開。

▲潛水員在海底接近沉船

我們?cè)趯?dǎo)演模式下,選擇480p的清晰度和“Regular”和“Steady”模式,輸入提示詞如下:

[開場(chǎng)] 你是一名火星基地的宇航員,結(jié)束艙外作業(yè),進(jìn)入氣閘艙。關(guān)閉厚重艙門,氣壓讀數(shù)上升。摘下頭盔,汗水順著臉頰滑落,深吸一口循環(huán)空氣中的金屬味。 [走進(jìn)生活艙] 綠色植物在LED燈下生長(zhǎng),跑步機(jī)靠墻,舷窗外紅色荒漠延伸至地平線。坐到電腦前,敲下:“第287天,一切正常?!?[推開植物艙門] 濕潤(rùn)的熱浪撲面而來。番茄藤爬滿支架,LED燈光閃爍,自動(dòng)灌溉系統(tǒng)發(fā)出輕微的嘶嘶聲。 [爬上觀測(cè)臺(tái)] 進(jìn)入穹頂觀測(cè)臺(tái)。360度全景玻璃外,火星星空璀璨奪目,火衛(wèi)一正快速劃過天際。 [進(jìn)入休息艙] 穿過走廊進(jìn)入休息艙。窄小的床鋪,墻上貼著家人的照片。躺下時(shí),飛船金屬骨架發(fā)出熟悉的吱呀聲。

HappyOyster生成世界的效果如下:

從視頻清晰度來看,HappyOyster生成的畫面整體清晰,場(chǎng)景切換時(shí)畫質(zhì)穩(wěn)定無斷層;在真實(shí)感上,主角身材、衣著、樣貌均未出現(xiàn)畸變,宇宙飛船風(fēng)格也保持統(tǒng)一,不過在場(chǎng)景切換時(shí)仍帶有一定AI生成痕跡。視頻所配的背景音樂也符合畫面調(diào)性。

指令遵循方面,輸入修改指令后世界能夠立即響應(yīng)并實(shí)時(shí)更改畫面,執(zhí)行效率較高;物理規(guī)律層面,整體符合基礎(chǔ)物理邏輯,但也存在少量bug,比如角色從窗戶進(jìn)入時(shí),窗框出現(xiàn)了像橡皮一樣被扯開的變形問題。

在漫游模式中,用戶能以第一人稱漫游,自由改變方向和鏡頭運(yùn)動(dòng),突破原有畫面邊界,而世界則會(huì)持續(xù)生成并保持連貫。在這個(gè)世界里,物體的位置保持穩(wěn)定,環(huán)境隨時(shí)間持續(xù)存在,用戶移動(dòng)時(shí)視角與光照也會(huì)連續(xù)響應(yīng)。

▲一個(gè)男人在廢土世界中行走

我們?cè)诼文J较逻x擇第三人稱視角,輸入提示詞如下:

一位穿著冰藍(lán)色長(zhǎng)裙的銀發(fā)女子站在冰封的湖面上。雪花圍繞她飛舞,她的長(zhǎng)發(fā)和裙擺隨風(fēng)飄動(dòng)。背景是極光和雪山,冰面反射出她的身影和極光。鏡頭圍繞她旋轉(zhuǎn),捕捉冰晶在陽(yáng)光下折射的七彩光芒。

從視頻清晰度來看,HappyOyster生成的世界畫面清晰,漫游過程中視角轉(zhuǎn)動(dòng)、場(chǎng)景切換都十分流暢,光影效果會(huì)跟隨視角自然變化,鏡頭旋轉(zhuǎn)一周后,場(chǎng)景內(nèi)物體位置依舊保持固定,沒有出現(xiàn)漂移錯(cuò)亂。

在真實(shí)感與AI痕跡上,生成的環(huán)境與主角形象高度貼合提示詞描述,人物無畸變、無穿模,整體自然真實(shí),AI生成痕跡較弱。在指令遵循程度上,模型能準(zhǔn)確響應(yīng)操控指令,可順暢控制角色行進(jìn)方向,以及鏡頭的朝向與角度。

在物理規(guī)律層面,場(chǎng)景物體空間位置穩(wěn)定,視角與光影的聯(lián)動(dòng)變化符合現(xiàn)實(shí)邏輯,整體物理表現(xiàn)連貫合理。

美中不足的是,無論是在導(dǎo)演模式還是漫游模式下,控制人物和鏡頭還會(huì)出現(xiàn)卡頓的情況。

在X上,也有用戶分享出了自己的作品。她制作了一一個(gè)顏色鮮艷、光怪陸離的世界,在世界中有一個(gè)小男孩背著背包在行走。這位網(wǎng)友說(她)使用的是導(dǎo)演模式,分辨率480p,選擇「常規(guī)」與「穩(wěn)定」設(shè)定,然后輸入提示詞即可。

▲網(wǎng)友實(shí)例(來源:X)

除了現(xiàn)實(shí)風(fēng)格,用戶在HappyOyster中還可以生成漫畫、水墨畫、素描等不同畫風(fēng) 的世界。

▲漫畫風(fēng)格的世界,汽車川流不息

此外,世界中的主角也不僅僅局限于人類,在HappyOyster里,用戶還可以創(chuàng)造以物品或動(dòng)物、昆蟲等為第一視角的世界。

▲足球視角在足球場(chǎng)上滾動(dòng)

▲螞蟻視角在衣服上爬行

二、對(duì)標(biāo)谷歌Genie3,阿里押注“世界模擬器”路線

相比大語(yǔ)言模型相對(duì)成熟的模型架構(gòu)和技術(shù)范式,世界模型仍屬于前沿探索領(lǐng)域。

據(jù)HappyOyster團(tuán)隊(duì)介紹,阿里的HappyOyster與谷歌的Genie3同屬于世界模擬器流派。區(qū)別于傳統(tǒng)文生視頻模型輸入提示詞、等待渲染、獲得成片的被動(dòng)流程,這一流派采用長(zhǎng)時(shí)間跨度上的世界演化建模方式。

通過學(xué)習(xí)海量長(zhǎng)視頻數(shù)據(jù),以及文本、動(dòng)作指令、圖像參考等多樣控制信號(hào),模型能夠主動(dòng)理解空間、物理與因果規(guī)律,預(yù)測(cè)情節(jié)和畫面的演變,從而把“被動(dòng)生成內(nèi)容”轉(zhuǎn)變?yōu)椤爸鲃?dòng)模擬世界演化”。

此次阿里發(fā)布的HappyOyster采用了時(shí)間跨度更長(zhǎng)的世界演化建模方式,使得模型能夠保持高保真、長(zhǎng)時(shí)序的動(dòng)態(tài)場(chǎng)景生成。

同時(shí),該模型在建模初始就設(shè)計(jì)了多樣的控制信號(hào),使模型能夠在統(tǒng)一的時(shí)序框架下同時(shí)實(shí)現(xiàn)生成質(zhì)量、長(zhǎng)時(shí)序與實(shí)時(shí)可控性的協(xié)同優(yōu)化。

結(jié)語(yǔ):阿里入局,給世界模型再添一把火

阿里ATH創(chuàng)新事業(yè)部在2026年3月正式成立,到今天是整一個(gè)月。

在這一個(gè)月的時(shí)間里,ATH創(chuàng)新事業(yè)部發(fā)布了企業(yè)級(jí)AI原生工作平臺(tái)“悟空”、AI開發(fā)工具秒悟Meoo、視頻大模型HappyHorse,進(jìn)度不可謂不驚人。

今天阿里ATH正式入局世界模型,給世界模型賽道再添一把猛火。

在阿里發(fā)布世界模型的同一天,騰訊也推出了混元3D世界模型2.0。前一天李飛飛的渲染引擎Spark 2.0開源,1月愛詩(shī)科技發(fā)布了世界模型PixVerse R1。

這4個(gè)月以來,世界模型更新的節(jié)奏快得讓人喘不過氣,也能從側(cè)面反映出:世界模型已經(jīng)開始真刀真槍地?fù)尩乇P了。

這場(chǎng)關(guān)于“誰(shuí)能造出更真、更活、更好玩的數(shù)字世界”的較量,才剛剛熱起來。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美軍擴(kuò)大對(duì)伊朗航運(yùn)物資封鎖范圍

美軍擴(kuò)大對(duì)伊朗航運(yùn)物資封鎖范圍

新華社
2026-04-16 20:07:20
只喝燒開的自來水,不碰桶裝水,不買礦泉水,最后結(jié)果如何?

只喝燒開的自來水,不碰桶裝水,不買礦泉水,最后結(jié)果如何?

芹姐說生活
2026-04-16 19:35:17
澳門有多大

澳門有多大

新科文
2026-04-16 18:31:53
女子利用天氣預(yù)報(bào)頻繁購(gòu)買飛機(jī)延誤險(xiǎn),5年買中900多次,獲賠近300萬,被抓時(shí):我符合保險(xiǎn)理賠要求

女子利用天氣預(yù)報(bào)頻繁購(gòu)買飛機(jī)延誤險(xiǎn),5年買中900多次,獲賠近300萬,被抓時(shí):我符合保險(xiǎn)理賠要求

譚老師地理大課堂
2026-04-15 20:11:42
5月1日起全國(guó)嚴(yán)查!以前的“小事”現(xiàn)在可能坐牢,抓緊了解一下!

5月1日起全國(guó)嚴(yán)查!以前的“小事”現(xiàn)在可能坐牢,抓緊了解一下!

老特有話說
2026-04-16 14:59:37
投訴公交提前發(fā)車,竟丟了工作?松原男子稱個(gè)人信息遭泄露,單位被施壓后將其解雇

投訴公交提前發(fā)車,竟丟了工作?松原男子稱個(gè)人信息遭泄露,單位被施壓后將其解雇

大風(fēng)新聞
2026-04-16 16:07:03
一季度GDP出爐:消費(fèi)數(shù)據(jù)太扎心了!

一季度GDP出爐:消費(fèi)數(shù)據(jù)太扎心了!

櫻桃大房子
2026-04-16 21:16:49
1599元!小米新機(jī)突然上架,真復(fù)古!

1599元!小米新機(jī)突然上架,真復(fù)古!

科技堡壘
2026-04-16 11:27:05
就這張照片,他已經(jīng)秒殺了絕大多數(shù)有錢人

就這張照片,他已經(jīng)秒殺了絕大多數(shù)有錢人

動(dòng)物奇奇怪怪
2026-04-16 15:22:15
一個(gè)30噸鋼卷,滾出了2026最“重量級(jí)”的地獄笑話

一個(gè)30噸鋼卷,滾出了2026最“重量級(jí)”的地獄笑話

果殼
2026-04-16 12:17:28
開拓者約談楊瀚森,引發(fā)震動(dòng)!老板勃然大怒,全員整頓!

開拓者約談楊瀚森,引發(fā)震動(dòng)!老板勃然大怒,全員整頓!

劉哥談體育
2026-04-16 11:30:39
普京敲定訪華,特朗普緊急下命令,中國(guó)通告全球,無懼美國(guó)威脅

普京敲定訪華,特朗普緊急下命令,中國(guó)通告全球,無懼美國(guó)威脅

書紀(jì)文譚
2026-04-16 18:08:02
男子因噪音過敏住5年隔音艙:自己設(shè)計(jì),已接上百個(gè)訂單,幫噪音受困者找回睡眠

男子因噪音過敏住5年隔音艙:自己設(shè)計(jì),已接上百個(gè)訂單,幫噪音受困者找回睡眠

半島官網(wǎng)
2026-04-16 11:20:50
任正非小女兒代言華為炸場(chǎng)!網(wǎng)友:代言人都自研,你們拿什么和我爭(zhēng)...

任正非小女兒代言華為炸場(chǎng)!網(wǎng)友:代言人都自研,你們拿什么和我爭(zhēng)...

品牌新
2026-04-16 12:10:00
王健林,被逼到崩潰邊緣...

王健林,被逼到崩潰邊緣...

鳴金網(wǎng)
2026-04-16 19:42:33
慘??!6億豪陣??!輸?shù)锰牧耍∮忠亟耍?>
    </a>
        <h3>
      <a href=籃球盛世
2026-04-16 12:36:36
鴻山寺方丈法云法師去世,終年61歲,3天前還好好的,弟子曝原因

鴻山寺方丈法云法師去世,終年61歲,3天前還好好的,弟子曝原因

180視角
2026-04-16 11:34:36
喜訊!北約宣布向?yàn)跆峁?00億美元援助,烏軍2026年軍費(fèi)達(dá)1700億

喜訊!北約宣布向?yàn)跆峁?00億美元援助,烏軍2026年軍費(fèi)達(dá)1700億

史政先鋒
2026-04-16 16:09:37
最新:同濟(jì)大學(xué)已成立調(diào)查組

最新:同濟(jì)大學(xué)已成立調(diào)查組

南方都市報(bào)
2026-04-16 16:57:13
新型出軌,越來越流行了!

新型出軌,越來越流行了!

黯泉
2026-04-16 21:56:14
2026-04-17 00:03:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11611文章數(shù) 117031關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰(shuí)在大模型上更高效

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰生意迷霧

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

旅游
家居
房產(chǎn)
藝術(shù)
公開課

旅游要聞

社評(píng):讀懂“China Travel”持續(xù)圈粉的邏輯

家居要聞

智能舒適 簡(jiǎn)約風(fēng)尚

房產(chǎn)要聞

人人人人!封關(guān)后首屆消博會(huì),擠爆了!

藝術(shù)要聞

張大千『 花菓薈萃冊(cè)』

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版