国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

阿里HappyHorse突然上線!實測讓馬斯克和奧爾特曼法庭開撕,還手搓了GTA6

0
分享至


智東西
作者 陳駿達(dá)
編輯 心緣

智東西4月27日報道,今天,阿里ATH創(chuàng)新事業(yè)部的最新視頻生成與編輯模型HappyHorse 1.0(官方譯名:快樂小馬)開啟灰度測試。創(chuàng)作者可在阿里云百煉平臺和HappyHorse官網(wǎng)注冊使用,大眾用戶可在千問App中體驗。


在盲測平臺Arena.ai上,HappyHorse 1.0在文生視頻、圖生視頻、視頻編輯三個榜單上均排名第二,僅次于前段時間爆火的字節(jié)Seedance 2.0。為驗證HappyHorse 1.0的真實效果,我們進(jìn)行了多維度的實測。


只需輸入簡單的文字描述,用戶就可用HappyHorse 1.0生成一段3s-15s長度的視頻,視頻中可以實現(xiàn)多鏡頭切換、連貫劇情等要素。

官網(wǎng)顯示,HappyHorse 1.0分辨率最高支持1080p,最多可同時生成4個視頻,生成720P和1080P視頻的刊例價分別為0.9元/s及1.6元/s,Pro套餐包月價格疊加限時折扣后為0.44元/s和0.78元/s。


同時,HappyHorse 1.0也出現(xiàn)在阿里旗下多款產(chǎn)品中,如阿里悟空、MuleRun和JVS Claw等Agent平臺。千問App預(yù)告,近期將上線“測一測”視頻玩法,測出用戶在短劇宇宙的本名角色后,通過HappyHorse 1.0生成用戶本人“出演”的角色短劇片段。

在這次實測中,我們發(fā)現(xiàn)了HappyHorse 1.0在指令遵循、生成速度方面的明顯優(yōu)勢,也看到了它在畫面物理準(zhǔn)確性、音畫同步等方面仍有提升空間。以下是我們提煉出的核心體驗要點:

(1)生成速度快:體驗過程中,生成一段視頻僅需約2-5分鐘,與其他視頻生成模型相比有一定競爭力。

(2)指令遵循能力強:能準(zhǔn)確理解并執(zhí)行復(fù)雜的提示詞要求,包括鏡頭運動、畫面構(gòu)圖、風(fēng)格氛圍等。

(3)多元素參考還原度高:圖生視頻中能準(zhǔn)確呈現(xiàn)所有上傳的參考元素,包括人物、場景、道具等。

(4)音畫同步仍有提升空間:人聲、音效等同步效果較好,但是在樂器演奏等復(fù)雜場景中,模型生成的手部動作與音頻節(jié)奏存在明顯錯位。

(5)長敘事易穿幫:10s以上的較長視頻中,容易出現(xiàn)物理bug,比如無外力物體自移動等等。

(6)文字渲染錯誤:畫面中出現(xiàn)的文字常出現(xiàn)亂碼或錯誤。

以下是我們的完整實測過程:

一、能理解800詞超長提示詞,物理真實性還有提升空間

我們的首批實測任務(wù)聚焦文生視頻能力。在這一場景中,模型的指令遵循能力、生成結(jié)果的物理準(zhǔn)確性、音畫同步效果等都是值得關(guān)注的能力點。

案例1:復(fù)雜動作與音畫同步

提示詞: 街頭音樂表演,鼓手敲擊節(jié)奏、吉他手彈奏旋律,觀眾圍成半圈隨節(jié)奏拍手并輕微擺動身體,氛圍熱烈,拉美風(fēng)格,傍晚暖色燈光,鏡頭緩慢推進(jìn)。

HappyHorse 1.0的生成速度是一大亮點,下方視頻生成的耗時大概在2分鐘左右。從生成結(jié)果上來看,HappyHorse 1.0生成的人像沒有出現(xiàn)肢體異常、扭曲等問題,鏡頭運動、畫面燈光等元素符合提示詞要求。

音畫同步效果是這段視頻中的缺憾。吉他手的演奏和視頻里的音樂節(jié)奏不同步,尤其在某些快速掃弦和重拍落點上,畫面中的手部動作與音頻中的音符出現(xiàn)錯位,破壞了演奏的真實感與沉浸感。

案例2:物理真實性

提示詞: 海邊懸崖上,海浪猛烈拍打巖石,水花飛濺,天空烏云密布,風(fēng)吹動人物衣服和頭發(fā),電影級真實感,慢動作。

在這一案例中,HappyHorse 1.0需要完成對物理世界的模擬,其難點在于對水體、風(fēng)這些元素的呈現(xiàn)。

最終,HappyHorse 1.0的生成結(jié)果很好地還原了波濤洶涌的效果,海浪與巖石的撞擊、海面上的泡沫都較為符合物理規(guī)律。

切換到人物后,主角頭發(fā)的飄動方向和衣服的飄動方向基本一致。美中不足的是,近景畫面中水滴滑落的速度不太符合物理規(guī)律,顯得略微慢了半拍。

案例三:超長提示詞

提示詞:

在這一案例中,我們考察了HappyHorse 1.0對復(fù)雜提示詞的理解能力。這段提示詞長達(dá)800詞,描述的是一個類似知名游戲《GTA》的實機演示畫面。

我們的提示詞對畫面中幾乎所有元素都進(jìn)行了定義,包括人物、天氣、環(huán)境、建筑等等,HappyHorse 1.0對這些元素都做到了準(zhǔn)確呈現(xiàn)。

不過,開頭的第一個畫面出現(xiàn)了物理bug,車門在沒有受到外力的情況下自己關(guān)閉了。最后一個鏡頭中,主角出現(xiàn)了變化,這顯示出HappyHorse在這一案例中的一致性方面還有提升空間。


案例四:鏡頭語言與敘事感

提示詞: 夜晚城市街道,一名偵探在雨中行走,霓虹燈反射在濕漉漉的地面上,鏡頭從遠(yuǎn)景緩慢拉近到特寫,電影黑色風(fēng)格。

上方提示詞對運鏡方式、畫面風(fēng)格都做了細(xì)致的規(guī)定,這對HappyHorse 1.0的指令遵循能力提出要求。

最終,HappyHorse 1.0準(zhǔn)確呈現(xiàn)了從遠(yuǎn)景緩慢拉近到特寫的鏡頭要求,電影風(fēng)格呈現(xiàn)準(zhǔn)確,霓虹燈的光線和反射都較為自然,但畫面中的中文文字渲染有明顯錯誤。

在這一案例中,我們還采用了1080P的分辨率和最長的15s時長,可以看到,放大后的畫面細(xì)節(jié)依然較為清晰。


從這幾個案例來看,在提示詞要求較為詳細(xì)時,HappyHorse 1.0可以較好地理解并執(zhí)行復(fù)雜的畫面構(gòu)圖、鏡頭運動和風(fēng)格氛圍要求,生成的人物形體與基礎(chǔ)物理交互也相對穩(wěn)定;但在高精度音畫同步、微觀物理細(xì)節(jié)以及畫面中的文字渲染方面仍有提升空間。

二、最多支持9圖參考,實測讓奧爾特曼和馬斯克“對簿公堂”

除了文生視頻之外,HappyHorse 1.0也支持圖生視頻與視頻編輯,這些場景對一致性、穩(wěn)定性提出了較高要求。不過,在今天的實際測試過程中,我們始終未能成功體驗視頻編輯能力。

案例一:首幀模式

我們首先嘗試了圖生視頻功能中的首幀模式,所上傳的圖片是OpenAI聯(lián)合創(chuàng)始人兼CEO薩姆·奧爾特曼和Anthropic聯(lián)合創(chuàng)始人兼CEO達(dá)里奧·阿莫迪前段時間的合影。

不過,可能是因為畫面中涉及多位真實人物,模型拒絕了這一生成請求。


之后我們上傳了奧爾特曼的單人照,要求模型生成他喝咖啡的畫面。這次嘗試最后成功了,畫面中人物與真人照片的相似度應(yīng)該能達(dá)到8成左右,并且隨著光線和背景的變化,人物的樣貌沒有出現(xiàn)改變。

案例二:多人物參考

多圖參考中,我們上傳了馬斯克與奧爾特曼的圖像,要求HappyHorse 1.0提前想象一下這兩位人物對簿公堂、激烈爭吵的畫面。

這次HappyHorse 1.0也沒有拒絕我們的生成請求,它給出的首版生成結(jié)果中,并沒能體現(xiàn)出二人爭吵的效果,主要是“馬斯克”在單方面輸出。此外,模型似乎不理解這兩位人物的母語都是英語,畫面中“馬斯克”操著一口流利的中文。

再進(jìn)一步細(xì)化要求后,HappyHorse 1.0能夠生成二人用英語爭論的畫面,其中人物的表情豐富,但是與參考圖相比出現(xiàn)了較為明顯的偏差。

案例三:多元素參考

除了上傳多個人物之外,多圖參考也允許用戶對視頻模型生成畫面的背景、具體元素等提供素材。我們便上傳了Sora核心人物Bill Peebles、OpenAI辦公室、紙箱等元素,要求HappyHorse 1.0生成一個離職的畫面。

在這一案例中,HappyHorse 1.0做得較高的方面是它準(zhǔn)確呈現(xiàn)了我們上傳的所有參考元素,人物、環(huán)境等都基本一致。

然而畫面中出現(xiàn)了不少物理bug,比如紙箱自動合上,門自動打開等等。

三、1080P、生成速度成HappyHorse亮點

在HappyHorse 1.0開始測試之際,智東西等部分媒體與多位參與HappyHorse 1.0測試的業(yè)內(nèi)人士與探討了這一模型目前的表現(xiàn),及其在行業(yè)中的競爭站位。

出海一站式AI電商營銷平臺麥斯國際的技術(shù)合伙人李明認(rèn)為,3s-15s的生成長度、較快的生成速度、支持1080P是HappyHorse 1.0的亮點功能。同時,在提示詞較為明確的情況下,模型的產(chǎn)出效果“還可以”。

然而,在實踐中,HappyHorse 1.0也展現(xiàn)出一些問題,比如生成視頻結(jié)果的一致性、生成語音內(nèi)容的機械感等等。李明認(rèn)為,HappyHorse 1.0與字節(jié)Seedance 2.0、OpenAI Sora 2等模型相比,“還有一些再提升的空間”。

我們向李明提及實測過程中遇到的音畫同步、文字渲染等問題。李明稱,字幕等文字內(nèi)容的渲染其實是當(dāng)前AI視頻生成模型的通病,目前業(yè)內(nèi)很少靠大模型直接生成,而是會借助后期工具進(jìn)行補充,這種模式也給調(diào)整留有余地。

音畫同步方面,李明觀察到通過更好的提示詞工程,可以提升HappyHorse 1.0、Seedance 2.0等模型的音畫同步效果,但這些模型目前在音畫同步維度多少還存在一些問題。

李明判斷,對企業(yè)而言,當(dāng)前視頻生成模型的生成質(zhì)量仍是一個普遍存在的痛點,部分創(chuàng)作團隊的“抽卡率”甚至高達(dá)50%-60%。生成的時效性也還有提升空間。

相比之下,價格反而是用戶更容易接受的維度。如果能做到又快又好,用戶對價格的接受度自然會隨之提高。

參與內(nèi)測的AI視頻創(chuàng)作平臺FLOVA相關(guān)團隊認(rèn)為,HappyHorse 1.0模型在真實感與敘事能力上表現(xiàn)不錯,尤其適合敘事性內(nèi)容、紀(jì)錄片風(fēng)格的題材。

同時,HappyHorse 1.0的焦段運用接近實拍,減輕了視頻的“AI感”,讓觀感更加真實,其鏡頭運動也比較自然。

結(jié)語:一匹有潛力的“快樂小馬”

從我們的體驗感受來看,HappyHorse 1.0可以是一款不錯的的視頻生成模型,其較強的指令遵循能力為專業(yè)創(chuàng)作者提供了更多的精細(xì)化控制的空間,一定程度上降低了反復(fù)抽卡、試錯帶來的資源浪費。

然而,HappyHorse 1.0的畫面還有不少可提升的空間,比如畫面的“油膩感”、物理準(zhǔn)確性等等。隨著HappyHorse進(jìn)一步迭代,這一模型有望在真實生產(chǎn)場景中發(fā)揮更大作用。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會審查

美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會審查

魯中晨報
2026-05-02 18:03:06
聞泰科技“帶帽”首日一字跌停 封單超41億元

聞泰科技“帶帽”首日一字跌停 封單超41億元

財聞
2026-05-06 11:08:36
1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

阿器談史
2026-04-26 14:13:38
新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機”

新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機”

發(fā)現(xiàn)新西蘭
2026-05-06 13:20:33
提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

雪狼侃體育
2026-05-06 19:18:33
蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

倫倫媽愛歷史
2026-05-02 10:01:48
斯洛伐克擬派F-16戰(zhàn)機參加北約防空任務(wù),從2028年起計劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

斯洛伐克擬派F-16戰(zhàn)機參加北約防空任務(wù),從2028年起計劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

魯中晨報
2026-05-06 19:54:03
1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

興趣知識
2026-05-05 17:43:16
牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

柏銘銳談
2026-05-04 20:40:53
小鹿好局痛失,淚灑賽場,中韓女團五強對決,韓國3:1獲勝

小鹿好局痛失,淚灑賽場,中韓女團五強對決,韓國3:1獲勝

月滿大江流
2026-05-06 16:58:31
妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

千秋文化
2026-03-25 21:49:57
估值數(shù)億美元,A.O.史密斯中國要賣了

估值數(shù)億美元,A.O.史密斯中國要賣了

融資中國
2026-05-05 09:59:32
以色列死局已定,無人能救!

以色列死局已定,無人能救!

大國觀察眼
2026-04-28 06:05:05
賈斯汀·比伯:一場音樂節(jié)如何讓播放量暴漲18倍

賈斯汀·比伯:一場音樂節(jié)如何讓播放量暴漲18倍

熱搜摘要官
2026-05-05 18:09:18
內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

夜白侃球
2026-05-06 15:19:02
伊斯蘭革命衛(wèi)隊:如果美國再犯錯誤,就燒毀報廢他們的巨型戰(zhàn)艦!

伊斯蘭革命衛(wèi)隊:如果美國再犯錯誤,就燒毀報廢他們的巨型戰(zhàn)艦!

混沌錄
2026-04-30 00:12:11
“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

美芽
2026-05-06 18:30:49
森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

羅說NBA
2026-05-06 05:52:40
官宣:杰倫·布朗因公開批評裁判將被處以5萬美元罰款

官宣:杰倫·布朗因公開批評裁判將被處以5萬美元罰款

北青網(wǎng)-北京青年報
2026-05-06 19:59:03
吳宜澤:奧沙利文在決賽關(guān)鍵時刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

吳宜澤:奧沙利文在決賽關(guān)鍵時刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

懂球帝
2026-05-05 21:25:07
2026-05-06 20:35:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11749文章數(shù) 117061關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財經(jīng)要聞

最新GDP!全國30強城市,又變了

汽車要聞

領(lǐng)克10/領(lǐng)克10+ 無論能源形式 領(lǐng)克都要快樂

態(tài)度原創(chuàng)

時尚
本地
旅游
健康
軍事航空

夏天的白裙,可以像赫本那樣穿

本地新聞

用青花瓷的方式,打開西溪濕地

旅游要聞

花海+武俠+說媒“五一”假期滬郊金山廊下吸引游客超2.5萬人次

干細(xì)胞治燒燙傷面臨這些“瓶頸”

軍事要聞

實施不到48小時 特朗普緊急喊停"霍爾木茲自由計劃"

無障礙瀏覽 進(jìn)入關(guān)懷版