国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

它沒有名字,沒有團(tuán)隊(duì)—卻在一周內(nèi)擊敗了全球最強(qiáng)的AI視頻模型

0
分享至


4月7日,一個(gè)沒有公司署名、沒有官方聲明、連GitHub倉庫都指向"即將上線"的視頻生成模型,悄悄出現(xiàn)在了全球最權(quán)威的AI視頻競(jìng)技場(chǎng)Artificial Analysis的排行榜上。

七天之后,它登上了榜首。

它的名字叫HappyHorse-1.0。在Artificial Analysis的盲測(cè)體系中,文生視頻方向Elo分1333、圖生視頻方向Elo分1392,兩個(gè)榜單雙料第一,將字節(jié)跳動(dòng)的Seedance 2.0、快手的Kling 3.0、谷歌的Veo 3.1遠(yuǎn)遠(yuǎn)甩在身后。這是迄今為止圖生視頻方向的歷史最高分。

讓這件事更耐人尋味的是:在奪得榜首之前,沒有人知道它是誰做的。

這個(gè)排行榜,為什么騙不了人

大多數(shù)AI基準(zhǔn)測(cè)試都有同一個(gè)漏洞:發(fā)布數(shù)字的,正是做出模型的人。

Artificial Analysis不一樣。它的Video Arena采用的是盲測(cè)加Elo積分制——用戶提交一個(gè)提示詞,系統(tǒng)同時(shí)用兩個(gè)匿名模型生成視頻,用戶在不知道來源的情況下選出更好的那個(gè),票數(shù)按Elo算法(與國際象棋等級(jí)分相同的數(shù)學(xué)邏輯)累計(jì)成最終排名。60分的Elo差距,意味著一個(gè)模型在兩兩對(duì)決中大約有58%到59%的勝率。而HappyHorse-1.0在文生視頻方向領(lǐng)先第二名整整60分。

這個(gè)分?jǐn)?shù)是數(shù)萬個(gè)人類真實(shí)偏好投票的結(jié)果,沒有實(shí)驗(yàn)室的自我匯報(bào),沒有精心挑選的演示樣本。Artificial Analysis在宣布這個(gè)模型進(jìn)入競(jìng)技場(chǎng)時(shí),用了一個(gè)詞:"pseudonymous"(匿名投稿)。換句話說,連平臺(tái)自己都不知道背后是誰。

那段時(shí)間,榜單上的排名每天都在變。HappyHorse-1.0短暫從榜單消失了一次,然后又回來了。事后復(fù)盤,那很可能不是技術(shù)故障,而是一次刻意的停頓——在確認(rèn)公開聲明之前,先暫時(shí)撤下。

在最好的時(shí)機(jī),踢開了最脆弱的門

4月10日,阿里巴巴旗下淘天集團(tuán)的Future Life Lab正式承認(rèn):HappyHorse-1.0是他們做的,隸屬ATH AI創(chuàng)新部門,技術(shù)負(fù)責(zé)人張迪,此前是快手副總裁、Kling AI的技術(shù)主導(dǎo)者。

這個(gè)時(shí)機(jī),幾乎算是精準(zhǔn)踩點(diǎn)。

就在HappyHorse出現(xiàn)前后,AI視頻生成賽道兩個(gè)最強(qiáng)的西方選手接連出了問題。OpenAI在2026年初關(guān)閉了Sora的獨(dú)立應(yīng)用和平臺(tái),給出的理由是算力成本過高、戰(zhàn)略重心轉(zhuǎn)向AGI和企業(yè)工具;而字節(jié)跳動(dòng)的Seedance 2.0雖然憑借自帶剪輯分鏡的視頻效果引爆了AI漫劇行業(yè)(甚至有制作公司把上班時(shí)間改到凌晨三點(diǎn),只為搶占低峰期的算力),卻在全球推廣中撞上了好萊塢主要制片廠和流媒體平臺(tái)的版權(quán)投訴,被迫暫停國際擴(kuò)張。

兩強(qiáng)同時(shí)空出位置,留下了一個(gè)等待被填補(bǔ)的真空。用一位觀察者的話說:"HappyHorse不是打贏了對(duì)手,是對(duì)手在同一時(shí)間倒下了,而它剛好站在那里。"

當(dāng)然,"剛好站在那里"本身就需要過硬的東西。Elo分不會(huì)說謊。

一個(gè)架構(gòu)決定,讓音頻不再是"后期"

視頻生成領(lǐng)域長期存在一個(gè)隱性的分裂:生成視頻是一件事,配上聲音是另一件事,二者由不同的模型或工具完成,然后拼接在一起。這套流程的代價(jià)是明顯的——嘴型對(duì)不上,環(huán)境音突兀,配樂像是粘貼進(jìn)去的。

HappyHorse-1.0的架構(gòu)選擇打破了這個(gè)分裂。

它采用的是單流統(tǒng)一Transformer結(jié)構(gòu),40層自注意力網(wǎng)絡(luò),文字、圖像、視頻幀、音頻四種模態(tài)的token從始至終在同一個(gè)序列里處理,沒有專門的跨模態(tài)注意力模塊。官方的說法是"三明治架構(gòu)":首尾各4層模態(tài)專屬層,中間32層全模態(tài)共享層。音頻和視頻在生成過程中始終是同一次前向傳播(forward pass)的產(chǎn)物,不是事后合成的。

結(jié)果是什么?口型精確對(duì)上了語音,腳步聲踩在地面接觸的那一幀,背景噪音隨著場(chǎng)景切換自然過渡。它目前支持7種語言的音視頻同步生成,包括英語、普通話、粵語、日語、韓語、德語和法語。在"有音頻"類別的排行上,HappyHorse-1.0位列第二,僅次于谷歌Veo 3.1。

這個(gè)排名有意思的地方在于:在傳統(tǒng)上最難做好的維度,一個(gè)"神秘新來者"的表現(xiàn)接近了調(diào)動(dòng)了谷歌全部多模態(tài)研究積累的Veo系列。

開源的承諾,和一個(gè)"即將上線"的空鏈接

故事到這里有一個(gè)裂縫,值得直接說清楚。

HappyHorse-1.0官網(wǎng)上寫著:基礎(chǔ)模型、蒸餾模型、超分辨率模塊、推理代碼,全部開源,Apache 2.0授權(quán),允許商用。這在技術(shù)圈引發(fā)了大量轉(zhuǎn)發(fā)和期待。

截至4月14日,HuggingFace的模型頁已經(jīng)存在,README文檔在當(dāng)天仍在持續(xù)更新——但文件列表里只有兩個(gè)文件:.gitattributes 和 README.md。沒有模型權(quán)重,沒有推理代碼,沒有任何可以實(shí)際運(yùn)行的東西。比起此前各家官網(wǎng)指向的"coming soon"空鏈接,這是一個(gè)進(jìn)步,但距離"真正可用的開源"還差最關(guān)鍵的一步。

"名義上開源"和"真正可用的開源"之間,有一道需要被跨過的門。

對(duì)開發(fā)者來說,開源意味著能下載權(quán)重、運(yùn)行推理代碼、基于它做微調(diào)。目前這些都還不存在。阿里巴巴承諾了API接入的計(jì)劃,但時(shí)間表不明確。

這不是要否定這個(gè)模型的技術(shù)成就。Elo排名是真實(shí)的人類偏好數(shù)據(jù),跑不掉。但如果把HappyHorse-1.0納入實(shí)際產(chǎn)品決策,現(xiàn)在需要的不是Elo分,而是一個(gè)可以調(diào)用的接口或可以運(yùn)行的權(quán)重文件。兩者都還不在。

快手出走的人,在阿里做出了什么

前快手副總裁、Kling AI技術(shù)主導(dǎo)者張迪,是這個(gè)項(xiàng)目公開身份中可見度最高的名字。

Kling系列是快手在視頻生成賽道的代表作,2024年以流暢的人物動(dòng)作生成在業(yè)內(nèi)建立了口碑。張迪之后加入阿里巴巴淘天集團(tuán),主導(dǎo)了Future Life Lab。HappyHorse-1.0的推理速度優(yōu)化思路——用DMD-2蒸餾將去噪步驟壓縮到8步,配合自研的MagiCompiler推理編譯器——在Kling系列的工程迭代中能看到類似的脈絡(luò)。

這條人員流動(dòng)線索,某種程度上解釋了為什么一個(gè)"神秘模型"能在上線一周內(nèi)就達(dá)到歷史最高Elo分:做模型的人,不是第一次做模型了。

不過阿里的"認(rèn)領(lǐng)"聲明里有一句話耐人尋味:項(xiàng)目"仍在開發(fā)中"。這通常意味著眼前的版本不是終態(tài)——它更像是一次技術(shù)摸底,用真實(shí)榜單驗(yàn)證架構(gòu)方向是否正確,然后決定下一步怎么走。

當(dāng)Sora退出,戰(zhàn)場(chǎng)變成了中國公司的主場(chǎng)

更大的背景是:AI視頻生成這條賽道,正在快速變成一場(chǎng)中國公司之間的競(jìng)爭(zhēng)。

OpenAI關(guān)閉Sora之后,其他主要選手還剩Runway Gen-4和Luma Dream Machine。但這兩家的Elo分與頭部中國模型的差距在過去三個(gè)月內(nèi)持續(xù)擴(kuò)大。字節(jié)的Seedance 2.0雖然遭遇版權(quán)風(fēng)波,但技術(shù)底子依然扎實(shí)。阿里的HappyHorse橫空出世,把Wan 2.7系列的既有積累與新架構(gòu)整合,直接沖到榜首。還有快手Kling 3.0、PixVerse V6持續(xù)迭代。

這不是一兩個(gè)爆款模型的偶然,而是整個(gè)中國視頻生成研究群體在過去兩年密集積累之后的集中浮現(xiàn)。

一個(gè)值得關(guān)注的價(jià)格信號(hào):中國AI視頻工具目前的商用定價(jià),普遍在每秒生成內(nèi)容約4美分左右,而西方同類服務(wù)的價(jià)格高出數(shù)倍。如果HappyHorse-1.0的API如期開放,開發(fā)者將面臨一個(gè)真實(shí)的選擇:在畫質(zhì)和速度接近甚至超越的前提下,是否愿意把視頻生成底層依托在一個(gè)中國公司提供的接口上?

這個(gè)問題,答案不會(huì)只有一種。

Q&A

Q1:HappyHorse-1.0的Elo排名是否可信,會(huì)不會(huì)是刷榜?

Artificial Analysis Video Arena的機(jī)制本身針對(duì)刷榜做了設(shè)計(jì)——用戶看不到是哪個(gè)模型生成的,投票基于真實(shí)偏好,Elo算法會(huì)根據(jù)對(duì)手強(qiáng)度加權(quán)。另一個(gè)佐證是,HappyHorse在"有音頻"類別中排名第二,如果是刷榜優(yōu)化,通常會(huì)針對(duì)全部類別同時(shí)拉高,而非在某些維度有明顯落差。短期內(nèi)憑借某類生成風(fēng)格的優(yōu)化偶爾占優(yōu)是可能的,但持續(xù)領(lǐng)先60+ Elo分需要大量比賽場(chǎng)次的穩(wěn)定勝出,這不是短期操縱能做到的。

Q2:HappyHorse-1.0最核心的技術(shù)突破是什么?

最值得關(guān)注的是單流統(tǒng)一Transformer對(duì)音視頻的聯(lián)合建模。傳統(tǒng)模型把視頻和音頻分開生成再合并,導(dǎo)致同步誤差。HappyHorse把所有模態(tài)放進(jìn)同一個(gè)token序列,在一次推理過程中同時(shí)輸出視頻幀和同步音頻,這從根本上消除了"拼接"帶來的對(duì)不上問題。配合DMD-2蒸餾(8步去噪)和MagiCompiler加速,在H100上生成1080p視頻約38秒,比同級(jí)別模型快30%。

Q3:現(xiàn)在能用HappyHorse-1.0做項(xiàng)目嗎?

目前只能通過官方在線平臺(tái)試用,沒有公開的API接口,也沒有可下載的模型權(quán)重。HuggingFace頁面已上線,文檔持續(xù)在更新,但模型權(quán)重和推理代碼尚未發(fā)布。對(duì)需要接入實(shí)際產(chǎn)品或工作流的開發(fā)者和制作團(tuán)隊(duì)來說,HappyHorse-1.0現(xiàn)在的價(jià)值更多在于"了解技術(shù)方向",而非立刻可以落地部署的工具。

END本文來自至頂AI實(shí)驗(yàn)室,一個(gè)專注于對(duì)AI計(jì)算機(jī)、工作站及各類AI相關(guān)硬件設(shè)備,開展基于真實(shí)使用場(chǎng)景評(píng)測(cè)的研究機(jī)構(gòu)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗女博主因以軍空襲遇難,至死不知伊朗情報(bào)部長家在自家附近

伊朗女博主因以軍空襲遇難,至死不知伊朗情報(bào)部長家在自家附近

網(wǎng)易新聞出品
2026-04-17 16:52:32
4月起后備箱嚴(yán)查!這3樣?xùn)|西再放就是違法,90%還不知道

4月起后備箱嚴(yán)查!這3樣?xùn)|西再放就是違法,90%還不知道

音樂時(shí)光的娛樂
2026-04-17 13:11:03
年輕人為什么寧愿跑單也不進(jìn)廠?廣州藍(lán)寶書數(shù)據(jù)很刺眼:送外賣15萬,工人才6萬

年輕人為什么寧愿跑單也不進(jìn)廠?廣州藍(lán)寶書數(shù)據(jù)很刺眼:送外賣15萬,工人才6萬

風(fēng)向觀察
2026-04-17 16:36:41
“天津突發(fā)8.8級(jí)地震”?警方通報(bào)

“天津突發(fā)8.8級(jí)地震”?警方通報(bào)

大象新聞
2026-04-16 17:41:08
拼多多太虎了!暴力抗法,被罰15億!處罰決定書曝光

拼多多太虎了!暴力抗法,被罰15億!處罰決定書曝光

說財(cái)貓
2026-04-17 19:51:40
“見過最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

“見過最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

妍妍教育日記
2026-04-15 09:30:09
今年最大空襲:烏克蘭上百人死傷!F-16一次擊落這么多目標(biāo)?

今年最大空襲:烏克蘭上百人死傷!F-16一次擊落這么多目標(biāo)?

鷹眼Defence
2026-04-17 18:43:57
訪華結(jié)束,蘇林搭上回國火車,臨走前向中國借飛機(jī),越南打破慣例

訪華結(jié)束,蘇林搭上回國火車,臨走前向中國借飛機(jī),越南打破慣例

軍機(jī)Talk
2026-04-17 20:35:48
黎以?;?0天,兩國代表合影轟動(dòng)中東!被真主黨控制的黎巴嫩為何與以色列談判

黎以?;?0天,兩國代表合影轟動(dòng)中東!被真主黨控制的黎巴嫩為何與以色列談判

紅星新聞
2026-04-17 17:17:23
馬關(guān)條約簽約131年同日,日艦闖入臺(tái)灣海峽,高市早苗上臺(tái)后首次

馬關(guān)條約簽約131年同日,日艦闖入臺(tái)灣海峽,高市早苗上臺(tái)后首次

軍機(jī)Talk
2026-04-17 20:54:52
周立波近況引熱議!定居美國現(xiàn)身同學(xué)會(huì),坐核心位抽雪茄大放厥詞

周立波近況引熱議!定居美國現(xiàn)身同學(xué)會(huì),坐核心位抽雪茄大放厥詞

鑒史錄
2026-04-16 23:30:31
爺爺生前錄音贈(zèng)孫女109萬元遺產(chǎn),六個(gè)姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

爺爺生前錄音贈(zèng)孫女109萬元遺產(chǎn),六個(gè)姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

魯中晨報(bào)
2026-04-17 17:00:03
中國駐英國使館發(fā)言人就英媒稱伊朗部署中國衛(wèi)星監(jiān)視美國駐中東基地事答記者問

中國駐英國使館發(fā)言人就英媒稱伊朗部署中國衛(wèi)星監(jiān)視美國駐中東基地事答記者問

界面新聞
2026-04-17 07:13:08
震驚!面館“免費(fèi)加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

震驚!面館“免費(fèi)加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

火山詩話
2026-04-17 07:28:41
雷軍挑戰(zhàn)成功!小米新SU7行駛1313公里只充1次電,連續(xù)直播15個(gè)小時(shí),多名車友一路跟隨

雷軍挑戰(zhàn)成功!小米新SU7行駛1313公里只充1次電,連續(xù)直播15個(gè)小時(shí),多名車友一路跟隨

極目新聞
2026-04-17 22:41:31
WCBA總決賽:張茹準(zhǔn)絕殺山西女籃滅四川追到1-1 王思雨丟關(guān)鍵兩罰

WCBA總決賽:張茹準(zhǔn)絕殺山西女籃滅四川追到1-1 王思雨丟關(guān)鍵兩罰

醉臥浮生
2026-04-17 21:58:04
世界超級(jí)摩托車錦標(biāo)賽荷蘭站:張雪機(jī)車奪得超級(jí)桿位賽第二名

世界超級(jí)摩托車錦標(biāo)賽荷蘭站:張雪機(jī)車奪得超級(jí)桿位賽第二名

環(huán)球網(wǎng)資訊
2026-04-17 23:38:04
阿爾斯通股價(jià)大跌36%

阿爾斯通股價(jià)大跌36%

每日經(jīng)濟(jì)新聞
2026-04-17 15:24:39
許家印倒臺(tái)后,恒大歌舞團(tuán)長白珊珊近照曝光,曝已嫁人生活滋潤

許家印倒臺(tái)后,恒大歌舞團(tuán)長白珊珊近照曝光,曝已嫁人生活滋潤

180視角
2026-04-17 11:44:13
馬斯克自己買了1279輛Cybertruck

馬斯克自己買了1279輛Cybertruck

碳基打工人
2026-04-16 22:31:13
2026-04-18 01:36:49
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
3319文章數(shù) 170關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒35.97億元

頭條要聞

特朗普:感謝伊朗開放霍爾木茲海峽

頭條要聞

特朗普:感謝伊朗開放霍爾木茲海峽

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩(wěn)的開掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

旅游
親子
本地
教育
公開課

旅游要聞

用斯皮爾伯格鏡頭,邀請(qǐng)您來諸城春茶開園!來玩!

親子要聞

找不到工作的幼師 去寵物幼兒園教“毛孩子”了

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

教育要聞

了解下:最偏愛中國留學(xué)生的企業(yè)?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版