国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

米哈游蔡浩宇A(yù)I公司首個(gè)視頻模型曝光了

0
分享至

米哈游蔡浩宇的AI公司Anuttacon,首個(gè)視頻模型正式曝光!

Anuttacon技術(shù)團(tuán)隊(duì)成員@Ailing Zeng,在X上展示了全新視頻角色表演生成模型——LPM 1.0

主打一個(gè)讓AI角色人物表現(xiàn)得更《出神入化》~


大家先看下面這位AI小哥,生動(dòng)演繹了一場(chǎng)16秒變換N種情緒的超絕大戲,你就說(shuō)這情緒拿捏到不到位吧:

不僅如此,在LPM 1.0模型中,連讓AI人物「聽(tīng)別人說(shuō)話」這事兒也同步進(jìn)化了。(天吶.jpg)

哪怕不張口、只是安靜坐著當(dāng)一個(gè)認(rèn)真聆聽(tīng)的人,角色的表情、眼神和情緒反饋也都在線,這情緒價(jià)值給的:

此外,我們還可以和AI進(jìn)行「實(shí)時(shí)互動(dòng)」。

只要對(duì)著電腦屏幕說(shuō)一句自己的甲方需求,屏幕里的AI角色就能夠根據(jù)指令當(dāng)下做出反應(yīng)。

哪怕是在長(zhǎng)時(shí)間交互下,依舊能保證人物形象穩(wěn)定一致,be like:

表情如此之自然、情緒如此之到位、交互如此之實(shí)時(shí),網(wǎng)友直接就是一個(gè)《坐不住》,直言:

實(shí)時(shí)、支持無(wú)限長(zhǎng)度的AI角色終于來(lái)了?。。。ù舐?jpg)


(說(shuō)真的,我大早上在官網(wǎng)看了這幾個(gè)demo效果后,屬實(shí)快分不出來(lái)AI不AI了…)

LPM 1.0:主打一個(gè)讓AI角色變「戲精」

其實(shí)對(duì)今天的AI視頻產(chǎn)品來(lái)說(shuō),能把人物角色的表情生動(dòng)演繹出來(lái),早就不算什么新鮮事了。

但是LPM 1.0模型特殊就特殊在吧——

我們能通過(guò)文本、音頻和圖像三種多模態(tài)形式,輕松生成一個(gè)能實(shí)時(shí)對(duì)話、會(huì)聽(tīng)會(huì)說(shuō)、還能持續(xù)保持人物一致性的動(dòng)態(tài)角色。

讓AI角色在視頻里,更會(huì)演、更會(huì)聽(tīng)、更會(huì)說(shuō),還能一直像同一個(gè)人~


我也幫友友們淺淺總結(jié)了一下LPM 1.0模型最核心的幾大「能力亮點(diǎn)」:

  • 超絕情緒演繹能力:能同步生成說(shuō)話、傾聽(tīng)、微表情和自然動(dòng)作,情緒表演更到位。

  • 實(shí)時(shí)視頻生成能力:通過(guò)在線生成器,用戶能實(shí)現(xiàn)和AI角色實(shí)現(xiàn)實(shí)時(shí)交互,適合做對(duì)話型角色。

  • 根據(jù)對(duì)方說(shuō)話做出反應(yīng)的能力:角色可以一邊聽(tīng)用戶說(shuō)話一邊做出表情反應(yīng),等輪到角色回答時(shí),它再根據(jù)合成語(yǔ)音生成說(shuō)話視頻。

  • 長(zhǎng)時(shí)間人物一致性:哪怕和AI的互動(dòng)時(shí)間延長(zhǎng)之后,AI角色依舊盡量維持同一個(gè)人的外觀和身份特征。

emm…這些能力是不是聽(tīng)上去有點(diǎn)乏味?沒(méi)關(guān)系,我們直接讓AI演員們上才藝!

先來(lái)說(shuō)說(shuō)大家很感興趣也很有意思的——「超絕情緒演繹能力」

具體來(lái)說(shuō),模型在口型同步、呼吸節(jié)奏、情緒表達(dá)維度上的表現(xiàn)更貼近人類(lèi)的表現(xiàn)方式,呈現(xiàn)效果也就更有層次。

比如在下面這個(gè)堪比好萊塢大片的視頻,兩位男子僅僅在幾秒鐘的時(shí)間,就生動(dòng)演繹出了多個(gè)神態(tài)——

前一秒還是猶豫和遲疑,下一秒就出現(xiàn)抿嘴、咬牙、嘆氣這類(lèi)更細(xì)小的動(dòng)作,能讓人明顯感受到心理狀態(tài)在變化。

(老戲骨啊老戲骨,建議送去參加AI版《演員的誕生》?。?/p>

再看下面這位老哥,短短9秒時(shí)間里,驚恐、緊張、憤怒幾種情緒接連切換,整個(gè)過(guò)程還挺有壓迫感??

此外不知道大家發(fā)沒(méi)發(fā)現(xiàn),當(dāng)人物在說(shuō)到重音位置時(shí),嘴部開(kāi)合幅度、面部發(fā)力方式也會(huì)跟著增強(qiáng)。

臺(tái)詞重心和表演重心是對(duì)得上的,融合度可以說(shuō)是非常不錯(cuò),be like:

除了對(duì)著鏡頭完成這類(lèi)單人表演,LPM 1.0還有個(gè)更有意思的能力——

那就是角色在「傾聽(tīng)別人說(shuō)話」時(shí),會(huì)同步給出與當(dāng)下情境相符的的表情和狀態(tài)反饋。

讓你覺(jué)得,眼前這個(gè)AI…好像真的在賽博世界和另一個(gè)人真實(shí)互動(dòng)。

比如下面這個(gè)女人接孩子電話的片段。

當(dāng)她聽(tīng)到電話那頭的聲音時(shí),第一時(shí)間先是眼神變化,隨后眼睛微微睜大,帶出一點(diǎn)意外和牽掛,緊接著眉頭收緊,像是在迅速判斷電腦那頭孩子是不是遇到了什么事。

emm…整段反應(yīng)很像真人接電話時(shí)那種「邊聽(tīng)邊消化信息」的狀態(tài):

再看下面這個(gè)神情已經(jīng)有點(diǎn)略微煩躁的男子。

對(duì)方一開(kāi)口,他的臉上就同步出現(xiàn)了扶頭、疲憊、輕微不耐煩這些反應(yīng),整個(gè)人的狀態(tài)像是在強(qiáng)撐著把這段話聽(tīng)完。

(像極了我們上班開(kāi)會(huì)聽(tīng)老板講話時(shí)候的表情…狠狠共鳴住了。)

除了上面我們展示的這些單向視頻生成能力外,LPM 1.0還有一個(gè)非常值得一提的能力——

那就是我們能與AI角色「實(shí)時(shí)互動(dòng)」。

例如你說(shuō)話時(shí),角色會(huì)實(shí)時(shí)做出正在聽(tīng)的表情和動(dòng)作,讓整個(gè)互動(dòng)看起來(lái)會(huì)更像真人視頻通話。

比如下面這個(gè)demo,在視頻對(duì)話器中,女子只張口說(shuō)了句「let’s sing a song」,屏幕里的AI女孩就能做到立刻開(kāi)始大展歌喉~

再比如,只說(shuō)一句「請(qǐng)你做個(gè)自我介紹」,屏幕里的AI女孩也能快速做出相關(guān)反應(yīng),更接近真實(shí)交流該有的節(jié)奏:

最后我們來(lái)說(shuō)說(shuō)LPM 1.0長(zhǎng)時(shí)間視頻生成中能力。

具體來(lái)說(shuō),LPM 1.0能夠讓AI角色在長(zhǎng)時(shí)間互動(dòng)里依舊保持穩(wěn)定輸出,既能持續(xù)對(duì)話,也能長(zhǎng)時(shí)間講故事,人物形象還不容易崩。

比如像下面官方案例中22分鐘、48分鐘的視頻也能輕松生成,而且角色形象一致性依舊保持不錯(cuò)~


LPM 1.0為啥這么會(huì)「演」?

能讓賽博世界里的人物角色表情神態(tài)和交互能力如此到位,LPM 1.0背后的技術(shù)架構(gòu)自然也不簡(jiǎn)單。

我先給大家小小科普一下,其實(shí)目前行業(yè)內(nèi)的視頻模型,一直很難同時(shí)兼顧三件事兒——

那就是表現(xiàn)力、實(shí)時(shí)性、長(zhǎng)視頻的角色一致性。

這三項(xiàng)能力可以說(shuō)是彼此牽制,水火不相容,這也構(gòu)成了當(dāng)下AI視頻最核心難題之一…

而為了解決這個(gè)大難點(diǎn),LPM 1.0團(tuán)隊(duì)先是構(gòu)建了一套以人為中心的多模態(tài)數(shù)據(jù)集——

在這個(gè)過(guò)程中加入了表演理解,身份感知等多種參考信息內(nèi)容,目的是讓AI角色更像真人交流時(shí)的狀態(tài)。


在此基礎(chǔ)上,團(tuán)隊(duì)又給底層架構(gòu)直接上了一套有著170億參數(shù)的擴(kuò)散Transformer。

這套架構(gòu)更擅長(zhǎng)處理視頻里空間與時(shí)間之間的復(fù)雜關(guān)聯(lián),能借助強(qiáng)大的自注意力機(jī)制,把人物表情、口型、動(dòng)作,以及前后幀之間的連續(xù)關(guān)系一起建模。

這樣一來(lái)模型就能知道到底怎么演才能更自然更像人類(lèi)~

而至于我們?cè)趧偛趴吹降哪軐?shí)時(shí)交互的模擬器,則是一個(gè)因果式流生成器,專(zhuān)門(mén)用于實(shí)現(xiàn)低延遲、可持續(xù)、無(wú)限長(zhǎng)度的實(shí)時(shí)交互。

這樣一來(lái)我們就和AI角人物進(jìn)行實(shí)時(shí)交流了?。ò敌?jpg)


除了模型本身的能力外,LPM 1.0團(tuán)隊(duì)成員同樣值得關(guān)注。

此次在X上披露LPM 1.0模型的@Ailing Zeng,身份為Anuttacon的技術(shù)團(tuán)隊(duì)成員,主要負(fù)責(zé)互動(dòng)多模態(tài)視頻生成模型的相關(guān)研究。

她博士畢業(yè)于香港中文大學(xué),在加入Anuttacon之前,曾在騰訊混元團(tuán)隊(duì)和IDEA從事大模型相關(guān)研究。


此外,該模型的技術(shù)論文由20+位研究人員共同參與完成,感興趣的uu可通過(guò)下方論文鏈接了解模型的詳細(xì)技術(shù)內(nèi)容~


Ps:目前,模型還沒(méi)有正式對(duì)外上線,感興趣的朋友可以蹲蹲。

[1]https://arxiv.org/html/2604.07823v1

[2]https://large-performance-model.github.io/#

文章來(lái)源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
第一集就全裸出鏡,女神新劇破格出演了

第一集就全裸出鏡,女神新劇破格出演了

來(lái)看美劇
2026-04-27 16:21:10
真?zhèn)牧?,哈維-西蒙斯在因傷無(wú)緣世界杯后清空了個(gè)人社媒

真?zhèn)牧?,哈維-西蒙斯在因傷無(wú)緣世界杯后清空了個(gè)人社媒

懂球帝
2026-04-27 18:48:21
圓明園地下大反轉(zhuǎn),大火燒掉的僅是圓明園的表皮

圓明園地下大反轉(zhuǎn),大火燒掉的僅是圓明園的表皮

混沌錄
2026-04-24 21:02:11
002779、603360,被證監(jiān)會(huì)立案!

002779、603360,被證監(jiān)會(huì)立案!

證券時(shí)報(bào)e公司
2026-04-27 22:46:03
2026禁賭來(lái)襲!打麻將的趕緊看!一次講透不踩坑

2026禁賭來(lái)襲!打麻將的趕緊看!一次講透不踩坑

生活新鮮市
2026-04-27 01:13:31
男籃官宣短期集訓(xùn)名單:王俊杰龐崢麟等在列 6月3日和4日打熱身賽

男籃官宣短期集訓(xùn)名單:王俊杰龐崢麟等在列 6月3日和4日打熱身賽

羅說(shuō)NBA
2026-04-27 20:46:29
世界杯制造20球有多難?歷史僅5人,巴西德國(guó)霸榜,現(xiàn)役僅1人

世界杯制造20球有多難?歷史僅5人,巴西德國(guó)霸榜,現(xiàn)役僅1人

籃球圈里的那些事
2026-04-27 09:24:49
革命衛(wèi)隊(duì)敢不敢切斷霍爾木茲海底的光纜?

革命衛(wèi)隊(duì)敢不敢切斷霍爾木茲海底的光纜?

高博新視野
2026-04-27 00:53:46
中日對(duì)峙到了今天,一個(gè)問(wèn)題已然徹底被擺在了中國(guó)的面前

中日對(duì)峙到了今天,一個(gè)問(wèn)題已然徹底被擺在了中國(guó)的面前

安安說(shuō)
2026-04-27 10:58:52
國(guó)家叫停美國(guó)資本收購(gòu)Manus,什么信號(hào)?

國(guó)家叫停美國(guó)資本收購(gòu)Manus,什么信號(hào)?

一見(jiàn)財(cái)經(jīng)
2026-04-27 22:18:21
皮蛋再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

皮蛋再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

健康科普365
2026-04-25 09:27:08
倒計(jì)時(shí)!全體車(chē)主自查!4月30日前務(wù)必辦完,5月起嚴(yán)查扣分罰款

倒計(jì)時(shí)!全體車(chē)主自查!4月30日前務(wù)必辦完,5月起嚴(yán)查扣分罰款

復(fù)轉(zhuǎn)這些年
2026-04-26 16:54:30
A股:漲到4086點(diǎn),尾盤(pán)很明顯,明天,4月28日,很可能這樣走

A股:漲到4086點(diǎn),尾盤(pán)很明顯,明天,4月28日,很可能這樣走

虎哥閑聊
2026-04-27 15:05:15
在中國(guó)有100萬(wàn)存款,算什么水平?銀行員工“直言不諱”

在中國(guó)有100萬(wàn)存款,算什么水平?銀行員工“直言不諱”

王二哥老搞笑
2026-04-26 13:59:23
兩年物是人非!當(dāng)初三方交易爆紅,如今遼籃少主成最大輸家

兩年物是人非!當(dāng)初三方交易爆紅,如今遼籃少主成最大輸家

弄月公子
2026-04-27 22:14:05
“神仙員工”每天最早到最晚走,不斷上報(bào)“穩(wěn)賺十幾萬(wàn)”大項(xiàng)目,老板多次爽快撥款!一看賬戶資金,傻眼了……

“神仙員工”每天最早到最晚走,不斷上報(bào)“穩(wěn)賺十幾萬(wàn)”大項(xiàng)目,老板多次爽快撥款!一看賬戶資金,傻眼了……

洪觀新聞
2026-04-27 16:49:40
悲催!荊州一90后醫(yī)生突發(fā)心梗在衛(wèi)生間去世,3小時(shí)后被妻子發(fā)現(xiàn)

悲催!荊州一90后醫(yī)生突發(fā)心梗在衛(wèi)生間去世,3小時(shí)后被妻子發(fā)現(xiàn)

火山詩(shī)話
2026-04-27 06:26:04
謝逸楓:顫抖吧!一季度賣(mài)地收入大跌,不足6000億元

謝逸楓:顫抖吧!一季度賣(mài)地收入大跌,不足6000億元

謝逸楓看樓市
2026-04-27 09:54:05
饒毅教授發(fā)文:痛斥一門(mén)三代七博士學(xué)術(shù)不端亂象

饒毅教授發(fā)文:痛斥一門(mén)三代七博士學(xué)術(shù)不端亂象

TOP大學(xué)來(lái)了
2026-04-27 09:31:01
廣州市未來(lái)五年城市整體規(guī)劃...

廣州市未來(lái)五年城市整體規(guī)劃...

西莫的藝術(shù)宮殿
2026-04-27 18:34:33
2026-04-27 23:40:49
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5496文章數(shù) 64624關(guān)注度
往期回顧 全部

游戲要聞

Xbox重磅官宣夏日游戲節(jié)試玩陣容!包含國(guó)產(chǎn)大作

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類(lèi)馬拉松"破二"新紀(jì)元,一場(chǎng)跑鞋軍備競(jìng)賽

娛樂(lè)要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財(cái)經(jīng)要聞

Meta 140億收購(gòu)Manus遭中國(guó)發(fā)改委否決

科技要聞

DeepSeek V4上線三天,第一批實(shí)測(cè)出來(lái)了

汽車(chē)要聞

不那么小眾也可以 smart的路會(huì)越走越寬

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
時(shí)尚
教育
親子

藝術(shù)要聞

你絕對(duì)想不到,攝影能讓她成為女神!

數(shù)碼要聞

LABUBU冰箱還未正式發(fā)售就已溢價(jià)3000元

絲巾的10種系法,愛(ài)美的女人必看

教育要聞

學(xué)生課堂偷吃、聽(tīng)課“擺爛”……這位老師的應(yīng)對(duì)方式絕了!

親子要聞

小姨又給妹妹買(mǎi)了好多衣服,姐做兼職給你買(mǎi)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版