国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

香港科大團(tuán)隊用AI創(chuàng)造互動視頻世界:手繪軌跡驅(qū)動AI角色表演

0
分享至


這項由香港科技大學(xué)、蟻集團(tuán)等機(jī)構(gòu)聯(lián)合開展的研究發(fā)表于2024年12月,研究團(tuán)隊開發(fā)了名為WorldCanvas的AI框架。有興趣深入了解的讀者可以通過論文編號arXiv:2512.16924v1查詢完整論文。研究的核心作者包括王翰林、歐陽豪、王秋雨等來自不同知名院校的研究者,陳啟峰教授擔(dān)任通訊作者。

在電影制作中,導(dǎo)演需要與演員反復(fù)溝通才能拍出理想的鏡頭。如今,一種全新的AI技術(shù)讓這個過程變得像用畫筆作畫一樣簡單。你只需要在屏幕上畫出想要的運動路徑,輸入一段文字描述,再放入一張參考圖片,AI就能自動生成完全符合你創(chuàng)意的視頻片段。

這聽起來像科幻電影的情節(jié),但香港科技大學(xué)的研究團(tuán)隊真的做到了。他們開發(fā)的WorldCanvas系統(tǒng)就像一個魔法畫布,任何人都能在上面創(chuàng)造出生動的視頻世界。更令人驚喜的是,這個系統(tǒng)不僅能讓靜態(tài)角色動起來,還能讓它們按照你的想法進(jìn)行復(fù)雜的互動,甚至能處理角色暫時消失又重新出現(xiàn)的情況,始終保持前后一致。

傳統(tǒng)的視頻生成AI通常只能根據(jù)文字描述產(chǎn)生大概的畫面,就像你告訴畫家"畫一個人在跑步",結(jié)果可能千差萬別。而WorldCanvas的創(chuàng)新之處在于,它把控制權(quán)完全交給了用戶。就好比你不僅告訴畫家要畫什么,還能精確指導(dǎo)每一筆的走向,最終得到的作品完全符合你的構(gòu)思。

這種精確控制是通過三種信息的巧妙結(jié)合實現(xiàn)的。軌跡信息就像舞臺上演員的走位圖,告訴AI角色應(yīng)該在何時何地做什么動作。參考圖片則像是角色的身份證照片,確保AI生成的角色外觀始終保持一致。而文字描述則是劇本,說明角色要執(zhí)行什么樣的動作和情感表達(dá)。這三種信息相互配合,就像一個完整的電影制作方案。

研究團(tuán)隊在設(shè)計這套系統(tǒng)時遇到的最大挑戰(zhàn)是如何讓AI理解復(fù)雜的多角色場景。設(shè)想一個場景:兩個小女孩在公園里玩耍,一個在前面哭泣并用手擦眼淚,另一個從后面走過來蹲下安慰。傳統(tǒng)AI很難準(zhǔn)確區(qū)分哪個動作對應(yīng)哪個角色,經(jīng)常會搞混。

為了解決這個問題,研究團(tuán)隊開發(fā)了一種叫做"空間感知加權(quán)交叉注意"的技術(shù)。這個名字聽起來很復(fù)雜,但原理其實很簡單。就像一個聰明的舞臺導(dǎo)演,AI會特別關(guān)注每個角色周圍的區(qū)域,并將相應(yīng)的文字描述精確匹配到對應(yīng)的角色身上。這樣,AI就能準(zhǔn)確理解"前面的女孩哭泣"指的是哪個角色,"后面的女孩蹲下"又是指哪個角色。

更有趣的是,這套系統(tǒng)還能處理一些看似不可能的情況。比如一條鯊魚從沙漠的沙子中跳出來,再潛入沙中,然后又跳出來。雖然這在現(xiàn)實中完全不可能發(fā)生,但AI能夠理解這種"反常識"的創(chuàng)意,并生成相應(yīng)的視頻效果,甚至還會添加鯊魚跳躍時濺起沙塵的細(xì)節(jié)。

在數(shù)據(jù)準(zhǔn)備方面,研究團(tuán)隊就像烹飪大師準(zhǔn)備食材一樣精心。他們從公開視頻中篩選出高質(zhì)量的片段,然后使用專門的追蹤算法記錄每個物體的運動軌跡。接著,他們讓先進(jìn)的AI模型觀察這些帶有軌跡標(biāo)記的視頻,并要求它描述每條軌跡對應(yīng)的動作。這樣,AI就學(xué)會了如何將抽象的運動路徑與具體的動作描述聯(lián)系起來。

最關(guān)鍵的創(chuàng)新在于軌跡的處理方式。以往的系統(tǒng)只是簡單地記錄物體的位置坐標(biāo),就像在地圖上標(biāo)記幾個點。而WorldCanvas則把軌跡當(dāng)作包含豐富信息的"故事線"。軌跡上點與點之間的距離暗示了運動速度:點密集的地方表示緩慢移動,點稀疏的地方表示快速移動。軌跡還包含可見性標(biāo)記,告訴AI角色在什么時候應(yīng)該出現(xiàn)或消失。

這種精細(xì)的軌跡處理讓系統(tǒng)能夠生成極其逼真的動作。當(dāng)你畫出一個籃球的拋物線軌跡時,AI不僅知道球的飛行路徑,還能根據(jù)軌跡的密度變化自動調(diào)整球的飛行速度,讓整個投籃動作看起來完全符合物理定律。

在實際測試中,WorldCanvas展現(xiàn)出了令人印象深刻的能力。研究團(tuán)隊設(shè)計了一個復(fù)雜場景:一位老人和一輛汽車同時進(jìn)入畫面,老人在看到汽車后向后退步,汽車急剎車避免撞到老人,最后老人走出畫面。這個場景涉及多個角色的協(xié)調(diào)動作和因果關(guān)系。傳統(tǒng)的視頻生成AI往往會產(chǎn)生混亂的結(jié)果,比如讓老人去追汽車,或者完全忽略兩者之間的互動。而WorldCanvas則能準(zhǔn)確生成符合邏輯的完整序列。

更令人驚嘆的是系統(tǒng)的一致性維護(hù)能力。當(dāng)一個角色暫時離開畫面然后重新出現(xiàn)時,AI能夠保持角色的外觀、身份和場景的連續(xù)性。這就像一個有記憶的畫家,即使畫布被暫時遮擋,重新露出時也能準(zhǔn)確接續(xù)之前的內(nèi)容。

為了驗證系統(tǒng)的效果,研究團(tuán)隊進(jìn)行了詳細(xì)的對比實驗。他們將WorldCanvas與當(dāng)前最先進(jìn)的視頻生成模型進(jìn)行比較,包括Wan2.2、ATI和Frame In-N-Out等。結(jié)果顯示,WorldCanvas在軌跡跟蹤準(zhǔn)確度、語義理解能力和視頻質(zhì)量等多個方面都顯著超越了這些基準(zhǔn)模型。

在用戶研究中,研究團(tuán)隊邀請了15位參與者,包括視頻制作研究人員、藝術(shù)家和普通用戶,對不同模型生成的視頻進(jìn)行評價。結(jié)果顯示,在軌跡跟蹤、文本遵循、文本-軌跡對齊、參考圖片保真度和整體視頻質(zhì)量五個維度上,WorldCanvas都獲得了壓倒性的支持,獲得了75%以上的"最佳"選票。

這項技術(shù)的潛在應(yīng)用前景廣闊。在電影制作領(lǐng)域,導(dǎo)演可以快速制作概念驗證視頻,在正式拍攝前就能看到想象中的畫面效果。在游戲開發(fā)中,設(shè)計師可以輕松創(chuàng)建復(fù)雜的角色動畫和場景演示。在教育領(lǐng)域,老師可以制作生動的教學(xué)視頻來解釋復(fù)雜概念。甚至普通用戶也能用它來制作個性化的社交媒體內(nèi)容。

當(dāng)然,這項技術(shù)也面臨一些挑戰(zhàn)。在處理極其復(fù)雜的空間變換或需要高度邏輯推理的場景時,系統(tǒng)偶爾會出現(xiàn)不完美的結(jié)果。比如當(dāng)相機(jī)做360度旋轉(zhuǎn)時,畫面中的物體可能會出現(xiàn)輕微的模糊或不一致。另外,當(dāng)角色暫時離開視野時,系統(tǒng)有時無法完全準(zhǔn)確地推理出角色在視野外應(yīng)該發(fā)生的變化。

盡管存在這些局限,WorldCanvas代表了視頻生成AI的一個重要里程碑。它不僅僅是一個技術(shù)工具,更像是一個創(chuàng)意伙伴,能夠理解用戶的想法并將其轉(zhuǎn)化為視覺現(xiàn)實。隨著技術(shù)的進(jìn)一步完善,我們可能很快就會看到一個人人都能成為視頻創(chuàng)作者的時代到來。

從技術(shù)角度看,這項研究還為更高級的AI系統(tǒng)奠定了基礎(chǔ)。能夠理解和生成復(fù)雜時空事件的AI,距離真正的通用人工智能又近了一步。這樣的系統(tǒng)不僅能生成視頻,還能理解世界的運作方式,這對于開發(fā)能夠在真實世界中安全運行的AI代理具有重要意義。

研究團(tuán)隊已經(jīng)將相關(guān)代碼和模型開源,這意味著全球的研究者和開發(fā)者都能基于這項工作繼續(xù)創(chuàng)新。相信在不久的將來,我們會看到更多基于WorldCanvas的應(yīng)用出現(xiàn),讓視頻創(chuàng)作變得像畫畫一樣簡單自然。

Q&A

Q1:WorldCanvas是什么樣的AI系統(tǒng)?

A:WorldCanvas是香港科技大學(xué)團(tuán)隊開發(fā)的視頻生成AI框架,用戶只需手繪運動軌跡、輸入文字描述,再加入?yún)⒖紙D片,就能讓AI自動生成符合創(chuàng)意的視頻片段,就像在魔法畫布上創(chuàng)作一樣簡單。

Q2:WorldCanvas比其他視頻生成AI強(qiáng)在哪里?

A:傳統(tǒng)AI只能根據(jù)文字生成大概畫面,而WorldCanvas通過軌跡、文字和參考圖片的結(jié)合,讓用戶能精確控制角色的動作、位置和外觀。它還能處理多角色互動場景,保持角色前后一致性,甚至能生成反常識的創(chuàng)意場景。

Q3:普通人能用WorldCanvas制作視頻嗎?

A:目前WorldCanvas還在研究階段,研究團(tuán)隊已經(jīng)開源了相關(guān)代碼。雖然普通用戶暫時無法直接使用,但隨著技術(shù)發(fā)展,未來可能會出現(xiàn)基于這項技術(shù)的消費級應(yīng)用,讓視頻創(chuàng)作變得像畫畫一樣簡單。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“盲眼龍婆”2026年預(yù)言:外星人到訪、世界大戰(zhàn)、AI崛起,全球巨變要來了?

“盲眼龍婆”2026年預(yù)言:外星人到訪、世界大戰(zhàn)、AI崛起,全球巨變要來了?

北美省錢快報
2026-01-01 07:40:23
上海一女子掏空公司3500萬!養(yǎng)了上百只貓,還癡迷于“云祭祀”……

上海一女子掏空公司3500萬!養(yǎng)了上百只貓,還癡迷于“云祭祀”……

環(huán)球網(wǎng)資訊
2026-01-01 11:20:08
球迷可以安心睡覺,徐杰檢查結(jié)果出爐:骨頭和韌帶沒事,只是硬傷

球迷可以安心睡覺,徐杰檢查結(jié)果出爐:骨頭和韌帶沒事,只是硬傷

鄒維體育
2026-01-01 22:32:18
小沈陽女兒沈佳潤道歉沖上熱搜第一,毛不易評論回應(yīng)

小沈陽女兒沈佳潤道歉沖上熱搜第一,毛不易評論回應(yīng)

觀察者網(wǎng)
2026-01-01 11:34:39
倫敦足球:根據(jù)英足總相關(guān)規(guī)定,熱蘇斯或因展示宗教標(biāo)語受罰

倫敦足球:根據(jù)英足總相關(guān)規(guī)定,熱蘇斯或因展示宗教標(biāo)語受罰

懂球帝
2026-01-01 12:05:13
已經(jīng)窮成這樣了嗎?我不信

已經(jīng)窮成這樣了嗎?我不信

觀人隨筆
2025-12-31 09:19:15
國家明令要求!2026年起,小區(qū)物業(yè)必須給業(yè)主發(fā)這5大補貼!

國家明令要求!2026年起,小區(qū)物業(yè)必須給業(yè)主發(fā)這5大補貼!

今朝牛馬
2025-12-30 15:36:19
2026足壇十大看點:世界聚焦美加墨,梅西爭50冠C羅沖1000球

2026足壇十大看點:世界聚焦美加墨,梅西爭50冠C羅沖1000球

懂球帝
2026-01-01 12:05:13
日本研究:血管變硬,問題出在早餐上?提醒:4種早餐應(yīng)撤下餐桌

日本研究:血管變硬,問題出在早餐上?提醒:4種早餐應(yīng)撤下餐桌

華庭講美食
2026-01-01 11:18:50
賭徒心理!永州美女老板引眾怒:領(lǐng)導(dǎo)找她談話 教練直言對她心寒

賭徒心理!永州美女老板引眾怒:領(lǐng)導(dǎo)找她談話 教練直言對她心寒

風(fēng)過鄉(xiāng)
2026-01-01 07:46:32
2026年首款萬元機(jī)皇來了!三星Galaxy S26 Ultra機(jī)模上手

2026年首款萬元機(jī)皇來了!三星Galaxy S26 Ultra機(jī)模上手

快科技
2025-12-31 16:17:04
起亞中國宣布奕跑、K3車型實行全國一口價

起亞中國宣布奕跑、K3車型實行全國一口價

界面新聞
2026-01-01 14:08:28
去你們的!馬威爆粗正式回應(yīng)被湖人退貨:他們輸了我確實幸災(zāi)樂禍

去你們的!馬威爆粗正式回應(yīng)被湖人退貨:他們輸了我確實幸災(zāi)樂禍

羅說NBA
2026-01-01 07:44:49
解放軍圍臺沒用彈道導(dǎo)彈,日媒:“雷聲大雨點小”,不想刺激日本

解放軍圍臺沒用彈道導(dǎo)彈,日媒:“雷聲大雨點小”,不想刺激日本

迷霧中的大眼睛
2026-01-01 22:04:42
烏克蘭戰(zhàn)俘馬齊耶夫斯基犧牲三周年 戰(zhàn)爭罪行執(zhí)行者罪責(zé)難逃

烏克蘭戰(zhàn)俘馬齊耶夫斯基犧牲三周年 戰(zhàn)爭罪行執(zhí)行者罪責(zé)難逃

老馬拉車莫少裝
2025-12-30 21:37:51
島內(nèi)最新民調(diào)!高達(dá)六成三的臺灣民眾不愿自身或家人上戰(zhàn)場

島內(nèi)最新民調(diào)!高達(dá)六成三的臺灣民眾不愿自身或家人上戰(zhàn)場

海峽導(dǎo)報社
2025-12-31 17:56:08
高市早苗終于開口反思,盼望得到中國原諒,語氣中透露著羞愧

高市早苗終于開口反思,盼望得到中國原諒,語氣中透露著羞愧

面包夾知識
2025-12-19 13:07:36
在日工作博主分享日本公司開年會,為什么他們?nèi)绱藫膏侧玻?>
    </a>
        <h3>
      <a href=日本物語
2025-12-31 21:51:38
9歲進(jìn)世界前八,打哭同齡人,林丹兒子進(jìn)步揭開歐少年網(wǎng)球有多卷

9歲進(jìn)世界前八,打哭同齡人,林丹兒子進(jìn)步揭開歐少年網(wǎng)球有多卷

網(wǎng)球之家
2026-01-01 12:33:37
造成毛岸英犧牲的罪魁禍?zhǔn)?,讓毛主席痛恨得罪人,他們下場如何?>
    </a>
        <h3>
      <a href=風(fēng)笛悠揚聲
2025-12-04 10:08:06
2026-01-02 01:07:00
至頂AI實驗室 incentive-icons
至頂AI實驗室
一個專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實驗室。
896文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

特斯拉Model 3車主首度全程自駕橫穿美國

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

體育要聞

2026,這些英超紀(jì)錄可能會被打破

娛樂要聞

跑調(diào)風(fēng)波越演越烈!沈佳潤被網(wǎng)友喊話

財經(jīng)要聞

巴菲特「身退,權(quán)還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

房產(chǎn)
健康
家居
藝術(shù)
手機(jī)

房產(chǎn)要聞

實景暴擊!??谶@個頂流紅盤,拋出準(zhǔn)現(xiàn)房+頂級書包雙王炸!

元旦舉家出行,注意防流感

家居要聞

無形有行 自然與靈感詩意

藝術(shù)要聞

你絕對想不到,這位東方畫家竟將印象派推向巔峰!

手機(jī)要聞

高通第六代驍龍8至尊版Pro曝光,定價將上漲

無障礙瀏覽 進(jìn)入關(guān)懷版