国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北卡羅來納大學(xué):AI如何讓視頻特效制作變得像拼圖一樣簡單

0
分享至


說到視頻制作,很多人都有過這樣的困惑:為什么電影中的汽車在水面上疾馳時(shí)會濺起逼真的水花,而我們自己拍攝的視頻卻總是缺少那種真實(shí)感?答案就在于專業(yè)的視覺特效處理。然而,傳統(tǒng)的特效制作就像在沒有說明書的情況下組裝復(fù)雜的機(jī)械裝置——既耗時(shí)又需要高超的專業(yè)技能。

北卡羅來納大學(xué)教堂山分校的齊路超等研究人員,聯(lián)合馬里蘭大學(xué)和工業(yè)光魔公司的團(tuán)隊(duì),在2024年12月發(fā)表了一項(xiàng)突破性研究成果。這項(xiàng)名為"Over++:生成式視頻合成的圖層交互效果"的研究,發(fā)表在計(jì)算機(jī)視覺領(lǐng)域的頂級期刊上,論文編號為arXiv:2512.19661v1。研究團(tuán)隊(duì)開發(fā)出了一種革命性的AI系統(tǒng),能夠讓視頻特效制作變得像拼拼圖一樣直觀簡單。

這項(xiàng)研究的核心突破在于解決了一個困擾影視制作行業(yè)多年的難題:如何自動生成前景物體與背景環(huán)境之間的真實(shí)交互效果。過去,當(dāng)制作團(tuán)隊(duì)需要在一個場景中添加陰影、水花、煙霧或反射等效果時(shí),藝術(shù)家們必須逐幀手工繪制,就像用畫筆在每一張連續(xù)的畫面上精細(xì)作畫。這個過程不僅需要數(shù)周甚至數(shù)月的時(shí)間,還要求操作者具備深厚的藝術(shù)功底和技術(shù)經(jīng)驗(yàn)。

研究團(tuán)隊(duì)設(shè)計(jì)的Over++系統(tǒng)改變了這一切。它能夠接受三個簡單的輸入:一段前景視頻(比如一個人在奔跑)、一段背景視頻(比如一片水面),以及一段描述期望效果的文字(比如"水花飛濺")。系統(tǒng)會自動分析這些素材,然后像一個經(jīng)驗(yàn)豐富的特效藝術(shù)家一樣,智能地生成各種環(huán)境交互效果。

更令人驚嘆的是,這個系統(tǒng)還支持精確的控制功能。用戶可以用簡單的蒙版(就像用記號筆圈出特定區(qū)域)來指定效果出現(xiàn)的位置,也可以通過調(diào)整文字描述來改變效果的強(qiáng)度和風(fēng)格。比如,同樣是煙霧效果,用戶可以通過改變描述從"白色煙霧"變成"紅色濃煙",系統(tǒng)就會相應(yīng)地調(diào)整輸出結(jié)果。

一、數(shù)據(jù)收集的巧妙策略

研發(fā)Over++系統(tǒng)面臨的首要挑戰(zhàn)是訓(xùn)練數(shù)據(jù)的稀缺。就好比教一個孩子畫畫,你需要給他看大量的好作品作為參考。但在視頻特效領(lǐng)域,同時(shí)擁有"原始版本"和"特效版本"的配對素材極其稀少。大多數(shù)現(xiàn)有的視頻要么已經(jīng)包含了特效,要么完全沒有特效,很難找到同一場景的前后對比版本。

研究團(tuán)隊(duì)采用了一種創(chuàng)新的解決方案。他們利用一種叫做Omnimatte的技術(shù),這種技術(shù)就像一個極其精巧的"圖層分離器"。當(dāng)面對一個已經(jīng)包含特效的視頻時(shí),Omnimatte能夠?qū)⑵洳鸾獬啥鄠€獨(dú)立的圖層:一個包含純凈前景物體的圖層,一個包含干凈背景的圖層,以及一個包含所有特效元素的圖層。這就像把一幅復(fù)雜的拼貼畫重新分解成原始的各個組成部分。

通過這種方法,研究團(tuán)隊(duì)成功構(gòu)建了一個多樣化的訓(xùn)練數(shù)據(jù)集。這個數(shù)據(jù)集包含三個主要部分:54個從現(xiàn)實(shí)世界收集的高質(zhì)量配對視頻,主要來源于DAVIS數(shù)據(jù)庫和專業(yè)素材庫;573個利用Blender和Kubric等三維軟件合成的配對視頻,這些合成數(shù)據(jù)能夠提供更多樣化的陰影和反射效果;以及460個利用先進(jìn)的文本到視頻生成模型創(chuàng)建的單獨(dú)特效視頻。

這種數(shù)據(jù)收集策略的精妙之處在于平衡了質(zhì)量與數(shù)量。現(xiàn)實(shí)世界的數(shù)據(jù)確保了效果的真實(shí)性,合成數(shù)據(jù)提供了多樣性,而單獨(dú)的特效視頻則幫助系統(tǒng)保持對文字描述的敏感性。這就像培養(yǎng)一個全面的藝術(shù)家,既要讓他臨摹大師作品,也要讓他練習(xí)基礎(chǔ)技法,還要鼓勵他進(jìn)行創(chuàng)意表達(dá)。

二、網(wǎng)絡(luò)架構(gòu)的精心設(shè)計(jì)

Over++系統(tǒng)的核心是一個經(jīng)過精心改造的視頻生成網(wǎng)絡(luò)。研究團(tuán)隊(duì)選擇了CogVideoX-5B作為基礎(chǔ)模型,這是一個在大規(guī)模視頻數(shù)據(jù)上預(yù)訓(xùn)練的強(qiáng)大生成器。然而,直接使用現(xiàn)有模型無法滿足精確的特效控制需求,就像一個通用的畫家雖然技藝精湛,但還需要專門訓(xùn)練才能勝任特效繪制的特殊要求。

研究團(tuán)隊(duì)對基礎(chǔ)模型進(jìn)行了巧妙的改造。他們保留了模型的視覺編碼器和解碼器部分,這些組件負(fù)責(zé)理解和生成視覺內(nèi)容,就像畫家的眼睛和手的協(xié)調(diào)能力。同時(shí),他們重新訓(xùn)練了所有的注意力機(jī)制模塊,這些模塊負(fù)責(zé)決定在生成過程中應(yīng)該關(guān)注哪些信息,類似于畫家在創(chuàng)作時(shí)的注意力分配。

系統(tǒng)的輸入處理方式也經(jīng)過了特別設(shè)計(jì)。與傳統(tǒng)的視頻修復(fù)方法不同,Over++并不會簡單地擦除指定區(qū)域然后重新填充。相反,它會保持原始視頻的完整信息,只在需要的地方添加新的特效元素。這種方法確保了原始場景的完整性,避免了不必要的內(nèi)容丟失或變形。

訓(xùn)練過程采用了一種創(chuàng)新的"三重蒙版"策略。在訓(xùn)練時(shí),系統(tǒng)會隨機(jī)遇到三種情況:有明確蒙版指導(dǎo)的情況、完全沒有蒙版的情況,以及介于兩者之間的灰色區(qū)域情況。這種設(shè)計(jì)讓模型學(xué)會了在不同程度的指導(dǎo)信息下工作,就像訓(xùn)練一個助手既能按照詳細(xì)指令工作,也能在模糊指示下發(fā)揮主觀能動性。

三、效果控制的雙重機(jī)制

Over++系統(tǒng)的一大亮點(diǎn)是其靈活的控制機(jī)制。用戶可以通過兩種方式來指導(dǎo)特效生成:空間控制和語義控制??臻g控制通過蒙版實(shí)現(xiàn),用戶可以像用熒光筆在紙上劃出重點(diǎn)一樣,在視頻中圈出需要添加特效的區(qū)域。語義控制則通過文字描述實(shí)現(xiàn),用戶可以用自然語言描述期望的效果類型和風(fēng)格。

空間控制的實(shí)現(xiàn)依賴于一個精巧的蒙版生成算法。當(dāng)系統(tǒng)擁有配對的訓(xùn)練視頻時(shí),它會自動計(jì)算兩個版本之間的差異,生成一個精確的蒙版來標(biāo)示特效出現(xiàn)的位置。然而,由于視頻分解和重組過程中的微小誤差,這個差異計(jì)算往往包含噪聲。研究團(tuán)隊(duì)開發(fā)了一套圖像處理流程來清理這些噪聲,包括灰度轉(zhuǎn)換、閾值分割和形態(tài)學(xué)操作等步驟,就像用精細(xì)的篩子過濾掉雜質(zhì),保留純凈的信號。

語義控制的實(shí)現(xiàn)更加復(fù)雜。研究團(tuán)隊(duì)發(fā)現(xiàn),如果只用有限的配對數(shù)據(jù)訓(xùn)練模型,系統(tǒng)很容易出現(xiàn)"語言漂移"現(xiàn)象——也就是逐漸失去對文字描述的理解能力,就像一個原本會多種語言的人因?yàn)殚L期不使用而逐漸遺忘。為了解決這個問題,他們引入了大量的單獨(dú)特效視頻,這些視頻只有最終效果和對應(yīng)的文字描述,沒有"前"和"后"的對比。

在訓(xùn)練過程中,系統(tǒng)會定期接觸這些單獨(dú)的特效視頻。在處理這類數(shù)據(jù)時(shí),系統(tǒng)會將輸入視頻和蒙版信息置零,只依靠文字描述來生成內(nèi)容。這種訓(xùn)練方式確保了模型始終保持對語言的敏感性,能夠根據(jù)不同的文字描述生成相應(yīng)的特效變化。

四、質(zhì)量評估的全方位驗(yàn)證

為了驗(yàn)證Over++系統(tǒng)的效果,研究團(tuán)隊(duì)設(shè)計(jì)了一套全面的評估體系。這套評估體系就像一個多角度的考試,從不同維度檢驗(yàn)系統(tǒng)的表現(xiàn)。

在定量評估方面,研究團(tuán)隊(duì)收集了24個測試視頻,包括18個來自DAVIS數(shù)據(jù)庫的視頻和6個真實(shí)世界的視頻。他們使用了多種評估指標(biāo),包括傳統(tǒng)的圖像質(zhì)量指標(biāo)(如SSIM、PSNR、LPIPS)和視頻質(zhì)量指標(biāo)(如FVD、VMAF、VBench)。然而,研究團(tuán)隊(duì)很快發(fā)現(xiàn)傳統(tǒng)的CLIP相似性指標(biāo)在評估環(huán)境特效時(shí)存在局限性。

這個發(fā)現(xiàn)頗有意思。傳統(tǒng)的CLIP指標(biāo)往往會給沒有特效的"不完整"結(jié)果打出更高的分?jǐn)?shù),因?yàn)檫@些結(jié)果更接近原始數(shù)據(jù)的分布。但從實(shí)際效果來看,包含正確特效的結(jié)果顯然更符合預(yù)期。為了解決這個問題,研究團(tuán)隊(duì)提出了一個新的評估指標(biāo)CLIPdir,這個指標(biāo)關(guān)注的不是絕對的相似性,而是變化的方向是否正確。

除了定量評估,研究團(tuán)隊(duì)還進(jìn)行了大規(guī)模的用戶調(diào)研。他們邀請了30名參與者,其中包括14名專業(yè)的視覺特效藝術(shù)家和16名普通用戶。調(diào)研從三個維度評估系統(tǒng)表現(xiàn):文字忠實(shí)度(生成的特效是否符合文字描述)、蒙版忠實(shí)度(特效是否出現(xiàn)在指定區(qū)域)、以及前景背景保真度(原始內(nèi)容是否得到良好保護(hù))。

調(diào)研結(jié)果顯示,Over++在所有維度都顯著優(yōu)于現(xiàn)有的基準(zhǔn)方法。特別值得注意的是,即使與商業(yè)化的Runway Aleph系統(tǒng)相比,Over++在保持原始內(nèi)容完整性方面表現(xiàn)更好,同時(shí)在效果控制的精確性上有明顯優(yōu)勢。

五、實(shí)際應(yīng)用的豐富場景

Over++系統(tǒng)的實(shí)用價(jià)值在其多樣化的應(yīng)用場景中得到了充分體現(xiàn)。研究團(tuán)隊(duì)展示了多個引人入勝的使用案例,每一個都展現(xiàn)了系統(tǒng)的獨(dú)特優(yōu)勢。

在基礎(chǔ)的特效生成方面,系統(tǒng)能夠處理各種常見的環(huán)境交互效果。比如,當(dāng)一輛汽車在道路上疾馳時(shí),系統(tǒng)能夠自動生成輪胎摩擦產(chǎn)生的煙霧;當(dāng)一個人跳入水中時(shí),系統(tǒng)會生成相應(yīng)的水花和波紋;當(dāng)陽光照射在物體上時(shí),系統(tǒng)會創(chuàng)造出自然的陰影效果。這些特效的生成不需要任何手工干預(yù),系統(tǒng)會根據(jù)場景內(nèi)容自動判斷合適的效果類型和強(qiáng)度。

在精確控制方面,系統(tǒng)展現(xiàn)了令人印象深刻的靈活性。用戶可以通過調(diào)整文字描述來改變特效的屬性。比如,同樣是煙霧效果,通過將描述從"白色煙霧"改為"紅色煙霧",系統(tǒng)就能生成相應(yīng)顏色的特效。更精細(xì)的控制還包括強(qiáng)度調(diào)節(jié),比如從"輕柔的陰影"到"濃重的陰影",或者從"溫和的水花"到"劇烈的水花"。

系統(tǒng)還支持關(guān)鍵幀標(biāo)注功能,這對于長視頻的處理特別有用。用戶不需要為每一幀都提供詳細(xì)的蒙版,只需要在幾個關(guān)鍵位置做標(biāo)記,系統(tǒng)就能自動推斷和插值整個序列的特效。這就像給導(dǎo)航系統(tǒng)標(biāo)記幾個重要路點(diǎn),它就能規(guī)劃出完整的路線。

在魯棒性測試中,系統(tǒng)展現(xiàn)了對不完美輸入的良好適應(yīng)性。即使用戶提供的蒙版不夠精確,包含了一些不合理的區(qū)域,系統(tǒng)也能夠智能地忽略這些錯誤,生成符合物理常識的特效。比如,如果用戶錯誤地在天空中標(biāo)記了地面特效區(qū)域,系統(tǒng)會自動忽略這個不合理的指示。

六、技術(shù)挑戰(zhàn)的創(chuàng)新解決

在開發(fā)Over++系統(tǒng)的過程中,研究團(tuán)隊(duì)遇到了多個技術(shù)挑戰(zhàn),每一個挑戰(zhàn)的解決都體現(xiàn)了獨(dú)特的創(chuàng)新思路。

首要挑戰(zhàn)是訓(xùn)練數(shù)據(jù)的不平衡問題。現(xiàn)實(shí)世界的高質(zhì)量配對數(shù)據(jù)極其稀少,而合成數(shù)據(jù)雖然數(shù)量充足但真實(shí)性有限。研究團(tuán)隊(duì)采用了一種漸進(jìn)式的訓(xùn)練策略,首先在合成數(shù)據(jù)上建立基礎(chǔ)能力,然后在真實(shí)數(shù)據(jù)上進(jìn)行精細(xì)調(diào)優(yōu)。這種方法確保了模型既能處理多樣化的場景,又能保持對真實(shí)世界效果的敏感性。

另一個重大挑戰(zhàn)是保持生成質(zhì)量的一致性。視頻特效生成不同于靜態(tài)圖像處理,它要求在時(shí)間維度上保持連貫性。研究團(tuán)隊(duì)引入了時(shí)間多擴(kuò)散技術(shù),這種技術(shù)能夠處理超過85幀的長視頻序列,確保整個時(shí)間跨度內(nèi)的特效保持自然流暢的變化。

在模型訓(xùn)練的穩(wěn)定性方面,研究團(tuán)隊(duì)發(fā)現(xiàn)傳統(tǒng)的訓(xùn)練方法容易導(dǎo)致模式崩塌,也就是模型會傾向于生成單一類型的特效而忽略輸入的多樣性。他們通過引入分類器無關(guān)指導(dǎo)(CFG)技術(shù)解決了這個問題。這種技術(shù)能夠在訓(xùn)練過程中動態(tài)調(diào)整不同輸入信號的權(quán)重,確保模型對所有類型的指導(dǎo)信息都保持敏感。

內(nèi)存優(yōu)化也是一個重要的考慮因素。視頻處理需要大量的計(jì)算資源,特別是在處理高分辨率長視頻時(shí)。研究團(tuán)隊(duì)采用了多GPU并行訓(xùn)練策略,同時(shí)優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu),在保持效果質(zhì)量的同時(shí)顯著降低了計(jì)算需求。最終的系統(tǒng)能夠在8個NVIDIA A6000 GPU上進(jìn)行有效訓(xùn)練,使得更多的研究機(jī)構(gòu)能夠復(fù)現(xiàn)和改進(jìn)這項(xiàng)技術(shù)。

七、性能表現(xiàn)的全面分析

Over++系統(tǒng)在各項(xiàng)性能測試中都表現(xiàn)出色,體現(xiàn)了其技術(shù)方案的有效性。在與現(xiàn)有方法的對比中,系統(tǒng)在多個維度都取得了顯著優(yōu)勢。

在效果生成質(zhì)量方面,Over++生成的特效在視覺真實(shí)性上明顯優(yōu)于基準(zhǔn)方法。比如在水花生成測試中,傳統(tǒng)方法往往產(chǎn)生模糊或不自然的效果,而Over++能夠生成具有清晰細(xì)節(jié)和自然動態(tài)的水花。在煙霧生成測試中,系統(tǒng)能夠準(zhǔn)確模擬煙霧的密度變化和擴(kuò)散模式,達(dá)到了接近專業(yè)特效的水平。

在原始內(nèi)容保護(hù)方面,Over++表現(xiàn)出了獨(dú)特的優(yōu)勢。許多現(xiàn)有的視頻編輯方法在添加特效時(shí)會無意中改變原始內(nèi)容的外觀,比如改變?nèi)宋锏拿娌刻卣骰蛘咝薷膱鼍暗纳势胶?。Over++通過其特殊的網(wǎng)絡(luò)設(shè)計(jì)有效避免了這些問題,確保了原始視頻內(nèi)容的完整性。

在處理速度方面,雖然當(dāng)前版本主要關(guān)注效果質(zhì)量而非速度優(yōu)化,但系統(tǒng)已經(jīng)能夠在合理的時(shí)間內(nèi)處理標(biāo)準(zhǔn)長度的視頻。對于典型的30秒視頻片段,整個處理過程通常在幾分鐘內(nèi)完成,這相比傳統(tǒng)的手工制作方法已經(jīng)是巨大的進(jìn)步。

特別值得注意的是系統(tǒng)的泛化能力。盡管訓(xùn)練數(shù)據(jù)相對有限,但Over++能夠處理訓(xùn)練時(shí)未見過的場景和特效類型。這種泛化能力部分得益于系統(tǒng)設(shè)計(jì)的通用性,部分得益于預(yù)訓(xùn)練模型的強(qiáng)大基礎(chǔ)能力。在測試中,系統(tǒng)成功處理了各種不同的環(huán)境、光照條件和動作類型,展現(xiàn)了良好的適應(yīng)性。

八、技術(shù)局限與改進(jìn)方向

盡管Over++系統(tǒng)已經(jīng)取得了顯著的成果,但研究團(tuán)隊(duì)對其當(dāng)前的局限性也有清醒的認(rèn)識。這種誠實(shí)的自我評估體現(xiàn)了嚴(yán)謹(jǐn)?shù)目茖W(xué)態(tài)度,也為后續(xù)改進(jìn)指明了方向。

在視覺保真度方面,系統(tǒng)偶爾會產(chǎn)生輕微的視覺偽影。這主要是由于VAE編碼解碼過程中的信息損失造成的。雖然這些偽影通常很微小,不會影響整體效果,但在某些對質(zhì)量要求極高的專業(yè)應(yīng)用中可能仍需改進(jìn)。研究團(tuán)隊(duì)建議未來可以通過引入更先進(jìn)的編碼技術(shù)或添加后處理優(yōu)化模塊來解決這個問題。

在特效多樣性方面,當(dāng)前系統(tǒng)主要關(guān)注幾種常見的環(huán)境交互效果,如陰影、水花、煙霧和反射。對于一些更復(fù)雜的特效類型,比如火焰、爆炸或魔法效果,系統(tǒng)的處理能力還有待提升。這主要是由于訓(xùn)練數(shù)據(jù)中這類特效的樣本相對較少,未來可以通過擴(kuò)充訓(xùn)練數(shù)據(jù)或設(shè)計(jì)專門的處理模塊來改進(jìn)。

在計(jì)算效率方面,雖然系統(tǒng)已經(jīng)能夠在合理時(shí)間內(nèi)完成處理,但對于實(shí)時(shí)應(yīng)用來說仍有優(yōu)化空間。特別是在處理4K或更高分辨率視頻時(shí),計(jì)算需求會顯著增加。研究團(tuán)隊(duì)建議可以通過模型壓縮、量化優(yōu)化或硬件加速等方法來提升處理速度。

在某些具有挑戰(zhàn)性的背景環(huán)境中,系統(tǒng)可能會生成一些不合理的特效。比如在復(fù)雜的紋理背景中,系統(tǒng)可能會錯誤地將背景元素識別為需要特效的區(qū)域。這個問題可以通過改進(jìn)背景理解算法或引入更強(qiáng)的預(yù)訓(xùn)練模型來緩解。

說到底,這項(xiàng)來自北卡羅來納大學(xué)的研究為視頻特效制作開辟了一條全新的道路。Over++系統(tǒng)的出現(xiàn)標(biāo)志著人工智能在創(chuàng)意制作領(lǐng)域的又一次重要突破,它不僅大大降低了專業(yè)特效制作的門檻,也為普通用戶提供了創(chuàng)造高質(zhì)量視頻內(nèi)容的可能性。

這項(xiàng)技術(shù)的影響遠(yuǎn)不止于技術(shù)層面。它有望改變整個視頻內(nèi)容創(chuàng)作的生態(tài),讓更多的創(chuàng)作者能夠?qū)W⒂趧?chuàng)意本身,而不必被復(fù)雜的技術(shù)細(xì)節(jié)所困擾。從教育視頻的制作到社交媒體內(nèi)容的創(chuàng)作,從小型工作室的項(xiàng)目到大型制作公司的流程優(yōu)化,Over++技術(shù)都有著廣闊的應(yīng)用前景。

更重要的是,這項(xiàng)研究展現(xiàn)了人工智能技術(shù)在解決實(shí)際問題時(shí)的巨大潛力。通過將復(fù)雜的專業(yè)技能轉(zhuǎn)化為智能算法,研究團(tuán)隊(duì)不僅推動了學(xué)術(shù)研究的邊界,也為整個行業(yè)的發(fā)展貢獻(xiàn)了實(shí)用的解決方案。對于那些對這項(xiàng)技術(shù)感興趣的讀者,可以通過論文編號arXiv:2512.19661v1查詢到完整的技術(shù)細(xì)節(jié)和實(shí)驗(yàn)結(jié)果。

隨著技術(shù)的不斷完善和應(yīng)用場景的拓展,我們有理由相信,類似Over++這樣的智能系統(tǒng)將會讓視頻創(chuàng)作變得更加民主化,讓每個人都能夠輕松創(chuàng)造出具有專業(yè)水準(zhǔn)的視覺內(nèi)容。這不僅是技術(shù)的進(jìn)步,更是創(chuàng)意表達(dá)方式的革命。

Q&A

Q1:Over++系統(tǒng)是什么?

A:Over++是由北卡羅來納大學(xué)等機(jī)構(gòu)開發(fā)的AI視頻特效生成系統(tǒng)。它能夠自動在視頻中生成真實(shí)的環(huán)境交互效果,比如陰影、水花、煙霧等,就像一個智能的特效藝術(shù)家。用戶只需提供前景視頻、背景視頻和文字描述,系統(tǒng)就能自動生成相應(yīng)的特效。

Q2:普通人可以使用Over++技術(shù)嗎?

A:目前Over++還是一項(xiàng)研究成果,主要在學(xué)術(shù)和專業(yè)制作環(huán)境中應(yīng)用。不過隨著技術(shù)的成熟,這類AI特效工具很可能會集成到普通的視頻編輯軟件中,讓普通用戶也能輕松制作專業(yè)級的特效視頻。

Q3:Over++生成的特效質(zhì)量如何?

A:根據(jù)測試結(jié)果,Over++生成的特效質(zhì)量已經(jīng)達(dá)到了很高的水平,在多項(xiàng)評估中都優(yōu)于現(xiàn)有方法。用戶調(diào)研顯示,即使與商業(yè)軟件相比,Over++在保持原始內(nèi)容完整性和效果控制精確性方面都有明顯優(yōu)勢,能夠生成看起來很自然的環(huán)境交互效果。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
從2026年起,中國或?qū)⒂瓉?大“降價(jià)潮”,建議大家提前準(zhǔn)備!

從2026年起,中國或?qū)⒂瓉?大“降價(jià)潮”,建議大家提前準(zhǔn)備!

平說財(cái)經(jīng)
2025-12-31 21:24:59
國家文物局雷霆出手!3 個跳梁小丑徹底涼涼

國家文物局雷霆出手!3 個跳梁小丑徹底涼涼

復(fù)轉(zhuǎn)這些年
2026-01-02 01:12:00
說好換血呢?邵佳一招11位30+老將!球迷吐槽:名單令人兩眼一黑

說好換血呢?邵佳一招11位30+老將!球迷吐槽:名單令人兩眼一黑

我愛英超
2026-01-01 11:15:23
價(jià)格相差太大?成都出租車要求實(shí)行網(wǎng)約車統(tǒng)一政府指導(dǎo)價(jià)

價(jià)格相差太大?成都出租車要求實(shí)行網(wǎng)約車統(tǒng)一政府指導(dǎo)價(jià)

順風(fēng)車之聲
2025-12-31 17:02:51
失業(yè)潮的終極解法,歷史只教了我們一課:不是救濟(jì),是戰(zhàn)爭

失業(yè)潮的終極解法,歷史只教了我們一課:不是救濟(jì),是戰(zhàn)爭

經(jīng)濟(jì)學(xué)教授V
2025-12-30 18:41:37
呂良偉70壽宴引熱搜,眾星云集堪比頒獎禮,凍齡狀態(tài)太驚艷

呂良偉70壽宴引熱搜,眾星云集堪比頒獎禮,凍齡狀態(tài)太驚艷

楓塵余往逝
2025-12-31 23:40:29
湖人隊(duì)勒布朗·詹姆斯轉(zhuǎn)會勇士隊(duì)的傳聞,遭里奇·保羅的斷然否認(rèn)

湖人隊(duì)勒布朗·詹姆斯轉(zhuǎn)會勇士隊(duì)的傳聞,遭里奇·保羅的斷然否認(rèn)

好火子
2026-01-02 02:56:42
廈門樓市來勢洶洶,廈門待售二手房數(shù)量是從39163套變成了39039套

廈門樓市來勢洶洶,廈門待售二手房數(shù)量是從39163套變成了39039套

有事問彭叔
2026-01-01 23:25:08
南航飛深圳航班因10歲男孩突發(fā)疾病備降!機(jī)組旅客合力施救

南航飛深圳航班因10歲男孩突發(fā)疾病備降!機(jī)組旅客合力施救

南方都市報(bào)
2026-01-01 14:39:06
廣州打響第一槍!2月1日起違規(guī)最高罰50萬,400萬車主徹底沸騰

廣州打響第一槍!2月1日起違規(guī)最高罰50萬,400萬車主徹底沸騰

蜉蝣說
2026-01-01 17:04:10
汪小菲新年帶兒女憶念大S!看煙花眼淚不止,馬筱梅挺孕肚做大餐

汪小菲新年帶兒女憶念大S!看煙花眼淚不止,馬筱梅挺孕肚做大餐

科學(xué)發(fā)掘
2026-01-02 01:41:55
香蕉立大功!醫(yī)生忠告:糖尿病患者常吃香蕉,或有這3大好處

香蕉立大功!醫(yī)生忠告:糖尿病患者常吃香蕉,或有這3大好處

看世界的人
2026-01-01 11:39:44
最高9.4,這五部硬核美劇,看過的都太有眼光

最高9.4,這五部硬核美劇,看過的都太有眼光

天天美劇吧
2025-12-30 19:26:51
《尋秦記》打破香港電影史首日票房紀(jì)錄

《尋秦記》打破香港電影史首日票房紀(jì)錄

韓小娛
2026-01-01 16:44:03
美日印澳在北京會談,共謀反華?不到24小時(shí),莫迪政府找中國對表

美日印澳在北京會談,共謀反華?不到24小時(shí),莫迪政府找中國對表

南宮一二
2026-01-01 12:38:41
24GB + 1TB!新機(jī)官宣:12月31日,已開啟預(yù)售!

24GB + 1TB!新機(jī)官宣:12月31日,已開啟預(yù)售!

科技堡壘
2025-12-31 12:11:41
真正的殺招,不是臺北的無人機(jī)

真正的殺招,不是臺北的無人機(jī)

美第奇效應(yīng)
2026-01-01 07:01:21
2025年最終版全球“最強(qiáng)護(hù)照”排行榜出爐!日本護(hù)照跌至第三位

2025年最終版全球“最強(qiáng)護(hù)照”排行榜出爐!日本護(hù)照跌至第三位

東京新青年
2025-12-13 18:10:46
吸毒藝人,就這么大張旗鼓的復(fù)出了

吸毒藝人,就這么大張旗鼓的復(fù)出了

韜聞
2026-01-02 00:11:01
剛剛,深夜36家A股上市公司發(fā)布重大利好 利空消息,看看都有哪些?

剛剛,深夜36家A股上市公司發(fā)布重大利好 利空消息,看看都有哪些?

股市皆大事
2026-01-01 21:15:30
2026-01-02 03:08:49
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
896文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

特斯拉Model 3車主首度全程自駕橫穿美國

頭條要聞

瑞士酒吧新年爆炸致百余死傷 有人嚴(yán)重?zé)齻y以辨認(rèn)

頭條要聞

瑞士酒吧新年爆炸致百余死傷 有人嚴(yán)重?zé)齻y以辨認(rèn)

體育要聞

2026,這些英超紀(jì)錄可能會被打破

娛樂要聞

跑調(diào)風(fēng)波越演越烈!沈佳潤被網(wǎng)友喊話

財(cái)經(jīng)要聞

巴菲特「身退,權(quán)還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

家居
本地
藝術(shù)
時(shí)尚
公開課

家居要聞

無形有行 自然與靈感詩意

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠(yuǎn)

藝術(shù)要聞

你絕對想不到,這位東方畫家竟將印象派推向巔峰!

2025年,記住她們的名字!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版