国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

NeurIPS 2025 | TC-Light:面向具身場景的生成式渲染器

0
分享至

TC-Light 是由中科院自動化所張兆翔教授團隊研發(fā)的生成式渲染器,能夠?qū)呱碛柧毴蝿?wù)中復(fù)雜和劇烈運動的長視頻序列進行逼真的光照與紋理重渲染,同時具備良好的時序一致性和低計算成本開銷,使得它能夠幫助減少 Sim2Real Gap 以及實現(xiàn) Real2Real 的數(shù)據(jù)增強,幫助獲得具身智能訓練所需的海量高質(zhì)量數(shù)據(jù)。


論文題目: TC-Light: Temporally Coherent Generative Rendering for Realistic World Transfer 論文鏈接: https://arxiv.org/abs/2506.18904 代碼鏈接: https://github.com/Linketic/TC-Light 項目主頁: https://dekuliutesla.github.io/tclight/
一、研究背景

光線及其與周圍環(huán)境的交互共同塑造了人類以及具身智能體感知數(shù)字世界和現(xiàn)實世界的基本方式,在不同光照條件下對世界的觀測使得我們理解光線與物質(zhì)的交互關(guān)系,使得我們形成對周邊環(huán)境物質(zhì)和幾何屬性的基本判斷,并且也使得我們能夠在不同的光照條件下都能夠魯棒且正確地完成與世界的交互。

然而,在現(xiàn)實環(huán)境中采集不同光照與場景條件下的數(shù)據(jù)代價高昂,而仿真環(huán)境中盡管可以獲得近乎無限的數(shù)據(jù),但受限于算力資源,通常需要對光線的多次折射衍射以及紋理精度進行近似和簡化,使得視覺真實性無可避免地受到損失,在視覺層面產(chǎn)生 Sim2Real Gap。而如果能夠借助生成式模型根據(jù)所需的光照條件對現(xiàn)實或仿真環(huán)境下采集到的視頻數(shù)據(jù)進行重渲染,不僅能夠幫助獲得增加已有真實數(shù)據(jù)的多樣性,并且能夠彌合計算誤差帶來的 CG 感,使得從仿真器中得到視覺上高度真實的傳感器數(shù)據(jù),包括 RL-CycleGAN 在內(nèi)的許多工作已經(jīng)證實,這一策略能夠幫助減少將具身模型遷移到真實環(huán)境中所需微調(diào)的數(shù)據(jù)量和訓練量。

盡管這一任務(wù)意義重大,但實際解決過程面臨許多挑戰(zhàn)。用于訓練的視頻數(shù)據(jù)往往伴隨復(fù)雜的運動以及前景物體的頻繁進出,同時視頻序列有著較長的長度以及較高的分辨率。我們的定量和定性實驗證據(jù)(參見論文實驗部分及 Project Page)表明,在這些復(fù)雜且困難的輸入條件下,已有的算法要么受制于訓練所用視頻數(shù)據(jù)的分布(如 COSMOS-Transfer1,Relighting4D),要么難以承受巨大的計算開銷(如 Light-A-Video, RelightVid),要么難以保證良好的時序一致性(如 VidToMe, RAVE 等)。


圖 1 TC-Light 效果展示

為了推動這一問題的解決,我們提出了 TC-Light 算法,在提升視頻生成模型計算效率的同時,通過兩階段在線快速優(yōu)化提升輸出結(jié)果的一致性,如圖 1 和視頻Demo所示所示,本算法在保持重渲染真實性的同時,時序一致性和真實性相比于已有算法取得了顯著提高。下面對算法細節(jié)進行詳細介紹。

二、TC-Light 算法介紹 2.1 零樣本時序模型擴展

TC-Light 首先使用視頻擴散模型根據(jù)文本指令對輸入視頻進行初步的重渲染。這里我們基于預(yù)訓練好的 SOTA 圖像模型 IC-Light 以及 VidToMe 架構(gòu)進行拓展,同時引入我們所提出的 Decayed Multi-Axis Denoising 模塊增強時序一致性。

具體而言,VidToMe 在模型的自注意力模塊前后分別對來自不同幀的相似 token 進行聚合和拆分,從而增強時序一致性并減少計算開銷;如圖 2 中 (a) 所示,類似 Slicedit,Decayed Multi-Axis Denoising 模塊將輸入視頻分別視作圖像 (x-y 平面) 的序列和時空切片(y-t 平面)的序列,分別用輸入的文本指令和空文本指令進行去噪,并對兩組噪聲進行整合,從而使用原視頻的運動信息指導去噪過程。不同于 Slicedit,我們在 AIN 模塊對兩組噪聲的統(tǒng)計特性進行了對齊,同時時空切片部分的噪聲權(quán)重隨去噪步數(shù)指數(shù)下降,從而避免原視頻光照和紋理分布對重渲染結(jié)果的過度影響。


圖 2 TC-Light 管線示意圖 2.2 兩階段時序一致性優(yōu)化策略

盡管通過引入前一小節(jié)的模型,視頻生成式重渲染結(jié)果的一致性得到了有效改善,但輸出結(jié)果仍然存在紋理和光照的跳變。因此我們進一步引入兩階段的時序一致性優(yōu)化策略,這同時也是 TC-Light 的核心模塊。在第一階段,如圖 2 中 (b) 所示,我們?yōu)槊恳粠?Appearance Embedding 以調(diào)整曝光度,并根據(jù) MemFlow 從輸入視頻估計的光流或仿真器給出的光流優(yōu)化幀間一致性,從而對齊全局光照。這一階段的優(yōu)化過程非??焖?,A100 上 300 幀 960x540 分辨率只需要數(shù)十秒的時間即可完成。

在第二階段,我們進一步對光照和紋理細節(jié)進行優(yōu)化。如圖 2 中 (c) 所示,這里我們首先根據(jù)光流以及可能提供的每個像素在世界系下的位置信息,快速將視頻 壓縮為碼本 (也即圖中的 Unique Video Tensor),即:


其中 κ(x,y,t) 為視頻幀給定像素依據(jù)光流及空間信息得到的碼本索引,這一基于時空先驗的壓縮方式在原視頻上近乎可以保持無損。不同于 Vector Quantization 僅考慮顏色相似性的做法,這一壓縮方案保證了被聚合的像素之間的時空關(guān)聯(lián)性,使得對應(yīng)同一個碼本值的不同像素具有相似的時空一致性優(yōu)化目標和梯度。隨后,我們以碼本 作為優(yōu)化目標,以解碼后的幀間一致性作為主要優(yōu)化目標,并且以 TV Loss 抑制噪聲,同時以 SSIM Loss 使得與一階段優(yōu)化結(jié)果保持一定程度的結(jié)構(gòu)相似性。實驗結(jié)果表明,這一階段的優(yōu)化能顯著改善時序一致性,同時非常快速,A100 上 300 幀 960x540 分辨率通常只花費 2 分鐘左右,且由于以壓縮后的碼本作為優(yōu)化目標,不僅避免了以往工作以 NeRF 或 3DGS 為載體帶來的 10-30 分鐘的訓練代價,顯存開銷上也能得到優(yōu)化。

三、實驗與分析


表 1 與主流算法的定量性能比較,其中 VidToMe 和 Slicedit 的基模型都換成了 IC-Light 以進行公平比較。Ours-light 指不用 Multi-Axis Denoising 模塊的結(jié)果,相當于對 VidToMe 直接應(yīng)用兩階段優(yōu)化算法。

為了驗證算法在長動態(tài)序列的重渲染表現(xiàn),我們從 CARLA、Waymo、AgiBot-DigitalWorld、DROID 等數(shù)據(jù)集收集了 58 個序列進行綜合評測,結(jié)果如表 1 所示??梢钥吹轿覀兊乃惴朔艘延兴惴ㄔ跁r序一致性和計算開銷等方面的問題,取得了最佳的綜合性能表現(xiàn)。圖 3 的可視化對比也表明,我們的算法在保持內(nèi)容細節(jié)的同時得到了高質(zhì)量的重渲染性能表現(xiàn)。


圖 3 一致性與生成質(zhì)量可視化對比。TC-Light 避免了 (a) 中像 Slicedit 和 COSMOS-Transfer1 那樣不自然的重渲染結(jié)果和 (b) 中展現(xiàn)出的模糊失真,或 (c) 中像 IC-Light 和 VidToMe 那樣的時序不一致性。

此外,我們也在有 GT 數(shù)據(jù)的仿真數(shù)據(jù)集 Virtual KITTI 上進行了比較,從而可以使用 SSIM 和 LPIPS 等指標替換 CLIP-T 等代理指標獲得更客觀的性能評估。表 2 的結(jié)果同樣表明,我們的算法很好地取得了計算開銷和性能之間的平衡,取得了最佳的重渲染效果。


表 2 Virtual KITTI 數(shù)據(jù)集上與主流算法的定量性能比較 四、總結(jié)

TC-Light 作為一種新的生成式渲染器,克服了具身環(huán)境下視覺傳感器數(shù)據(jù)重渲染面對的時序一致性和長序列計算開銷兩大挑戰(zhàn),在性能表現(xiàn)上優(yōu)于現(xiàn)有技術(shù),不僅為 Sim2Real 和 Real2Real 數(shù)據(jù)擴展帶來了新的思路,也為視頻編輯領(lǐng)域帶來了新的模型范式。TC-Light 的論文和代碼均已開源,希望能夠相關(guān)領(lǐng)域帶來不同的思考和啟發(fā)。

來源:公眾號【機器之心】

llustration From IconScout By IconScout Store

-The End-

本周上新!

掃碼觀看!

“AI技術(shù)流”原創(chuàng)投稿計劃

TechBeat是由將門創(chuàng)投建立的AI學習社區(qū)(www.techbeat.net)。社區(qū)上線700+期talk視頻,3000+篇技術(shù)干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會及其他線上交流活動,不定期舉辦技術(shù)人線下聚會交流活動。我們正在努力成為AI人才喜愛的高質(zhì)量、知識型交流平臺,希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其成長。

投稿內(nèi)容

// 最新技術(shù)解讀/系統(tǒng)性知識分享 //

// 前沿資訊解說/心得經(jīng)歷講述 //

投稿須知

稿件需要為原創(chuàng)文章,并標明作者信息。

我們會選擇部分在深度技術(shù)解析及科研心得方向,對用戶啟發(fā)更大的文章,做原創(chuàng)性內(nèi)容獎勵

投稿方式

發(fā)送郵件到

michellechang@thejiangmen.com

或添加工作人員微信(michelle333_)投稿,溝通投稿詳情

關(guān)于我“門”

將門是一家以專注于數(shù)智核心科技領(lǐng)域新型創(chuàng)投機構(gòu),也是北京市標桿型孵化器。 公司致力于通過連接技術(shù)與商業(yè),發(fā)掘和培育具有全球影響力的科技創(chuàng)新企業(yè),推動企業(yè)創(chuàng)新發(fā)展與產(chǎn)業(yè)升級。

將門成立于2015年底,創(chuàng)始團隊由微軟創(chuàng)投在中國的創(chuàng)始團隊原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。

如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價值的投后服務(wù),歡迎發(fā)送或者推薦項目給我“門”:

bp@thejiangmen.com


點擊右上角,把文章分享到朋友圈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
浙江全省正在嚴查!“不要購買,更不要駕駛”

浙江全省正在嚴查!“不要購買,更不要駕駛”

極目新聞
2026-03-14 21:37:21
特朗普動起歪腦筋,稱美軍在伊朗打仗,給中國送了一份“大禮”

特朗普動起歪腦筋,稱美軍在伊朗打仗,給中國送了一份“大禮”

空天力量
2026-03-14 19:09:49
隨著廣廈加時輸3分!山東贏9分!上海狂勝50分,CBA最新排名大變

隨著廣廈加時輸3分!山東贏9分!上??駝?0分,CBA最新排名大變

老吳說體育
2026-03-14 22:14:20
第6輪會談美方表態(tài),魯比奧接受邀請將隨特朗普訪華

第6輪會談美方表態(tài),魯比奧接受邀請將隨特朗普訪華

似水流年忘我
2026-03-14 16:25:05
隨著中國女籃86-76勝南蘇丹,世預(yù)賽最新形勢:4隊爭3個出線名額

隨著中國女籃86-76勝南蘇丹,世預(yù)賽最新形勢:4隊爭3個出線名額

小火箭愛體育
2026-03-14 21:32:52
巴拿馬急了:中遠海運,恢復(fù)運營吧

巴拿馬急了:中遠海運,恢復(fù)運營吧

觀察者網(wǎng)
2026-03-14 09:24:05
2025霧霾最嚴重的十個城市

2025霧霾最嚴重的十個城市

電工知庫
2026-03-14 15:04:40
農(nóng)民自愿永久退出承包地:2026最新補償標準與辦理流程全說明

農(nóng)民自愿永久退出承包地:2026最新補償標準與辦理流程全說明

現(xiàn)代小青青慕慕
2026-03-14 12:56:29
今年的315,草莓第一個翻車,重金屬農(nóng)殘超標,敵敵畏隨便用

今年的315,草莓第一個翻車,重金屬農(nóng)殘超標,敵敵畏隨便用

Mr王的飯后茶
2026-03-14 13:15:36
“戰(zhàn)斧”首次交付日本,中方正告!

“戰(zhàn)斧”首次交付日本,中方正告!

環(huán)球時報國際
2026-03-14 17:02:11
大爭議!F1外媒官號曬合照“裁掉”頒獎嘉賓吳艷妮 做法太low

大爭議!F1外媒官號曬合照“裁掉”頒獎嘉賓吳艷妮 做法太low

醉臥浮生
2026-03-14 15:45:44
淚目了!伊朗向死而生,讓美以最絕望的出現(xiàn)了!

淚目了!伊朗向死而生,讓美以最絕望的出現(xiàn)了!

大嘴說天下
2026-03-14 19:36:56
特朗普越過紅線?美軍空襲伊朗關(guān)鍵而脆弱的“石油心臟” 專家:奪島容易控島難

特朗普越過紅線?美軍空襲伊朗關(guān)鍵而脆弱的“石油心臟” 專家:奪島容易控島難

紅星新聞
2026-03-14 10:18:18
“伊朗想放部分油輪過海峽,前提是石油以人民幣結(jié)算”

“伊朗想放部分油輪過海峽,前提是石油以人民幣結(jié)算”

觀察者網(wǎng)
2026-03-14 08:19:04
我國臺灣問題不談判不退讓不惜一戰(zhàn),哪怕犧牲億人毀城百座城池

我國臺灣問題不談判不退讓不惜一戰(zhàn),哪怕犧牲億人毀城百座城池

瀚霖學史
2026-03-14 08:58:49
突發(fā):霍爾木茲海峽前哨戰(zhàn)打響!

突發(fā):霍爾木茲海峽前哨戰(zhàn)打響!

西樓飲月
2026-03-14 22:03:05
600年前城磚上出現(xiàn)“劉德華”?南京官方回應(yīng)

600年前城磚上出現(xiàn)“劉德華”?南京官方回應(yīng)

澎湃新聞
2026-03-14 20:02:09
1984年,張宗遜之子張又俠8個多小時拿下松毛嶺:預(yù)備隊還沒上呢

1984年,張宗遜之子張又俠8個多小時拿下松毛嶺:預(yù)備隊還沒上呢

歷史甄有趣
2026-03-13 12:45:14
泰州市監(jiān)委通報,于浩被查

泰州市監(jiān)委通報,于浩被查

上觀新聞
2026-03-14 19:41:03
字節(jié)辟謠「武漢全部被裁」:超2000人base武漢,將加大對湖北投入

字節(jié)辟謠「武漢全部被裁」:超2000人base武漢,將加大對湖北投入

鞭牛士
2026-03-14 12:04:14
2026-03-15 03:31:00
將門創(chuàng)投 incentive-icons
將門創(chuàng)投
加速及投資技術(shù)驅(qū)動型初創(chuàng)企業(yè)
2310文章數(shù) 596關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

伊朗船只迫近林肯號航母 美軍連開數(shù)炮全打空

頭條要聞

伊朗船只迫近林肯號航母 美軍連開數(shù)炮全打空

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂要聞

九成美曝田栩?qū)幵衅诔鲕?AI反轉(zhuǎn)引熱議

財經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

房產(chǎn)
時尚
親子
家居
軍事航空

房產(chǎn)要聞

不容易??!??诮K于又要賣地了!

伊姐周六熱推:電視劇《逐玉》;電視劇《江湖夜雨十年燈》......

親子要聞

從"疲憊帶娃"到"從容陪娃":每位家長都能掌握的魔法轉(zhuǎn)變

家居要聞

藝術(shù)之家 法式優(yōu)雅

軍事要聞

特朗普宣布空襲伊石油出口樞紐哈爾克島

無障礙瀏覽 進入關(guān)懷版