国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

面向具身場(chǎng)景的生成式渲染器TC-Light來(lái)了,代碼已開(kāi)源

0
分享至



TC-Light 是由中科院自動(dòng)化所張兆翔教授團(tuán)隊(duì)研發(fā)的生成式渲染器,能夠?qū)呱碛?xùn)練任務(wù)中復(fù)雜和劇烈運(yùn)動(dòng)的長(zhǎng)視頻序列進(jìn)行逼真的光照與紋理重渲染,同時(shí)具備良好的時(shí)序一致性和低計(jì)算成本開(kāi)銷(xiāo),使得它能夠幫助減少 Sim2Real Gap 以及實(shí)現(xiàn) Real2Real 的數(shù)據(jù)增強(qiáng),幫助獲得具身智能訓(xùn)練所需的海量高質(zhì)量數(shù)據(jù)。

它是如何實(shí)現(xiàn)的呢?本文將為你揭秘 TC-Light 背后的黑科技!本工作已中稿 NeurIPS2025,論文與代碼均已公開(kāi),歡迎大家試用和體驗(yàn),也歡迎大家到 Project Page 體驗(yàn) Video Demo。



  • 論文題目:TC-Light: Temporally Coherent Generative Rendering for Realistic World Transfer
  • 項(xiàng)目主頁(yè): https://dekuliutesla.github.io/tclight/
  • 論文鏈接: https://arxiv.org/abs/2506.18904
  • 代碼鏈接: https://github.com/Linketic/TC-Light

研究背景

光線(xiàn)及其與周?chē)h(huán)境的交互共同塑造了人類(lèi)以及具身智能體感知數(shù)字世界和現(xiàn)實(shí)世界的基本方式,在不同光照條件下對(duì)世界的觀測(cè)使得我們理解光線(xiàn)與物質(zhì)的交互關(guān)系,使得我們形成對(duì)周邊環(huán)境物質(zhì)和幾何屬性的基本判斷,并且也使得我們能夠在不同的光照條件下都能夠魯棒且正確地完成與世界的交互。

然而,在現(xiàn)實(shí)環(huán)境中采集不同光照與場(chǎng)景條件下的數(shù)據(jù)代價(jià)高昂,而仿真環(huán)境中盡管可以獲得近乎無(wú)限的數(shù)據(jù),但受限于算力資源,通常需要對(duì)光線(xiàn)的多次折射衍射以及紋理精度進(jìn)行近似和簡(jiǎn)化,使得視覺(jué)真實(shí)性無(wú)可避免地受到損失,在視覺(jué)層面產(chǎn)生 Sim2Real Gap。而如果能夠借助生成式模型根據(jù)所需的光照條件對(duì)現(xiàn)實(shí)或仿真環(huán)境下采集到的視頻數(shù)據(jù)進(jìn)行重渲染,不僅能夠幫助獲得增加已有真實(shí)數(shù)據(jù)的多樣性,并且能夠彌合計(jì)算誤差帶來(lái)的 CG 感,使得從仿真器中得到視覺(jué)上高度真實(shí)的傳感器數(shù)據(jù),包括 RL-CycleGAN 在內(nèi)的許多工作已經(jīng)證實(shí),這一策略能夠幫助減少將具身模型遷移到真實(shí)環(huán)境中所需微調(diào)的數(shù)據(jù)量和訓(xùn)練量。

盡管這一任務(wù)意義重大,但實(shí)際解決過(guò)程面臨許多挑戰(zhàn)。用于訓(xùn)練的視頻數(shù)據(jù)往往伴隨復(fù)雜的運(yùn)動(dòng)以及前景物體的頻繁進(jìn)出,同時(shí)視頻序列有著較長(zhǎng)的長(zhǎng)度以及較高的分辨率。我們的定量和定性實(shí)驗(yàn)證據(jù)(參見(jiàn)論文實(shí)驗(yàn)部分及 Project Page)表明,在這些復(fù)雜且困難的輸入條件下,已有的算法要么受制于訓(xùn)練所用視頻數(shù)據(jù)的分布(如 COSMOS-Transfer1,Relighting4D),要么難以承受巨大的計(jì)算開(kāi)銷(xiāo)(如 Light-A-Video, RelightVid),要么難以保證良好的時(shí)序一致性(如 VidToMe, RAVE 等)。



圖 1 TC-Light 效果展示

為了推動(dòng)這一問(wèn)題的解決,我們提出了 TC-Light 算法,在提升視頻生成模型計(jì)算效率的同時(shí),通過(guò)兩階段在線(xiàn)快速優(yōu)化提升輸出結(jié)果的一致性,如圖 1 和視頻Demo所示所示,本算法在保持重渲染真實(shí)性的同時(shí),時(shí)序一致性和真實(shí)性相比于已有算法取得了顯著提高。下面對(duì)算法細(xì)節(jié)進(jìn)行詳細(xì)介紹。

二、TC-Light 算法介紹

零樣本時(shí)序模型擴(kuò)展

TC-Light 首先使用視頻擴(kuò)散模型根據(jù)文本指令對(duì)輸入視頻進(jìn)行初步的重渲染。這里我們基于預(yù)訓(xùn)練好的 SOTA 圖像模型 IC-Light 以及 VidToMe 架構(gòu)進(jìn)行拓展,同時(shí)引入我們所提出的 Decayed Multi-Axis Denoising 模塊增強(qiáng)時(shí)序一致性。具體而言,VidToMe 在模型的自注意力模塊前后分別對(duì)來(lái)自不同幀的相似 token 進(jìn)行聚合和拆分,從而增強(qiáng)時(shí)序一致性并減少計(jì)算開(kāi)銷(xiāo);如圖 2 中 (a) 所示,類(lèi)似 Slicedit,Decayed Multi-Axis Denoising 模塊將輸入視頻分別視作圖像 (x-y 平面) 的序列和時(shí)空切片(y-t 平面)的序列,分別用輸入的文本指令和空文本指令進(jìn)行去噪,并對(duì)兩組噪聲進(jìn)行整合,從而使用原視頻的運(yùn)動(dòng)信息指導(dǎo)去噪過(guò)程。不同于 Slicedit,我們?cè)?AIN 模塊對(duì)兩組噪聲的統(tǒng)計(jì)特性進(jìn)行了對(duì)齊,同時(shí)時(shí)空切片部分的噪聲權(quán)重隨去噪步數(shù)指數(shù)下降,從而避免原視頻光照和紋理分布對(duì)重渲染結(jié)果的過(guò)度影響。



圖 2 TC-Light 管線(xiàn)示意圖

兩階段時(shí)序一致性?xún)?yōu)化策略

盡管通過(guò)引入前一小節(jié)的模型,視頻生成式重渲染結(jié)果的一致性得到了有效改善,但輸出結(jié)果仍然存在紋理和光照的跳變。因此我們進(jìn)一步引入兩階段的時(shí)序一致性?xún)?yōu)化策略,這同時(shí)也是 TC-Light 的核心模塊。在第一階段,如圖 2 中 (b) 所示,我們?yōu)槊恳粠?Appearance Embedding 以調(diào)整曝光度,并根據(jù) MemFlow 從輸入視頻估計(jì)的光流或仿真器給出的光流優(yōu)化幀間一致性,從而對(duì)齊全局光照。這一階段的優(yōu)化過(guò)程非??焖?,A100 上 300 幀 960x540 分辨率只需要數(shù)十秒的時(shí)間即可完成。





三、實(shí)驗(yàn)與分析



表 1 與主流算法的定量性能比較,其中 VidToMe 和 Slicedit 的基模型都換成了 IC-Light 以進(jìn)行公平比較。Ours-light 指不用 Multi-Axis Denoising 模塊的結(jié)果,相當(dāng)于對(duì) VidToMe 直接應(yīng)用兩階段優(yōu)化算法。

為了驗(yàn)證算法在長(zhǎng)動(dòng)態(tài)序列的重渲染表現(xiàn),我們從 CARLA、Waymo、AgiBot-DigitalWorld、DROID 等數(shù)據(jù)集收集了 58 個(gè)序列進(jìn)行綜合評(píng)測(cè),結(jié)果如表 1 所示。可以看到我們的算法克服了已有算法在時(shí)序一致性和計(jì)算開(kāi)銷(xiāo)等方面的問(wèn)題,取得了最佳的綜合性能表現(xiàn)。圖 3 的可視化對(duì)比也表明,我們的算法在保持內(nèi)容細(xì)節(jié)的同時(shí)得到了高質(zhì)量的重渲染性能表現(xiàn)。



圖 3 一致性與生成質(zhì)量可視化對(duì)比。TC-Light 避免了 (a) 中像 Slicedit 和 COSMOS-Transfer1 那樣不自然的重渲染結(jié)果和 (b) 中展現(xiàn)出的模糊失真,或 (c) 中像 IC-Light 和 VidToMe 那樣的時(shí)序不一致性。

此外,我們也在有 GT 數(shù)據(jù)的仿真數(shù)據(jù)集 Virtual KITTI 上進(jìn)行了比較,從而可以使用 SSIM 和 LPIPS 等指標(biāo)替換 CLIP-T 等代理指標(biāo)獲得更客觀的性能評(píng)估。表 2 的結(jié)果同樣表明,我們的算法很好地取得了計(jì)算開(kāi)銷(xiāo)和性能之間的平衡,取得了最佳的重渲染效果。



表 2 Virtual KITTI 數(shù)據(jù)集上與主流算法的定量性能比較

四、總結(jié)

TC-Light 作為一種新的生成式渲染器,克服了具身環(huán)境下視覺(jué)傳感器數(shù)據(jù)重渲染面對(duì)的時(shí)序一致性和長(zhǎng)序列計(jì)算開(kāi)銷(xiāo)兩大挑戰(zhàn),在性能表現(xiàn)上優(yōu)于現(xiàn)有技術(shù),不僅為 Sim2Real 和 Real2Real 數(shù)據(jù)擴(kuò)展帶來(lái)了新的思路,也為視頻編輯領(lǐng)域帶來(lái)了新的模型范式。TC-Light 的論文和代碼均已開(kāi)源,希望能夠相關(guān)領(lǐng)域帶來(lái)不同的思考和啟發(fā)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
2026年1月1日起看病報(bào)銷(xiāo)全改了!這些福利關(guān)系每個(gè)人,趕緊存好!

2026年1月1日起看病報(bào)銷(xiāo)全改了!這些福利關(guān)系每個(gè)人,趕緊存好!

老特有話(huà)說(shuō)
2025-12-19 17:52:27
突然爆雷,深圳總部幾乎搬空!有人投入700多萬(wàn)元

突然爆雷,深圳總部幾乎搬空!有人投入700多萬(wàn)元

晉江電視臺(tái)
2025-12-20 13:06:55
印度約8000名考生坐機(jī)場(chǎng)跑道上答題考試,競(jìng)爭(zhēng)僅有的187個(gè)政府職位

印度約8000名考生坐機(jī)場(chǎng)跑道上答題考試,競(jìng)爭(zhēng)僅有的187個(gè)政府職位

觀威海
2025-12-20 16:42:05
楊瀚森放心飛!開(kāi)拓者全程報(bào)銷(xiāo)頭等艙+每天給1000,只需要揮毛巾

楊瀚森放心飛!開(kāi)拓者全程報(bào)銷(xiāo)頭等艙+每天給1000,只需要揮毛巾

嘴炮體壇
2025-12-20 12:37:04
網(wǎng)友在泰國(guó)駐華大使館下面留言打這里:柬埔寨幼兒骨髓提取中心

網(wǎng)友在泰國(guó)駐華大使館下面留言打這里:柬埔寨幼兒骨髓提取中心

深度報(bào)
2025-12-19 23:07:44
哈蘭德獨(dú)造3球!雙響后英超已入104球,超越C羅追平德羅巴

哈蘭德獨(dú)造3球!雙響后英超已入104球,超越C羅追平德羅巴

奧拜爾
2025-12-21 00:39:58
兩岸好消息:“承認(rèn)”共屬中國(guó)!臺(tái)當(dāng)局終于做對(duì)1次,熟悉統(tǒng)一

兩岸好消息:“承認(rèn)”共屬中國(guó)!臺(tái)當(dāng)局終于做對(duì)1次,熟悉統(tǒng)一

愛(ài)吃醋的貓咪
2025-12-20 21:11:30
同仁堂集團(tuán)就南極磷蝦油事件致歉:全面開(kāi)展品牌清理行動(dòng)

同仁堂集團(tuán)就南極磷蝦油事件致歉:全面開(kāi)展品牌清理行動(dòng)

界面新聞
2025-12-20 09:03:27
“冬天冷不冷,就看冬至”,明日冬至,冬天到底有多冷?答案來(lái)了

“冬天冷不冷,就看冬至”,明日冬至,冬天到底有多冷?答案來(lái)了

阿龍美食記
2025-12-20 03:58:15
降息50基點(diǎn)!剛剛,集體宣布!

降息50基點(diǎn)!剛剛,集體宣布!

證券時(shí)報(bào)
2025-12-20 19:40:06
發(fā)改委雄文,預(yù)示收入分配制度重大突破,釋放什么信號(hào)?

發(fā)改委雄文,預(yù)示收入分配制度重大突破,釋放什么信號(hào)?

華山穹劍
2025-12-20 20:01:29
哈蘭德閃擊!兩連擊破門(mén),7戰(zhàn)西漢姆轟10球,跳機(jī)械舞慶祝

哈蘭德閃擊!兩連擊破門(mén),7戰(zhàn)西漢姆轟10球,跳機(jī)械舞慶祝

奧拜爾
2025-12-20 23:12:58
攜程翻車(chē):與柬埔寨國(guó)家旅游局簽約引發(fā)用戶(hù)“卸載潮”

攜程翻車(chē):與柬埔寨國(guó)家旅游局簽約引發(fā)用戶(hù)“卸載潮”

新商業(yè)派
2025-12-19 15:51:28
羅素:愚蠢的四大特征

羅素:愚蠢的四大特征

尚曦讀史
2025-12-19 09:55:05
太戳人!泰國(guó)駐華使館評(píng)論區(qū)被“感謝”刷屏,網(wǎng)友花式鼓勵(lì)太可愛(ài)

太戳人!泰國(guó)駐華使館評(píng)論區(qū)被“感謝”刷屏,網(wǎng)友花式鼓勵(lì)太可愛(ài)

胡嚴(yán)亂語(yǔ)
2025-12-19 15:39:54
李平康:戴琳已經(jīng)在今天將欠潘碩的錢(qián)還清,還多給了5000多

李平康:戴琳已經(jīng)在今天將欠潘碩的錢(qián)還清,還多給了5000多

懂球帝
2025-12-20 21:14:12
咸魚(yú)還是太全面了,怪不得人稱(chēng)國(guó)內(nèi)黑市

咸魚(yú)還是太全面了,怪不得人稱(chēng)國(guó)內(nèi)黑市

另子維愛(ài)讀史
2025-12-20 17:07:20
終局通告!高市政府希望送回大熊貓,中方對(duì)日判斷出錯(cuò)了?

終局通告!高市政府希望送回大熊貓,中方對(duì)日判斷出錯(cuò)了?

貓眼觀史
2025-12-19 22:27:11
大量網(wǎng)友相信強(qiáng)力磁鐵可讓燃?xì)獗碜兟瑢?zhuān)家:竊氣嚴(yán)重可刑事處罰

大量網(wǎng)友相信強(qiáng)力磁鐵可讓燃?xì)獗碜兟瑢?zhuān)家:竊氣嚴(yán)重可刑事處罰

映射生活的身影
2025-12-20 03:39:27
73歲普京罕見(jiàn)回應(yīng)感情生活,承認(rèn)正在戀愛(ài)中!信息量很大......

73歲普京罕見(jiàn)回應(yīng)感情生活,承認(rèn)正在戀愛(ài)中!信息量很大......

新民周刊
2025-12-20 17:10:52
2025-12-21 01:04:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
11957文章數(shù) 142515關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時(shí)刻"還未到來(lái)

頭條要聞

印度官員:若"臺(tái)灣有事" 印度不太可能像西方那樣回應(yīng)

頭條要聞

印度官員:若"臺(tái)灣有事" 印度不太可能像西方那樣回應(yīng)

體育要聞

我開(kāi)了20年大巴,現(xiàn)在是一名西甲主帥

娛樂(lè)要聞

2026央視跨年晚會(huì)陣容曝光,豪華陣仗

財(cái)經(jīng)要聞

求解“地方財(cái)政困難”

汽車(chē)要聞

嵐圖推進(jìn)L3量產(chǎn)測(cè)試 已完成11萬(wàn)公里實(shí)際道路驗(yàn)證

態(tài)度原創(chuàng)

時(shí)尚
游戲
親子
本地
藝術(shù)

最顯腿細(xì)的騎士靴,誰(shuí)穿誰(shuí)是腿精

新勞拉·克勞馥演員回憶《完美黑暗》項(xiàng)目取消經(jīng)歷

親子要聞

邊牧和德牧帶娃在外面挖坑,三個(gè)小朋友加起來(lái)800個(gè)心眼子!

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

藝術(shù)要聞

投資26億!廣州“獨(dú)角獸”的總部大樓,躍出地面!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版