国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中科大香港團隊突破:4K 360度全景視頻原生生成技術(shù)問世

0
分享至


當我們談論虛擬現(xiàn)實體驗時,往往會想象自己能夠在一個完全沉浸式的360度視頻世界中自由觀看。然而現(xiàn)實卻是,制作高質(zhì)量的360度全景視頻需要昂貴的專業(yè)設備,普通攝像機拍攝的視頻只能顯示有限的視角?,F(xiàn)在,一項由中國科學技術(shù)大學香港分校與騰訊PCG ARC實驗室聯(lián)合開展的研究為這個問題帶來了突破性解決方案。

這項名為"CubeComposer: Spatio-Temporal Autoregressive 4K 360° Video Generation from Perspective Video"的研究發(fā)表于2026年計算機視覺頂級會議,論文編號為arXiv:2603.04291v1。有興趣深入了解技術(shù)細節(jié)的讀者可以通過該編號查詢完整論文。研究團隊開發(fā)出了一種全新的人工智能模型CubeComposer,它能夠僅從普通攝像機拍攝的局部視頻中,智能生成完整的4K分辨率360度全景視頻,而且質(zhì)量遠超以往任何同類技術(shù)。

這種技術(shù)的意義就好比擁有了一臺神奇的"視覺補全機"。當你用普通手機攝像頭錄制了一段風景視頻時,這臺機器能夠根據(jù)畫面中的內(nèi)容,智能推測并生成出你背后、左右兩側(cè),甚至頭頂和腳下的完整場景,最終形成一個你可以自由旋轉(zhuǎn)觀看的360度沉浸式視頻。更令人驚喜的是,生成的視頻達到了4K分辨率,畫面細膩程度堪比專業(yè)級設備拍攝效果。

傳統(tǒng)的360度視頻制作方式就像是需要六個人同時用六臺攝像機從不同方向拍攝同一場景,然后將畫面拼接在一起。這不僅成本高昂,而且操作復雜,普通消費者根本無法承擔。而CubeComposer的出現(xiàn),相當于讓一臺普通攝像機具備了"透視眼"的能力,能夠自動補全看不見的部分。

研究團隊面臨的核心挑戰(zhàn)是如何讓人工智能理解三維空間的連續(xù)性和一致性。當AI需要生成你背后的景象時,它不能隨意編造內(nèi)容,而必須確保生成的場景在物理上合理,在視覺上連貫,在時間上一致。這就像要求一個從未見過房間全貌的人,僅僅通過觀察房間一角,就能準確描繪出整個房間的布局和裝飾。

一、突破性的立方體分解策略

CubeComposer的第一個創(chuàng)新在于它對360度視頻的全新處理方式。傳統(tǒng)方法將360度視頻處理為一個整體的球面圖像,這種方式雖然直觀,但會產(chǎn)生嚴重的圖像扭曲,特別是在南北極區(qū)域。研究團隊采用了立方體映射的巧妙方法,將球面360度視頻分解為六個平面,分別對應前、后、左、右、上、下六個方向,就像將一個球形燈籠展開成六塊平整的布料。

這種分解方式的好處在于每個面都是規(guī)整的方形圖像,沒有畸變,非常適合現(xiàn)有的人工智能模型處理。更重要的是,這種方法大幅降低了計算復雜度。原本需要同時處理整個4K分辨率的360度視頻,現(xiàn)在可以分別處理六個相對較小的方形視頻片段。這就像原本需要同時烹飪一桌十二道菜,現(xiàn)在可以按照合理的順序一道一道地精心制作,既保證了質(zhì)量,又減輕了廚師的工作負擔。

然而,將復雜的球面視頻分解為六個獨立的平面后,如何確保它們在拼接時不會出現(xiàn)明顯的接縫和不一致性,成為了一個全新的技術(shù)挑戰(zhàn)。研究團隊需要設計一套精密的協(xié)調(diào)機制,確保每個面的內(nèi)容都能與相鄰面完美銜接。

二、智能化的生成順序規(guī)劃

面對六個立方體面和多個時間窗口的復雜生成任務,CubeComposer采用了一種類似"智能施工排期"的策略。在建造一棟復雜建筑時,工程師不會同時開工所有部分,而是會根據(jù)結(jié)構(gòu)依賴關(guān)系和資源可用性制定最優(yōu)的施工順序。CubeComposer也是如此,它會分析輸入的普通視頻內(nèi)容,確定哪些立方體面包含更多的已知信息,然后優(yōu)先生成這些"信息豐富"的區(qū)域。

具體來說,模型會計算每個立方體面在當前時間窗口內(nèi)被原始視頻覆蓋的程度。被覆蓋越多的面意味著有更多的參考信息,生成質(zhì)量也就越有保障。系統(tǒng)會按照覆蓋度從高到低的順序安排生成計劃,就像先完成有充足材料保障的工程部分,再處理需要更多推測和創(chuàng)造的部分。

這種策略的巧妙之處在于,早期生成的高質(zhì)量內(nèi)容會為后續(xù)生成提供更好的上下文參考。當模型開始生成原始視頻完全沒有覆蓋的背面區(qū)域時,它已經(jīng)擁有了前面、左側(cè)、右側(cè)等多個角度的豐富信息,可以據(jù)此推斷出背面應該呈現(xiàn)什么樣的內(nèi)容。這種方法顯著提高了整體生成質(zhì)量的一致性和合理性。

三、高效的上下文管理機制

在生成過程中,CubeComposer需要同時考慮三類重要信息:已經(jīng)生成的歷史內(nèi)容、當前時間窗口內(nèi)其他面的信息,以及來自未來時間段的原始視頻片段。這就像一個經(jīng)驗豐富的導演在拍攝電影時,既要回顧前面已經(jīng)拍攝的鏡頭保持連續(xù)性,又要參考劇本中后續(xù)的情節(jié)安排,確保當前鏡頭的內(nèi)容合理自然。

傳統(tǒng)的人工智能模型在處理這種復雜上下文時會遇到計算量爆炸的問題。隨著上下文信息的增加,計算復雜度會呈指數(shù)級增長,很快就會超出現(xiàn)有硬件的處理能力。研究團隊開發(fā)了一種"稀疏上下文注意力"機制來解決這個問題。

這種機制的工作原理類似于人類的選擇性注意力。在觀看一場足球比賽時,我們不會同時關(guān)注場上的每一個細節(jié),而是會重點關(guān)注球的位置、關(guān)鍵球員的動作,以及與當前比賽進程最相關(guān)的信息。CubeComposer也是如此,它會讓正在生成的內(nèi)容對所有相關(guān)信息保持全面關(guān)注,而讓上下文信息只關(guān)注最重要的部分,這樣既保證了信息的充分利用,又大幅降低了計算負擔。

研究團隊還設計了一套動態(tài)的未來信息選擇策略。對于來自未來時間段的原始視頻信息,系統(tǒng)不會盲目地包含所有內(nèi)容,而是會智能地識別哪些片段包含有效信息,然后只選擇最接近當前生成時間點且信息密度最高的片段作為參考。這種做法既充分利用了原始視頻的指導作用,又避免了無關(guān)信息的干擾。

四、連續(xù)性保障的精密設計

由于CubeComposer采用分塊生成的策略,如何確保各個立方體面在拼接時不會出現(xiàn)明顯的邊界線和不連續(xù)現(xiàn)象,成為了技術(shù)實現(xiàn)的關(guān)鍵難點。這個問題類似于制作一幅大型拼圖時,如何確保每片拼圖都能與相鄰部分完美貼合。

研究團隊開發(fā)了兩項核心技術(shù)來解決這個問題。第一項是"立方體感知位置編碼",它讓人工智能模型從一開始就理解各個立方體面之間的空間關(guān)系。傳統(tǒng)的位置編碼就像給每個圖像塊分配一個獨立的身份證號碼,而新的編碼方式則像給每個塊分配一個包含鄰居關(guān)系信息的詳細地址,模型因此能夠了解當前處理的區(qū)域與周圍區(qū)域的相對位置關(guān)系。

第二項技術(shù)是"立方體感知填充與混合"策略。在生成每個立方體面時,系統(tǒng)會自動從相鄰面借用一部分邊界區(qū)域的信息作為參考,確保新生成的內(nèi)容與已有內(nèi)容在邊界處保持一致。生成完成后,系統(tǒng)還會對重疊區(qū)域進行智能混合,就像用柔軟的畫筆將兩種顏色自然地融合在一起,消除任何可能存在的突兀過渡。

這種處理方式的效果顯著。在最終生成的360度視頻中,觀眾無法察覺到任何拼接痕跡,整個視覺體驗自然流暢,仿佛真的是用專業(yè)360度攝像機一次性拍攝完成的。

五、訓練數(shù)據(jù)與評估體系

為了訓練和評估CubeComposer模型,研究團隊構(gòu)建了一個名為4K360Vid的高質(zhì)量數(shù)據(jù)集,包含超過11,832個4K分辨率的360度視頻片段。這些視頻不僅分辨率高,內(nèi)容也極其豐富,涵蓋了自然風光、城市街景、室內(nèi)場景等多種環(huán)境類型。更重要的是,每個視頻都配備了全局描述和分面描述兩套標注系統(tǒng),這樣模型既能理解整體場景的特征,又能掌握每個方向的具體細節(jié)。

在評估方面,研究團隊采用了多維度的評價標準。除了傳統(tǒng)的圖像質(zhì)量指標如清晰度、色彩還原度等,他們還特別關(guān)注了360度視頻特有的評價維度,包括空間一致性、時間連續(xù)性、美學質(zhì)量等。這種綜合評價體系確保了生成的視頻不僅在技術(shù)指標上優(yōu)秀,在實際觀看體驗上也令人滿意。

實驗結(jié)果表明,CubeComposer在所有主要評價指標上都顯著優(yōu)于現(xiàn)有的同類技術(shù)。特別是在原生4K分辨率生成方面,傳統(tǒng)方法即使配合后期超分辨率處理,也無法達到CubeComposer的視覺質(zhì)量水平。這證明了原生高分辨率生成相比于后期放大處理具有本質(zhì)優(yōu)勢。

六、實際應用前景與技術(shù)意義

CubeComposer的成功不僅僅是一個技術(shù)演示,更開啟了360度內(nèi)容創(chuàng)作的新時代。在虛擬現(xiàn)實娛樂領(lǐng)域,這項技術(shù)能夠大幅降低VR內(nèi)容制作成本,讓更多創(chuàng)作者能夠制作高質(zhì)量的沉浸式體驗。在教育培訓方面,老師可以用普通設備錄制講課視頻,然后轉(zhuǎn)換為360度全景版本,為學生提供更好的遠程學習體驗。

在旅游和房地產(chǎn)行業(yè),這項技術(shù)的應用價值同樣巨大。旅游景點可以用簡單的設備制作360度宣傳視頻,房地產(chǎn)中介可以輕松創(chuàng)建房屋的沉浸式展示內(nèi)容。這些應用不僅成本更低,制作周期也大幅縮短。

從技術(shù)發(fā)展角度來看,CubeComposer代表了人工智能視頻生成領(lǐng)域的重要進展。它首次實現(xiàn)了原生4K分辨率的360度視頻生成,突破了傳統(tǒng)方法的分辨率限制。更重要的是,其空間-時間自回歸生成策略為處理其他復雜視覺生成任務提供了新的思路。

研究團隊在論文中也坦誠地討論了當前技術(shù)的局限性和未來改進方向。雖然CubeComposer在大多數(shù)場景下表現(xiàn)優(yōu)秀,但在處理快速運動物體或極度復雜場景時仍有提升空間。未來的研究重點將集中在進一步提高生成效率、支持實時流式生成,以及處理更加復雜的場景內(nèi)容等方面。

這項研究的成功證明了人工智能在創(chuàng)造性內(nèi)容生成方面的巨大潛力。隨著技術(shù)的不斷成熟和普及,我們有理由期待360度沉浸式內(nèi)容將成為數(shù)字媒體的重要組成部分,為人們的娛樂、學習、工作帶來全新的體驗。

Q&A

Q1:CubeComposer能用普通手機視頻生成360度全景視頻嗎?

A:是的,CubeComposer可以將普通攝像機或手機拍攝的局部視頻轉(zhuǎn)換為完整的4K分辨率360度全景視頻。它通過人工智能技術(shù)智能推測和生成原始視頻中沒有覆蓋的區(qū)域,創(chuàng)造出可以自由旋轉(zhuǎn)觀看的沉浸式體驗。

Q2:CubeComposer生成的4K視頻質(zhì)量如何?

A:CubeComposer能夠原生生成4K分辨率的360度視頻,畫質(zhì)遠超傳統(tǒng)方法。傳統(tǒng)技術(shù)最多只能生成1K分辨率的視頻,即使配合后期超分辨率處理提升到2K,視覺效果仍然不如CubeComposer的原生4K生成質(zhì)量。

Q3:這項技術(shù)什么時候能普通人使用?

A:目前CubeComposer還是研究階段的技術(shù),尚未開發(fā)出面向普通消費者的產(chǎn)品。不過考慮到其在VR內(nèi)容制作、旅游宣傳、房地產(chǎn)展示等領(lǐng)域的巨大應用價值,預計相關(guān)商業(yè)化產(chǎn)品會在未來幾年內(nèi)逐步出現(xiàn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
《妻子的浪漫旅行8》錄制路透,金莎孫丞瀟牽手,秦昊伊能靜撒糖

《妻子的浪漫旅行8》錄制路透,金莎孫丞瀟牽手,秦昊伊能靜撒糖

章眽八卦
2026-03-14 19:34:29
今年春季,事業(yè)像開掛一樣飆升的三個星座,升職加薪只是開始

今年春季,事業(yè)像開掛一樣飆升的三個星座,升職加薪只是開始

小晴星座說
2026-03-14 19:34:17
同濟醫(yī)院核磁共振事故:患者不能自己脫困嗎

同濟醫(yī)院核磁共振事故:患者不能自己脫困嗎

金牌娛樂
2026-03-14 09:31:27
宮魯鳴若下課,女籃新帥3選1,王治郅在列,57歲名宿解禁成熱門

宮魯鳴若下課,女籃新帥3選1,王治郅在列,57歲名宿解禁成熱門

萌蘭聊個球
2026-03-14 14:44:40
陳立夫:從高官到雞農(nóng),58歲患糖尿病,活102歲的長壽秘訣是什么

陳立夫:從高官到雞農(nóng),58歲患糖尿病,活102歲的長壽秘訣是什么

林雁飛
2026-03-06 14:35:14
哈馬斯呼吁伊朗不要將襲擊目標對準鄰國

哈馬斯呼吁伊朗不要將襲擊目標對準鄰國

新華社
2026-03-14 18:14:07
擊落美軍加油機?B-1B轟炸機對伊朗扔炸彈,以色列財長之子受重傷

擊落美軍加油機?B-1B轟炸機對伊朗扔炸彈,以色列財長之子受重傷

鷹眼Defence
2026-03-13 17:40:40
1944年,宋氏三姐妹拍了最后一張照片后,天各一方,相會無期

1944年,宋氏三姐妹拍了最后一張照片后,天各一方,相會無期

浩渺青史
2026-03-13 19:38:07
比安東尼還坑!曼聯(lián) 5000 萬新水貨,弗格森后最爛引援!

比安東尼還坑!曼聯(lián) 5000 萬新水貨,弗格森后最爛引援!

瀾歸序
2026-03-14 04:18:00
她果然沒離,畢竟400億資產(chǎn)的男人也不多?。?>
    </a>
        <h3>
      <a href=她果然沒離,畢竟400億資產(chǎn)的男人也不多啊! BenSir本色說
2026-03-11 22:06:22
貴州茅臺董秘蔣焰嚴重違紀違法被留置 此前已被“帶走”

貴州茅臺董秘蔣焰嚴重違紀違法被留置 此前已被“帶走”

21世紀經(jīng)濟報道
2026-03-13 21:14:12
伊朗最大的內(nèi)鬼被處決了

伊朗最大的內(nèi)鬼被處決了

犀利辣椒
2026-03-13 06:40:38
8次搶斷,劉洋刷新山東泰山隊史球員中超單場搶斷紀錄

8次搶斷,劉洋刷新山東泰山隊史球員中超單場搶斷紀錄

懂球帝
2026-03-14 18:17:53
廣東男籃本賽季消失的“七位故人”!他們都在哪?過的還好嗎?

廣東男籃本賽季消失的“七位故人”!他們都在哪?過的還好嗎?

男足的小球童
2026-03-14 19:37:29
1萬5起價 蘋果iPhone Fold計劃銷量上調(diào)20%

1萬5起價 蘋果iPhone Fold計劃銷量上調(diào)20%

PChome電腦之家
2026-03-13 11:21:45
新版《呼嘯山莊》“一刀未剪”,海報標注“未成年人謹慎觀看”

新版《呼嘯山莊》“一刀未剪”,海報標注“未成年人謹慎觀看”

韓小娛
2026-03-14 07:31:32
大批美國游客涌入中國,回國后坦言:客觀對比,中國比美國強多了

大批美國游客涌入中國,回國后坦言:客觀對比,中國比美國強多了

燦若銀爛
2026-02-27 20:11:39
太善良!王藝迪4比3險勝申裕斌,接受采訪擔心申裕斌是不是受傷

太善良!王藝迪4比3險勝申裕斌,接受采訪擔心申裕斌是不是受傷

鳳幻洋
2026-03-14 14:30:08
中國女足艱難晉級!媒體人熱議:衛(wèi)冕提前結(jié)束,米帥注定是恥辱

中國女足艱難晉級!媒體人熱議:衛(wèi)冕提前結(jié)束,米帥注定是恥辱

奧拜爾
2026-03-14 15:48:55
西部排名又變了:火箭超越湖人,快船高歌猛進,勇士岌岌可危

西部排名又變了:火箭超越湖人,快船高歌猛進,勇士岌岌可危

籃球大視野
2026-03-14 17:26:40
2026-03-14 20:11:00
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
7585文章數(shù) 555關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

霍爾木茲海峽上周末僅4艘船通過 繞行要多走5500公里

頭條要聞

霍爾木茲海峽上周末僅4艘船通過 繞行要多走5500公里

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂要聞

張藝興,犯了大忌

財經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

家居
本地
數(shù)碼
時尚
公開課

家居要聞

藝術(shù)之家 法式優(yōu)雅

本地新聞

坐標北京,過敏季反向遷徒

數(shù)碼要聞

399 元 2TB!長江存儲致態(tài) TiPlus7200 殺瘋,7200MB/s 封神

審美提升|| 來和時髦尖子生學幾招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版