国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不得了,這個新技術(shù)把視頻壓縮到了0.02%!

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

感謝AI!

原生1個G的視頻,現(xiàn)在只需要傳200K數(shù)據(jù)就能看了——

視頻數(shù)據(jù)的壓縮率干到了0.02%,但依舊能保持畫面的高清、連貫和畫面細節(jié)。

或許你會問,這又有什么用呢?

想象一下,你身處于太平洋的一艘遠洋貨輪中,衛(wèi)星信號只有一兩格,刷個朋友圈,加載內(nèi)容的圈圈都要轉(zhuǎn)好久。

但正是因為有了這項AI技術(shù),現(xiàn)在在如此極端的環(huán)境之下,你甚至可以直接看高清的世界杯直播!



沒錯,視頻傳輸?shù)奈锢矸▌t,算是被重寫了。

而這項新研究,正是來自中國電信人工智能研究院(TeleAI)的技術(shù)——生成式視頻壓縮(GVC,Generative Video Compression)

作為國資央企、全球領(lǐng)先的綜合智能信息服務(wù)運營商,中國電信不僅擁有覆蓋海陸空天的通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施,更具備將前沿AI技術(shù)與實際通信場景深度融合的能力。

這種“云網(wǎng)融合+AI原生”的獨特優(yōu)勢,使得GVC技術(shù)從實驗室走向遠洋船舶、應(yīng)急現(xiàn)場等真實極端環(huán)境成為可能。



那么這項研究到底是如何做到的,以及又能給我們現(xiàn)實生活帶來什么改變,我們繼續(xù)往下看。

用計算,換寬帶

在介紹這項黑科技之前,我們需得先聊聊現(xiàn)在的視頻是怎么傳輸?shù)摹?/p>

無論是你要看的Netflix、B站,還是微信視頻通話,背后主要依靠的是HEVC(H.265)或VVC(H.266)這類傳統(tǒng)視頻編碼標(biāo)準(zhǔn)。

這些技術(shù)的底層邏輯,說白了是像素的極致搬運:編碼器拼命計算哪些像素是不變的、哪些是移動的,然后盡可能多地保留像素信息,再想辦法塞進有限的帶寬里。

這種邏輯在寬帶富裕時很完美,但在極限環(huán)境下(極低帶寬)會迅速崩盤。

一旦帶寬不夠,傳統(tǒng)編碼器為了湊合傳輸,只能瘋狂丟棄高頻信息。結(jié)果我們都見過:畫面糊成一團,甚至直接卡死。

但 TeleAI 團隊換了個思路,如果我不傳像素了呢?

GVC的核心邏輯是:不再傳遞畫面本身,而是傳遞“如何畫出這幅畫面”的指令。

打個比方:

  • 傳統(tǒng)壓縮:就像是把《蒙娜麗莎》拍一張照片,盡量壓縮這張照片發(fā)給你。如果網(wǎng)不好,照片就糊得像一堆色塊。
  • 生成式視頻壓縮(GVC):我不發(fā)照片了。我發(fā)給你一段描述——“一位女士,神秘微笑,背景是山水,光影是從左側(cè)來的……”,以及她嘴角上揚的精確弧度數(shù)據(jù)。你的接收端坐著一位AI畫師(生成式模型),聽到描述后,現(xiàn)場給你畫出一幅《蒙娜麗莎》。



剛剛說的只是打個比方,實際情況要復(fù)雜得多,傳輸?shù)膬?nèi)容也并非只有文字。

這就是技術(shù)報告中提到的核心理念:用計算,換寬帶(Trading computation for bandwidth)。

把傳輸?shù)膲毫ΓD(zhuǎn)移到了推理計算上。



視頻地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

GVC到底壓了些什么?

既然不傳像素,那這0.02%的數(shù)據(jù)里到底裝了什么?

技術(shù)報告揭示了GVC系統(tǒng)的內(nèi)部構(gòu)造,它主要由神經(jīng)編碼器(Neural Encoder)生成式視頻解碼器(Generative Video Decoder)兩部分組成。

里面?zhèn)鬏數(shù)氖且环N被稱為壓縮Token的極小數(shù)據(jù)包,這些Token里包含了視頻的靈魂,主要分為兩類:

  1. 語義信息(Semantic Information): 這是一個什么場景?有人嗎?有車嗎?物體的大致結(jié)構(gòu)是什么?這是畫面的骨架。
  2. 運動信息(Motion Dynamics): 這些物體下一秒往哪動?風(fēng)怎么吹?車輪怎么轉(zhuǎn)?這是畫面的靈魂。

經(jīng)過 TeleAI 團隊的測試,這些Token的大小可以被壓縮到極致的0.005 bpp - 0.008 bpp(bits per pixel,比特每像素)。

這是什么概念?通常我們看的高清視頻,bpp至少在0.1以上。GVC直接把數(shù)據(jù)量砍掉了兩個數(shù)量級。

除此之外,在接收端,還有一個擴散模型(Diffusion Model)嚴陣以待。

它接收到這些簡短的Token指令后,利用預(yù)訓(xùn)練好的海量世界知識(比如它本來就知道海浪長什么樣,足球長什么樣),結(jié)合指令中的特征,開始腦補并生成視頻。

這在通信理論上,實現(xiàn)了一次巨大的跨越。

香農(nóng)-韋弗(Shannon-Weaver)通信模型將通信分為三個層級:

  • Level A:技術(shù)問題(傳得準(zhǔn)不準(zhǔn)?)
  • Level B:語義問題(意思對不對?)
  • Level C:有效性問題(能不能完成任務(wù)?)

傳統(tǒng)視頻壓縮在死磕Level A,而GVC直接跳到了Level C



它不在乎每一個像素點是否和原圖一模一樣(比如這片樹葉的紋理是否100%重合),它在乎的是:在人眼看來,這是否是一場連貫、清晰、真實的球賽?在機器看來,能否準(zhǔn)確識別出這是否是越位?

數(shù)據(jù)實測:非常省流

極端壓縮聽起來很玄,但具體指標(biāo)并不含糊。

技術(shù)報告中展示了在MCL-JCV權(quán)威數(shù)據(jù)集上的測試結(jié)果,數(shù)據(jù)非常硬核。

畫質(zhì)吊打傳統(tǒng)算法

在極低碼率下(0.005 bpp左右),使用LPIPS(一種更符合人類視覺感知的畫質(zhì)評價指標(biāo))進行對比:

  • 傳統(tǒng)霸主HEVC已經(jīng)徹底崩潰,畫面基本是馬賽克亂舞,LPIPS數(shù)值飆升(越低越好)。
  • GVC生成的畫面依然保持了清晰的紋理和結(jié)構(gòu),LPIPS數(shù)值顯著低于HEVC。

技術(shù)報告中給出了一個驚人的對比結(jié)論:傳統(tǒng)方法(如HEVC)要想達到和GVC同樣的視覺畫質(zhì),需要消耗6倍以上的帶寬!



這意味著,在同樣的渣畫質(zhì)網(wǎng)絡(luò)下,GVC能讓你看清C羅的表情,而HEVC只能讓你看清C羅是個移動的色塊。

不只是給人看,機器也能用

有人會問:AI生成的視頻,會不會失真?比如把球生成沒了?

這是一個非常犀利且實在的問題。

為此,團隊在DAVIS2017視頻分割任務(wù)上進行了驗證;結(jié)果顯示,在bpp=0.01的極限壓縮下,GVC重建視頻的J&F指標(biāo)(衡量分割準(zhǔn)確度)顯著高于HEVC。



這說明GVC傳輸?shù)牟粌H僅是“好看”的皮囊,更是“準(zhǔn)確”的語義。即使是AI重繪的,關(guān)鍵物體(人、車、球)的位置和輪廓也是精準(zhǔn)的,完全不影響后續(xù)的AI分析。

消費級顯卡也能跑

計算換寬帶,那會不會把電腦算爆?

確實,生成式模型通常是算力黑洞。但 TeleAI 通過模型小型化、知識蒸餾等手段,搞定了落地的最后一公里。

報告數(shù)據(jù)顯示,經(jīng)過優(yōu)化的GVC模型,在消費級GPU(如RTX 4090)上,生成一組29幀的畫面大約只需要0.95秒到1.35秒。

雖然比不上傳統(tǒng)解碼器的毫秒級速度,但在很多非實時或準(zhǔn)實時的場景下(比如直播延遲幾秒),這已經(jīng)是完全可用的狀態(tài)了。

當(dāng)然不只是為了看個世界杯

0.02%,這篇技術(shù)報告所展現(xiàn)的關(guān)鍵數(shù)據(jù)已然非常驚艷,但它背后更加可期的,還是這項技術(shù)給未來帶來的改變。

除了開頭我們提到的世界杯的例子外,在報告展示的Demo場景中,GVC還展現(xiàn)了其它極端網(wǎng)絡(luò)環(huán)境下的情況:

  • 遠洋海事通信: 船員通過窄帶衛(wèi)星網(wǎng)絡(luò)(帶寬極其昂貴且稀缺)接收數(shù)據(jù)。用GVC,200K的數(shù)據(jù)流就能還原出連貫的球賽直播。這不僅是娛樂,對于海上遠程醫(yī)療、設(shè)備維修指導(dǎo)來說,是救命的技術(shù)。
  • 應(yīng)急救援: 地震或洪水災(zāi)區(qū),基站損毀,只有微弱的應(yīng)急通信信號。救援無人機傳回的如果是4K畫面,根本發(fā)不出來;如果是GVC壓縮后的Token,指揮中心就能實時看到清晰的現(xiàn)場生成畫面,哪怕細節(jié)紋理是AI補全的,但受災(zāi)人數(shù)、房屋倒塌結(jié)構(gòu)等核心信息是準(zhǔn)確無誤的。
  • 深空探測與車載視頻: 想象一下火星車發(fā)回的視頻,或者數(shù)百萬輛自動駕駛汽車每天上傳的路測數(shù)據(jù)。如果都能壓縮到0.02%,存儲和傳輸成本將呈指數(shù)級下降。



視頻地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

實際上,GVC并非孤立的技術(shù)突破,而是建立在“智傳網(wǎng)(AI Flow)”理論體系之上。

智傳網(wǎng)(AI Flow)是人工智能與通信、網(wǎng)絡(luò)交叉領(lǐng)域的一項關(guān)鍵技術(shù),即通過網(wǎng)絡(luò)分層架構(gòu),基于連接和交互,實現(xiàn)智能的傳遞和涌現(xiàn)。

在去年的世界人工智能大會(WAIC)上,中國電信集團 CTO、首席科學(xué)家、中國電信人工智能研究院(TeleAI)院長李學(xué)龍教授,介紹了 TeleAI 在智傳網(wǎng)(AI Flow)研究中所發(fā)現(xiàn)的三個定律:信容律、同源律、集成律。

信容律描述大模型的本質(zhì)規(guī)律和能力邊界,通過數(shù)據(jù)壓縮的方式來衡量模型的知識密度,也就是智能能力。

同源律則展現(xiàn)大模型的“部分”與“整體”關(guān)系,在相同訓(xùn)練計算開銷下,能指導(dǎo)得到數(shù)量更多、性能更好的不同大小的家族模型。

集成律能指導(dǎo)大模型“單體”與“群體”的協(xié)同,通過多個模型集成的方式,實現(xiàn)智能能力的提升與涌現(xiàn)。



視頻地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

基于智傳網(wǎng)(AI Flow)的信容律,在AI時代,通信的本質(zhì)不再是單純的數(shù)據(jù)傳輸,而是智能的分發(fā)與協(xié)同。

在此體系下,GVC通過“用計算換帶寬”的資源置換策略,實現(xiàn)了通信效率與感知質(zhì)量的最優(yōu)平衡。

GVC就是這一理論的最佳實踐:當(dāng)帶寬成為瓶頸時,我們就燃燒算力來換取自由。

從像素還原到語義生成,視頻壓縮技術(shù)正在經(jīng)歷一場類似從功能機到智能機的范式轉(zhuǎn)移。

GVC標(biāo)志著視頻通信正從像素搬運邁向語義生成的新階段。

作為央企在AI+通信融合創(chuàng)新中的重要成果,它不僅為遠洋通信、應(yīng)急救援、邊緣智能等場景提供了高效可行的解決方案,更開啟了以任務(wù)有效性為核心的下一代視頻傳輸范式:

在未來的互聯(lián)網(wǎng)里,流淌在光纖和電波中的,可能不再是龐大的原始數(shù)據(jù),而是高度濃縮的智慧和指令。

技術(shù)報告地址:
https://www.arxiv.org/abs/2512.24300

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
賈國龍應(yīng)該“拜師”余承東

賈國龍應(yīng)該“拜師”余承東

鈦媒體APP
2026-01-16 16:08:10
整治過低票價,不如整治過低工資

整治過低票價,不如整治過低工資

黑噪音
2026-01-15 11:04:41
深夜利空,航天龍頭利潤暴降4487%,20個龍頭業(yè)績暴雷了,別踩雷

深夜利空,航天龍頭利潤暴降4487%,20個龍頭業(yè)績暴雷了,別踩雷

風(fēng)風(fēng)順
2026-01-16 04:05:03
賈國龍要“約戰(zhàn)”羅永浩!但他沒有任何勝算,因為他找錯對手了

賈國龍要“約戰(zhàn)”羅永浩!但他沒有任何勝算,因為他找錯對手了

狐貍先森講升學(xué)規(guī)劃
2026-01-17 00:05:03
浙江隊又造大手筆!28歲巴薩舊將加盟 簽約2年 薪水400萬歐創(chuàng)紀(jì)錄

浙江隊又造大手筆!28歲巴薩舊將加盟 簽約2年 薪水400萬歐創(chuàng)紀(jì)錄

我愛英超
2026-01-16 12:06:35
佛山一高中74名學(xué)生感染諾如病毒

佛山一高中74名學(xué)生感染諾如病毒

南方都市報
2026-01-16 12:09:05
-18℃!暴雪!罕見五預(yù)警齊發(fā)!山東或遭強降雪侵襲

-18℃!暴雪!罕見五預(yù)警齊發(fā)!山東或遭強降雪侵襲

環(huán)球網(wǎng)資訊
2026-01-16 17:22:09
廉價:一次主動的透明化

廉價:一次主動的透明化

疾跑的小蝸牛
2026-01-16 23:21:02
壕!蘭德爾與嬌妻買下24萬平方米土地造夢想家園 面積=34個足球場

壕!蘭德爾與嬌妻買下24萬平方米土地造夢想家園 面積=34個足球場

Emily說個球
2026-01-16 12:47:00
膝關(guān)節(jié)就是被這樣用廢的!6個動作保養(yǎng)你的膝蓋

膝關(guān)節(jié)就是被這樣用廢的!6個動作保養(yǎng)你的膝蓋

瑜伽解剖學(xué)
2026-01-16 08:22:17
突發(fā)!血栓噩夢+賽季報銷,火箭棄將再遭打擊,才21歲啊,可惜了

突發(fā)!血栓噩夢+賽季報銷,火箭棄將再遭打擊,才21歲啊,可惜了

球童無忌
2026-01-16 15:22:47
對越反擊戰(zhàn)期間,先前有 15 個國家明確站隊支持越南,然而戰(zhàn)爭正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

對越反擊戰(zhàn)期間,先前有 15 個國家明確站隊支持越南,然而戰(zhàn)爭正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

史海孤雁
2025-12-19 17:46:17
西貝賈國龍再發(fā)聲為華杉正名:“當(dāng)時他流淚勸我不要回應(yīng),是我不聽”

西貝賈國龍再發(fā)聲為華杉正名:“當(dāng)時他流淚勸我不要回應(yīng),是我不聽”

現(xiàn)代快報
2026-01-16 11:14:31
剛剛,周五夜晚10家A股上市公司發(fā)布重大利空消息,看看都有哪些?

剛剛,周五夜晚10家A股上市公司發(fā)布重大利空消息,看看都有哪些?

股市皆大事
2026-01-16 20:19:42
AI應(yīng)用概念港股漲幅擴大 MINIMAX漲18%

AI應(yīng)用概念港股漲幅擴大 MINIMAX漲18%

財聯(lián)社
2026-01-16 13:48:06
越扒越有,被人民網(wǎng)點名后,閆學(xué)晶又被曝身份造假,成名史太精彩

越扒越有,被人民網(wǎng)點名后,閆學(xué)晶又被曝身份造假,成名史太精彩

奇思妙想草葉君
2026-01-14 21:18:53
亞歷山大表情挑釁,狂噴杜蘭特到底說了啥?原話曝光比追夢還扎心

亞歷山大表情挑釁,狂噴杜蘭特到底說了啥?原話曝光比追夢還扎心

嘴炮體壇
2026-01-16 12:20:51
原來他就是聶衛(wèi)平長子,移民日本改國籍娶日本妻,拒絕讓兒子姓聶

原來他就是聶衛(wèi)平長子,移民日本改國籍娶日本妻,拒絕讓兒子姓聶

一娛三分地
2026-01-15 16:10:35
離婚真相大白不到2月,“一言不發(fā)”的唐嫣給整個娛樂圈上了一課

離婚真相大白不到2月,“一言不發(fā)”的唐嫣給整個娛樂圈上了一課

素衣讀史
2026-01-15 14:21:30
本該發(fā)給媳婦的信息,卻發(fā)到了工作群,后續(xù)讓人沒想到……

本該發(fā)給媳婦的信息,卻發(fā)到了工作群,后續(xù)讓人沒想到……

環(huán)球網(wǎng)資訊
2026-01-15 14:50:09
2026-01-17 01:20:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12023文章數(shù) 176360關(guān)注度
往期回顧 全部

科技要聞

賈國龍與羅永浩被禁言,微博CEO回應(yīng)

頭條要聞

羅永浩、賈國龍微博賬號均被禁言

頭條要聞

羅永浩、賈國龍微博賬號均被禁言

體育要聞

全隊身價=登貝萊,他們憑什么領(lǐng)跑法甲?

娛樂要聞

李湘翻車,早就有跡可循!

財經(jīng)要聞

清流|酒店商家在攜程和美團之間淪為炮灰

汽車要聞

方程豹品牌銷量突破30萬輛 2026年還將推出轎跑系列

態(tài)度原創(chuàng)

家居
健康
教育
數(shù)碼
藝術(shù)

家居要聞

歲月柔情 現(xiàn)代品質(zhì)輕奢

血常規(guī)3項異常,是身體警報!

教育要聞

寒假指南|你的國美寒假生活一站式指南,請查收!

數(shù)碼要聞

熊貓MX34U7 34英寸帶魚屏顯示器發(fā)布,售價1299元

藝術(shù)要聞

180米!上海北外灘新地標(biāo),設(shè)計藏了3個“小心機”

無障礙瀏覽 進入關(guān)懷版