国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

百萬 Token 也能無損壓縮?C3 模型用“級(jí)聯(lián)壓縮”重新定義長(zhǎng)上下文挑戰(zhàn)

0
分享至


【編者按】百萬級(jí)別 Token 的輸入,正在成為大型語言模型(LLMs)長(zhǎng)上下文任務(wù)中的計(jì)算與內(nèi)存“噩夢(mèng)”。DeepSeekOCR 憑借“上下文光學(xué)壓縮”技術(shù)實(shí)現(xiàn)了 10 倍 Token 壓縮率,引發(fā)全網(wǎng)熱議。但透過現(xiàn)象看本質(zhì),高壓縮率的秘密,真的在于“圖像化”嗎?

作者 |劉帆帆

出品丨作者投稿

DeepSeekOCR 的成功讓許多人誤以為“視覺編碼”是壓縮的關(guān)鍵。然而,研究團(tuán)隊(duì)經(jīng)過深入分析發(fā)現(xiàn),高壓縮率的核心其實(shí)源自 Latent Tokens(潛在 Token)本身——這是一種比離散文本 Token 更高效、密度更高的信息載體。

基于這一洞察,作者所在的研究團(tuán)隊(duì)提出了一種直擊本質(zhì)的全新路徑:Context Cascade Compression (C3,上下文級(jí)聯(lián)壓縮)。

將兩種路徑進(jìn)行對(duì)比:

  • DeepSeek OCR 路徑: 文本 → 圖像 → 視覺 Token → 語言模型(引入了布局、噪點(diǎn)、視覺編碼器等無關(guān)干擾)

  • C3 路徑: 文本 → 文本 Latent Tokens → 語言模型(純粹、無損、直接)

具體來說,一個(gè)小型 LLM 作為第一級(jí),通過將長(zhǎng)上下文壓縮成一組潛在 token(例如,長(zhǎng)度為 32 或 64),實(shí)現(xiàn)高比例的文本 token 到潛在 token 的壓縮。 一個(gè)大型 LLM 作為第二級(jí),然后對(duì)這個(gè)壓縮的上下文執(zhí)行解碼任務(wù)。

這一設(shè)計(jì)也驗(yàn)證了近期熱門論文《LANGUAGE MODELS ARE INJECTIVE AND HENCE INVERTIBLE》中關(guān)于「LLM 本質(zhì)是無損壓縮」的論斷。

實(shí)驗(yàn)表明,在 20 倍壓縮比(文本 token 數(shù)量是潛在 token 數(shù)量的 20 倍)下,C3 實(shí)現(xiàn)了 98% 的解碼準(zhǔn)確率,而 DeepSeek OCR 大約為60%。當(dāng)我們進(jìn)一步將壓縮比增加到 40 倍時(shí),準(zhǔn)確率仍保持在約 93%。這表明在上下文壓縮領(lǐng)域,C3 壓縮比光學(xué)字符壓縮展示了更優(yōu)越的性能和可行性。

目前模型與代碼現(xiàn)已開源:

  • 原文:https://arxiv.org/pdf/2511.15244

  • 代碼:https://github.com/liufanfanlff/C3-Context-Cascade-Compression

  • 模型:https://huggingface.co/liufanfanlff/C3-Context-Cascade-Compression


架構(gòu)

在介紹 C3 之前,先帶大家來了解一下 DeepSeek-OCR 的工作原理。DeepSeek-OCR 采用了一種創(chuàng)新的"視覺壓縮"思路,這種方法的優(yōu)勢(shì)在于利用了視覺編碼器強(qiáng)大的特征提取能力,但也面臨著圖像布局復(fù)雜性、低分辨率下的模糊等固有限制。C3 提出了一個(gè)更直接的壓縮思路:跳過視覺中介,沒有中間商賺差價(jià),直接在文本域進(jìn)行壓縮。其核心架構(gòu)包括:

1.雙 LLM 級(jí)聯(lián)設(shè)計(jì)

  • 小型 LLM(算力消耗低)作為壓縮編碼器,壓縮上下文信息。

  • 大型 LLM(推理生成能力強(qiáng))作為解碼器執(zhí)行下游任務(wù)。

2.壓縮機(jī)制

  • 引入可學(xué)習(xí)的"上下文查詢"(Context Query)嵌入

  • 將長(zhǎng)文本壓縮為固定長(zhǎng)度的潛在token(如32或64個(gè))。

  • 完全保留預(yù)訓(xùn)練 LLM 的語言壓縮能力



性能表現(xiàn)

在 Fox 基準(zhǔn)測(cè)試中,C3 展現(xiàn)出顯著優(yōu)勢(shì):

  • 在約 20 倍壓縮時(shí),C3 保持 98.4% 精度,而D eepSeek-OCR 降至59.1%

  • 即使在極限的 40 倍壓縮率下(32 個(gè)潛在 token),C3 仍能維持 93% 以上的重建精度

獨(dú)特的"遺忘模式":更接近人類記憶


研究還發(fā)現(xiàn)了 C3 的一個(gè)有趣特性:當(dāng)壓縮率過高導(dǎo)致信息損失時(shí),錯(cuò)誤往往集中在文本末尾,呈現(xiàn)序列性信息衰減。這與光學(xué)壓縮方法的"全局模糊"不同,反而更類似人類記憶的漸進(jìn)式遺忘過程。

這種特性使得 C3 在實(shí)際應(yīng)用中更具可預(yù)測(cè)性——重要信息可以優(yōu)先放置在文本前部,確保關(guān)鍵內(nèi)容的完整保留。

測(cè)試


無論是在長(zhǎng)英文文本還是中文古文上均做到了近乎完美的壓縮還原

甚至對(duì)于 LLM 一直難以處理的亂序文本也能精準(zhǔn)還原


應(yīng)用前景

1. 超長(zhǎng)上下文處理:C3 可作為現(xiàn)有 LLM 的"前端壓縮器",將百萬級(jí) token 的輸入(如整本書籍、大型代碼庫)壓縮到可處理范圍,降低計(jì)算成本。

2. 多模態(tài):級(jí)連輕量級(jí) VLM 和 LLM,輕量級(jí) VLM 作為視覺 encoder 進(jìn)行信息壓縮,處理視覺信息豐富的長(zhǎng)文檔等。

3. 下一代模型的基礎(chǔ)組件 :C3 的編碼-解碼架構(gòu)可直接應(yīng)用于擴(kuò)散語言模型和潛在自回歸模型,將可變長(zhǎng)度文本轉(zhuǎn)換為固定長(zhǎng)度潛在表示。

這是一個(gè)在有限的人力、算力與數(shù)據(jù)背景下誕生的“小而美”項(xiàng)目。

目前 C3 的代碼與權(quán)重開源,希望開源社區(qū)的研究者們能接過這一棒,激發(fā)出C3 的巨大潛能。


【活動(dòng)推薦】2025 年是 C++ 正式發(fā)布以來的 40 周年,也是全球 C++ 及系統(tǒng)軟件技術(shù)大會(huì)舉辦 20 周年。這一次,C++ 之父 Bjarne Stroustrup 將再次親臨「2025 全球 C++及系統(tǒng)軟件技術(shù)大會(huì)」北京現(xiàn)場(chǎng),與全球頂尖的系統(tǒng)軟件工程師、編譯器專家、AI 基礎(chǔ)設(shè)施研究者同臺(tái)對(duì)話。

本次大會(huì)共設(shè)立現(xiàn)代 C++ 最佳實(shí)踐、架構(gòu)與設(shè)計(jì)演化、軟件質(zhì)量建設(shè)、安全與可靠、研發(fā)效能、大模型驅(qū)動(dòng)的軟件開發(fā)、AI 算力與優(yōu)化、異構(gòu)計(jì)算、高性能與低時(shí)延、并發(fā)與并行、系統(tǒng)級(jí)軟件、嵌入式系統(tǒng)十二大主題,共同構(gòu)建了一個(gè)全面而立體的知識(shí)體系,確保每一位參會(huì)者——無論是語言愛好者、系統(tǒng)架構(gòu)師、性能優(yōu)化工程師,還是技術(shù)管理者——都能在這里找到自己的坐標(biāo),收獲深刻的洞見與啟發(fā)。詳情參考官網(wǎng):https://cpp-summit.org/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
安徽29歲開邁巴赫相親,女子主動(dòng)撲上遭拒后爬車頂賴著,網(wǎng)友評(píng)辣眼

安徽29歲開邁巴赫相親,女子主動(dòng)撲上遭拒后爬車頂賴著,網(wǎng)友評(píng)辣眼

糖逗在娛樂
2026-03-07 22:30:03
暴跌94%!霍爾木茲海峽,傳來大消息!高盛突發(fā)警告!

暴跌94%!霍爾木茲海峽,傳來大消息!高盛突發(fā)警告!

證券時(shí)報(bào)
2026-03-07 23:53:44
人倫崩塌,誰在毀掉我們的家庭?

人倫崩塌,誰在毀掉我們的家庭?

青蘋果sht
2026-03-07 05:52:19
大內(nèi)總管被殺,伊朗開始軟化?

大內(nèi)總管被殺,伊朗開始軟化?

西樓飲月
2026-03-07 23:35:57
上帝之女洪宣嬌: “毀掉”太平天國(guó)的淫蕩女人

上帝之女洪宣嬌: “毀掉”太平天國(guó)的淫蕩女人

年代回憶
2026-03-07 20:05:55
扣押巨額資產(chǎn),帶走兩名烏克蘭戰(zhàn)俘:澤連斯基要把歐爾班拉下馬

扣押巨額資產(chǎn),帶走兩名烏克蘭戰(zhàn)俘:澤連斯基要把歐爾班拉下馬

鷹眼Defence
2026-03-07 18:14:39
美國(guó)完全沒料到!伊朗大阿亞圖拉全球追殺令,3億教徒裁決特朗普

美國(guó)完全沒料到!伊朗大阿亞圖拉全球追殺令,3億教徒裁決特朗普

好賢觀史記
2026-03-07 16:38:35
集體下挫!美聯(lián)儲(chǔ)降息,突傳大消息!

集體下挫!美聯(lián)儲(chǔ)降息,突傳大消息!

證券時(shí)報(bào)e公司
2026-03-07 22:27:40
吳京:可能沒有以后了

吳京:可能沒有以后了

視覺志
2026-03-05 10:38:20
全網(wǎng)催開門!上海一小吃店明天開門營(yíng)業(yè),老板:5毛錢的水煎包、3元的胡辣湯,新年不漲價(jià)

全網(wǎng)催開門!上海一小吃店明天開門營(yíng)業(yè),老板:5毛錢的水煎包、3元的胡辣湯,新年不漲價(jià)

極目新聞
2026-03-07 18:58:33
全國(guó)政協(xié)委員楊建德 : 建議將春節(jié)連續(xù)9天假期固定下來,順應(yīng)民生期盼、保障休假權(quán)益、激發(fā)內(nèi)需活力、疏解春運(yùn)壓力

全國(guó)政協(xié)委員楊建德 : 建議將春節(jié)連續(xù)9天假期固定下來,順應(yīng)民生期盼、保障休假權(quán)益、激發(fā)內(nèi)需活力、疏解春運(yùn)壓力

每日經(jīng)濟(jì)新聞
2026-03-07 16:12:40
一舞封神后,被東莞首富收入囊中,如今已是7歲孩子的媽媽

一舞封神后,被東莞首富收入囊中,如今已是7歲孩子的媽媽

娛說瑜悅
2026-03-06 18:13:06
CBA扣籃大賽預(yù)賽!俞澤辰100分力壓張鼎巖排第1,攜劉禮嘉晉級(jí)!

CBA扣籃大賽預(yù)賽!俞澤辰100分力壓張鼎巖排第1,攜劉禮嘉晉級(jí)!

籃球資訊達(dá)人
2026-03-07 22:44:59
海瀾之家被軍隊(duì)設(shè)局坑害?真相到底是什么?

海瀾之家被軍隊(duì)設(shè)局坑害?真相到底是什么?

有牙的兔紙
2026-03-07 15:26:41
特朗普沒想到:美伊大戰(zhàn)打醒兩個(gè)國(guó)家,一個(gè)是越南,一個(gè)是菲律賓

特朗普沒想到:美伊大戰(zhàn)打醒兩個(gè)國(guó)家,一個(gè)是越南,一個(gè)是菲律賓

探索新高度
2026-03-07 23:24:06
鄺兆鐳中超處子秀!09年齡段第一人,0突破0射門,3次對(duì)抗均失敗

鄺兆鐳中超處子秀!09年齡段第一人,0突破0射門,3次對(duì)抗均失敗

奧拜爾
2026-03-07 21:31:37
特朗普發(fā)表聲明:伊朗已向其中東鄰國(guó)投降!這是由于美以的持續(xù)攻擊才實(shí)現(xiàn)的

特朗普發(fā)表聲明:伊朗已向其中東鄰國(guó)投降!這是由于美以的持續(xù)攻擊才實(shí)現(xiàn)的

爆角追蹤
2026-03-07 21:09:51
iPhone 18 Pro Max正式定檔,史詩級(jí)升級(jí)全曝光

iPhone 18 Pro Max正式定檔,史詩級(jí)升級(jí)全曝光

小柱解說游戲
2026-03-08 01:46:36
魯迅在北京用3765塊大洋,買一套32間的四合院,如今值多少錢?

魯迅在北京用3765塊大洋,買一套32間的四合院,如今值多少錢?

鶴羽說個(gè)事
2026-03-07 18:52:54
足壇一夜動(dòng)態(tài):尤文造4-0慘案,巴薩小勝巴斯克雄獅,曼城擒喜鵲

足壇一夜動(dòng)態(tài):尤文造4-0慘案,巴薩小勝巴斯克雄獅,曼城擒喜鵲

釘釘陌上花開
2026-03-08 06:27:53
2026-03-08 06:51:00
AI科技大本營(yíng) incentive-icons
AI科技大本營(yíng)
連接AI技術(shù)的創(chuàng)造者和使用者
2639文章數(shù) 7660關(guān)注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

伊朗啟動(dòng)“真實(shí)承諾4”第27輪軍事行動(dòng)

頭條要聞

伊朗啟動(dòng)“真實(shí)承諾4”第27輪軍事行動(dòng)

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

汪小菲曝親媽猛料,張?zhí)m公開財(cái)產(chǎn)分配

財(cái)經(jīng)要聞

針對(duì)"不敢休、不讓休"怪圈 國(guó)家出手了

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

家居
時(shí)尚
手機(jī)
公開課
軍事航空

家居要聞

暖棕撞色 輕法奶油風(fēng)

2026春夏一定要擁有的6只包,好看又百搭

手機(jī)要聞

vivo X300 Max真機(jī)曝光,圓形后攝方案

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美第三個(gè)航母打擊群據(jù)稱準(zhǔn)備部署至中東

無障礙瀏覽 進(jìn)入關(guān)懷版