国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

真·開外掛!MIT新研究:架構(gòu)0改動(dòng),讓大模型解鎖千萬級上下文

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

讓大模型輕松處理比自身上下文窗口長兩個(gè)數(shù)量級的超長文本!

MIT CSAIL研究團(tuán)隊(duì)提出了一種叫做遞歸語言模型RLM的長文本處理新方法,來解決上下文腐爛問題。

不修改模型架構(gòu)、不升級模塊設(shè)計(jì),但能讓GPT-5、Qwen-3這類頂尖模型推理層具備千萬級token的超長文本處理能力。



核心思路是不把提示詞直接塞進(jìn)大模型的上下文窗口,而把它“外包”給可交互的Python環(huán)境,讓模型主動(dòng)通過自動(dòng)編程和遞歸調(diào)用拆解任務(wù)、按需處理。

?大模型讀上下文也能遞歸操作?

上下文窗口不夠,仍能推理

先說上下文腐爛這個(gè)扎心的問題。

不管大模型宣稱自己的上下文窗口有多大,它們處理超長文本時(shí),都會(huì)遇到文本越長,模型對早期信息的記憶越模糊,推理性能直線下滑的問題。

這就像我們讀百萬字小說,讀到后半段,早就忘了前半段的關(guān)鍵情節(jié)。



現(xiàn)在主流的解決辦法有上下文壓縮、檢索增強(qiáng)生成RAG,或者對模型進(jìn)行架構(gòu)級優(yōu)化

比如,GPT-5.2-Codex采用的就是窗口內(nèi)的原生上下文壓縮技術(shù),在持續(xù)數(shù)周的大型代碼倉庫協(xié)助任務(wù)中保持全上下文信息。

同時(shí),GPT系列、Claude、Qwen等企業(yè)級版本原生集成RAG功能也是行業(yè)共識(shí)。

而架構(gòu)級優(yōu)化的例子,有社區(qū)普遍猜測的Gemini 3的環(huán)形注意力等。

現(xiàn)在的RLM和這些直接在模型上“硬磕”的方法不同,它把上下文處理給“外包”了



RLM給模型搭了一個(gè)可交互的Python編程環(huán)境REPL

開始處理上下文前,它先啟動(dòng)Python REPL交互式編程環(huán)境,將超長提示詞作為字符串變量存入環(huán)境;

接著模型像程序員一樣編寫代碼,對文本變量進(jìn)行關(guān)鍵詞篩選、局部探查、邏輯拆分等操作,通過「編寫代碼-觀察結(jié)果」的交互循環(huán)減少無效信息攝入;

隨后模型將復(fù)雜任務(wù)拆解為若干子任務(wù),遞歸調(diào)用自身或輕量化子模型處理拆分后的文本片段,所有子任務(wù)輸出均存儲(chǔ)為新變量回流到REPL環(huán)境;

最后主模型編寫代碼讀取并整合所有子任務(wù)結(jié)果變量,進(jìn)行邏輯拼接或語義處理,形成最終輸出。

全程由模型自主決策,實(shí)現(xiàn)按需處理,徹底解耦輸入文本長度與模型上下文窗口的綁定。



實(shí)驗(yàn)顯示,RLM有效處理規(guī)模已突破千萬級Token,超過GPT-5等前沿模型原生上下文窗口的兩個(gè)數(shù)量級。

在復(fù)雜長文本任務(wù)中,RLM的優(yōu)勢也比較顯著。面對要求聚合成對信息、復(fù)雜度呈二次方增長的OOLONG-Pairs任務(wù),基礎(chǔ)GPT-5和Qwen3-Coder的 F1分?jǐn)?shù)不足0.1%;

采用RLM方案后,兩款模型分別取得58.00%和23.11%的F1分?jǐn)?shù)。

在600萬至1100萬Token規(guī)模的BrowseComp-Plus(1K)多文檔推理任務(wù)中,RLM(GPT-5)的正確率高達(dá)91.33%,大幅超越其他長文本處理方案;

即便在要求線性掃描并處理幾乎所有信息的OOLONG任務(wù)中,RLM也實(shí)現(xiàn)了雙位數(shù)的性能提升。



從調(diào)用成本上看,在50分位數(shù)這個(gè)指標(biāo)上,RLM的成本和其他長文本處理方案處于同一水平,甚至更低。

這說明在大多數(shù)常規(guī)任務(wù)場景中,RLM的性價(jià)比是很有優(yōu)勢的。

但到了95分位數(shù)這類高百分位區(qū)間時(shí),RLM的成本會(huì)出現(xiàn)明顯飆升。

主要是因?yàn)镽LM的推理過程是動(dòng)態(tài)的,會(huì)根據(jù)任務(wù)復(fù)雜度自主決定代碼編寫、文本拆分和遞歸調(diào)用的次數(shù),額外的步驟會(huì)增加API調(diào)用次數(shù)。



最后再劃個(gè)小重點(diǎn),RLM是一種不碰模型架構(gòu)的通用推理策略,也就是說,理論上任何模型都能直接上車。

論文地址:https://arxiv.org/abs/2512.24601
參考鏈接:https://x.com/MatthewBerman/status/2012701592756383893


— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
迪奧曼德,利物浦下一個(gè)猛將型邊鋒目標(biāo)?

迪奧曼德,利物浦下一個(gè)猛將型邊鋒目標(biāo)?

靴室笑談社
2026-01-19 16:12:25
炒豬肉時(shí),瘦肉總是柴,干硬嚼不動(dòng),教你一招,像豆腐一樣嫩滑,沒牙的老人都能吃

炒豬肉時(shí),瘦肉總是柴,干硬嚼不動(dòng),教你一招,像豆腐一樣嫩滑,沒牙的老人都能吃

美食格物
2026-01-16 18:47:36
突發(fā)!國乒24歲名將宣布退出國家隊(duì),戀情曝光

突發(fā)!國乒24歲名將宣布退出國家隊(duì),戀情曝光

最愛乒乓球
2026-01-19 13:49:51
1948年,國民黨想要策反林彪,派出信使與其會(huì)面,林彪說道:你留下來別走了

1948年,國民黨想要策反林彪,派出信使與其會(huì)面,林彪說道:你留下來別走了

寄史言志
2026-01-19 11:26:17
爭議!決賽罷賽!補(bǔ)時(shí)點(diǎn)球不進(jìn)!3進(jìn)球被吹+5中門框

爭議!決賽罷賽!補(bǔ)時(shí)點(diǎn)球不進(jìn)!3進(jìn)球被吹+5中門框

足球大號
2026-01-19 15:42:21
剛公布:2025年,中國GDP破140萬億,增速5%!2026年GDP會(huì)如何?

剛公布:2025年,中國GDP破140萬億,增速5%!2026年GDP會(huì)如何?

王爺說圖表
2026-01-19 10:33:23
中國歷史上第一次,沒戰(zhàn)爭而出生率下滑,生存危機(jī)還是卷不動(dòng)了?

中國歷史上第一次,沒戰(zhàn)爭而出生率下滑,生存危機(jī)還是卷不動(dòng)了?

近史談
2025-12-09 20:30:50
供應(yīng)商停產(chǎn)H200芯片關(guān)鍵組件!

供應(yīng)商停產(chǎn)H200芯片關(guān)鍵組件!

中國半導(dǎo)體論壇
2026-01-19 13:01:53
很多人都患過“帶狀皰疹”,卻不知它和“老年癡呆”有關(guān)!了解下

很多人都患過“帶狀皰疹”,卻不知它和“老年癡呆”有關(guān)!了解下

岐黃傳人孫大夫
2026-01-12 13:00:07
外交部長王毅年輕時(shí)舊照,與妻子同框合影,岳父曾是周總理秘書

外交部長王毅年輕時(shí)舊照,與妻子同框合影,岳父曾是周總理秘書

萬物知識(shí)圈
2025-12-25 09:07:23
就在今天!1月19日上午,國足傳來李昊、王鈺棟、蒯紀(jì)聞新消息!

就在今天!1月19日上午,國足傳來李昊、王鈺棟、蒯紀(jì)聞新消息!

寒律
2026-01-19 08:59:17
性壓抑時(shí)代,搞黃色成了AI的第一生產(chǎn)力

性壓抑時(shí)代,搞黃色成了AI的第一生產(chǎn)力

虎嗅APP
2026-01-18 17:01:10
中方瀟灑離場,大規(guī)模拋售美債,馬斯克已通知白宮:美基本沒救了

中方瀟灑離場,大規(guī)模拋售美債,馬斯克已通知白宮:美基本沒救了

小鬼頭體育
2026-01-19 11:46:10
重磅!廣東隊(duì)緊急召回張文逸,杜鋒徹底不要防守了?

重磅!廣東隊(duì)緊急召回張文逸,杜鋒徹底不要防守了?

緋雨兒
2026-01-19 15:21:37
新加坡媒體銳評呆呆殺豬宴,15字一針見血,直戳中國人內(nèi)心

新加坡媒體銳評呆呆殺豬宴,15字一針見血,直戳中國人內(nèi)心

李侽在北漂
2026-01-18 14:30:53
送孩子去澳洲,是我這輩子最后悔的事

送孩子去澳洲,是我這輩子最后悔的事

澳洲財(cái)經(jīng)見聞
2026-01-19 03:46:00
盤點(diǎn)史上最震撼的十大對聯(lián),皆是精妙絕倫的千古絕對,哪個(gè)最妙?

盤點(diǎn)史上最震撼的十大對聯(lián),皆是精妙絕倫的千古絕對,哪個(gè)最妙?

長風(fēng)文史
2026-01-14 11:36:27
繼白俄羅斯后,又有一國跳出來,中歐班列從我這過,運(yùn)量翻一倍

繼白俄羅斯后,又有一國跳出來,中歐班列從我這過,運(yùn)量翻一倍

桑啟紅原
2026-01-18 23:20:31
最冷一周!北京已連續(xù)60小時(shí)跌破冰點(diǎn)!預(yù)計(jì)回暖時(shí)間——

最冷一周!北京已連續(xù)60小時(shí)跌破冰點(diǎn)!預(yù)計(jì)回暖時(shí)間——

環(huán)球網(wǎng)資訊
2026-01-19 14:20:34
1月21日開始喜事吉慶臨門,家有這3生肖告霉運(yùn)清零,事業(yè)運(yùn)強(qiáng)

1月21日開始喜事吉慶臨門,家有這3生肖告霉運(yùn)清零,事業(yè)運(yùn)強(qiáng)

人閒情事
2026-01-19 15:12:45
2026-01-19 16:36:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12031文章數(shù) 176360關(guān)注度
往期回顧 全部

科技要聞

這一仗必須贏!馬斯克死磕芯片"9個(gè)月一更"

頭條要聞

特朗普:解決俄對格陵蘭島威脅時(shí)機(jī)已到 是時(shí)候行動(dòng)了

頭條要聞

特朗普:解決俄對格陵蘭島威脅時(shí)機(jī)已到 是時(shí)候行動(dòng)了

體育要聞

21年后,中國男足重返亞洲四強(qiáng)

娛樂要聞

離婚三年,孫怡董子健首次公開互動(dòng)

財(cái)經(jīng)要聞

公章爭奪 家族反目 雙星為何從頂端跌落?

汽車要聞

徐軍:沖擊百萬銷量,零跑一直很清醒

態(tài)度原創(chuàng)

本地
手機(jī)
時(shí)尚
公開課
軍事航空

本地新聞

云游內(nèi)蒙|黃沙與碧波撞色,烏海天生會(huì)“混搭”

手機(jī)要聞

小米官宣“測到死”直播:REDMI Turbo5 Max將與2.5K檔機(jī)型PK續(xù)航

伊姐周日熱推:電視劇《看得見風(fēng)景的窗》;電視劇《春日狂熱》......

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

古美關(guān)系高度緊張 古巴啟動(dòng)"戰(zhàn)爭狀態(tài)"

無障礙瀏覽 進(jìn)入關(guān)懷版