国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

M+框架來了,增加LLM隱空間記憶,不再受上下文窗口限制

0
分享至



本文的第一作者Yu Wang來自加州大學(xué)圣地亞哥分校,主要研究方向為Memory for LLMs and Memory for LLM Agents. 該論文于2024年在MIT-IBM Waston Lab實習(xí)過程中完成,通訊作者Zexue He也畢業(yè)于加州大學(xué)圣地亞哥分校。

M+是在 MemoryLLM 之上提出的長期隱空間記憶擴(kuò)展框架:通過把「過期」隱藏向量寫入CPU - 側(cè)長期記憶池,再用協(xié)同檢索器拉回最相關(guān)記憶,它將 8 B 級模型的有效記憶跨度從原本不到 20 k tokens 提升到 160 k tokens 以上,同時顯存占用保持不變。



  • 論文標(biāo)題:M+: Extending MemoryLLM with Scalable Long-Term Memory
  • 論文鏈接:https://arxiv.org/abs/2502.00592
  • 代碼倉庫:https://github.com/wangyu-ustc/MemoryLLM
  • 開源模型:https://huggingface.co/YuWangX/mplus-8b

背景:上下文 ≠ 記憶 & 現(xiàn)有記憶模型的缺陷

上下文窗口并不能直接等價于記憶。GPT-4.1 之類的模型即便支持 100 萬 token,也會隨窗口線性升高顯存與延遲,難以落地本地部署。

業(yè)界主流做法是 “Token-Level Memory”:把歷史內(nèi)容或三元組存在數(shù)據(jù)庫 / 向量庫,檢索后再拼接回 prompt;MemGPT等系統(tǒng)即屬此類。該類做法不需要重復(fù)訓(xùn)練,直接結(jié)合 GPT-4 這樣的大模型便可以獲得很不錯的性能,但是,它也會有一些隨之而來的問題:(1)冗余:原始文本并非最緊湊表達(dá),重復(fù)率高。(2)沖突難解:遇到相互矛盾或不斷更新的信息時,文本級沖突消解復(fù)雜。(3)多模態(tài)能力弱:由于數(shù)據(jù)庫格式為文本,處理音頻或者圖片,視頻數(shù)據(jù)將相對困難。

因此,我們希望探索隱空間 (Latent-Space) 的 Memory -- 既壓縮又可端到端訓(xùn)練,更接近人類在神經(jīng)激活中存儲信息的方式。

M + 的關(guān)鍵改進(jìn):Long-Term Memory

在 MemoryLLM 中,我們?yōu)?8B 的 Llama3 模型引入了約 1.67B 的 Memory。Llama3-8B 的 Transformer 共包含 32 層。當(dāng)?shù)谝粚咏邮盏皆~輸入后,會通過 Embedding 層將詞轉(zhuǎn)化為一系列 4096 維的向量?;谶@一特點(diǎn),我們設(shè)計了 MemoryLLM,在每一層都加入 N 個 Memory Tokens(實驗中 N=12800)。在生成過程中,這些 Memory Tokens 會作為每一層的 Prefix,通過 Cross-Attention 將信息注入后續(xù)層,使模型能 “看到” 保存在 Memory Pool 中的歷史信息。



在更新階段,我們會將每層 Memory Token 中最后 K 個(實驗中 K=256)與需要寫入的信息一同送入 Transformer,再次經(jīng)過 Cross-Attention,將信息壓入新的 Memory Tokens 中(如下圖所示)。與此同時,我們在原有 Memory 中隨機(jī)丟棄 K 個舊 Token,并將新生成的 K 個 Token 放到 Memory 尾部,完成更新。



基于這樣的設(shè)計,借助每層 12800 個 Memory Vectors,我們在 50k tokens 內(nèi)都能保持良好的信息留存(最早 MemoryLLM-7B 版本只做到 20k,后續(xù)在 GitHub 提供的新版模型 https://github.com/wangyu-ustc/MemoryLLM 可達(dá) 50k)。然而,這樣的記憶容量仍無法滿足我們對更長序列的期待。要進(jìn)一步擴(kuò)展 Memory,單靠原有的 1.67B 容量已遠(yuǎn)遠(yuǎn)不夠,因此我們提出了Long-Term Memory。

如何高效實現(xiàn) Long-Term Memory?考慮到 MemoryLLM 中每一個 Memory Token 本質(zhì)上都來自 Hidden States,我們將那些在更新過程中被 “丟棄” 的 Memory Token 并非直接舍棄,而是將其保存在長期記憶池中(如下圖)。



僅僅保存是不夠的,我們還需要具備強(qiáng)大的提取能力。最初我們嘗試用 Attention 來從長期記憶中檢索 Hidden States,但實驗表明 Attention 在提取 Hidden States 時效果有限(在論文的消融實驗中做了詳盡對比)。因此我們提出協(xié)同提取器(Co-trained Retriever),并與全模型進(jìn)行聯(lián)合訓(xùn)練(如下圖)。



通過這一結(jié)構(gòu),我們將模型的有效記憶跨度從 50k 一舉提升到 160k,且由于 Memory 主要駐留在 CPU,不會顯著增加 GPU 負(fù)擔(dān)。

M + 的實驗結(jié)果

顯著性能提升及更少的 GPU 使用:在 Longbook-QA 和 Longbook-Event-QA 兩個數(shù)據(jù)集上,我們都在更少 GPU 的使用下(單卡 18GB 左右)獲得了更強(qiáng)大的性能。





更強(qiáng)的信息留存能力:在 SQuAD 數(shù)據(jù)集上表現(xiàn)出遠(yuǎn)超 MemoryLLM-7B 以及相關(guān) ablation baseline 的信息留存能力,可以達(dá)到 160k 依舊不完全遺忘過去的信息。





結(jié)語

M+ 展示了我們在探索隱空間長期記憶領(lǐng)域的重要進(jìn)展,也為下一代具備持續(xù)記憶能力的語言模型提供了堅實的技術(shù)支撐。未來,我們將繼續(xù)研究更高效的存儲機(jī)制、更智能的檢索策略,以及與多模態(tài)輸入更自然融合的隱空間記憶架構(gòu)。在此方向上,M+ 不僅是對 MemoryLLM 的一次擴(kuò)展,也是我們對 “讓模型擁有接近人類記憶能力” 這一愿景的又一次有力實踐。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
21個市級政府,被約談

21個市級政府,被約談

新京報政事兒
2025-12-18 14:59:53
索尼將退出中國,3萬員工一夜失業(yè),一代人的青春落幕

索尼將退出中國,3萬員工一夜失業(yè),一代人的青春落幕

胡嚴(yán)亂語
2025-12-18 14:25:25
海南封關(guān)之后當(dāng)?shù)鼐W(wǎng)友吐槽物價變貴,油條7塊菠菜32一斤

海南封關(guān)之后當(dāng)?shù)鼐W(wǎng)友吐槽物價變貴,油條7塊菠菜32一斤

映射生活的身影
2025-12-18 22:03:06
蘭海高速一小車定速巡航故障剎車失靈,時速115狂奔490公里直至燃油耗盡,交警開道、路政壓陣成功化險

蘭海高速一小車定速巡航故障剎車失靈,時速115狂奔490公里直至燃油耗盡,交警開道、路政壓陣成功化險

極目新聞
2025-12-18 14:18:42
國家統(tǒng)計局原局長邱曉華:很多人按揭買的房子,房子的價格已經(jīng)比首付還要低!它給人帶來的心理沖擊是很大的

國家統(tǒng)計局原局長邱曉華:很多人按揭買的房子,房子的價格已經(jīng)比首付還要低!它給人帶來的心理沖擊是很大的

和訊網(wǎng)
2025-12-18 17:46:52
張韶涵“裁員裁到大動脈”登熱搜,前發(fā)型師發(fā)文回應(yīng)

張韶涵“裁員裁到大動脈”登熱搜,前發(fā)型師發(fā)文回應(yīng)

紅星新聞
2025-12-18 11:38:30
董路與孫繼海公開翻臉:low貨抱團(tuán)惡毒攻擊我,那就拼個你死我活

董路與孫繼海公開翻臉:low貨抱團(tuán)惡毒攻擊我,那就拼個你死我活

念洲
2025-12-18 10:14:12
泰國駐華大使館評論區(qū)爆了,感恩不斷

泰國駐華大使館評論區(qū)爆了,感恩不斷

深度報
2025-12-18 22:18:22
第一批免簽去俄羅斯的消費(fèi)者們,估計都傻眼了……

第一批免簽去俄羅斯的消費(fèi)者們,估計都傻眼了……

翻開歷史和現(xiàn)實
2025-12-18 12:42:20
陳慧琳演唱會穿三角褲衩,五十多了合適嗎?人老心不老

陳慧琳演唱會穿三角褲衩,五十多了合適嗎?人老心不老

蕾爸退休日記
2025-12-16 22:37:37
美記:看到克萊獨(dú)自一人回?fù)魧κ值奶翎叄瑤炖镄睦锸蛛y受

美記:看到克萊獨(dú)自一人回?fù)魧κ值奶翎叄瑤炖镄睦锸蛛y受

移動擋拆
2025-12-19 07:17:01
全球首條!人形機(jī)器人批量上崗寧德時代電池產(chǎn)線 單日工作量較人工提升3倍

全球首條!人形機(jī)器人批量上崗寧德時代電池產(chǎn)線 單日工作量較人工提升3倍

財聯(lián)社
2025-12-18 16:05:06
被撞員工已確認(rèn)死亡,撞人的小米新車司機(jī)恐承擔(dān)刑責(zé)

被撞員工已確認(rèn)死亡,撞人的小米新車司機(jī)恐承擔(dān)刑責(zé)

映射生活的身影
2025-12-18 22:56:32
絲芭放大招了!將實名舉報鞠婧祎涉嫌經(jīng)濟(jì)犯罪,多個合作方要擔(dān)責(zé)

絲芭放大招了!將實名舉報鞠婧祎涉嫌經(jīng)濟(jì)犯罪,多個合作方要擔(dān)責(zé)

萌神木木
2025-12-18 11:53:46
第一個取消育兒補(bǔ)貼的省份來了

第一個取消育兒補(bǔ)貼的省份來了

數(shù)字財經(jīng)智庫
2025-12-18 12:13:04
韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質(zhì)的中國籍綁匪

韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質(zhì)的中國籍綁匪

環(huán)球熱點(diǎn)快評
2025-12-18 11:43:15
轟炸機(jī)抵近東京,美國拒表態(tài),日本承認(rèn)波茨坦公告,求中國一件事

轟炸機(jī)抵近東京,美國拒表態(tài),日本承認(rèn)波茨坦公告,求中國一件事

梁訊
2025-12-18 10:38:01
國務(wù)院安委會辦公室對21個市級政府開展安全生產(chǎn)約談

國務(wù)院安委會辦公室對21個市級政府開展安全生產(chǎn)約談

界面新聞
2025-12-18 14:41:59
30歲健美冠軍王昆意外猝死,深扒死因發(fā)現(xiàn),他生前有3個致命習(xí)慣

30歲健美冠軍王昆意外猝死,深扒死因發(fā)現(xiàn),他生前有3個致命習(xí)慣

法老不說教
2025-12-18 19:20:30
公開婚紗照!知名女星宣布將于明年辦婚禮

公開婚紗照!知名女星宣布將于明年辦婚禮

深圳晚報
2025-12-18 16:49:19
2025-12-19 08:39:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11950文章數(shù) 142513關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

牛彈琴:戰(zhàn)機(jī)又被照射后日本急了 有人第一個想到中國

頭條要聞

牛彈琴:戰(zhàn)機(jī)又被照射后日本急了 有人第一個想到中國

體育要聞

紐約尼克斯,板正的球隊

娛樂要聞

絲芭放大招了!實名舉報鞠婧祎經(jīng)濟(jì)犯罪

財經(jīng)要聞

尹艷林:呼吁加快2.5億新市民落戶進(jìn)程

汽車要聞

在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

態(tài)度原創(chuàng)

藝術(shù)
旅游
本地
時尚
公開課

藝術(shù)要聞

馬世曉書法技藝引爭議,筆力柔弱令人難以理解。

旅游要聞

番茄小鎮(zhèn)的歡樂與承諾(旅人心語)

本地新聞

云游安徽|決戰(zhàn)烽火照古今,千秋一脈看宿州

“煙管褲”今年冬天爆火,怎么搭都時髦!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版