国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

智源人工智能研究院與高瓴人工智能學(xué)院聯(lián)合推出MemoBrain:為長程推理重建“執(zhí)行記憶”的新一代智能體架構(gòu)

0
分享至

如果你最近關(guān)注過 AI Agent 的發(fā)展,你會(huì)發(fā)現(xiàn)一個(gè)趨勢,智能體越來越像“多線程程序”。它們會(huì)搜索網(wǎng)頁、調(diào)用代碼執(zhí)行器、分析結(jié)果、再搜索、再分析……推理鏈條動(dòng)輒幾十步、上百步。每一步都會(huì)產(chǎn)生大量中間信息,搜索結(jié)果、網(wǎng)頁片段、失敗的嘗試、錯(cuò)誤的推斷、臨時(shí)的假設(shè)。

這些東西會(huì)被一股腦塞進(jìn)大模型的上下文里。

于是問題來了——上下文爆炸。

當(dāng)推理鏈條越拉越長,模型的上下文窗口就像被塞滿的行李箱,開始出現(xiàn)各種“推理斷裂”。

推著推著,模型突然忘了自己在干什么。 查著查著,它開始重復(fù)之前失敗過的路徑。 甚至有時(shí)候,它會(huì)被噪聲信息帶偏,走向完全錯(cuò)誤的方向。

這不是模型“不聰明”,而是它被信息淹沒了。

這就是大模型推理的第一大瓶頸: 推理痕跡、工具輸出、失敗嘗試不斷累積,最終反噬推理本身。

很多人會(huì)問,為什么不讓 AI 用“記憶”來解決?

問題在于,現(xiàn)有的記憶機(jī)制根本不是為“推理”設(shè)計(jì)的。

跨任務(wù)記憶更像是“用戶偏好存檔”,適合長期個(gè)性化,但不適合任務(wù)內(nèi)的復(fù)雜推理結(jié)構(gòu)。 長時(shí)記憶擅長存儲(chǔ)大量信息,卻不理解“推理依賴”,它不知道哪些信息是關(guān)鍵鏈條、哪些只是噪聲。 上下文壓縮方法雖然能減少 token,但它只是工程優(yōu)化,不具備“認(rèn)知控制”能力,無法決定哪些推理路徑應(yīng)該被保留、哪些應(yīng)該被抑制。

換句話說,它們都在“存東西”,但沒有一個(gè)在“管理思考”。

而復(fù)雜推理真正需要的,是一種能理解推理結(jié)構(gòu)、能主動(dòng)調(diào)度信息的記憶系統(tǒng)。

近日,來自北京智源人工智能研究院(BAAI)與中國人民大學(xué)高瓴人工智能學(xué)院的聯(lián)合團(tuán)隊(duì)提出AI 的“思考過程”管理工具:MemoBrain 。

MemoBrain 的突破點(diǎn)在于,它不是一個(gè)“記憶庫”,而是一個(gè)“執(zhí)行大腦”。

它提出了一個(gè)全新的概念:執(zhí)行記憶(Executive Memory)。

這是一種只在任務(wù)內(nèi)部存在、隨著推理過程實(shí)時(shí)演化的記憶機(jī)制。它不是被動(dòng)堆疊上下文,而是主動(dòng)管理推理結(jié)構(gòu):

它會(huì)判斷哪些推理步驟已經(jīng)完成,可以折疊成一個(gè)更緊湊的結(jié)論; 它會(huì)識(shí)別哪些嘗試已經(jīng)無效,可以被沖刷成一個(gè)極簡的占位符; 它會(huì)維護(hù)一個(gè)依賴圖,讓模型知道“當(dāng)前推理依賴于哪些過去的結(jié)論”。

更重要的是,MemoBrain 是一個(gè)獨(dú)立模型,與主推理代理并行運(yùn)行。 主代理負(fù)責(zé)“思考”,MemoBrain 負(fù)責(zé)“管理思考”。

這就像給 AI 裝上了一個(gè)“副駕駛”,專門負(fù)責(zé)保持推理鏈條的清晰、緊湊和目標(biāo)一致。

MemoBrain 的作者來自兩個(gè)方向截然不同但高度互補(bǔ)的機(jī)構(gòu)。

北京智源人工智能研究院(BAAI)擅長大模型工程、系統(tǒng)設(shè)計(jì)、推理框架構(gòu)建,是中國最早推動(dòng)大模型開放生態(tài)的機(jī)構(gòu)之一。 中國人民大學(xué)高瓴人工智能學(xué)院則在認(rèn)知建模、推理結(jié)構(gòu)、智能體行為機(jī)制方面有深厚積累。

一個(gè)負(fù)責(zé)“讓系統(tǒng)跑起來”,一個(gè)負(fù)責(zé)“讓系統(tǒng)更像人類思考”。 MemoBrain 正是這兩種力量的結(jié)合產(chǎn)物。

01 執(zhí)行記憶(Executive Memory):一種新的 AI 記憶范式

如果說傳統(tǒng)記憶是“倉庫”,那么執(zhí)行記憶就是“前額葉皮層”。

它不是為了存儲(chǔ),而是為了控制。

執(zhí)行記憶的定義

執(zhí)行記憶的核心特征非常鮮明,它只在任務(wù)內(nèi)部構(gòu)建,不跨任務(wù)、不持久化。 它隨著推理過程實(shí)時(shí)演化,像影子一樣跟著智能體的每一步。 它不是被動(dòng)記錄,而是主動(dòng)選擇、壓縮、抑制、調(diào)度信息。 它的目標(biāo)不是“記住更多”,而是“讓推理更清晰、更高效、更目標(biāo)一致”。

這是一種完全不同于傳統(tǒng)記憶的范式。

與傳統(tǒng)記憶的對比

在理解 MemoBrain 的定位之前,我們不妨先看看它與傳統(tǒng)記憶機(jī)制的根本差異。雖然“記憶”這個(gè)詞在 AI 領(lǐng)域已經(jīng)被頻繁使用,但不同記憶系統(tǒng)的目標(biāo)和能力其實(shí)完全不同。

跨任務(wù)記憶更像是一個(gè)長期檔案庫,它擅長記錄用戶偏好、歷史經(jīng)驗(yàn)、個(gè)性化信息,但它并不理解推理結(jié)構(gòu),也無法參與任務(wù)內(nèi)部的邏輯組織。因此,它無法幫助智能體在復(fù)雜推理中保持鏈條清晰。MemoBrain 則完全不跨任務(wù),它只關(guān)注當(dāng)前推理過程本身,把全部能力都投入到“任務(wù)內(nèi)推理結(jié)構(gòu)管理”上。

長時(shí)記憶的優(yōu)勢在于容量大,能存儲(chǔ)大量文檔、對話或知識(shí)片段,但它的弱點(diǎn)也很明顯:它不理解推理依賴關(guān)系。它不知道哪些信息是關(guān)鍵節(jié)點(diǎn)、哪些只是背景噪聲。MemoBrain 的突破在于,它會(huì)主動(dòng)構(gòu)建推理依賴圖,讓每一步推理都能找到自己的“前因后果”。

上下文壓縮方法則屬于工程優(yōu)化路線,它的目標(biāo)是減少 token,而不是理解推理。它可以壓縮文本,卻無法判斷哪些推理路徑應(yīng)該被保留、哪些應(yīng)該被抑制。MemoBrain 則具備“執(zhí)行控制”能力,能夠主動(dòng)管理推理結(jié)構(gòu),而不是被動(dòng)壓縮內(nèi)容。

執(zhí)行記憶的認(rèn)知類比

如果你熟悉認(rèn)知科學(xué),會(huì)發(fā)現(xiàn) MemoBrain 的設(shè)計(jì)非常接近人類大腦的執(zhí)行功能。

它像前額葉皮層一樣,負(fù)責(zé)任務(wù)管理、抑制無效路徑、維持目標(biāo)一致性,負(fù)責(zé)在復(fù)雜信息中保持清晰的推理主線。

它不是“記憶”,而是“思維的管理者”。

這正是 AI 在邁向更強(qiáng)推理能力時(shí)最缺失的一塊拼圖。

02
MemoBrain 的整體架構(gòu)與工作流程


圖1:MemoBrain異步地將瞬態(tài)推理會(huì)話抽象為緊湊的、依賴感知的存儲(chǔ)單元,并維護(hù)全局推理記憶。在達(dá)到內(nèi)存預(yù)算后,它通過折疊或刷新過去的信息來構(gòu)建內(nèi)存管理的上下文,從而實(shí)現(xiàn)連貫的長期推理。

如果說傳統(tǒng)的 AI 推理像一個(gè)人單線程地思考,那么 MemoBrain 的設(shè)計(jì)更像是給智能體配備了一個(gè)“副駕駛”。主代理繼續(xù)負(fù)責(zé)推理、調(diào)用工具、執(zhí)行任務(wù),而 MemoBrain 則在旁邊默默記錄、整理、抽象、管理整個(gè)推理過程。兩者之間不是主從關(guān)系,而是并行協(xié)作的“雙腦結(jié)構(gòu)”。

主代理負(fù)責(zé)“做事”,MemoBrain 負(fù)責(zé)“管理思考”。 主代理負(fù)責(zé)“行動(dòng)”,MemoBrain 負(fù)責(zé)“組織行動(dòng)的邏輯”。 主代理負(fù)責(zé)“往前走”,MemoBrain 負(fù)責(zé)“告訴它哪些路已經(jīng)走過、哪些路不必再走”。

這種雙模型協(xié)作的最大特點(diǎn)是異步性。MemoBrain 不會(huì)阻塞主代理的推理流程,它像一個(gè)后臺(tái)線程,在推理進(jìn)行的同時(shí)不斷吸收新的推理片段,把它們轉(zhuǎn)化為結(jié)構(gòu)化的記憶單元,再根據(jù)需要對整個(gè)推理結(jié)構(gòu)進(jìn)行折疊、沖刷和重組。主代理不需要等待 MemoBrain 的“整理工作”,而 MemoBrain 也不需要干涉主代理的即時(shí)推理。

在這個(gè)雙腦系統(tǒng)中,MemoBrain 的工作可以被拆解為兩個(gè)核心流程:記憶構(gòu)建與記憶管理。

記憶構(gòu)建負(fù)責(zé)把推理過程中的每一個(gè) episode 抽象成一個(gè) thought,讓推理軌跡從“文本堆疊”變成“結(jié)構(gòu)化記憶”。 記憶管理則負(fù)責(zé)在上下文預(yù)算有限的情況下,決定哪些推理路徑應(yīng)該被保留、哪些應(yīng)該被折疊、哪些應(yīng)該被沖刷,從而保持推理鏈條的清晰與緊湊。

這兩個(gè)流程共同構(gòu)成了 MemoBrain 的“執(zhí)行記憶系統(tǒng)”,讓智能體在長程推理中不再被自己的思考過程拖垮。

03
記憶構(gòu)建:從推理 Episode 到 Thought 的抽象

要理解 MemoBrain 如何構(gòu)建記憶,我們需要先看看它如何看待“推理 episode”。在傳統(tǒng)的 ReAct 或工具增強(qiáng)推理中,一個(gè) episode 通常包含兩類信息:執(zhí)行級(jí)信息和語義級(jí)結(jié)果。

執(zhí)行級(jí)信息包括工具調(diào)用、網(wǎng)頁內(nèi)容、搜索結(jié)果、代碼輸出等。這些信息往往冗長、噪聲多、結(jié)構(gòu)混亂,但又是推理過程中不可避免的“原材料”。 語義級(jí)結(jié)果則是本輪推理真正的“產(chǎn)出”,例如“找到了某個(gè)證據(jù)”“確認(rèn)了某個(gè)假設(shè)”“排除了某條路徑”。

MemoBrain 的第一步,就是把這兩類信息分離開來。

它不會(huì)把執(zhí)行級(jí)信息原樣塞進(jìn)記憶里,而是只保留語義貢獻(xiàn)。換句話說,它不關(guān)心你搜索了多少網(wǎng)頁、看了多少段落、嘗試了多少失敗路徑,它只關(guān)心你最終得到了什么結(jié)論、解決了哪個(gè)子問題、依賴了哪些已有信息。

這一步的產(chǎn)物,就是所謂的 thought——一個(gè)緊湊、抽象、結(jié)構(gòu)化的記憶單元。

每個(gè) thought 都像是推理過程中的一個(gè)“節(jié)點(diǎn)”,記錄著:

這一步解決了什么子問題 它依賴了哪些之前的 thought 它為后續(xù)推理提供了什么新的信息

這讓推理過程不再是線性的文本堆疊,而是逐漸形成一個(gè) directed memory graph——一個(gè)有向的推理記憶圖。

在這個(gè)記憶圖中,每個(gè) thought 都有自己的“前因后果”。 有的 thought 是關(guān)鍵節(jié)點(diǎn),決定著推理的主線。 有的 thought 是探索性嘗試,可能最終被折疊或沖刷。 有的 thought 是分支路徑,為后續(xù)推理提供備用方案。

最重要的是,MemoBrain 不只是記錄這些 thought,它理解它們之間的依賴關(guān)系。這意味著它不僅知道“發(fā)生了什么”,還知道“為什么會(huì)發(fā)生”“接下來應(yīng)該發(fā)生什么”。

這正是執(zhí)行記憶區(qū)別于傳統(tǒng)記憶的關(guān)鍵所在。

04
記憶管理:FOLD / FLUSH 的執(zhí)行控制機(jī)制

如果說記憶構(gòu)建讓 MemoBrain 能“看懂”推理過程,那么記憶管理就是讓它能“管理”推理過程。長程推理的最大敵人不是模型不夠聰明,而是上下文預(yù)算永遠(yuǎn)有限。推理軌跡越長,噪聲越多,模型越容易迷失在自己制造的文本洪流里。

這就像一個(gè)人思考問題時(shí),腦海里不斷冒出各種想法、嘗試、假設(shè)、失敗路徑。如果沒有一個(gè)執(zhí)行系統(tǒng)來清理、壓縮、篩選,這些信息最終會(huì)把思維本身拖垮。

MemoBrain 的記憶管理機(jī)制,就是為了避免這種“推理擁堵”。

它必須主動(dòng)決定:哪些信息值得保留,哪些應(yīng)該被折疊,哪些必須被丟棄。 它必須在有限的上下文里,維持推理鏈條的清晰與緊湊。 它必須像一個(gè)真正的“執(zhí)行大腦”一樣,保持任務(wù)目標(biāo)不被噪聲淹沒。

于是,F(xiàn)OLD 和 FLUSH 兩個(gè)核心操作登場了。

FOLD:折疊已解決的子任務(wù)

FOLD 是 MemoBrain 最具“執(zhí)行功能”色彩的操作。它的目標(biāo)非常明確:把已經(jīng)解決的子任務(wù)從推理上下文中“折疊”起來。

當(dāng) MemoBrain 識(shí)別到某段推理子軌跡已經(jīng)得到明確結(jié)論時(shí),它會(huì)把這段軌跡整體壓縮成一個(gè) summary thought。 原本可能包含十幾步搜索、分析、嘗試、驗(yàn)證的過程,會(huì)被濃縮成一句話式的結(jié)論。

這就像程序執(zhí)行完一個(gè)函數(shù)后,把整個(gè)調(diào)用棧折疊,只保留返回值。 過程不再重要,結(jié)論才是關(guān)鍵。

FOLD 的價(jià)值在于,它能讓推理上下文保持輕盈。 它能讓模型不再被過去的細(xì)節(jié)拖住腳步。 它能讓推理主線更加突出。

在長程推理中,這種“折疊能力”幾乎是生存必需品。

FLUSH:沖刷無效或過時(shí)的推理

如果說 FOLD 是“壓縮成功路徑”,那么 FLUSH 就是“清理失敗路徑”。

推理過程中總會(huì)出現(xiàn)各種嘗試: 搜索錯(cuò)了方向、分析了無關(guān)內(nèi)容、驗(yàn)證了錯(cuò)誤假設(shè)…… 這些信息如果一直留在上下文里,只會(huì)成為噪聲。

MemoBrain 會(huì)識(shí)別這些無效、過時(shí)、被覆蓋的推理步驟,并將它們替換成一個(gè)極簡 thought。 這個(gè) thought 不包含任何執(zhí)行細(xì)節(jié),只保留一個(gè)“我嘗試過,但沒用”的標(biāo)記。

這樣做有兩個(gè)好處,它避免模型重復(fù)探索同樣的錯(cuò)誤路徑,它讓上下文保持干凈,不被無效信息污染。

FLUSH 的存在,讓 MemoBrain 不只是“壓縮”,而是“清理”。 它讓推理過程更像人類的思考:失敗嘗試會(huì)被快速歸檔,而不是永遠(yuǎn)占據(jù)注意力。

上下文重組:讓推理重新變得清晰

當(dāng) FOLD 和 FLUSH 完成后,MemoBrain 會(huì)根據(jù)更新后的記憶圖重新構(gòu)建上下文。

它會(huì)保留所有 active thoughts,也就是仍然參與當(dāng)前推理的關(guān)鍵節(jié)點(diǎn)。 它會(huì)丟棄或折疊掉所有不再必要的內(nèi)容。 它會(huì)把整個(gè)推理上下文重新組織成一個(gè)緊湊、邏輯化、目標(biāo)一致的結(jié)構(gòu)。

最終呈現(xiàn)給主代理的,不再是冗長的推理日志,而是一條清晰的推理主線。

這一步的意義非常重大!它讓智能體在長程推理中保持“思維清醒”。 它讓模型不再被自己的歷史信息拖垮。 它讓推理過程真正具備“執(zhí)行控制能力”。

05
訓(xùn)練策略:SFT + DPO 的兩階段優(yōu)化

要讓 MemoBrain 具備這樣的執(zhí)行能力,僅靠規(guī)則或啟發(fā)式方法是不夠的。它需要學(xué)習(xí),需要訓(xùn)練,需要在大量推理數(shù)據(jù)中理解“什么是重要的推理結(jié)構(gòu)”。

MemoBrain 的訓(xùn)練分為兩個(gè)階段:記憶構(gòu)建的監(jiān)督學(xué)習(xí)(SFT)和記憶管理的偏好優(yōu)化(DPO)。

階段一:記憶構(gòu)建的監(jiān)督學(xué)習(xí)(SFT)

在第一階段,MemoBrain 學(xué)習(xí)如何把推理 episode 抽象成 thought。

研究團(tuán)隊(duì)使用強(qiáng)大的教師模型生成高質(zhì)量的 thought 標(biāo)注,讓 MemoBrain 學(xué)會(huì):

如何從執(zhí)行級(jí)信息中提取語義貢獻(xiàn) 如何判斷一個(gè) episode 的核心結(jié)論是什么 如何構(gòu)建結(jié)構(gòu)化的 thought

這一階段的目標(biāo)是讓 MemoBrain 具備穩(wěn)定、可靠的抽象能力。 它不需要做決策,只需要學(xué)會(huì)“看懂推理”。

階段二:記憶管理的偏好優(yōu)化(DPO)

第二階段才是執(zhí)行記憶真正的靈魂所在。

記憶管理不是一個(gè)簡單的分類任務(wù),而是一個(gè)復(fù)雜的決策問題。 它需要在“壓縮”與“保留”之間做權(quán)衡。 它需要理解推理結(jié)構(gòu),判斷哪些路徑是關(guān)鍵鏈條,哪些可以被折疊或沖刷。

研究團(tuán)隊(duì)使用 DPO(Direct Preference Optimization)來訓(xùn)練 MemoBrain 的決策能力。

他們會(huì)為同一個(gè)記憶狀態(tài)生成多個(gè)候選操作集(不同的 FOLD/FLUSH 組合),然后觀察這些操作對后續(xù)推理質(zhì)量的影響。 表現(xiàn)更好的操作集被標(biāo)記為“偏好”,表現(xiàn)差的被標(biāo)記為“非偏好”。

MemoBrain 就是在這種“偏好對比”中學(xué)會(huì)了如何做出最優(yōu)的記憶管理決策。

這讓它不僅能抽象推理,還能真正“管理推理”。

06
實(shí)驗(yàn)結(jié)果:執(zhí)行記憶的系統(tǒng)級(jí)價(jià)值

研究團(tuán)隊(duì)沒有停留在“理論創(chuàng)新”層面,而是把 MemoBrain 嚴(yán)格放進(jìn)真實(shí)的長程推理場景里,與當(dāng)前最強(qiáng)的工具增強(qiáng)智能體正面較量。

結(jié)果非常直接,執(zhí)行記憶不是錦上添花,而是雪中送炭。


表1:主要實(shí)驗(yàn)結(jié)果。最佳分?jǐn)?shù)以粗體顯示,次佳分?jǐn)?shù)以下劃線顯示。我們報(bào)道Pass@1.標(biāo)有?的結(jié)果引用自原始論文。MemoBrain結(jié)果是通過將MemoBrain-8B整合到相應(yīng)的基礎(chǔ)試劑(GLM-4.6和DeepResearch-30B-A3B)中獲得的。

基準(zhǔn)任務(wù):三大長程推理試煉場

為了驗(yàn)證 MemoBrain 的價(jià)值,研究團(tuán)隊(duì)選擇了三個(gè)風(fēng)格迥異、難度極高的 benchmark,它們共同構(gòu)成了當(dāng)今 AI 長程推理的“試煉三角”。

GAIA 是一個(gè)典型的多步驟推理任務(wù),問題往往需要跨越多個(gè)知識(shí)點(diǎn)、多個(gè)推理階段,甚至需要反復(fù)驗(yàn)證假設(shè)。它考驗(yàn)的是智能體的“推理深度”。

WebWalker 則是網(wǎng)頁跳轉(zhuǎn)推理任務(wù),要求智能體在多個(gè)網(wǎng)頁之間跳轉(zhuǎn)、提取信息、整合證據(jù)。它考驗(yàn)的是“信息導(dǎo)航能力”。

BrowseComp-Plus 是密集檢索 + 推理任務(wù),智能體需要在固定網(wǎng)頁庫中進(jìn)行多輪檢索、比對、篩選、推斷。它考驗(yàn)的是“工具調(diào)用密度”和“推理鏈條長度”。

這三個(gè)任務(wù)共同覆蓋了長程推理的核心挑戰(zhàn): 推得深、走得遠(yuǎn)、查得多。

執(zhí)行記憶帶來的不是小修小補(bǔ),而是系統(tǒng)級(jí)提升

實(shí)驗(yàn)結(jié)果非常清晰,MemoBrain 顯著提升了GLM-4.6 和 DeepResearch-30B-A3B 兩大強(qiáng)力智能體的整體表現(xiàn)。

更有意思的是,提升幅度并不是平均分布的,而是呈現(xiàn)出一種“越難越強(qiáng)”的趨勢。

在 GAIA 的 L3 難度上,MemoBrain 的提升最為明顯。 在 BrowseComp-Plus 這種密集檢索場景中,MemoBrain 的優(yōu)勢也被完全放大。 在工具調(diào)用頻繁、推理鏈條極長的任務(wù)中,MemoBrain 的表現(xiàn)尤為突出。

這說明一個(gè)關(guān)鍵事實(shí),執(zhí)行記憶的價(jià)值在于處理復(fù)雜推理,而不是簡單任務(wù)。

換句話說,MemoBrain 不是為了讓模型“更聰明”,而是為了讓模型“在復(fù)雜環(huán)境中不崩潰”。

這也從側(cè)面證明了一個(gè)重要觀點(diǎn),執(zhí)行記憶是未來 agent 的關(guān)鍵組件,而不是可選插件。


圖2:MemoBrain的消融研究。所有實(shí)驗(yàn)都是在BrowseComp Plus中隨機(jī)抽取的100個(gè)實(shí)例上進(jìn)行的,使用DeepResearch30B-A3B作為基礎(chǔ)推理代理。

執(zhí)行記憶不是壓縮工具,而是推理控制器

很多人看到 MemoBrain 的 FOLD 和 FLUSH 操作,可能會(huì)誤以為它只是一個(gè)“更聰明的上下文壓縮器”。但實(shí)驗(yàn)結(jié)果告訴我們,它遠(yuǎn)不止如此。

傳統(tǒng)壓縮工具的目標(biāo)是減少 token。 MemoBrain 的目標(biāo)是保持推理鏈條的穩(wěn)定性。

傳統(tǒng)壓縮工具是被動(dòng)的。 MemoBrain 是主動(dòng)的。

傳統(tǒng)壓縮工具不理解推理結(jié)構(gòu)。 MemoBrain 通過結(jié)構(gòu)化記憶圖理解推理的“因果鏈”。

這就是為什么 MemoBrain 能解決長程推理中最核心的問題: 上下文崩潰(context collapse)。


圖3:MemoBrain的效率分析。在32K內(nèi)存預(yù)算下,使用4×H100 GPU用于推理模型,2×H100 GPUs用于內(nèi)存模型,批量大小為8,對完整BrowseComp Plus基準(zhǔn)進(jìn)行端到端運(yùn)行時(shí)統(tǒng)計(jì)。

當(dāng)推理鏈條越來越長、工具調(diào)用越來越密集、噪聲越來越多時(shí),傳統(tǒng)智能體會(huì)逐漸迷失方向。 而 MemoBrain 會(huì)不斷清理、折疊、重組推理結(jié)構(gòu),讓智能體始終保持“思維清醒”。

這不是壓縮,這是執(zhí)行控制。 這不是優(yōu)化,這是認(rèn)知升級(jí)。

07
MemoBrain 的意義

MemoBrain 的提出不僅僅是一個(gè)新模塊的誕生,更像是智能體架構(gòu)的一次范式轉(zhuǎn)變。它讓我們第一次意識(shí)到AI 的推理能力,不僅取決于模型本身,還取決于它如何管理自己的思考過程。

記憶從“存儲(chǔ)”走向“執(zhí)行”

MemoBrain 最大的貢獻(xiàn),是把“記憶”從一個(gè)存儲(chǔ)機(jī)制提升為一個(gè)執(zhí)行控制機(jī)制。

它讓智能體具備類似人類前額葉皮層的能力,管理任務(wù)、抑制噪聲、保持目標(biāo)一致、維護(hù)推理鏈條。

它讓長程推理不再依賴“更大的上下文窗口”,而是依賴“更聰明的上下文管理”。

它讓推理過程從線性文本堆疊,變成結(jié)構(gòu)化的因果鏈條。

這是一種認(rèn)知層面的升級(jí)。

未來屬于多模型協(xié)作

MemoBrain 的成功說明了一個(gè)趨勢,未來的智能體不會(huì)是一個(gè)大模型,而是多個(gè)模型的協(xié)作系統(tǒng)。

主代理負(fù)責(zé)推理 執(zhí)行記憶負(fù)責(zé)管理推理 工具負(fù)責(zé)提供外部能力 調(diào)度器負(fù)責(zé)協(xié)調(diào)流程

執(zhí)行記憶將成為 agent 的標(biāo)準(zhǔn)組件,就像 GPU 是深度學(xué)習(xí)的標(biāo)準(zhǔn)硬件一樣。

而推理結(jié)構(gòu)化,將成為下一代 agent 的核心能力。

執(zhí)行記憶的進(jìn)化之路

MemoBrain 只是執(zhí)行記憶的第一代形態(tài),未來還有很多值得探索的方向。

更細(xì)粒度的推理依賴建模,讓記憶圖更像人類的思維結(jié)構(gòu)。 多代理共享執(zhí)行記憶,讓協(xié)作智能體擁有共同的“任務(wù)理解”。 執(zhí)行記憶與長期記憶的融合,讓智能體既能記住過去,又能管理現(xiàn)在。 記憶管理的可解釋性與可控性,讓人類能夠理解智能體的“思維過程”。

這些方向共同指向一個(gè)未來: AI 不只是“會(huì)算”,而是“會(huì)思考、會(huì)管理思考”。(END)

參考資料:https://arxiv.org/pdf/2601.08079


關(guān)于波動(dòng)智能——

波動(dòng)智能旨在建立一個(gè)基于人類意圖與反應(yīng)的真實(shí)需求洞察及滿足的價(jià)值體系,融合人工智能與意識(shí)科學(xué),構(gòu)建覆蓋情緒識(shí)別、建模與推薦的智能引擎,自主研發(fā)面向社交、電商等場景的多模態(tài)意圖識(shí)別引擎、意圖標(biāo)簽系統(tǒng)及意圖智能推薦算法,形成從情緒采集、意圖建模到商業(yè)轉(zhuǎn)化的完整解決方案。波動(dòng)智能提出“意圖是連接人、物與內(nèi)容的新型接口”,其產(chǎn)品廣泛應(yīng)用于AI社交、個(gè)性化內(nèi)容推薦、虛擬陪伴、電商體驗(yàn)優(yōu)化等領(lǐng)域。波動(dòng)智能正在探索“EMO-as-a-Service”技術(shù)服務(wù)架構(gòu),賦能企業(yè)實(shí)現(xiàn)更高效的用戶洞察與精準(zhǔn)情緒交互,推動(dòng)從功能驅(qū)動(dòng)到意圖驅(qū)動(dòng)的產(chǎn)業(yè)范式升級(jí)。

親愛的人工智能研究者,為了確保您不會(huì)錯(cuò)過*波動(dòng)智能*的最新推送,請星標(biāo)*波動(dòng)智能*。我們傾心打造并精選每篇內(nèi)容,只為為您帶來啟發(fā)和深思,希望能成為您理性思考路上的伙伴!

加入AI交流群請掃碼加微信


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
龍洋眼往上瞟,不是看提詞器,也不是針打多了,而是一個(gè)“硬傷”

龍洋眼往上瞟,不是看提詞器,也不是針打多了,而是一個(gè)“硬傷”

她時(shí)尚丫
2026-02-17 22:41:30
越看越上頭!小七寶萌化全網(wǎng),張?zhí)m直言:這娃來的正是好時(shí)候!

越看越上頭!小七寶萌化全網(wǎng),張?zhí)m直言:這娃來的正是好時(shí)候!

樂悠悠娛樂
2026-02-28 15:12:32
上海電影院捉奸后續(xù),女子帶情夫公然出軌,視頻流出高清照片曝光

上海電影院捉奸后續(xù),女子帶情夫公然出軌,視頻流出高清照片曝光

壹月情感
2026-03-02 21:09:52
總的來說,DeepSeek的歷史使命已然落幕!

總的來說,DeepSeek的歷史使命已然落幕!

達(dá)文西看世界
2026-02-14 19:31:04
廣州人注意:明天請?zhí)嵩缫粋(gè)小時(shí)出門!

廣州人注意:明天請?zhí)嵩缫粋(gè)小時(shí)出門!

羊城攻略
2026-03-02 23:44:28
美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

悅心知足
2026-02-21 23:03:46
這種飲料正在摧毀你的胰島細(xì)胞!很多糖尿病,都和這種飲料有關(guān)!

這種飲料正在摧毀你的胰島細(xì)胞!很多糖尿病,都和這種飲料有關(guān)!

蜉蝣說
2026-01-29 14:46:50
伊朗猛轟迪拜報(bào)復(fù)美以!海灣國家被迫站隊(duì),美軍事基地壓力驟增!

伊朗猛轟迪拜報(bào)復(fù)美以!海灣國家被迫站隊(duì),美軍事基地壓力驟增!

深析古今
2026-03-03 03:09:36
2026,買了老小區(qū)的業(yè)主要發(fā)財(cái)了,房齡滿28年以上的老房子有新規(guī)

2026,買了老小區(qū)的業(yè)主要發(fā)財(cái)了,房齡滿28年以上的老房子有新規(guī)

室內(nèi)設(shè)計(jì)師有料兒
2026-03-02 16:35:55
伊朗強(qiáng)援已到!以色列集結(jié)10萬大軍,關(guān)鍵時(shí)刻,普京對中國做承諾

伊朗強(qiáng)援已到!以色列集結(jié)10萬大軍,關(guān)鍵時(shí)刻,普京對中國做承諾

咣當(dāng)?shù)厍?/span>
2026-03-02 17:00:31
西媒曝曼聯(lián)將簽卡塞米羅接班人,預(yù)算2億歐,托納利標(biāo)價(jià)1.5億英鎊

西媒曝曼聯(lián)將簽卡塞米羅接班人,預(yù)算2億歐,托納利標(biāo)價(jià)1.5億英鎊

夏侯看英超
2026-03-03 02:18:14
外媒:一艘懸掛美國國旗油輪遭兩枚炮彈擊中

外媒:一艘懸掛美國國旗油輪遭兩枚炮彈擊中

參考消息
2026-03-02 20:53:04
6分鐘19個(gè)導(dǎo)彈連全軍覆沒,82架戰(zhàn)機(jī)被擊落,此戰(zhàn)給我們敲響警鐘

6分鐘19個(gè)導(dǎo)彈連全軍覆沒,82架戰(zhàn)機(jī)被擊落,此戰(zhàn)給我們敲響警鐘

混沌錄
2026-02-04 22:25:03
為拿美國綠卡,在聯(lián)合國大樓舉牌抹黑中國的張曉寧,如今“圓夢”

為拿美國綠卡,在聯(lián)合國大樓舉牌抹黑中國的張曉寧,如今“圓夢”

嫹筆牂牂
2026-03-02 17:03:39
女足亞洲杯太瘋狂:韓國3-0制造首個(gè)慘案!中國隊(duì)衛(wèi)冕首秀5-0起步

女足亞洲杯太瘋狂:韓國3-0制造首個(gè)慘案!中國隊(duì)衛(wèi)冕首秀5-0起步

侃球熊弟
2026-03-02 19:10:46
朝鮮人對中國人是怎樣的態(tài)度?讓我告訴你真相

朝鮮人對中國人是怎樣的態(tài)度?讓我告訴你真相

世界圈
2026-02-24 19:20:21
中美就兩國元首互動(dòng)保持著溝通

中美就兩國元首互動(dòng)保持著溝通

北青網(wǎng)-北京青年報(bào)
2026-03-02 15:53:19
美國打仗最怕什么?張召忠:一旦發(fā)生這2種情況,美軍必然戰(zhàn)敗

美國打仗最怕什么?張召忠:一旦發(fā)生這2種情況,美軍必然戰(zhàn)敗

聞識(shí)
2026-03-02 07:35:39
來搞笑的?超級(jí)杯花名冊漏洞百出:照片古早且粗糙,譯名疊詞

來搞笑的?超級(jí)杯花名冊漏洞百出:照片古早且粗糙,譯名疊詞

懂球帝
2026-03-02 22:29:12
少婦當(dāng)眾脫褲猥褻男子:高顏值照流出,臟臟細(xì)節(jié)披露,警方已介入

少婦當(dāng)眾脫褲猥褻男子:高顏值照流出,臟臟細(xì)節(jié)披露,警方已介入

博士觀察
2026-03-01 14:24:34
2026-03-03 03:55:00
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4555文章數(shù) 37413關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

特朗普:對伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

頭條要聞

特朗普:對伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

家居
時(shí)尚
親子
本地
軍事航空

家居要聞

萬物互聯(lián) 享科技福祉

今年春天一定要擁有的4件衣服,太好看了!

親子要聞

45歲這年,我這個(gè)二胎媽媽決定做一件“瘋狂”的事

本地新聞

津南好·四時(shí)總相宜

軍事要聞

美國中央司令部透露對伊朗動(dòng)武全部武器裝備清單

無障礙瀏覽 進(jìn)入關(guān)懷版