国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

從經(jīng)歷到知識(shí):UIUC、清華PlugMem如何重構(gòu)Agent記憶

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】現(xiàn)在的AI agent往往把長(zhǎng)交互歷史直接存起來(lái),但很難高效復(fù)用。最樸素的方法直接從「原始記憶」里檢索,但常常把模型淹沒(méi)在冗長(zhǎng)、低價(jià)值的上下文里。PlugMem把經(jīng)驗(yàn)轉(zhuǎn)化為結(jié)構(gòu)化、可復(fù)用的知識(shí),并提出一個(gè)任務(wù)無(wú)關(guān)(task-agnostic)的統(tǒng)一記憶模塊,在多種Agent基準(zhǔn)上提升性能,同時(shí)消耗更少。

隨著AI agent承擔(dān)越來(lái)越復(fù)雜的任務(wù)——長(zhǎng)對(duì)話(huà)、多步推理、交互式網(wǎng)頁(yè)導(dǎo)航等——它們必須記住并復(fù)用過(guò)去的經(jīng)驗(yàn)。

但多數(shù)現(xiàn)有記憶系統(tǒng)更像「日志文件」:不斷累積原始交互軌跡,需要時(shí)再?gòu)闹腥〕鲆恍┪谋酒巍r(shí)間一長(zhǎng),記憶會(huì)無(wú)限增長(zhǎng)、噪聲增多,并迅速擠占agent的上下文窗口。

于是出現(xiàn)一個(gè)悖論:AI agent擁有前所未有的「記憶量」,卻依然難以有效使用。然而,對(duì)決策真正重要的內(nèi)容,往往不是完整的交互記錄,而是從記錄中沉淀出的知識(shí)。

比如做商品推薦時(shí),agent需要記住用戶(hù)偏好,而不是反復(fù)閱讀長(zhǎng)對(duì)話(huà);在新網(wǎng)站購(gòu)物時(shí),agent需要的是「如何搜索、篩選、下單」的通用策略,而不是重放自己看過(guò)的每一個(gè)頁(yè)面。

AI agent記憶問(wèn)題的核心挑戰(zhàn)并非「存更多」,而是以能突出決策相關(guān)信息的方式組織記憶

UIUC、清華大學(xué)最新提出的AI agent的記憶方法PlugMem:一個(gè)任務(wù)無(wú)關(guān)、即插即用的記憶模塊,用來(lái)把智能體的原始經(jīng)驗(yàn)轉(zhuǎn)化為可復(fù)用知識(shí)。PlugMem不把記憶當(dāng)作扁平文本來(lái)檢索,而是借鑒認(rèn)知科學(xué),將經(jīng)驗(yàn)結(jié)構(gòu)化為以知識(shí)為中心的表示。


論文鏈接:https://arxiv.org/abs/2603.03296

代碼鏈接:https://github.com/TIMAN-group/PlugMem

認(rèn)知科學(xué)通常區(qū)分三類(lèi)記憶:對(duì)事件的回憶、對(duì)事實(shí)的知識(shí)、以及對(duì)技能/策略的掌握。事件提供背景,但有效決策依賴(lài)從事件中抽象出的事實(shí)與技能。這一視角啟發(fā)我們重新思考 AI agent 的記憶設(shè)計(jì)。

PlugMem將對(duì)話(huà)、文檔、網(wǎng)頁(yè)軌跡等異構(gòu)交互記錄,轉(zhuǎn)化為結(jié)構(gòu)化的知識(shí)單元:更緊湊、更可復(fù)用,并且與決策直接對(duì)齊。

PlugMem包含三個(gè)核心組件:

  1. Structuring(結(jié)構(gòu)化) 將原始情景經(jīng)驗(yàn)標(biāo)準(zhǔn)化,并提取為兩類(lèi)知識(shí):命題式知識(shí)(facts)與處方式知識(shí)(skills、可復(fù)用技能/策略)。這些知識(shí)單元被組織為結(jié)構(gòu)化的記憶圖。

  2. Retrieval(檢索) 不再檢索冗長(zhǎng)文本塊,而是檢索與當(dāng)前任務(wù)語(yǔ)義對(duì)齊的知識(shí)單元。高層概念與意圖(concepts / intents)作為「路由信號(hào)」,幫助快速定位最相關(guān)的內(nèi)容。

  3. Reasoning(推理/壓縮) 把檢索到的知識(shí)進(jìn)一步壓縮為簡(jiǎn)潔、可直接用于當(dāng)前任務(wù)的指引,再交給AI agent使用,從而更高效地利用上下文。


PlugMem將異構(gòu)智能體經(jīng)驗(yàn)組織為知識(shí)中心的記憶圖,實(shí)現(xiàn)結(jié)構(gòu)化檢索與推理。

PlugMem與傳統(tǒng)GraphRAG系統(tǒng)的關(guān)鍵差別在于「記憶訪問(wèn)單元」。傳統(tǒng)方法通常索引文本chunk或?qū)嶓w;PlugMem以知識(shí)單元(命題與處方)作為基本構(gòu)件。這樣的設(shè)計(jì)減少冗余、提升信息密度,并提高檢索精度。

一個(gè)能跨任務(wù)遷移的記憶模塊

很多記憶系統(tǒng)往往為特定基準(zhǔn)精心定制:例如對(duì)話(huà)記憶、知識(shí)密集問(wèn)答、網(wǎng)頁(yè)智能體等。這類(lèi)任務(wù)特定記憶模塊在單一場(chǎng)景里可能表現(xiàn)很好,但換任務(wù)往往要重新設(shè)計(jì)。

PlugMem選擇了另一種方法:作為一個(gè)即插即用的通用記憶骨架,可以直接接到不同AI agent上,無(wú)需針對(duì)任務(wù)做專(zhuān)門(mén)修改。文中用同一個(gè)模塊、保持實(shí)現(xiàn)不變,在三個(gè)異構(gòu)基準(zhǔn)上評(píng)測(cè):長(zhǎng)程對(duì)話(huà)式問(wèn)答、基于維基百科的多跳知識(shí)檢索、交互式網(wǎng)頁(yè)決策任務(wù)。

結(jié)果顯示:PlugMem在三種設(shè)置下都穩(wěn)定提升了任務(wù)表現(xiàn),超過(guò)了通用檢索方法與多種任務(wù)特定記憶設(shè)計(jì)。更重要的是,這些提升是在向AI agent上下文注入顯著更少記憶智元(token)的前提下實(shí)現(xiàn)的。

用「效用」衡量記憶

而不是用「大小」

只看任務(wù)準(zhǔn)確率并不能反映記憶系統(tǒng)的關(guān)鍵能力:記憶模塊必須在「決策效用」和「上下文成本」之間權(quán)衡。

因此PlugMem工作中提出一個(gè)信息論指標(biāo),用來(lái)度量記憶系統(tǒng)每消耗一個(gè)智元(token),能帶來(lái)多少「決策相關(guān)的信息增益」。直觀地說(shuō):記憶模塊產(chǎn)生的記憶智元(token)能讓AI agent對(duì)正確行動(dòng)更有把握多少?接著再按記憶長(zhǎng)度做歸一化。

在效用–成本空間里,PlugMem穩(wěn)定處于更有優(yōu)勢(shì)的位置:更低智元(token)成本下獲得更高的決策效用。


在多種基準(zhǔn)上,PlugMem在更小的記憶預(yù)算下提供更高的決策相關(guān)效用。

這些結(jié)果支持一個(gè)結(jié)論:把經(jīng)驗(yàn)轉(zhuǎn)化為知識(shí),比直接檢索原始日志更緊湊、更有信息量。

超過(guò)任務(wù)特定設(shè)計(jì)

乍看之下,一個(gè)任務(wù)無(wú)關(guān)的記憶模塊能超過(guò)為某個(gè)基準(zhǔn)量身定制的方法似乎有些反直覺(jué)。PlugMem的結(jié)果表明,決定性因素往往不是特定benchmark的啟發(fā)式技巧,而是對(duì)「決策相關(guān)知識(shí)抽取」的有效檢索。

沒(méi)有檢索,記憶只是靜態(tài)存儲(chǔ);沒(méi)有結(jié)構(gòu)化知識(shí),檢索就缺乏精度。PlugMem將以下三件事拆開(kāi)并協(xié)同:結(jié)構(gòu)化決定「可被檢索的內(nèi)容是什么」,檢索決定「記憶是否真的能幫助決策」,推理/壓縮確保「以更低成本被AI智能體利用」。

PlugMem也不試圖取代任務(wù)特定技巧。它更像一個(gè)通用記憶底座,上層依然可以疊加任務(wù)適配。實(shí)驗(yàn)也顯示:在PlugMem之上再加入任務(wù)特定啟發(fā)式探索方法,往往還能進(jìn)一步提升效果,二者具有互補(bǔ)性。

走向智能體的「可復(fù)用知識(shí)基礎(chǔ)設(shè)施」

當(dāng)AI agent邁向更長(zhǎng)程的自主能力,記憶需要從被動(dòng)存儲(chǔ)走向成為主動(dòng)的知識(shí)基礎(chǔ)設(shè)施:agents應(yīng)當(dāng)積累可遷移的事實(shí)與策略,讓知識(shí)跨任務(wù)、跨環(huán)境復(fù)用,緩解AI agents冷啟動(dòng)問(wèn)題,并支持更強(qiáng)的泛化。

PlugMem是朝這個(gè)方向邁出的一步。它以認(rèn)知科學(xué)為設(shè)計(jì)啟發(fā),將「知識(shí)」作為復(fù)用的基本單位,展示了任務(wù)無(wú)關(guān)記憶在效率與能力上同時(shí)可行。

更廣義地看,這項(xiàng)工作提示了一個(gè)視角轉(zhuǎn)變:與其追求檢索更多上下文,不如追求把經(jīng)驗(yàn)表示成天然可復(fù)用的形式。隨著智能體能力擴(kuò)展,可擴(kuò)展、可遷移的記憶系統(tǒng)將成為基礎(chǔ)設(shè)施;知識(shí)中心的記憶很可能是下一代智能體的重要基石。

參考資料:

https://arxiv.org/abs/2603.03296


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
風(fēng)向徹底變了!西方媒體集體改口:中國(guó),無(wú)需再向世界證明什么

風(fēng)向徹底變了!西方媒體集體改口:中國(guó),無(wú)需再向世界證明什么

樂(lè)天閑聊
2026-03-26 03:40:35
一瓶3塊,爆賣(mài)2億!喝一口能把人送走的廣東神飲,讓老表們瘋搶了

一瓶3塊,爆賣(mài)2億!喝一口能把人送走的廣東神飲,讓老表們瘋搶了

毒sir財(cái)經(jīng)
2026-03-16 21:37:01
里子面子都丟了,森林北自曝身體出了問(wèn)題,汪峰的體面被撕碎

里子面子都丟了,森林北自曝身體出了問(wèn)題,汪峰的體面被撕碎

素衣讀史
2025-11-19 16:09:14
卡塔爾向伊朗交60億美元保護(hù)費(fèi)?伊朗打擊升級(jí):瞄準(zhǔn)以色列往死里打

卡塔爾向伊朗交60億美元保護(hù)費(fèi)?伊朗打擊升級(jí):瞄準(zhǔn)以色列往死里打

滄海旅行家
2026-03-26 16:37:46
都看出張雪峰不對(duì)勁,卻沒(méi)人攔得住,最終還是走了

都看出張雪峰不對(duì)勁,卻沒(méi)人攔得住,最終還是走了

笑熬漿糊111
2026-03-25 12:21:46
雷軍曬成績(jī):小米SU7、YU7雙雙第一!

雷軍曬成績(jī):小米SU7、YU7雙雙第一!

快科技
2026-03-26 13:09:04
蘇敏旅游6年后簡(jiǎn)直不敢認(rèn),連面相都變了,網(wǎng)友:這16萬(wàn)花得值

蘇敏旅游6年后簡(jiǎn)直不敢認(rèn),連面相都變了,網(wǎng)友:這16萬(wàn)花得值

小樾說(shuō)歷史
2026-03-25 15:06:05
封神戰(zhàn)在即!德約出戰(zhàn)蒙特卡洛,沖擊史無(wú)前例三圈“金大師”!

封神戰(zhàn)在即!德約出戰(zhàn)蒙特卡洛,沖擊史無(wú)前例三圈“金大師”!

田先生籃球
2026-03-26 13:33:00
男性衰老的標(biāo)志:1臭、2大、2小,如果你沒(méi)有,說(shuō)明還年輕!

男性衰老的標(biāo)志:1臭、2大、2小,如果你沒(méi)有,說(shuō)明還年輕!

健康科普365
2026-03-16 20:35:03
華為首款旗艦MPV!后輪轉(zhuǎn)向,綜合續(xù)航1250km+,智界V9一炮而紅

華為首款旗艦MPV!后輪轉(zhuǎn)向,綜合續(xù)航1250km+,智界V9一炮而紅

隔壁說(shuō)車(chē)?yán)贤?/span>
2026-03-26 08:12:16
風(fēng)向徹底變了!西方媒體集體改口:中國(guó),無(wú)需再向世界證明什么

風(fēng)向徹底變了!西方媒體集體改口:中國(guó),無(wú)需再向世界證明什么

大衛(wèi)聊科技
2026-03-25 12:22:18
人民日?qǐng)?bào)專(zhuān)訪陳夢(mèng)!不談金牌退役,句句不提孫穎莎,卻字字藏著她

人民日?qǐng)?bào)專(zhuān)訪陳夢(mèng)!不談金牌退役,句句不提孫穎莎,卻字字藏著她

林雁飛
2026-03-25 16:09:46
幾十個(gè)家庭壟斷一座城:縣城婆羅門(mén)的閉環(huán)游戲,正在逼走年輕人

幾十個(gè)家庭壟斷一座城:縣城婆羅門(mén)的閉環(huán)游戲,正在逼走年輕人

黑噪音
2026-03-21 19:33:08
給女兒留過(guò)億財(cái)產(chǎn)后,張雪峰身家被扒底朝天,李雪琴的話(huà)有人信了

給女兒留過(guò)億財(cái)產(chǎn)后,張雪峰身家被扒底朝天,李雪琴的話(huà)有人信了

愛(ài)下廚的阿釃
2026-03-26 20:14:43
闖禍的最高境界是什么?看網(wǎng)友講述,這是正常人能做出的事情嗎?

闖禍的最高境界是什么?看網(wǎng)友講述,這是正常人能做出的事情嗎?

侃神評(píng)故事
2026-03-21 19:15:03
德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

老馬拉車(chē)莫少裝
2026-03-24 22:55:20
18歲的姚晨在肯德基工作時(shí)的一張照片,那時(shí)就難掩渾身的好氣質(zhì)

18歲的姚晨在肯德基工作時(shí)的一張照片,那時(shí)就難掩渾身的好氣質(zhì)

娛你同歡
2026-03-17 16:08:28
《火遮眼》北美定檔,近10年最強(qiáng)動(dòng)作片,沒(méi)人能擋住謝苗成為巨星

《火遮眼》北美定檔,近10年最強(qiáng)動(dòng)作片,沒(méi)人能擋住謝苗成為巨星

阿纂看事
2026-03-26 16:03:34
崩潰,市級(jí)城投集團(tuán):全員薪資腰斬后還發(fā)不出工資!

崩潰,市級(jí)城投集團(tuán):全員薪資腰斬后還發(fā)不出工資!

黯泉
2026-03-25 21:19:18
曝張雪峰遺囑內(nèi)容,和原配離婚原因被扒,三段感情時(shí)間線全曝光!

曝張雪峰遺囑內(nèi)容,和原配離婚原因被扒,三段感情時(shí)間線全曝光!

古希臘掌管松餅的神
2026-03-26 09:30:58
2026-03-26 23:39:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14821文章數(shù) 66721關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣(mài)大戰(zhàn)后成績(jī)單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂(lè)要聞

劉曉慶妹妹發(fā)聲!稱(chēng)姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車(chē)要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

數(shù)碼
本地
藝術(shù)
游戲
公開(kāi)課

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專(zhuān)業(yè)顯卡驅(qū)動(dòng),支持B70 / B65顯卡

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬(wàn)遍

藝術(shù)要聞

哪一座橋不是風(fēng)景?

"死亡擱淺"外骨骼來(lái)了!小島工作室轉(zhuǎn)發(fā)聯(lián)名 原度拉滿(mǎn)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版