国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

模型編輯新范式,HSE實現(xiàn)大規(guī)?!鞍踩茨X”且能力反升

0
分享至


始智AI wisemodel.cn社區(qū)是源自中國的中立開放的AI開源社區(qū)。正在,歡迎加入共同成長。wisemodel推出邀請注冊獎勵活動,最高可得算力券+token包380元獎勵,歡迎參與和支持!

你是否想過,我們是如何“修正”大模型(LLM)的記憶的?這個過程叫做“模型編輯”(Model Editing)。它就像是給大模型“打補(bǔ)丁”或“更新記憶” ,比如告訴它一個新事實,或者糾正一個它的“幻覺”。

但一個核心問題是:你今天剛教會它“拜登是第46任總統(tǒng)”,明天它可能就忘了“特朗普是第45任”;你剛給它更新了最新的醫(yī)療知識,它在回答通用問題時就開始“胡言亂語”。對大模型進(jìn)行持續(xù)的知識更新,是否必然導(dǎo)致“災(zāi)難性遺忘”(catastrophic forgetting)?是不是模型一編輯,就必然“性能崩潰”(model collapse)?

來自國防科技大學(xué) PDL的研究團(tuán)隊,在發(fā)表于NeurIPS 2025 的最新論文中,從生物大腦中汲取靈感,給出了一個顛覆性的答案:給大模型裝上“海馬體”!

研究團(tuán)隊受人腦海馬體處理記憶的“三突觸回路”啟發(fā),提出了一種全新的類海馬體序列編輯(HSE)框架。該框架通過三大核心機(jī)制,徹底改變了模型編輯的“游戲規(guī)則”。當(dāng)其他模型在連續(xù)編輯數(shù)百次后性能就“雪崩”至零時,HSE在連續(xù)編輯1000次后,通用能力不僅毫發(fā)無損,甚至還超越了原始模型!已上線始智AI-wisemodel開源社區(qū),歡迎體驗。


代碼地址

https://wisemodel.cn/codes/SquareGroupsky/Hippocampal-like-Sequential-Editing

01.

揭秘HSE的“海馬體”三部曲

為什么大模型會遺忘?因為它們?nèi)狈θ四X的精妙機(jī)制。HSE框架則模擬了海馬體的三大法寶:

1.機(jī)制一:主動遺忘(Active Forgetting)

靈感來源:人腦會通過長時程抑制(LTD)機(jī)制主動忘記過時或沖突的信息。

HSE做法:引入“機(jī)器遺忘”(Machine Unlearning)策略。在學(xué)習(xí)新知識過程中,“主動忘記”那些即將過時的舊知識,為新記憶騰出“神經(jīng)空間”,從根源上解決新舊沖突。


2.機(jī)制二:領(lǐng)域分離(Knowledge Separation)

靈感來源:海馬體的齒狀回(DG)具有“模式分離”(Pattern Separation)功能,能將相似的輸入信息映射到完全不同的神經(jīng)元上,互不干擾。

HSE做法:使用“Fisher Information Matrix” (FIM)來指導(dǎo)參數(shù)更新。FIM能識別出對不同知識領(lǐng)域最重要的參數(shù),在編輯時“精準(zhǔn)控制”更新幅度,確保編輯“醫(yī)療知識”時,不會干擾到“藝術(shù)知識”,防止跨域干擾。


3.機(jī)制三:參數(shù)回放(Parameter Replay)

靈感來源:人腦在休息時,海馬體會“回放”(Replay)白天的經(jīng)歷(SWRs),將短期記憶固化為長期記憶。

HSE做法:設(shè)計了一種高效的“參數(shù)回放”機(jī)制。它以一種輕量化的參數(shù)形式,不斷“鞏固”所有編輯過的歷史知識,最終推導(dǎo)出嚴(yán)謹(jǐn)?shù)拈]式解(closed-form solution),在數(shù)學(xué)上保證了長期記憶的穩(wěn)定。


02.

為什么HSE在數(shù)學(xué)上更優(yōu)?

這篇成果的亮點絕不僅在于“仿生”,更在于其堅實的理論貢獻(xiàn):

1.更緊的泛化界(Tighter Generalization Bound):

研究者從數(shù)學(xué)上證明,其“主動遺忘”模塊(MAF Loss)相比傳統(tǒng)的交叉熵?fù)p失(CE Loss),能帶來更緊的泛化誤差上界(Corollary 1) 。


2.可證明的收斂性(Provable Convergence):

研究者證明了其“參數(shù)回放”模塊(LEM)的更新范數(shù)(Frobenius norm)是收斂的


3.AlphaEdit只是一個特例:

AlphaEdit 是模型編輯領(lǐng)域一個強(qiáng)力的基線。但HSE從理論上指出,AlphaEdit的知識正交化方法,在數(shù)學(xué)上只是HSE所提出的參數(shù)回放公式的一個特例。實驗也表明,HSE的效果顯著優(yōu)于AlphaEdit 。


4.F-Norm洞察:

模型的抗編輯性論文還揭示了一個關(guān)鍵洞察:原始模型的F-NormFrobenius Norm)越大,模型越抗編輯。Llama3和Mistral的F-Norm遠(yuǎn)小于GPT-J ,這導(dǎo)致它們對編輯更敏感,也更容易“崩潰” 。而HSE的LEM模塊,正是通過約束F-Norm的增長,才成功駕馭了這些敏感模型 。


03.

不僅沒遺忘,通用能力還變強(qiáng)了?

堅實的理論帶來了驚人的實驗效果。研究團(tuán)隊在Llama3等多個主流模型上,進(jìn)行了多達(dá)1000次的序列編輯實驗 。驚人現(xiàn)象出現(xiàn)了:

1.終結(jié)模型崩潰

在評估通用能力的GLUE基準(zhǔn)測試上,現(xiàn)有的方法(如MEND、MEMIT、PRUNE)在經(jīng)歷幾百次編輯后,性能無一例外地急劇下降至接近零,模型徹底“崩潰” 。


HSE框架,在經(jīng)歷了1000次編輯后,性能曲線幾乎紋絲不動,甚至在使用ZsRE數(shù)據(jù)集編輯后,平均性能還提升了1.67%!這意味著HSE不僅修復(fù)了知識,還順便提升了模型的通用理解能力。

2.編輯性能遙遙領(lǐng)先

在CounterFact和ZsRE兩個標(biāo)準(zhǔn)的模型編輯基準(zhǔn)上,HSE的編輯效果也全面占優(yōu)。與最佳基線相比,HSE泛化性上平均提升20.6%,特異性上提升21.9%。


3.解決真實世界難題

研究者還在三大實際應(yīng)用中驗證了HSE的威力:

緩解幻覺:在HalluEdit數(shù)據(jù)集上,HSE在9個不同領(lǐng)域均能有效緩解模型幻覺。


醫(yī)療知識注入:成功為專業(yè)醫(yī)療大模型注入新大的醫(yī)療知識,且不破壞原有專業(yè)性。


減少社會偏見:在SafeEdit數(shù)據(jù)集上,HSE能有效“遺忘”有害和歧視性內(nèi)容,顯著提升模型安全性 。


這項研究不再滿足于模型編輯的“小修小補(bǔ)”,而是從生物機(jī)制出發(fā),首次提出了一套完整的、受海馬體啟發(fā)的序列編輯框架HSE 。

通過主動遺忘、領(lǐng)域分離參數(shù)回放三大機(jī)制HSE在理論上被證明具有更緊的泛化界和更穩(wěn)定的收斂性,在實踐中則首次實現(xiàn)在大規(guī)模序列編輯后,通用能力不降反升的驚人效果。這為大模型實現(xiàn)“終身學(xué)習(xí)”和“持續(xù)進(jìn)化”提供了一條極具潛力的技術(shù)路徑。

----- END -----


wisemodel相關(guān):

系列模型:

關(guān)于wisemodel更多

1

歡迎持續(xù)關(guān)注和支持

開源社區(qū)建設(shè)需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開源社區(qū)的志愿者計劃和開源共創(chuàng)計劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動態(tài)。

2

歡迎加盟wisemodel開源社區(qū)

始智AI wisemodel社區(qū)自2023年9月上線以來,逐漸成為影響力日益擴(kuò)大的中立開放的AI開源社區(qū),為了加快公司發(fā)展,我們長期需要技術(shù)、運營等人才加盟,技術(shù)側(cè)重在AI infra、后端開發(fā),熟悉K8S、模型訓(xùn)練和推理等技術(shù), 以及熟悉開發(fā)者生態(tài)運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優(yōu)質(zhì)內(nèi)容

歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵高校實驗室、大企業(yè)研究團(tuán)隊、個人等,在wisemodel平臺上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關(guān)于wisemodel開源社區(qū)

始智AI wisemodel.cn開源社區(qū)由清華校友總會AI大數(shù)據(jù)專委會副秘書長劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高??蒲性核⒋笮突ヂ?lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個人開發(fā)者,以及政府部門、學(xué)會協(xié)會、聯(lián)盟、基金會等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。

向上滑動查看

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
邵佳一這次一口氣征召10名U23新星,為何唯獨不用彭嘯?原因找到

邵佳一這次一口氣征召10名U23新星,為何唯獨不用彭嘯?原因找到

零度眼看球
2026-03-27 07:29:19
上海全市強(qiáng)制執(zhí)行!騎車、走路上下班的都注意了!趕緊自查!

上海全市強(qiáng)制執(zhí)行!騎車、走路上下班的都注意了!趕緊自查!

小影的娛樂
2026-03-27 08:13:09
一點別同情她!被教練性侵27次,卻在奧運賽場上,把隊友撞出賽道

一點別同情她!被教練性侵27次,卻在奧運賽場上,把隊友撞出賽道

云舟史策
2026-03-18 14:29:29
95歲葉選平追悼會現(xiàn)場:身覆黨旗安睡,送別者擠滿會場,中央派人專程慰問

95歲葉選平追悼會現(xiàn)場:身覆黨旗安睡,送別者擠滿會場,中央派人專程慰問

文史明鑒
2026-03-26 21:54:14
無解!姆巴佩嗖一下就甩開巴西后衛(wèi):2秒跑10米+挑射 連續(xù)7場破門

無解!姆巴佩嗖一下就甩開巴西后衛(wèi):2秒跑10米+挑射 連續(xù)7場破門

風(fēng)過鄉(xiāng)
2026-03-27 05:43:38
女子和男領(lǐng)導(dǎo)搞曖昧,尺度沒把握好被強(qiáng)行占有,結(jié)果害人又害己

女子和男領(lǐng)導(dǎo)搞曖昧,尺度沒把握好被強(qiáng)行占有,結(jié)果害人又害己

漢史趣聞
2026-03-26 14:15:30
領(lǐng)導(dǎo)干部任職前公示

領(lǐng)導(dǎo)干部任職前公示

錫望
2026-03-26 21:00:55
最近全網(wǎng)都在夸陳若琳長得好看,我真的想說:別光看臉啊

最近全網(wǎng)都在夸陳若琳長得好看,我真的想說:別光看臉啊

小光侃娛樂
2026-03-26 06:55:03
為什么一定要多接高中孩子放學(xué)?這5個答案點醒無數(shù)家長

為什么一定要多接高中孩子放學(xué)?這5個答案點醒無數(shù)家長

戶外阿毽
2026-03-26 12:33:16
石油危機(jī)惡化,美聯(lián)儲拒不加息,中國警惕了幾十年,防的就是今天

石油危機(jī)惡化,美聯(lián)儲拒不加息,中國警惕了幾十年,防的就是今天

無情有思ss
2026-03-26 14:01:00
全世界沒料到,美國動作真快,沒踩中東坑,反而一招洗空30萬億債

全世界沒料到,美國動作真快,沒踩中東坑,反而一招洗空30萬億債

瀲滟晴方DAY
2026-03-26 22:46:22
中國經(jīng)濟(jì)已正式從“增量狂歡”徹底切換至“存量絞殺”

中國經(jīng)濟(jì)已正式從“增量狂歡”徹底切換至“存量絞殺”

流蘇晚晴
2026-03-26 18:50:52
夢幻轉(zhuǎn)會:克瓦拉茨赫利亞加盟阿森納

夢幻轉(zhuǎn)會:克瓦拉茨赫利亞加盟阿森納

蘭亭墨未干
2026-03-27 08:55:13
阿根廷世界杯名單已定20人!16大名將爭最后6席 21歲加納喬已出局

阿根廷世界杯名單已定20人!16大名將爭最后6席 21歲加納喬已出局

我愛英超
2026-03-26 19:07:13
轟炸進(jìn)入第四周:伊朗民眾現(xiàn)身說法,直指特朗普“完全不可信”

轟炸進(jìn)入第四周:伊朗民眾現(xiàn)身說法,直指特朗普“完全不可信”

Ck的蜜糖
2026-03-27 09:56:36
東北兩省書記省長會見劉強(qiáng)東

東北兩省書記省長會見劉強(qiáng)東

觀察者網(wǎng)
2026-03-25 21:43:37
是時候說出真相!打越南時損失或超乎想象,從犧牲的名將后代便知

是時候說出真相!打越南時損失或超乎想象,從犧牲的名將后代便知

輿圖看世界
2026-03-26 09:15:03
日本被踢出局,僅僅48小時,高市就開始報復(fù):拿中日關(guān)系做文章

日本被踢出局,僅僅48小時,高市就開始報復(fù):拿中日關(guān)系做文章

掉了顆大白兔糖
2026-03-27 07:23:53
馬斯克粉碎華爾街規(guī)矩?SpaceX據(jù)稱擬將至多30%新股留給散戶

馬斯克粉碎華爾街規(guī)矩?SpaceX據(jù)稱擬將至多30%新股留給散戶

財聯(lián)社
2026-03-27 04:12:16
約基奇背靠背均貢獻(xiàn)15+15+15歷史首人!穆雷:嘆為觀止

約基奇背靠背均貢獻(xiàn)15+15+15歷史首人!穆雷:嘆為觀止

北青網(wǎng)-北京青年報
2026-03-26 20:51:06
2026-03-27 10:31:00
wisemodel開源社區(qū) incentive-icons
wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū),打造中國版“huggingface”
466文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產(chǎn)力

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

很反常!油價向上,黃金向下

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
數(shù)碼
教育
本地
軍事航空

親子要聞

過敏性鼻炎需要注意什么,飲食注意事項

數(shù)碼要聞

中國耳機(jī)市場6年來首次下滑:銷量跌回2億 2026還要降

教育要聞

中考報名!剛剛,2026山東一市公布中考報名操作流程

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版