国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ACL 2025 | 以知識回路視角揭秘大語言模型的新知識習(xí)得機理

0
分享至

本研究系統(tǒng)追蹤了大規(guī)模語言模型在持續(xù)預(yù)訓(xùn)練階段知識回路的動態(tài)演化,由宏觀表現(xiàn)到微觀拓?fù)渑c組件逐層解析,揭示出若干關(guān)鍵規(guī)律。我們認(rèn)為,大語言模型并非不可解釋的黑箱,而是由海量知識回路構(gòu)成的精密系統(tǒng);深入理解這些回路的演化機制,或為構(gòu)建更可控、更高效且更安全的人工智能奠定理論與技術(shù)基礎(chǔ)。


論文題目: How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training 論文鏈接: https://arxiv.org/abs/2502.11196v2 代碼鏈接: https://github.com/zjunlp/DynamicKnowledgeCircuits
一、引言

當(dāng)今大語言模型正進(jìn)化得越來越聰明,展現(xiàn)出強大的“百科全書”能力,但你是否好奇它們是如何習(xí)得這些知識的?特別是當(dāng)世界不斷變化,新知識層出不窮,模型如何“更新”自己的認(rèn)知?究竟是“死記硬背”還是會在內(nèi)部重新組織結(jié)構(gòu)?

為了探索這些問題,本文從“知識回路”的視角切入,通過追蹤分析模型內(nèi)部的計算子圖的動態(tài)演化,系統(tǒng)揭示了大語言模型在持續(xù)預(yù)訓(xùn)練期間如何結(jié)構(gòu)性地整合、存儲和優(yōu)化新知識。


二、核心方法

本文首先構(gòu)建了一個可控的合成知識數(shù)據(jù)集,由虛構(gòu)人物及其出生地、大學(xué)、公司等信息構(gòu)成,覆蓋高、中、低頻率知識,并確保這些知識在模型的預(yù)訓(xùn)練階段不存在,屬于新知識的范疇,并同時涵蓋相關(guān)新知識和全新知識兩種類型。隨后對decoder-only 架構(gòu)的 GPT-2、TinyLLaMA、Phi-1.5 等系列模型在合成構(gòu)建的新知識語料庫上進(jìn)行了持續(xù)預(yù)訓(xùn)練。

傳統(tǒng)的分析手段往往將大語言模型中的知識視為分散的“知識神經(jīng)元”或“記憶塊”,而本文從新穎的“知識回路”視角來進(jìn)行研究。什么是知識回路?它是模型內(nèi)部一個稀疏的計算子圖,由模型完整計算圖中少部分關(guān)鍵節(jié)點和邊組成,專門負(fù)責(zé)存儲和處理某一類特定知識。本文使用現(xiàn)有的回路發(fā)現(xiàn)方法EAP-IG,為模型中的每一條邊分配一個重要性分?jǐn)?shù),通過保留分?jǐn)?shù)絕對值最高的若干(約7%~15%)邊來識別回路。通過在持續(xù)預(yù)訓(xùn)練期間不同的訓(xùn)練檢查點上運行 EAP-IG 方法可以識別不同階段的知識回路,進(jìn)一步可以分析它們的演化規(guī)律。本文的分析將由表及里從三個層面展開:

  • 性能表現(xiàn):知識回路獨立重現(xiàn)模型行為的表現(xiàn)如何變化?

  • 拓?fù)浣Y(jié)構(gòu):知識回路的拓?fù)浣Y(jié)構(gòu)如何變化?

  • 功能組件:組成知識回路的結(jié)點與邊如何變化?

三、核心發(fā)現(xiàn)知識回路表現(xiàn)分析


通過分析知識回路在持續(xù)預(yù)訓(xùn)練期間的性能變化,本文發(fā)現(xiàn)模型對于新知識的習(xí)得遵從知識相關(guān)性原則(Knowledge Relevance Principle),即模型更容易學(xué)習(xí)與已有知識相關(guān)的新知識(如已知實體新的屬性),而對完全陌生的知識更難吸收,表明說大語言模型更擅長在已有認(rèn)知框架內(nèi)進(jìn)行擴展。更擅長在已有認(rèn)知框架內(nèi)進(jìn)行擴展。

知識回路拓?fù)浞治?/strong>


在知識回路的拓?fù)浣Y(jié)構(gòu)層面,本文首先檢查每個中間檢查點上的知識回路與最終回路之間的相似度,通過回路中的邊構(gòu)成的集合的交集除以并集所得的比例來衡量。實驗發(fā)現(xiàn),在所有的模型上,回路的相似度都呈現(xiàn)出一個穩(wěn)定的上升趨勢,表明隨著知識習(xí)得的進(jìn)行,知識回路與最終回路越來越相似,檢查點之間不存在很大幅度的調(diào)整。

根據(jù)觀察到的趨勢,本文進(jìn)一步提出了假設(shè):在模型的知識習(xí)得過程中,知識回路會逐步獲取特定的知識,回路會越來越高效和精確,其中一小部分關(guān)鍵節(jié)點和邊緣會變得越來越重要,影響也越來越大。為了驗證這一假設(shè),本文借鑒信息論設(shè)計了回路熵指標(biāo),并探索知識回路演化過程中的熵變化。實驗發(fā)現(xiàn),在持續(xù)預(yù)訓(xùn)練期間,知識回路的熵呈現(xiàn)穩(wěn)定下降趨勢,表明知識回路的拓?fù)浣Y(jié)構(gòu)變得越來越集中,特定邊的重要性在不斷增加。

同時實驗還發(fā)現(xiàn),回路相似度的上升趨勢和回路熵的下降趨勢在訓(xùn)練達(dá)到某一步之后明顯放緩,本文將這一有趣現(xiàn)象總結(jié)為知識回路的雙階段演化(Biphasic Circuit Evolution),即知識回路的演化先經(jīng)歷形成階段,快速鎖定基礎(chǔ)結(jié)構(gòu),關(guān)鍵邊和節(jié)點逐漸凸顯,回路結(jié)構(gòu)變化大;再進(jìn)入優(yōu)化階段,結(jié)構(gòu)趨于穩(wěn)定,在已有結(jié)構(gòu)上不斷提升表現(xiàn),性能繼續(xù)增長直至收斂。

知識回路組件分析



在知識回路的組件層級,本文主要關(guān)注回路中的關(guān)鍵結(jié)點即注意力頭的行為變化。實驗發(fā)現(xiàn),位于知識回路的中到深層的注意力頭先學(xué)會從模型參數(shù)中提取特定的知識,而位于知識回路較淺層的注意力頭在訓(xùn)練期間持續(xù)豐富特定知識的表征。

四、總結(jié)

本文通過對大語言模型在持續(xù)預(yù)訓(xùn)練過程中的知識回路的動態(tài)變化進(jìn)行追蹤,由表及里地對知識回路的表現(xiàn)、拓?fù)浜徒M件進(jìn)行了全面分析,揭示了幾個關(guān)鍵發(fā)現(xiàn)。我們相信大語言模型并非黑盒,而是由無數(shù)知識回路組成的精密系統(tǒng),理解這些回路的演化規(guī)律,也許是邁向更可控、更高效、更安全人工智能的關(guān)鍵步驟。

作者:歐翌昕 來源:知識引擎實驗室-ZJU

llustration From IconScout By IconScout Store

-The End-

本周上新!

掃碼觀看!

“AI技術(shù)流”原創(chuàng)投稿計劃

TechBeat是由將門創(chuàng)投建立的AI學(xué)習(xí)社區(qū)(www.techbeat.net)。社區(qū)上線700+期talk視頻,3000+篇技術(shù)干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會及其他線上交流活動,不定期舉辦技術(shù)人線下聚會交流活動。我們正在努力成為AI人才喜愛的高質(zhì)量、知識型交流平臺,希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其成長。

投稿內(nèi)容

// 最新技術(shù)解讀/系統(tǒng)性知識分享 //

// 前沿資訊解說/心得經(jīng)歷講述 //

投稿須知

稿件需要為原創(chuàng)文章,并標(biāo)明作者信息。

我們會選擇部分在深度技術(shù)解析及科研心得方向,對用戶啟發(fā)更大的文章,做原創(chuàng)性內(nèi)容獎勵

投稿方式

發(fā)送郵件到

michellechang@thejiangmen.com

或添加工作人員微信(michelle333_)投稿,溝通投稿詳情

關(guān)于我“門”

將門是一家以專注于數(shù)智核心科技領(lǐng)域新型創(chuàng)投機構(gòu),也是北京市標(biāo)桿型孵化器。 公司致力于通過連接技術(shù)與商業(yè),發(fā)掘和培育具有全球影響力的科技創(chuàng)新企業(yè),推動企業(yè)創(chuàng)新發(fā)展與產(chǎn)業(yè)升級。

將門成立于2015年底,創(chuàng)始團(tuán)隊由微軟創(chuàng)投在中國的創(chuàng)始團(tuán)隊原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。

如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價值的投后服務(wù),歡迎發(fā)送或者推薦項目給我“門”:

bp@thejiangmen.com


點擊右上角,把文章分享到朋友圈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費者被坑慘,家長要警惕

假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費者被坑慘,家長要警惕

趣文說娛
2026-03-10 16:47:22
凌晨刷屏!中遠(yuǎn)海運強硬反擊 巴拿馬港口空箱全撤 所有訂艙悉數(shù)取消

凌晨刷屏!中遠(yuǎn)海運強硬反擊 巴拿馬港口空箱全撤 所有訂艙悉數(shù)取消

生活新鮮市
2026-03-14 00:18:55
美國“林肯”號航母已經(jīng)被擊中,失去了作戰(zhàn)能力,目前已返回美國

美國“林肯”號航母已經(jīng)被擊中,失去了作戰(zhàn)能力,目前已返回美國

安安說
2026-03-14 18:53:39
中東魔幻一幕:哈馬斯突然勸伊朗收手,別打鄰居!臉都不要了

中東魔幻一幕:哈馬斯突然勸伊朗收手,別打鄰居!臉都不要了

老馬拉車莫少裝
2026-03-14 18:34:48
阿德巴約:如果逝者能夠開口說話,我堅信科比一定會恭喜我

阿德巴約:如果逝者能夠開口說話,我堅信科比一定會恭喜我

懂球帝
2026-03-14 09:45:09
57歲王菲斷崖式衰老!臉腫皮膚松,十個月前和謝霆鋒秀恩愛差距大

57歲王菲斷崖式衰老!臉腫皮膚松,十個月前和謝霆鋒秀恩愛差距大

青梅侃史啊
2026-02-18 07:25:41
在剛剛,17家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個股?

在剛剛,17家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個股?

股市皆大事
2026-03-14 11:09:10
北京市屬公園春花觀賞季陸續(xù)啟幕

北京市屬公園春花觀賞季陸續(xù)啟幕

北京商報
2026-03-13 17:12:20
分手7年范冰冰也沒想到,46歲李晨隱藏身份曝光,王寶強沒說錯

分手7年范冰冰也沒想到,46歲李晨隱藏身份曝光,王寶強沒說錯

錯過美好
2026-03-13 23:16:47
別等孩子上了初中才明白:小學(xué)最重要的,根本不是刷了多少題

別等孩子上了初中才明白:小學(xué)最重要的,根本不是刷了多少題

諾媽家有男寶娃
2026-03-13 15:15:55
有很多人可能根本“撐不過”2026年了

有很多人可能根本“撐不過”2026年了

放牛娃的遐想
2026-03-12 08:29:33
早春外套別亂買!跟著博主解鎖3件王炸單品,顯瘦時髦一整季!

早春外套別亂買!跟著博主解鎖3件王炸單品,顯瘦時髦一整季!

虎哥說衣不二
2026-03-14 19:10:10
蒙古總理換人后,一下子硬氣了,當(dāng)面要求西方廢除不平等條款

蒙古總理換人后,一下子硬氣了,當(dāng)面要求西方廢除不平等條款

知鑒明史
2026-03-13 18:31:46
蒙哥馬利:我們在定位球防守需做得更好,侯森肋部受傷需休息

蒙哥馬利:我們在定位球防守需做得更好,侯森肋部受傷需休息

懂球帝
2026-03-14 18:38:05
曝1名伊朗女足留澳球員接受足協(xié)主席命令 勸說其他隊友返回伊朗

曝1名伊朗女足留澳球員接受足協(xié)主席命令 勸說其他隊友返回伊朗

念洲
2026-03-14 13:47:06
上甘嶺戰(zhàn)役,美軍為什么不像對付日軍那樣,用噴火器向坑道里狂噴

上甘嶺戰(zhàn)役,美軍為什么不像對付日軍那樣,用噴火器向坑道里狂噴

朝子亥
2026-03-14 17:15:03
不要再叫喊擊沉美航母了:擊沉一艘航母有多難?你根本看不懂

不要再叫喊擊沉美航母了:擊沉一艘航母有多難?你根本看不懂

起喜電影
2026-03-02 07:35:37
“美國不敢打”論誤國誤民!

“美國不敢打”論誤國誤民!

據(jù)說無據(jù)
2026-03-12 15:56:59
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
以軍發(fā)動大規(guī)??找u 伊朗首都發(fā)生爆炸

以軍發(fā)動大規(guī)模空襲 伊朗首都發(fā)生爆炸

財聯(lián)社
2026-03-14 02:40:14
2026-03-14 20:00:49
將門創(chuàng)投 incentive-icons
將門創(chuàng)投
加速及投資技術(shù)驅(qū)動型初創(chuàng)企業(yè)
2310文章數(shù) 596關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

霍爾木茲海峽上周末僅4艘船通過 繞行要多走5500公里

頭條要聞

霍爾木茲海峽上周末僅4艘船通過 繞行要多走5500公里

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂要聞

張藝興,犯了大忌

財經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

游戲
親子
本地
房產(chǎn)
公開課

《GTA》歷代開發(fā)成本對比:25年來暴增上百倍!

親子要聞

萌娃為何覺得自己和大人一樣?聽到答案的大人們繃不住了

本地新聞

坐標(biāo)北京,過敏季反向遷徒

房產(chǎn)要聞

不容易啊!??诮K于又要賣地了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版