国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

AI向人腦「黃金標準」又近一步,谷歌發(fā)布嵌套學習,賦予大模型持續(xù)學習的能力

0
分享至


剛剛,谷歌發(fā)布了一項名為“嵌套學習”(Nested Learning)的全新機器學習范式,它將模型視為嵌套優(yōu)化問題,從而增強對長上下文的處理能力?;谇短讓W習的概念驗證模型 Hope 在語言建模方面展現(xiàn)出更優(yōu)異的性能,谷歌的野心是緩解乃至徹底解決LLM遺忘問題,實現(xiàn)類似人腦的持續(xù)學習能力

相關論文《Nested Learning: The Illusion of Deep Learning Architectures》已在NeurIPS 2025上發(fā)表


在過去十年,機器學習取得了巨大進步,但LLM的成功之下,一些根本性挑戰(zhàn)依然存在,尤其是在持續(xù)學習方面。

人腦是持續(xù)學習的黃金標準,其通過神經可塑性不斷調整自身結構以適應新體驗。相比之下,當前LLM的知識局限于其輸入窗口的即時上下文或預訓練期間學到的靜態(tài)信息。

最直接的解決方法——用新數(shù)據(jù)持續(xù)更新模型參數(shù),往往會導致“災難性遺忘”(Catastrophic Forgetting, CF)。傳統(tǒng)上,研究人員通過調整架構或優(yōu)化規(guī)則來對抗CF,但長期以來,模型架構與優(yōu)化算法被視為兩個獨立部分,阻礙了真正統(tǒng)一高效的學習系統(tǒng)誕生。

谷歌提出的“嵌套學習”則打破了這一壁壘。

什么是嵌套學習?

嵌套學習范式提出,一個復雜的ML模型并非單一的連續(xù)過程,而是一個由相互關聯(lián)、多層次的學習問題組成的系統(tǒng),這些問題被嵌套或并行地同時優(yōu)化。

該理論認為,模型架構和訓練規(guī)則(即優(yōu)化算法)本質上是同一概念,它們只是處于不同“層級”的優(yōu)化問題,每個層級都有其自身的信息流(“上下文流”)和更新速率

通過識別這種內在結構,“嵌套學習”為設計更強大的AI提供了一個全新的、此前不可見的維度,允許構建具有更深計算深度的學習組件,從而最終解決災難性遺忘等問題。

為了闡釋這一范式,研究人員以“聯(lián)想記憶”(associative memory)為例。

他們指出,訓練過程本身(尤其是反向傳播)就可以被建模為一個聯(lián)想記憶。模型學習將給定數(shù)據(jù)點映射到其局部誤差值,該誤差值衡量了數(shù)據(jù)點的“意外”程度。同樣,像Transformer中的注意力機制等關鍵架構組件,也可以被形式化為學習序列中Token之間映射關系的簡單聯(lián)想記憶模塊。

通過為每個組件定義一個“更新頻率”,即權重調整的頻率,這些相互關聯(lián)的優(yōu)化問題就可以被排列成不同的“層級”。這個有序集合構成了嵌套學習范式的心臟。

研究人員表示,人腦中統(tǒng)一且可復用的結構以及多時間尺度的更新,是人類持續(xù)學習的關鍵。嵌套學習允許模型的每個組件進行多時間尺度更新,并證明了Transformer等知名架構實際上是具有不同更新頻率的線性層。

嵌套學習的應用

基于“嵌套學習”的視角,可以直接獲得改進現(xiàn)有算法和架構的原則性方法:

1. 深度優(yōu)化器 (Deep optimizers)

由于嵌套學習將優(yōu)化器(如動量優(yōu)化器)也視為聯(lián)想記憶模塊,因此可以將聯(lián)想記憶的原理應用于優(yōu)化器設計。研究人員觀察到,許多標準優(yōu)化器依賴于簡單的點積相似度,其更新并未考慮不同數(shù)據(jù)樣本之間的關聯(lián)。通過將優(yōu)化器的底層目標更改為更標準的損失度量,例如L2回歸損失,他們?yōu)閯恿康群诵母拍钔茖С隽诵碌墓?,使其對不完美?shù)據(jù)更具魯棒性。

2. 連續(xù)譜記憶系統(tǒng) (Continuum memory systems, CMS)

在標準Transformer中,序列模型充當短期記憶,保存即時上下文;前饋網絡則充當長期記憶,存儲預訓練知識。嵌套學習將這一概念擴展為一個“連續(xù)譜記憶系統(tǒng)”,其中記憶被視為由一系列模塊組成的光譜,每個模塊都以特定的不同頻率進行更新,為持續(xù)學習創(chuàng)造了更豐富、更有效的記憶系統(tǒng)。

Hope:一個自修改的驗證架構

作為概念驗證,研究團隊利用嵌套學習原理設計了一款名為“Hope”的自修改架構。

Hope是Titans架構的一個變體。Titans架構是一種長期記憶模塊,能根據(jù)記憶的“意外”程度確定其優(yōu)先級,但它只有兩個參數(shù)更新層級。

而Hope是一個自修改的循環(huán)架構,它能夠利用無限層級的上下文學習,并通過CMS模塊增強,以擴展到更大的上下文窗口。它本質上可以通過一個自引用過程來優(yōu)化自身的記憶,從而創(chuàng)造出一個具有無限循環(huán)學習層級的架構。

實驗結果

在語言建模、長上下文推理、持續(xù)學習和知識整合等一系列任務上的實驗證明了嵌套學習、連續(xù)譜記憶系統(tǒng)和自修改Titans架構的有效性。

通用性能:在一系列公開的語言建模和常識推理任務上,Hope架構展現(xiàn)出比現(xiàn)代循環(huán)模型(如Titans、Samba)和標準Transformer更低的困惑度和更高的準確率


長上下文處理:在“大海撈針”(Needle-In-Haystack, NIAH)下游任務中,Hope展示了卓越的記憶管理能力,證明了CMS是處理擴展信息序列的一種更高效的方式,其性能在不同難度的任務上均優(yōu)于Titans、TTT和Mamba2


結論

谷歌研究團隊認為,“嵌套學習”范式代表了對深度學習理解的一次飛躍。通過將架構和優(yōu)化視為一個統(tǒng)一、連貫的嵌套優(yōu)化問題系統(tǒng),它為模型設計解鎖了一個新的維度

像Hope這樣的模型證明,采用原則性方法統(tǒng)一這些元素,可以帶來表達能力更強、功能更強大、效率更高的學習算法。

團隊相信,“嵌套學習”為彌合當前LLM的遺忘特性與人腦卓越的持續(xù)學習能力之間的鴻溝,提供了一個堅實的基礎,并期待研究社區(qū)能共同探索這一新維度,以構建下一代自我完善的AI

參考:

https://research.google/blog/introducing-nested-learning-a-new-ml-paradigm-for-continual-learning/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
買洗碗機丈夫砸家后續(xù):知情人曝內幕,女子作精愛花錢欠外債20萬

買洗碗機丈夫砸家后續(xù):知情人曝內幕,女子作精愛花錢欠外債20萬

青梅侃史啊
2026-01-10 08:58:19
炸裂!切爾西新帥激活 3700 萬水貨,庫庫雷利亞主力位置告急

炸裂!切爾西新帥激活 3700 萬水貨,庫庫雷利亞主力位置告急

瀾歸序
2026-01-11 06:21:24
船員柬埔寨轉機后失聯(lián)超十天,與妻子通話中疑似暗示報警

船員柬埔寨轉機后失聯(lián)超十天,與妻子通話中疑似暗示報警

大象新聞
2026-01-11 10:01:13
52票贊成47票反對!美國投票結果公布;美國或將失去聯(lián)大投票權

52票贊成47票反對!美國投票結果公布;美國或將失去聯(lián)大投票權

南宗歷史
2026-01-09 10:24:03
1968年,林彪想換北京軍區(qū)司令,毛主席只問了一句話,林彪徹底啞火

1968年,林彪想換北京軍區(qū)司令,毛主席只問了一句話,林彪徹底啞火

老杉說歷史
2026-01-09 22:00:17
“深圳成全國首個電動車停車收費城市”系不實信息

“深圳成全國首個電動車停車收費城市”系不實信息

上觀新聞
2026-01-10 19:14:14
蘋果正式官宣:1月9日,全面官降!

蘋果正式官宣:1月9日,全面官降!

科技堡壘
2026-01-09 11:45:41
飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時間吃藥才最好

飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時間吃藥才最好

路醫(yī)生健康科普
2025-12-16 12:45:03
禁令執(zhí)行第四天,中國電路板廠商不再向日本發(fā)貨,日本廠商天塌了

禁令執(zhí)行第四天,中國電路板廠商不再向日本發(fā)貨,日本廠商天塌了

卷史
2026-01-10 14:02:40
炸裂!曼聯(lián)世界級巨星或將離隊,阿莫林下課成導火索?

炸裂!曼聯(lián)世界級巨星或將離隊,阿莫林下課成導火索?

奶蓋熊本熊
2026-01-11 03:11:54
伊能靜參觀清真寺!包著頭巾不敢大聲說話,秦昊把她拍得像130斤

伊能靜參觀清真寺!包著頭巾不敢大聲說話,秦昊把她拍得像130斤

林木體育解說
2026-01-10 21:59:58
對話“死了么”APP創(chuàng)始人:開發(fā)成本1000多元,計劃出售10%股份,即將上線短信通知功能

對話“死了么”APP創(chuàng)始人:開發(fā)成本1000多元,計劃出售10%股份,即將上線短信通知功能

藍鯨新聞
2026-01-11 09:04:24
廣東今日早報!杜鋒深夜發(fā)聲,胡明軒拒絕輪休,崔永熙更新康復

廣東今日早報!杜鋒深夜發(fā)聲,胡明軒拒絕輪休,崔永熙更新康復

多特體育說
2026-01-11 07:20:03
美防長“飄了”,先嘲諷俄羅斯,再將矛頭對準中國

美防長“飄了”,先嘲諷俄羅斯,再將矛頭對準中國

空天力量
2026-01-10 20:07:38
名哨腿筋拉傷無限期休戰(zhàn)!昨日坐輪椅離場 有望常規(guī)賽結束前回歸

名哨腿筋拉傷無限期休戰(zhàn)!昨日坐輪椅離場 有望常規(guī)賽結束前回歸

羅說NBA
2026-01-11 06:30:58
閆學晶的拼搏:20歲嫁30歲小老板,給8歲小妹妹當后媽

閆學晶的拼搏:20歲嫁30歲小老板,給8歲小妹妹當后媽

小小河
2026-01-10 20:21:22
張學良晚年直言:我這輩子不后悔"西安捉蔣",后悔的是殺了楊宇霆

張學良晚年直言:我這輩子不后悔"西安捉蔣",后悔的是殺了楊宇霆

嘮叨說歷史
2026-01-05 14:12:05
果然是你!名記:東契奇是施羅德在走廊尋找并且想揍的人

果然是你!名記:東契奇是施羅德在走廊尋找并且想揍的人

懂球帝
2026-01-11 10:32:00
“性蕭條”才是這個時代真正的危機

“性蕭條”才是這個時代真正的危機

深藍夜讀
2025-09-24 16:00:09
85%的血管淤堵,根本不用過度治療!醫(yī)生:做好3件事,比吃藥管用

85%的血管淤堵,根本不用過度治療!醫(yī)生:做好3件事,比吃藥管用

孟大夫之家1
2026-01-09 15:47:05
2026-01-11 11:12:49
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
1027文章數(shù) 393關注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

牛彈琴:特朗普沒想到 抓馬杜羅后全球情緒總體很穩(wěn)定

頭條要聞

牛彈琴:特朗普沒想到 抓馬杜羅后全球情緒總體很穩(wěn)定

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

網友偶遇賈玲張小斐崇禮滑雪

財經要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

游戲
家居
旅游
公開課
軍事航空

《全面戰(zhàn)爭:戰(zhàn)錘3》DLC“折磨之潮”試玩報告:落日余暉

家居要聞

木色留白 演繹現(xiàn)代自由

旅游要聞

官方帶你冬游喀什,詳細路線產品來啦!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

海空英雄高翔逝世 曾駕駛殲-6打爆美軍機

無障礙瀏覽 進入關懷版