国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

<samp id="sqwko"><kbd id="sqwko"></kbd></samp>

<table id="sqwko"><dl id="sqwko"></dl></table>

<samp id="sqwko"></samp>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權(quán)郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

金魚損失隨機剔除token，讓AI不再死記硬背

2025-09-03 17:37:23　來源: 量子位

北京舉報

0

分享至

henry 發(fā)自凹非寺
量子位 | 公眾號 QbitAI

訓練大模型時，有時讓它“記性差一點”，反而更聰明！

大語言模型如果不加約束，很容易把訓練數(shù)據(jù)原封不動地復刻出來。為解決這個問題，來自馬里蘭大學、圖賓根大學和馬普所的研究團隊提出了一個新方法——金魚損失（Goldfish Loss）

顧名思義，金魚損失就是讓模型像金魚一樣，不去死記每一個細節(jié)，而是在損失函數(shù)計算時隨機剔除一小部分token。

由此，模型不再逐字記住訓練集內(nèi)容，但仍能學會語言規(guī)律。

實驗顯示，LLaMA-2在使用金魚損失后：

記憶化內(nèi)容顯著減少：模型不再復現(xiàn)訓練數(shù)據(jù)
下游任務(wù)性能幾乎不受影響：仍然能流暢生成文本

用網(wǎng)友的精辟評論概括就是：dropout，但損失函數(shù)！

在梯度計算中隨機屏蔽部分token

金魚損失的核心理念非常簡單，就是在模型訓練過程中隨機剔除一部分訓練文本中的tokens，使其不參與損失計算。

這樣一來，當模型在推理階段遇到這些位置時，就只能“猜測”，而不是逐字逐句復現(xiàn)訓練數(shù)據(jù)的完整序列。

此外，為了保證被剔除token的一致性，研究人員設(shè)計了一種基于哈希（hashing）的掩碼策略。

那么，這和同樣是防止模型背會的正則化方法有什么不同呢？

Dropout這樣的正則化方法為例，它通過在訓練時“加噪聲”來防止模型過度依賴某些參數(shù)，從而提高模型舉一反三的能力。

但這樣做的問題在于：如果只是隨機丟token，那么，每次看到同一段落時，丟掉的地方不一樣，模型累計幾次就能拼湊出完整段落。

所以，說到底，模型還是靠死記硬背，記住了答案。

相比之下，金魚損失則用哈希掩碼確保每次遇到同一段落，掩蓋位置都一樣，這就從根本上阻止了模型復現(xiàn)完整訓練文本。

接下來，我們來看金魚損失具體是怎么做的。

在傳統(tǒng)的next-token prediction中，模型以序列中的下一個真實token作為目標，輸出預測分布，并基于該分布計算交叉熵損失。

在金魚損失下，模型雖然也在前向傳播中預測序列里下一個 token。但在計算損失時，會以一定的概率將某些位置的token從損失計算里“抹掉”。

也就是說，有些真實的下一個token不會作為目標來訓練。

在這里，研究人員采用了簡單的靜態(tài)掩碼（static mask），剔除每序列中的第4個token。

更進一步，為了確保模型不會從其他地方學到被掩碼的數(shù)據(jù)（例如不同的文檔會在不同的網(wǎng)頁中反復出現(xiàn)），研究團隊還提出了一種局部化哈希掩碼（localized hashed mask），使得當相同的前h個token出現(xiàn)時，掩蓋模式是相同的（可重復）。

實驗測試與結(jié)果

為了驗證金魚損失確實能防止記憶化，研究團隊設(shè)計了兩種實驗場景：

一種是極端場景，通過對少量樣本進行多個訓練周期（即重復）來強烈促使記憶化；

另一種是標準場景，模擬現(xiàn)實模型訓練中使用的批次處理方式。

同時，為了評估模型的記憶化程度，研究采用了以下指標：

RougeL得分：該指標衡量最長公共（非連續(xù)）子序列的長度。得分為1.0表示完美記憶。
精確匹配率（Exact Match）：該指標衡量正確預測的序列占真實序列的百分比.

實驗表明，在極端場景下，標準訓練導致模型逐字記憶了100篇文章中的84篇，而金魚損失沒有記憶任何文章

（注：實驗讓LLaMA-2-7B在《哈利·波特》第一章或100篇維基百科文檔上進一步訓練了100個epoch）

此外，在標準訓練場景下，金魚損失也明顯減少了模型逐字復現(xiàn)訓練語料庫中目標序列的情況。

但這里可能有個直覺式的反應(yīng)——如果讓模型“隨機漏學”一些token，它的能力會不會也隨之降低呢？

對此，研究人員進行了測試：研究表明，金魚損失模型、標準損失模型和對照模型之間的總體性能沒有系統(tǒng)性差異。

需要注意的是，金魚損失的核心在于忽略部分token的梯度計算。因此，為了學到足夠的語言模式，模型必須通過更多數(shù)據(jù)來補償這些空缺，這可能導致計算效率的下降。

[1]https://arxiv.org/pdf/2406.10209

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

DPO「只看總分不看細節(jié)」？TI-DPO用Token重要性重塑大模型對齊

機器之心Pro 2026-02-11 13:45:57
0 跟貼 0
中國AI調(diào)用量首超美國四款大模型霸榜全球前五

財聯(lián)社 2026-02-26 19:44:05
6226 跟貼 6226

4個月燒掉30億Token，這位「菜鳥」程序員做出50多個產(chǎn)品

機器之心Pro 2026-01-04 14:53:09
88 跟貼 88

最新AI軍事模擬：Claude、Gemini、GPT對決，95%對局發(fā)射核彈

新智元 2026-02-28 09:56:07
34 跟貼 34
1億用戶、80%暴跌：全球最大在線白板公司的自救

虎嗅APP 2026-02-28 03:55:10
2 跟貼 2

寶馬宣布在德國工廠引入人形機器人試點接管裝配線最累工序

財聯(lián)社 2026-02-28 02:54:10
166 跟貼 166

三年投入超千億，百度AI業(yè)務(wù)“必須”扛起大旗

鈦媒體APP 2026-02-28 15:02:09
0 跟貼 0
再攜手!清華陳建宇×斯坦福Chelsea團隊VLAW,世界模型×VLA協(xié)同進化

機器之心Pro 2026-02-28 14:26:41
0 跟貼 0

千問將發(fā)布AI眼鏡、耳機、指環(huán)，巨頭搶占AI新入口丨智能涌現(xiàn)獨家

36氪 2026-02-28 15:18:35
0 跟貼 0
Nano Banana 2 的 5 個神級玩法，還是 AI 生圖的神，建議收藏（附提示詞）

愛范兒 2026-02-28 12:34:44
0 跟貼 0
女生分享自己的養(yǎng)魚方式，一養(yǎng)一個大震驚，網(wǎng)友：沒錯，魚從小就不能慣著

鶴壁焦點 2026-02-26 16:18:10
1 跟貼 1
一個實驗告訴你為什么不能給寶寶喝太熱的奶

小明不講理 2026-02-26 18:53:34
1 跟貼 1
來一份小時候的美食，太香了

廣西阿金 2026-02-27 21:21:29
0 跟貼 0
“手機將全面漲價”沖上熱搜

南方都市報 2026-02-27 14:31:12
20636 跟貼 20636
為什么貓的形狀沒有狗多?

果殼 2026-02-27 20:16:19
100 跟貼 100
夜間氣溫達零下30℃ 烏總統(tǒng)：烏面臨幾十年來最難冬天

紅星新聞 2026-02-27 17:33:09
11127 跟貼 11127
養(yǎng)了一年的金魚換水，一個舉動都讓養(yǎng)魚佬心死，只有強者才配生存

君子生活 2026-02-28 09:02:21
0 跟貼 0
成功了，好消息傳來，我國向世界宣告突破性科技成果量子網(wǎng)絡(luò)

祭懷蓮 2026-02-28 04:26:44
0 跟貼 0
蘇聯(lián)“人猿雜交”實驗：5名女孩與11只猩猩參與，最終結(jié)局如何？

談史論天地 2026-02-28 13:35:18
0 跟貼 0
網(wǎng)傳新能源汽車開征“里程稅”10省市試點多地回應(yīng)

封面新聞 2026-02-27 19:17:03
8845 跟貼 8845
小伙用實驗提醒大家，充電器不用時要及時拔掉，網(wǎng)友：不充電時居然也會耗電

星沙時報 2026-02-26 17:00:35
0 跟貼 0
養(yǎng)魚別著急催體

愛養(yǎng)魚的大劉劉 2026-02-26 20:01:00
0 跟貼 0
中科大華為諾亞TAPPA：時序視角的統(tǒng)一解釋框架

機器之心Pro 2026-02-28 14:29:50
0 跟貼 0
百褶裙泰獅，好的金魚玩美詮釋了這個詞語，國內(nèi)漁場也開始培育了

小松搞笑現(xiàn)場 2026-02-26 18:23:36
0 跟貼 0
新魚入缸什么時候喂食？

愛養(yǎng)魚的大劉劉 2026-02-27 20:02:00
0 跟貼 0
網(wǎng)友分享小時候剪的小金魚評論區(qū)紛紛曬出各自的時光記憶

北青網(wǎng)-北京青年報 2026-02-27 14:37:22
0 跟貼 0
中國095亮相！排水量破萬噸，多項指標超越美國弗吉尼亞級

戰(zhàn)武科普 2026-02-27 20:09:48
0 跟貼 0
商務(wù)部：調(diào)整對加拿大反歧視措施

界面新聞 2026-02-27 16:42:51
758 跟貼 758
楊瀚森強勢爆發(fā)，11+12+3+2填滿數(shù)據(jù)，2項全隊第一

伴君終老a 2026-02-26 01:33:40
0 跟貼 0
酷態(tài)科官宣3月3日“新玩家”入場，配圖6號卡丁車

IT之家 2026-02-28 10:27:59
1 跟貼 1
年前100多元一斤，年后價格腰斬！有湖北人已迫不及待下單

環(huán)球網(wǎng)資訊 2026-02-27 09:52:19
525 跟貼 525
樂高動物人仔抽抽樂，官方玩法vs玩家腦洞，誰把動物園“玩瘋了”

酷玩潮CHAO 2026-02-26 16:47:07
0 跟貼 0
金魚眼睛旁長了個瘤狀物，主人用剪刀幫修剪，那以后還能看見嗎？

大腕沙雕 2026-02-27 15:08:09
0 跟貼 0
極氪公布春節(jié)十大獵裝旅行路線，揭秘深度自駕游版圖

魯中晨報 2026-02-26 12:29:41
15583 跟貼 15583
最新 | 天津雪情有變！剛剛預報！

天津廣播 2026-02-28 09:21:24
35 跟貼 35
40000人次！鄭州科技館開啟“科學新年”

大象新聞 2026-02-28 12:29:08
0 跟貼 0
楊振寧先生生前講解量子糾纏片段，不愧為大師，講解很生動形象

小魚二動漫 2026-02-25 01:18:05
0 跟貼 0
2026最新｜5款PDF轉(zhuǎn)Word工具實測對比，教你選對不踩坑

影像渭南 2026-02-27 21:40:14
0 跟貼 0
八名新援集體亮相武磊豪言想要再加一顆星！海港舉行2026賽季出征儀式

上觀新聞 2026-02-28 10:10:25
39 跟貼 39
FOCUS 關(guān)鍵幀提取：長視頻理解能力提升11.9%，只需采樣<2% 幀

機器之心Pro 2026-02-28 14:36:23
0 跟貼 0

外媒：伊朗擊落一架美軍機，價值幾十億的戰(zhàn)略飛機

外媒：伊朗擊落一架美軍機，價值幾十億的戰(zhàn)略飛機

大國之翼

2026-02-28 06:30:03

朝鮮閱兵式現(xiàn)場大將僅剩5人！戰(zhàn)略軍直接被裁？

朝鮮閱兵式現(xiàn)場大將僅剩5人！戰(zhàn)略軍直接被裁？

IN朝鮮

2026-02-28 10:45:32

苦等13年！上海唯一沒地鐵的區(qū)，終于等來了“救兵”！長三角新C位已就位！

苦等13年！上海唯一沒地鐵的區(qū)，終于等來了“救兵”！長三角新C位已就位！

輝哥說動漫

2026-02-28 12:49:08

突發(fā)！2026年全國第一巨額搶劫案在江蘇發(fā)生了，197萬，疑犯已捕

突發(fā)！2026年全國第一巨額搶劫案在江蘇發(fā)生了，197萬，疑犯已捕

古事尋蹤記

2026-02-28 07:08:05

執(zhí)教勝率72.5%！超禪師、科爾高居歷史第一，實力不輸斯波被低估

執(zhí)教勝率72.5%！超禪師、科爾高居歷史第一，實力不輸斯波被低估

你的籃球頻道

2026-02-28 14:03:39

趴在中國仁愛礁9000多天的菲律賓軍艦，如今已經(jīng)再也拖不走了

趴在中國仁愛礁9000多天的菲律賓軍艦，如今已經(jīng)再也拖不走了

小小科普員

2025-11-21 20:23:24

主裁解釋沖突懲罰！約基奇回應(yīng)多爾特惡犯：那是一個不必要動作

主裁解釋沖突懲罰！約基奇回應(yīng)多爾特惡犯：那是一個不必要動作

追球者

2026-02-28 15:01:57

小米粥再次成矚目，調(diào)查發(fā)現(xiàn)：高血糖患者喝小米粥，或有4大改善

小米粥再次成矚目，調(diào)查發(fā)現(xiàn)：高血糖患者喝小米粥，或有4大改善

阿兵科普

2026-02-28 09:33:48

臉在江山在？事實證明，失去黃曉明的楊穎，又回到了她的“怪圈”

臉在江山在？事實證明，失去黃曉明的楊穎，又回到了她的“怪圈”

觀察鑒娛

2026-02-28 10:07:44

中國不當冤大頭了！中科院停付國際期刊發(fā)表費，老外專家也急了

中國不當冤大頭了！中科院停付國際期刊發(fā)表費，老外專家也急了

青青子衿

2026-02-27 20:32:03

保住聯(lián)盟第一！活塞加時險勝無哈登騎士杜倫33+16三人6犯

保住聯(lián)盟第一！活塞加時險勝無哈登騎士杜倫33+16三人6犯

醉臥浮生

2026-02-28 11:33:18

楊瀾也沒想到，被她拋棄的普通人前夫，如今早已收獲了真的幸福

楊瀾也沒想到，被她拋棄的普通人前夫，如今早已收獲了真的幸福

手工制作阿殲

2026-02-28 00:21:40

新華社快訊：伊朗稱準備對以色列進行“毀滅性報復打擊”

新華社快訊：伊朗稱準備對以色列進行“毀滅性報復打擊”

新華社

2026-02-28 15:30:15

聯(lián)盟第1又臟又壞！約基奇要殺人了！

聯(lián)盟第1又臟又壞！約基奇要殺人了！

貴圈真亂

2026-02-28 14:13:11

“去中國化”最徹底的4個國家，有一個已經(jīng)完全西化了

“去中國化”最徹底的4個國家，有一個已經(jīng)完全西化了

北緯的咖啡豆

2026-02-24 09:16:33

這次荷蘭沒話說了！中方正式宣布：更換國內(nèi)供應(yīng)商，從此不再合作

這次荷蘭沒話說了！中方正式宣布：更換國內(nèi)供應(yīng)商，從此不再合作

曉劗就是我

2026-02-26 15:50:07

中國四位最“不靠譜”專家，“忽悠”央視28年，為何還能爆火至今

中國四位最“不靠譜”專家，“忽悠”央視28年，為何還能爆火至今

小莜讀史

2026-02-27 20:30:12

公開宣稱要創(chuàng)造條件解體俄羅斯，內(nèi)部確實很難！布達諾夫干得不錯

公開宣稱要創(chuàng)造條件解體俄羅斯，內(nèi)部確實很難！布達諾夫干得不錯

鷹眼Defence

2026-02-27 12:52:36

2026兩會即將召開，霍啟剛遭央媒點名，信息量大，郭晶晶放心了

2026兩會即將召開，霍啟剛遭央媒點名，信息量大，郭晶晶放心了

動物奇奇怪怪

2026-02-28 09:29:30

突然被扣費,連續(xù)數(shù)月不知情! 上海已有多人遭遇! 快查, 你的錢有沒有"消失"?

突然被扣費,連續(xù)數(shù)月不知情! 上海已有多人遭遇! 快查, 你的錢有沒有"消失"?

新浪財經(jīng)

2026-02-27 17:11:04

追蹤人工智能動態(tài)

12210文章數(shù) 176398關(guān)注度

往期回顧全部

科技要聞

狂攬1100億美元！OpenAI再創(chuàng)融資神話

頭條要聞

內(nèi)塔尼亞胡：美以軍事行動目標是推翻伊朗政權(quán)

頭條要聞

內(nèi)塔尼亞胡：美以軍事行動目標是推翻伊朗政權(quán)

體育要聞

球隊主力全報銷？頂風擺爛演都不演了

娛樂要聞

疑似王一博被爆私密聊天記錄

財經(jīng)要聞

沈明高提共富建議百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市搭載華為四激光智駕方案

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

健康

教育

親子

旅游

《星際戰(zhàn)甲》Switch2版來了！官方定檔3月25日

轉(zhuǎn)頭就暈的耳石癥，能開車上班嗎？

教育要聞

我給兩會捎句話丨剛性保障中小學每天一節(jié)體育課

親子要聞

寶藍用氣球做成各種小玩具，用筆畫上小表情，有趣又好玩~

旅游要聞

9天超長春節(jié)長假收官，上海接待超2167萬人次游客，全要素旅游消費總額超256億元

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進入關(guān)懷版