国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

別直接訓(xùn)!給主模型加個(gè)錯(cuò)題本,6B輕松超越8B | NeurIPS

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】傳統(tǒng)訓(xùn)練只關(guān)注模型輸出對錯(cuò),最新研究在大模型訓(xùn)練中引入「錯(cuò)題本」,記錄了模型犯錯(cuò)時(shí)的內(nèi)部思考狀態(tài),包括問題、推理過程和錯(cuò)誤位置,更接近人類反思學(xué)習(xí)。通過輔助模型學(xué)習(xí)這些「錯(cuò)題本」,能實(shí)時(shí)校正主模型預(yù)測,提升性能。

很多人回顧自己的學(xué)習(xí)經(jīng)歷時(shí)都會發(fā)現(xiàn):能力真正產(chǎn)生躍遷,并不是刷題數(shù)量最多的時(shí)候,而是開始系統(tǒng)整理「錯(cuò)題本」的階段。

關(guān)鍵并不在于把錯(cuò)誤答案抄下來,而在于持續(xù)追問——當(dāng)時(shí)為什么會這么想?是哪一步的判斷出現(xiàn)了偏差?這種錯(cuò)誤是偶發(fā)的,還是反復(fù)出現(xiàn)的思維模式?

正是通過這種反思式學(xué)習(xí),人類逐漸學(xué)會識別自身的「錯(cuò)誤規(guī)律」,在復(fù)雜和不確定問題面前變得更加穩(wěn)健。

那么,一個(gè)問題隨之而來:大語言模型有沒有屬于自己的「錯(cuò)題本」?

在當(dāng)前主流訓(xùn)練范式中,大模型的學(xué)習(xí)過程高度簡化為一個(gè)循環(huán):

  • 給定輸入 → 預(yù)測輸出

  • 與標(biāo)準(zhǔn)答案對比 → 計(jì)算loss

  • 通過反向傳播更新參數(shù)

從本質(zhì)上看,這一過程強(qiáng)調(diào)的是「如何更好地?cái)M合正確答案」。

模型只需要知道結(jié)果對不對,而并不真正關(guān)心:我當(dāng)時(shí)是通過怎樣的內(nèi)部推理路徑走到這個(gè)錯(cuò)誤結(jié)論的?

這也揭示了一個(gè)關(guān)鍵缺失:當(dāng)前的大模型并不缺數(shù)據(jù),也不缺算力,而是缺少一種類似人類的深度反思能力——即圍繞錯(cuò)誤本身展開的結(jié)構(gòu)化復(fù)盤。

伊利諾伊大學(xué)厄巴納-香檳分校、普林斯頓大學(xué)的研究人員發(fā)表的最新論文,提出了一個(gè)非?!溉祟惢沟母拍睿篗istake Log(錯(cuò)題本)。


論文鏈接:https://arxiv.org/pdf/2505.16270

代碼鏈接:https://github.com/jiaruzouu/TransformerCopilot

與傳統(tǒng)訓(xùn)練僅關(guān)注最終輸出不同,Mistake Log的目標(biāo)并不是回答「模型錯(cuò)沒錯(cuò)」,而是刻畫一個(gè)更本質(zhì)的問題:模型是在什么樣的內(nèi)部狀態(tài)下犯下這個(gè)錯(cuò)誤的?

換句話說,它關(guān)注的不是答案,而是錯(cuò)誤產(chǎn)生的全過程。

Mistake Log的三層結(jié)構(gòu)



Question:模型當(dāng)時(shí)在解決什么問題?

在訓(xùn)練過程中,每一個(gè)輸入都會被映射為一個(gè)問題級別的表示,用于刻畫「模型此刻面對的任務(wù)語境」。這一步對應(yīng)的是:我當(dāng)時(shí)在做哪一道題?

Rationale(核心):模型當(dāng)時(shí)的內(nèi)部推理狀態(tài)

這是該方法與標(biāo)準(zhǔn)SFT拉開差距的關(guān)鍵所在。研究并不滿足于觀察最終生成的token,而是直接讀取Transformer在所有層、所有token位置上的隱藏狀態(tài)表示。這些高維向量并非人類可讀的文字解釋,而是模型真實(shí)的內(nèi)部思考軌跡:


其中,t表示第t個(gè)訓(xùn)練步奏、i表示第i個(gè) token、l表示第l層 Transformer、h表示模型計(jì)算過程中這一刻的隱狀態(tài)。

將這些隱藏狀態(tài)整體收集后,就得到了一個(gè)完整的Rationale軌跡:


它可以被視為模型在犯錯(cuò)瞬間的「認(rèn)知狀態(tài)快照」。

這一步類似于人類在復(fù)盤錯(cuò)題時(shí)回憶:「我當(dāng)時(shí)是基于哪個(gè)公式推導(dǎo)的?」「為什么在這個(gè)分支做出了錯(cuò)誤判斷?」

Mistakes:逐token精細(xì)刻畫錯(cuò)誤來源

不同于用一個(gè)標(biāo)量loss模糊衡量整體錯(cuò)誤,該工作在token級別定位偏差:(1)對比模型預(yù)測分布與真實(shí)分布;(2)計(jì)算兩者在每個(gè) token 上的差距:


  • 模型預(yù)測分布:

  • 真實(shí)正確分布:

  • 兩者之間的 discrepancy(差距):

由此構(gòu)建出一張錯(cuò)誤熱力圖,精確回答這樣的問題:錯(cuò)誤是從哪一個(gè) token 開始出現(xiàn)的?又是如何一步步累積放大的?一條完整的Mistake Log包含什么?

最終,每一次訓(xùn)練迭代都會生成一條三元組:

  • Question:任務(wù)語境

  • Rationale:內(nèi)部推理狀態(tài)

  • Mistakes:逐 token 的偏差刻畫

如果訓(xùn)練進(jìn)行了T步,那么模型就隱式地積累了T條結(jié)構(gòu)化「錯(cuò)題記錄」:


如何真正「利用」這些錯(cuò)題本?

作者進(jìn)一步提出了一個(gè)極具啟發(fā)性的設(shè)計(jì):引入一個(gè)輔助模型 Copilot,專門學(xué)習(xí)主模型(Pilot)的Mistake Log。


Copilot 的訓(xùn)練方式

輔助模型的輸入形式:將任務(wù)對應(yīng)的輸入語境表示,與主模型在推理階段產(chǎn)生的內(nèi)部中間表示


進(jìn)行聯(lián)合建模,以刻畫模型當(dāng)前的決策狀態(tài);

輔助模型的訓(xùn)練目標(biāo):學(xué)習(xí)預(yù)測主模型在生成過程中各個(gè)token層面的誤差分布


,用于判斷哪些位置更易產(chǎn)生偏差以及偏差程度的大小。

換言之,Copilot學(xué)習(xí)的是:在什么樣的內(nèi)部推理狀態(tài)下,主模型更容易犯哪類錯(cuò)誤?

Polit-Copilot的協(xié)同推理


在生成過程中,Copilot輸出的糾錯(cuò)logits會與主模型原始logits融合,從而在token生成階段進(jìn)行實(shí)時(shí)修正。最終的模型不再只是「記住答案」,而是具備了一種能力:基于歷史錯(cuò)誤經(jīng)驗(yàn),動態(tài)修正當(dāng)前推理軌跡。

理論結(jié)果:糾錯(cuò)是有保證的

論文進(jìn)一步證明:只要Copilot能較準(zhǔn)確地預(yù)測錯(cuò)誤趨勢,且糾錯(cuò)權(quán)重λ選取在合理區(qū)間內(nèi),那么在每一個(gè)token維度上,融合后的預(yù)測期望誤差嚴(yán)格小于原始模型的誤差。


這意味著,Mistake Log并非啟發(fā)式技巧,而是具有明確理論支撐的糾錯(cuò)機(jī)制。

糾錯(cuò)提升

小模型也能「以小博大」

實(shí)驗(yàn)在多種主流模型(如LLaMA-3、Qwen2.5)和10個(gè)推理基準(zhǔn)任務(wù)上驗(yàn)證了該方法的有效性。一個(gè)尤為亮眼的現(xiàn)象是:大模型 Pilot+小規(guī)模 Copilot+的組合,往往能顯著提升性價(jià)比。

LLaMA-3.2-3B+3B Copilot(總6B參數(shù))的性能超過原始8B的 LLaMA-3.1-8B。

這表明:糾錯(cuò)能力本身,可能比單純擴(kuò)大模型規(guī)模更關(guān)鍵。


討論與展望

該工作首次系統(tǒng)性地定義并探索了大模型訓(xùn)練中的Mistake Log 機(jī)制,但這僅僅是一個(gè)起點(diǎn)。

當(dāng)前主流的「反思式」方法,多依賴于顯式思維鏈(Chain-of-Thought)和多Agent外部糾錯(cuò),這些方法更多停留在輸出層面,而Mistake Log則直接作用于模型內(nèi)部認(rèn)知狀態(tài)

一個(gè)值得深入研究的問題是:基于模型自身內(nèi)部狀態(tài)的「自我反思」,是否比依賴外部文本或代理的糾錯(cuò)方式更加有效?

此外,Mistake Log 的表示形式、錯(cuò)誤模式的抽象方式,以及Copilot的結(jié)構(gòu)設(shè)計(jì),都仍有廣闊的優(yōu)化空間。目前方法在穩(wěn)定性和泛化性上仍存在提升余地,值得在未來工作中進(jìn)一步深入優(yōu)化。

參考資料:

https://arxiv.org/pdf/2505.16270

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1999年那筆血債,十年后終于有人去收了?美國特工橫死街頭,F(xiàn)BI連夜封鎖現(xiàn)場

1999年那筆血債,十年后終于有人去收了?美國特工橫死街頭,F(xiàn)BI連夜封鎖現(xiàn)場

史海孤雁
2026-01-08 19:35:10
老佛爺會趕走你!皇馬1.5億帝星屢遭西蒙尼挑釁 被換下后憤怒約架

老佛爺會趕走你!皇馬1.5億帝星屢遭西蒙尼挑釁 被換下后憤怒約架

我愛英超
2026-01-09 07:25:45
曾經(jīng)他們硬氣的拒絕了中國,如今好懷念他們當(dāng)初桀驁不馴的樣子!

曾經(jīng)他們硬氣的拒絕了中國,如今好懷念他們當(dāng)初桀驁不馴的樣子!

北緯的咖啡豆
2025-12-23 14:28:08
150 架美軍戰(zhàn)機(jī)參戰(zhàn),俄式導(dǎo)彈擊中一架:為賞金,內(nèi)奸出賣馬杜羅

150 架美軍戰(zhàn)機(jī)參戰(zhàn),俄式導(dǎo)彈擊中一架:為賞金,內(nèi)奸出賣馬杜羅

議紀(jì)史
2026-01-08 13:00:03
腳是心梗的放大鏡?忠告:腳部出現(xiàn)這幾種表現(xiàn),要盡快就醫(yī)!

腳是心梗的放大鏡?忠告:腳部出現(xiàn)這幾種表現(xiàn),要盡快就醫(yī)!

岐黃傳人孫大夫
2025-12-25 09:56:07
俄軍確認(rèn)使用“榛樹”導(dǎo)彈襲擊烏克蘭

俄軍確認(rèn)使用“榛樹”導(dǎo)彈襲擊烏克蘭

新京報(bào)政事兒
2026-01-09 15:11:27
抗癌歸來的馮提莫,力挺“直播禁美顏”,素顏后惡心的一幕上演了

抗癌歸來的馮提莫,力挺“直播禁美顏”,素顏后惡心的一幕上演了

跳跳歷史
2026-01-09 11:32:07
停了13年!廈門超級“網(wǎng)紅爛尾樓”地標(biāo)終于活過來了!

停了13年!廈門超級“網(wǎng)紅爛尾樓”地標(biāo)終于活過來了!

GA環(huán)球建筑
2026-01-09 13:54:38
中國最狠禁令砸向日本!這次結(jié)局,一定比廣場協(xié)議還慘

中國最狠禁令砸向日本!這次結(jié)局,一定比廣場協(xié)議還慘

一個(gè)壞土豆
2026-01-08 20:50:28
吊帶紅裙,性感尤物

吊帶紅裙,性感尤物

吃瓜黨二號頭目
2026-01-09 09:59:03
重磅!全球局勢不穩(wěn),新華社官宣轟-20、殲-36或在2026年正式亮相

重磅!全球局勢不穩(wěn),新華社官宣轟-20、殲-36或在2026年正式亮相

策略述
2026-01-08 18:17:38
分手8年,自曝私密事的Coco,沒給謝賢留體面,原來謝霆鋒沒說謊

分手8年,自曝私密事的Coco,沒給謝賢留體面,原來謝霆鋒沒說謊

娛說瑜悅
2026-01-06 17:28:42
兩次拒絕黎明,無視鐘漢良示愛,被折磨20年后55歲的她憔悴成大媽

兩次拒絕黎明,無視鐘漢良示愛,被折磨20年后55歲的她憔悴成大媽

青史樓蘭
2025-12-29 10:12:14
逍遙國外的丁玉梅也沒想到,15億資產(chǎn)才被凍結(jié),許家印就又出事了

逍遙國外的丁玉梅也沒想到,15億資產(chǎn)才被凍結(jié),許家印就又出事了

小小李娛
2026-01-09 09:41:01
去年每平方千米傷亡78人!擊中俄戰(zhàn)略彈藥庫,兩個(gè)烏軍士兵的故事

去年每平方千米傷亡78人!擊中俄戰(zhàn)略彈藥庫,兩個(gè)烏軍士兵的故事

鷹眼Defence
2026-01-07 17:08:07
遲到的父愛也是愛,成龍向女兒拋橄欖枝,吳卓林回應(yīng)已回香港創(chuàng)業(yè)

遲到的父愛也是愛,成龍向女兒拋橄欖枝,吳卓林回應(yīng)已回香港創(chuàng)業(yè)

青史樓蘭
2026-01-07 09:35:21
綁架馬杜羅的“原班人馬”,全部飛抵歐洲,美軍第二戰(zhàn)已確定目標(biāo)

綁架馬杜羅的“原班人馬”,全部飛抵歐洲,美軍第二戰(zhàn)已確定目標(biāo)

依偎在角落
2026-01-07 10:30:44
這植物全株有毒,還曾讓溫宜公主吐奶,如今卻成了最火的奶茶小料?

這植物全株有毒,還曾讓溫宜公主吐奶,如今卻成了最火的奶茶小料?

果殼
2026-01-08 16:11:09
董璇一家為張維伊慶生,和岳父母穿親子裝,佟麗婭佟大為夫婦都在

董璇一家為張維伊慶生,和岳父母穿親子裝,佟麗婭佟大為夫婦都在

心靜物娛
2026-01-09 13:54:55
突發(fā)!特朗普宣布,暴漲!

突發(fā)!特朗普宣布,暴漲!

中國基金報(bào)
2026-01-09 00:13:04
2026-01-09 15:32:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14293文章數(shù) 66451關(guān)注度
往期回顧 全部

教育要聞

一年級培優(yōu)題,填數(shù)字,很多家長都算錯(cuò)了

頭條要聞

52票贊成47票反對 特朗普怒了:對委動武或遭限制

頭條要聞

52票贊成47票反對 特朗普怒了:對委動武或遭限制

體育要聞

金元時(shí)代最后的外援,來中國8年了

娛樂要聞

檀健次戀愛風(fēng)波越演越烈 上學(xué)經(jīng)歷被扒

財(cái)經(jīng)要聞

郁亮的萬科35年:從"寶萬之爭"到"活下去"

科技要聞

市場偏愛MiniMax:開盤漲42%,市值超700億

汽車要聞

更智能更豪華 樂道L90加配置會貴多少?

態(tài)度原創(chuàng)

教育
藝術(shù)
旅游
家居
時(shí)尚

教育要聞

現(xiàn)在高三,英語只能考70多分,刷題時(shí)要背試卷上不認(rèn)識的單詞嗎

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

旅游要聞

旅業(yè)采購需求(第28期):急急急急需商旅、票務(wù)、旅行社等供應(yīng)商

家居要聞

木色留白 演繹現(xiàn)代自由

這一次,抖音美妝讓36萬用戶來定義美

無障礙瀏覽 進(jìn)入關(guān)懷版