国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

調(diào)整訓(xùn)練數(shù)據(jù)出場順序大模型就能變聰明!無需擴大模型/數(shù)據(jù)規(guī)模

0
分享至

DELT團隊 投稿
量子位 | 公眾號 QbitAI

模型訓(xùn)練重點在于數(shù)據(jù)的數(shù)量與質(zhì)量?其實還有一個關(guān)鍵因素——

數(shù)據(jù)的出場順序。

對此,微軟亞洲研究院提出了一種全新的文本數(shù)據(jù)組織范式DELT(Data Efficacy in LM Training),通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,在不同模型尺寸與規(guī)模下都達到了良好性能。



數(shù)據(jù)效率與效能提升

該方法用優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來讓語言模型學(xué)得更好,還不用增加數(shù)據(jù)量或擴大模型規(guī)模。

來看看是怎么做到的。

訓(xùn)練樣本的組織順序很關(guān)鍵

首先,我們先來理清幾個概念。

在語言模型訓(xùn)練中,數(shù)據(jù)使用效率至關(guān)重要?,F(xiàn)有研究多關(guān)注于數(shù)據(jù)效率(Data Efficiency),即如何通過數(shù)據(jù)選擇提升模型訓(xùn)練效率并保持優(yōu)異性能。

然而,數(shù)據(jù)效能(Data Efficacy),即如何通過數(shù)據(jù)組織增強模型訓(xùn)練表現(xiàn),卻常常被忽視。

以烹飪?yōu)槔?,?shù)據(jù)效率就像在市場挑選新鮮、合適的食材,而數(shù)據(jù)效能則像名廚把握投放調(diào)料的時機與分寸,讓菜品發(fā)揮出最佳風(fēng)味。

數(shù)據(jù)組織的重要性

為了避免過擬合,當前的大語言模型往往在海量數(shù)據(jù)上進行訓(xùn)練,并且訓(xùn)練的次數(shù)非常有限,甚至僅進行一次完整的訓(xùn)練周期(epoch=1),這與早期模型依賴多次迭代訓(xùn)練(epoch>>1)截然不同。

這些變化讓數(shù)據(jù)呈現(xiàn)的先后順序?qū)Y(jié)果影響巨大

早期的AI模型類似于讓學(xué)生多次反復(fù)翻閱同一本書,在多輪學(xué)習(xí)中慢慢補齊細節(jié);而現(xiàn)在更像只給一遍通讀,不再反復(fù)回看。

這就對閱讀順序提出了極高要求,必須精心規(guī)劃學(xué)習(xí)材料出現(xiàn)的先后和結(jié)構(gòu)。因此,訓(xùn)練樣本的組織順序顯得尤為關(guān)鍵。然而,關(guān)于這一點的研究卻很少。

基于此觀察,微軟亞洲研究院最新提出的文本數(shù)據(jù)組織范式DELT,通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,實現(xiàn)了數(shù)據(jù)的高效利用與效能提升。



DELT范式不但通過數(shù)據(jù)選擇提升效率,選取高質(zhì)量數(shù)據(jù),加快訓(xùn)練速度;

而且通過數(shù)據(jù)排序提升效能,在預(yù)訓(xùn)練和后訓(xùn)練階段都顯著提升了模型性能,且適用于通用、數(shù)學(xué)和代碼等多領(lǐng)域任務(wù)。

給模型按部就班安排訓(xùn)練課程
數(shù)據(jù)訓(xùn)練效能定義Data Efficacy

研究首先定義了數(shù)據(jù)訓(xùn)練效能(Data Efficacy),是指通過優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來最大化語言模型的性能表現(xiàn),而無需改變數(shù)據(jù)內(nèi)容或模型架構(gòu)。

與以往關(guān)注的“數(shù)據(jù)訓(xùn)練效率” (Data Efficiency) 側(cè)重數(shù)據(jù)篩選的研究目的不同,數(shù)據(jù)效能強調(diào)對訓(xùn)練數(shù)據(jù)的評分和排序,以充分挖掘數(shù)據(jù)的潛在價值。

數(shù)據(jù)順序在語言模型訓(xùn)練中的潛力尚未被充分挖掘, 數(shù)據(jù)效能旨在通過合理的數(shù)據(jù)組織方式,使模型在有限的訓(xùn)練數(shù)據(jù)和資源下實現(xiàn)更高的性能和泛化能力,成為提升語言模型性能的一種新興方法。

數(shù)據(jù)組織范式DELT介紹



DELT范式架構(gòu)

DELT(DataEfficacy inLMTraining)是一種創(chuàng)新的文本數(shù)據(jù)組織范式。

它集成了數(shù)據(jù)評分(Data Scoring)、數(shù)據(jù)選擇(Data Selection) 和數(shù)據(jù)排序(Data Ordering) 三大核心組件。

數(shù)據(jù)評分根據(jù)特定的屬性為每個樣本賦予分數(shù),如:難度、質(zhì)量、多樣性等。

數(shù)據(jù)選擇通過評分篩選出最優(yōu)子集(如:top-k、按閾值篩選等),然后數(shù)據(jù)排序根據(jù)評分重新組織所選擇數(shù)據(jù)的呈現(xiàn)順序(如:基于課程學(xué)習(xí)的分數(shù)從低到高排列)。 為了兼顧數(shù)據(jù)處理效率,DELT范式的數(shù)據(jù)選擇和數(shù)據(jù)排序共用數(shù)據(jù)評分的結(jié)果。

因此,數(shù)據(jù)評分的規(guī)則設(shè)置非常重要。于是,研究還提出了Learning-Quality Score(LQS)方法。



LQS打分方式

該數(shù)據(jù)評分方式結(jié)合了質(zhì)量可學(xué)習(xí)性兩個關(guān)鍵指標,不但可以篩選出低質(zhì)量數(shù)據(jù),而且也能捕捉數(shù)據(jù)在不同階段的訓(xùn)練價值,進一步提供了可靠的數(shù)據(jù)排列順序。

為了進一步提升數(shù)據(jù)效能,團隊還提出了一種全新的折疊排序方法Folding Ordering(FO)。

基于課程學(xué)習(xí)的排序(即,按分數(shù)升序排序)可能導(dǎo)致模型遺忘和數(shù)據(jù)內(nèi)部分布偏差。

折疊排序策略通過多層“折疊”,將數(shù)據(jù)按分數(shù)分層并多次采樣,無重復(fù)且均衡分布。



Folding排序方式

相比隨機打亂或單一排序,它既保留難度排序優(yōu)勢,又避免模型過度遺忘或依賴特定數(shù)據(jù),提升了魯棒性和泛化能力。

與傳統(tǒng)隨機排序方法相比,DELT范式不僅通過減小數(shù)據(jù)規(guī)模提升了訓(xùn)練效率;而且在不同模型尺寸和數(shù)據(jù)規(guī)模下,在各種評測集上都顯著提升了模型性能。



不同數(shù)據(jù)規(guī)模和模型尺寸下的結(jié)果

DELT給Data-centric AI領(lǐng)域帶來了全新思路。

看來,類比于人類教學(xué)實踐,講究個性化與按部就班地安排學(xué)習(xí)內(nèi)容,AI訓(xùn)練也需要類似的學(xué)習(xí)方法。

論文鏈接:https://arxiv.org/abs/2506.21545
代碼鏈接:https://github.com/microsoft/DELT

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
憤怒發(fā)聲!瓜帥怒斥球迷:為齋月暫停被噓,完全不可接受

憤怒發(fā)聲!瓜帥怒斥球迷:為齋月暫停被噓,完全不可接受

夜白侃球
2026-03-01 21:09:12
別被李煜的詩詞騙了!南唐和吳越,根本就不是一個級別的對手

別被李煜的詩詞騙了!南唐和吳越,根本就不是一個級別的對手

新車知多少
2026-03-01 13:37:45
哈梅內(nèi)伊一死,普京急召全體高層,防空系統(tǒng)全失靈,俄這次背大鍋

哈梅內(nèi)伊一死,普京急召全體高層,防空系統(tǒng)全失靈,俄這次背大鍋

健身狂人
2026-03-01 18:40:33
中方奉陪到底!訪華遲遲沒回復(fù),特朗普掀桌了,要廢除中國一地位

中方奉陪到底!訪華遲遲沒回復(fù),特朗普掀桌了,要廢除中國一地位

史行途
2026-03-01 14:24:27
國家出手,反詐老陳徹底涼涼!網(wǎng)友再曝猛料,不止搞對立這么簡單

國家出手,反詐老陳徹底涼涼!網(wǎng)友再曝猛料,不止搞對立這么簡單

云舟史策
2026-02-28 14:22:50
哈佛華西證實:咖啡真能續(xù)命!但90%的人都喝錯了

哈佛華西證實:咖啡真能續(xù)命!但90%的人都喝錯了

愛醫(yī)斯坦
2026-02-28 10:01:47
輪到西方一克難求,如今全球巨頭終于明白,中國該領(lǐng)域已改天換地

輪到西方一克難求,如今全球巨頭終于明白,中國該領(lǐng)域已改天換地

泠泠說史
2026-03-01 17:05:28
恩愛23年抵不過現(xiàn)實,73歲梁錦松年老色衰,47歲伏明霞花樣年華

恩愛23年抵不過現(xiàn)實,73歲梁錦松年老色衰,47歲伏明霞花樣年華

小熊侃史
2026-02-24 18:03:53
孫穎莎如果拿下2026新加坡大滿貫冠軍,

孫穎莎如果拿下2026新加坡大滿貫冠軍,

小光侃娛樂
2026-03-01 14:05:03
49歲林心如斷崖式衰老,當年的紫薇格格也老了,臉變長 抬頭紋好多

49歲林心如斷崖式衰老,當年的紫薇格格也老了,臉變長 抬頭紋好多

陳意小可愛
2026-03-01 00:49:59
臺關(guān)注我軍機活動“斷崖式銳減”動因

臺關(guān)注我軍機活動“斷崖式銳減”動因

沃德輿情觀察
2026-02-28 23:26:00
孫志浩肝癌晚期,將50億資產(chǎn)里的豪宅與股份盡數(shù)轉(zhuǎn)至女兒梧桐妹

孫志浩肝癌晚期,將50億資產(chǎn)里的豪宅與股份盡數(shù)轉(zhuǎn)至女兒梧桐妹

陳意小可愛
2026-03-01 10:33:40
月月315|男子花52.5萬全款購買婚房,5年多未等來房產(chǎn)證,湖南岳陽縣住建局:房款未進入開發(fā)商賬戶,正全力推動解決

月月315|男子花52.5萬全款購買婚房,5年多未等來房產(chǎn)證,湖南岳陽縣住建局:房款未進入開發(fā)商賬戶,正全力推動解決

大風(fēng)新聞
2026-03-01 14:34:03
伊朗第九輪導(dǎo)彈射向以色列

伊朗第九輪導(dǎo)彈射向以色列

財聯(lián)社
2026-03-01 01:00:05
A股:不必等明天開盤了,股市已經(jīng)有變化,周一很可能這樣走了

A股:不必等明天開盤了,股市已經(jīng)有變化,周一很可能這樣走了

財經(jīng)大拿
2026-03-01 12:02:26
她在非誠勿擾上站五年,爆燈無數(shù)卻不牽手,最終被主持人趕下臺

她在非誠勿擾上站五年,爆燈無數(shù)卻不牽手,最終被主持人趕下臺

琴聲飛揚
2026-02-22 15:21:45
向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

談史論天地
2026-02-10 08:16:24
伊朗臨時領(lǐng)導(dǎo)委員會人員構(gòu)成

伊朗臨時領(lǐng)導(dǎo)委員會人員構(gòu)成

界面新聞
2026-03-01 17:54:03
終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

福建平子
2026-01-28 10:52:25
打破壟斷,光纖巨頭,拿下300億訂單!

打破壟斷,光纖巨頭,拿下300億訂單!

新浪財經(jīng)
2026-03-01 18:26:42
2026-03-01 21:47:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12211文章數(shù) 176399關(guān)注度
往期回顧 全部

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂部

頭條要聞

全球1/5"石油動脈"被切斷 海運行業(yè)遭遇急性運營危機

頭條要聞

全球1/5"石油動脈"被切斷 海運行業(yè)遭遇急性運營危機

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

藝術(shù)
時尚
家居
游戲
本地

藝術(shù)要聞

2025年第二屆少兒美術(shù)教師作品展 | 油畫選刊

今年春天最流行的4件衛(wèi)衣,照著穿就很好看

家居要聞

素色肌理 品意式格調(diào)

LCK決賽:GEN橫掃BFX!達成在2026LCK杯大場全勝奪冠成就

本地新聞

津南好·四時總相宜

無障礙瀏覽 進入關(guān)懷版