国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

KDD 2025 Best Paper Runner-Up | EI-BERT:超緊湊語(yǔ)言模型壓縮框架

0
分享至

近年來(lái),如何在資源受限的移動(dòng)或邊緣設(shè)備上高效部署自然語(yǔ)言理解(NLU)模型,已成為學(xué)術(shù)界和產(chǎn)業(yè)界共同關(guān)注的核心問(wèn)題。本研究在保持模型性能的前提下,實(shí)現(xiàn)了高度壓縮與高效運(yùn)行,為大規(guī)模語(yǔ)言模型的輕量化應(yīng)用提供了新的思路與實(shí)踐路徑,具有重要的理論價(jià)值與應(yīng)用前景。

未來(lái)的研究將主要沿兩個(gè)方向展開(kāi):其一,探索如何通過(guò)壓縮與知識(shí)蒸餾技術(shù),將生成式語(yǔ)言模型的關(guān)鍵能力(如多步推理與上下文學(xué)習(xí))遷移至計(jì)算與存儲(chǔ)受限的邊緣設(shè)備;其二,發(fā)展參數(shù)高效的適應(yīng)性方法,并結(jié)合模塊化接口設(shè)計(jì),實(shí)現(xiàn)模型在不同領(lǐng)域的快速遷移與應(yīng)用。

論文標(biāo)題: Put Teacher in Student's Shoes: Cross-Distillation for Ultra-compact Model Compression Framework 論文地址: https://arxiv.org/abs/2507.04636
一、研究背景與動(dòng)機(jī)

在移動(dòng)計(jì)算時(shí)代,將高效的自然語(yǔ)言處理模型部署到資源受限的邊緣設(shè)備上面臨巨大挑戰(zhàn)。這些場(chǎng)景通常要求嚴(yán)格的隱私合規(guī)、實(shí)時(shí)響應(yīng)能力和多任務(wù)處理功能。

現(xiàn)有的 BERT 模型壓縮技術(shù)僅能實(shí)現(xiàn) 15-20MB 的壓縮,遠(yuǎn)不能滿足移動(dòng)設(shè)備 4MB 的嚴(yán)格內(nèi)存限制。特別是在金融應(yīng)用場(chǎng)景中,本地 AI 處理對(duì)保護(hù)用戶(hù)隱私至關(guān)重要,同時(shí)還需確保約 300 毫秒的實(shí)時(shí)響應(yīng)。這種差距凸顯了對(duì)極致壓縮框架的迫切需求。

二、方法:多階段的極值壓縮框架

EI-BERT 框架通過(guò)三個(gè)關(guān)鍵步驟實(shí)現(xiàn)極致壓縮:硬令牌剪枝智能篩選重要詞匯,大幅減少存儲(chǔ)需求;交叉蒸餾確保高效知識(shí)傳遞,突破傳統(tǒng)方法局限;模塊化量化采用 INT8 量化進(jìn)一步優(yōu)化存儲(chǔ)。

其中,交叉蒸餾方法創(chuàng)新性地讓教師模型 "站在學(xué)生模型的角度",通過(guò)參數(shù)集成和師生互動(dòng)的動(dòng)態(tài)適應(yīng)機(jī)制,實(shí)現(xiàn)精準(zhǔn)的知識(shí)轉(zhuǎn)移。該方法有效解決了教師 - 學(xué)生模型間的容量差異和知識(shí)適應(yīng)性問(wèn)題。最終實(shí)現(xiàn)了99.5% 的壓縮率,創(chuàng)造了1.91MB 的 BERT 模型新紀(jì)錄。

詞表剪枝

在傳統(tǒng)模型中,詞匯嵌入占據(jù)了大量參數(shù)空間(ALBERT-tiny2 達(dá) 44.7%,TinyBERT2 達(dá) 36.6%),嚴(yán)重制約了移動(dòng)端部署。針對(duì)這一瓶頸,EI-BERT 框架基于注意力機(jī)制的硬令牌剪枝策略,通過(guò)精確建模量化每個(gè) token 的重要性。

  • 首先利用多頭注意力計(jì)算 token 間的語(yǔ)義關(guān)聯(lián)概率分布,捕捉詞匯間的關(guān)系強(qiáng)度。

  • 接著,通過(guò)跨層聚合計(jì)算每個(gè) token 的全局重要性得分,綜合考慮層數(shù)、句子數(shù)量和注意力頭數(shù)等多個(gè)維度,從而識(shí)別出真正承載核心語(yǔ)義的關(guān)鍵詞匯,實(shí)現(xiàn)高效精準(zhǔn)的剪枝。

交叉蒸餾

傳統(tǒng)知識(shí)蒸餾面臨容量鴻溝和適應(yīng)性缺失兩大挑戰(zhàn)。模型極致壓縮導(dǎo)致的巨大架構(gòu)差異使知識(shí)傳遞困難,靜態(tài)教學(xué)方式也難以適應(yīng)學(xué)生模型的特殊需求。EI-BERT 框架提出參數(shù)集成策略,將教師模型經(jīng)過(guò)精調(diào)的下游任務(wù)層直接融入學(xué)生模型。這一 "拿來(lái)主義" 基于深刻洞察:教師模型末端層包含豐富的任務(wù)特定判別信息,直接集成可大幅降低學(xué)習(xí)難度。

在交叉蒸餾中,通過(guò)動(dòng)態(tài)互動(dòng)機(jī)制打破傳統(tǒng)單向知識(shí)傳遞的局限。

  • 教師模型采用較小學(xué)習(xí)率進(jìn)行微調(diào),持續(xù)感知并適應(yīng)學(xué)生的學(xué)習(xí)狀態(tài)。

  • 學(xué)生模型則使用更大學(xué)習(xí)率,深入學(xué)習(xí)教師的輸出和中間表征。

  • 損失函數(shù)通過(guò)任務(wù)特定損失、MSE 損失和 KL 散度損失三個(gè)維度的約束,確保知識(shí)傳遞的全面性和精確性。

模塊化量化

完成蒸餾后,EI-BERT 框架采用創(chuàng)新的模塊化量化方案將模型壓縮至 INT8 精度。不同于傳統(tǒng)逐矩陣量化,該方法從模塊整體優(yōu)化,最小化層間累積誤差。通過(guò)精心設(shè)計(jì)的量化函數(shù)和可學(xué)習(xí)的步長(zhǎng)參數(shù),確保 8 位整數(shù)充分覆蓋參數(shù)動(dòng)態(tài)范圍,在極大壓縮存儲(chǔ)空間的同時(shí)將精度損失降至最低。

三、實(shí)驗(yàn)結(jié)果

EI-BERT 在句子任務(wù)上平均得分63.97,超越了所有基線模型;在機(jī)器閱讀理解任務(wù)上得分50.04,整體性能位居前列。

EI-BERT 以?xún)H 1.91MB 的存儲(chǔ)空間和 1.3 GIOPs 的計(jì)算量,實(shí)現(xiàn)了比 TinyBERT4小 23 倍、比 ALBERT4小 8 倍的極致壓縮,同時(shí)計(jì)算效率提升 8 倍。

四、實(shí)際應(yīng)用

該技術(shù)已在支付寶生態(tài)系統(tǒng)中大規(guī)模部署,服務(wù)超10 億用戶(hù),展現(xiàn)出卓越的實(shí)際效果。在邊緣推薦系統(tǒng)中,自 2024 年 1 月起每日服務(wù) 840 萬(wàn)活躍設(shè)備,處理 2100 萬(wàn)實(shí)時(shí)請(qǐng)求,PV-Click 提升 4.23%,PV-CTR 提升 3.3%;智能助手實(shí)現(xiàn) 65% 的延遲降低,響應(yīng)時(shí)間從 1 秒降至 214 毫秒,同時(shí)保持 98.2% 的準(zhǔn)確率;小程序場(chǎng)景實(shí)現(xiàn)完全本地化處理,網(wǎng)絡(luò)負(fù)載減少 85%,云計(jì)算成本降低 40%,隱私敏感應(yīng)用的用戶(hù)留存率提升 12.3%。這些成果充分驗(yàn)證了該框架在真實(shí)工業(yè)場(chǎng)景中的巨大價(jià)值。

五、總結(jié)與未來(lái)展望

這項(xiàng)研究成功解決了在資源受限的移動(dòng)設(shè)備上部署 NLU 模型的難題,在保證性能的同時(shí)實(shí)現(xiàn)了極致壓縮,具有重要的學(xué)術(shù)價(jià)值和產(chǎn)業(yè)影響力。

未來(lái),計(jì)劃在兩個(gè)方向繼續(xù)推進(jìn)研究:一是探索如何將生成式語(yǔ)言模型的核心能力 (如多步推理、上下文學(xué)習(xí)等) 通過(guò)壓縮知識(shí)蒸餾遷移到極度受限的邊緣設(shè)備上;二是研究參數(shù)高效的適應(yīng)性方法,通過(guò)模塊化接口設(shè)計(jì)實(shí)現(xiàn)快速的領(lǐng)域遷移。

作者:王茂林 來(lái)源:公眾號(hào)【機(jī)器之心】

llustration From IconScout By IconScout Store

-The End-

掃碼觀看!

本周上新!

“AI技術(shù)流”原創(chuàng)投稿計(jì)劃

TechBeat是由將門(mén)創(chuàng)投建立的AI學(xué)習(xí)社區(qū)(www.techbeat.net)。社區(qū)上線700+期talk視頻,3000+篇技術(shù)干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會(huì)及其他線上交流活動(dòng),不定期舉辦技術(shù)人線下聚會(huì)交流活動(dòng)。我們正在努力成為AI人才喜愛(ài)的高質(zhì)量、知識(shí)型交流平臺(tái),希望為AI人才打造更專(zhuān)業(yè)的服務(wù)和體驗(yàn),加速并陪伴其成長(zhǎng)。

投稿內(nèi)容

// 最新技術(shù)解讀/系統(tǒng)性知識(shí)分享 //

// 前沿資訊解說(shuō)/心得經(jīng)歷講述 //

投稿須知

稿件需要為原創(chuàng)文章,并標(biāo)明作者信息。

我們會(huì)選擇部分在深度技術(shù)解析及科研心得方向,對(duì)用戶(hù)啟發(fā)更大的文章,做原創(chuàng)性?xún)?nèi)容獎(jiǎng)勵(lì)

投稿方式

發(fā)送郵件到

michellechang@thejiangmen.com

或添加工作人員微信(michelle333_)投稿,溝通投稿詳情

關(guān)于我“門(mén)”

將門(mén)是一家以專(zhuān)注于數(shù)智核心科技領(lǐng)域新型創(chuàng)投機(jī)構(gòu),也是北京市標(biāo)桿型孵化器。 公司致力于通過(guò)連接技術(shù)與商業(yè),發(fā)掘和培育具有全球影響力的科技創(chuàng)新企業(yè),推動(dòng)企業(yè)創(chuàng)新發(fā)展與產(chǎn)業(yè)升級(jí)。

將門(mén)成立于2015年底,創(chuàng)始團(tuán)隊(duì)由微軟創(chuàng)投在中國(guó)的創(chuàng)始團(tuán)隊(duì)原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。

如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價(jià)值的投后服務(wù),歡迎發(fā)送或者推薦項(xiàng)目給我“門(mén)”:

bp@thejiangmen.com

點(diǎn)擊右上角,把文章分享到朋友圈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費(fèi)者被坑慘,家長(zhǎng)要警惕

假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費(fèi)者被坑慘,家長(zhǎng)要警惕

趣文說(shuō)娛
2026-03-10 16:47:22
凌晨刷屏!中遠(yuǎn)海運(yùn)強(qiáng)硬反擊 巴拿馬港口空箱全撤 所有訂艙悉數(shù)取消

凌晨刷屏!中遠(yuǎn)海運(yùn)強(qiáng)硬反擊 巴拿馬港口空箱全撤 所有訂艙悉數(shù)取消

生活新鮮市
2026-03-14 00:18:55
美國(guó)“林肯”號(hào)航母已經(jīng)被擊中,失去了作戰(zhàn)能力,目前已返回美國(guó)

美國(guó)“林肯”號(hào)航母已經(jīng)被擊中,失去了作戰(zhàn)能力,目前已返回美國(guó)

安安說(shuō)
2026-03-14 18:53:39
中東魔幻一幕:哈馬斯突然勸伊朗收手,別打鄰居!臉都不要了

中東魔幻一幕:哈馬斯突然勸伊朗收手,別打鄰居!臉都不要了

老馬拉車(chē)莫少裝
2026-03-14 18:34:48
阿德巴約:如果逝者能夠開(kāi)口說(shuō)話,我堅(jiān)信科比一定會(huì)恭喜我

阿德巴約:如果逝者能夠開(kāi)口說(shuō)話,我堅(jiān)信科比一定會(huì)恭喜我

懂球帝
2026-03-14 09:45:09
57歲王菲斷崖式衰老!臉腫皮膚松,十個(gè)月前和謝霆鋒秀恩愛(ài)差距大

57歲王菲斷崖式衰老!臉腫皮膚松,十個(gè)月前和謝霆鋒秀恩愛(ài)差距大

青梅侃史啊
2026-02-18 07:25:41
在剛剛,17家公司出現(xiàn)重大利好消息,看看有沒(méi)有與你相關(guān)的個(gè)股?

在剛剛,17家公司出現(xiàn)重大利好消息,看看有沒(méi)有與你相關(guān)的個(gè)股?

股市皆大事
2026-03-14 11:09:10
北京市屬公園春花觀賞季陸續(xù)啟幕

北京市屬公園春花觀賞季陸續(xù)啟幕

北京商報(bào)
2026-03-13 17:12:20
分手7年范冰冰也沒(méi)想到,46歲李晨隱藏身份曝光,王寶強(qiáng)沒(méi)說(shuō)錯(cuò)

分手7年范冰冰也沒(méi)想到,46歲李晨隱藏身份曝光,王寶強(qiáng)沒(méi)說(shuō)錯(cuò)

錯(cuò)過(guò)美好
2026-03-13 23:16:47
別等孩子上了初中才明白:小學(xué)最重要的,根本不是刷了多少題

別等孩子上了初中才明白:小學(xué)最重要的,根本不是刷了多少題

諾媽家有男寶娃
2026-03-13 15:15:55
有很多人可能根本“撐不過(guò)”2026年了

有很多人可能根本“撐不過(guò)”2026年了

放牛娃的遐想
2026-03-12 08:29:33
早春外套別亂買(mǎi)!跟著博主解鎖3件王炸單品,顯瘦時(shí)髦一整季!

早春外套別亂買(mǎi)!跟著博主解鎖3件王炸單品,顯瘦時(shí)髦一整季!

虎哥說(shuō)衣不二
2026-03-14 19:10:10
蒙古總理?yè)Q人后,一下子硬氣了,當(dāng)面要求西方廢除不平等條款

蒙古總理?yè)Q人后,一下子硬氣了,當(dāng)面要求西方廢除不平等條款

知鑒明史
2026-03-13 18:31:46
蒙哥馬利:我們?cè)诙ㄎ磺蚍朗匦枳龅酶?,侯森肋部受傷需休?>
    </a>
        <h3>
      <a href=懂球帝
2026-03-14 18:38:05
曝1名伊朗女足留澳球員接受足協(xié)主席命令 勸說(shuō)其他隊(duì)友返回伊朗

曝1名伊朗女足留澳球員接受足協(xié)主席命令 勸說(shuō)其他隊(duì)友返回伊朗

念洲
2026-03-14 13:47:06
上甘嶺戰(zhàn)役,美軍為什么不像對(duì)付日軍那樣,用噴火器向坑道里狂噴

上甘嶺戰(zhàn)役,美軍為什么不像對(duì)付日軍那樣,用噴火器向坑道里狂噴

朝子亥
2026-03-14 17:15:03
不要再叫喊擊沉美航母了:擊沉一艘航母有多難?你根本看不懂

不要再叫喊擊沉美航母了:擊沉一艘航母有多難?你根本看不懂

起喜電影
2026-03-02 07:35:37
“美國(guó)不敢打”論誤國(guó)誤民!

“美國(guó)不敢打”論誤國(guó)誤民!

據(jù)說(shuō)無(wú)據(jù)
2026-03-12 15:56:59
有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深?lèi)?ài)雜談
2026-02-18 20:55:58
以軍發(fā)動(dòng)大規(guī)??找u 伊朗首都發(fā)生爆炸

以軍發(fā)動(dòng)大規(guī)模空襲 伊朗首都發(fā)生爆炸

財(cái)聯(lián)社
2026-03-14 02:40:14
2026-03-14 20:00:49
將門(mén)創(chuàng)投 incentive-icons
將門(mén)創(chuàng)投
加速及投資技術(shù)驅(qū)動(dòng)型初創(chuàng)企業(yè)
2310文章數(shù) 596關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

霍爾木茲海峽上周末僅4艘船通過(guò) 繞行要多走5500公里

頭條要聞

霍爾木茲海峽上周末僅4艘船通過(guò) 繞行要多走5500公里

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂(lè)要聞

張藝興,犯了大忌

財(cái)經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車(chē)要聞

吉利銀河M7技術(shù)首秀 實(shí)力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

藝術(shù)
親子
家居
房產(chǎn)
手機(jī)

藝術(shù)要聞

李建鵬:90后第四屆“中國(guó)美術(shù)獎(jiǎng)”銅獎(jiǎng)獲得者

親子要聞

萌娃為何覺(jué)得自己和大人一樣?聽(tīng)到答案的大人們繃不住了

家居要聞

藝術(shù)之家 法式優(yōu)雅

房產(chǎn)要聞

不容易??!??诮K于又要賣(mài)地了!

手機(jī)要聞

華為新機(jī)三箭齊發(fā):暢享90系列、Pura X2、Pura 90,均迎大變化!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版