国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大團隊改造DeepSeek注意力,速度快四倍還不丟精度

0
分享至

聽雨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

就在大家都急頭白臉地等待DeepSeek-V4的時候,冷不丁一篇新論文引起了網(wǎng)友們的注意——

提出新稀疏注意力機制HISA(分層索引稀疏注意力),突破64K上下文的索引瓶頸,相比DeepSeek正在用的DSA(DeepSeek Sparse Attention)提速2-4倍。



不僅做到了大幅提速,而且?guī)缀醪粊G精度、即插即用不用重新訓(xùn)練



論文直接在DeepSeek-V3.2和GLM-5上替換索引器,無需微調(diào)。

并且在找關(guān)鍵信息、長文本理解等任務(wù)上,精度都和原方法幾乎持平。



兩步消除上下文索引瓶頸

這篇論文想解決的問題很明確:給大模型的稀疏注意力機制換個更高效的 “檢索器”。

現(xiàn)有主流的DSA等token級稀疏注意力,核心就是通過只計算關(guān)鍵token的注意力,降低了核心計算成本。

但這個設(shè)計有個致命隱藏問題:要挑出相關(guān)字符,得靠一個 “索引器”——它需要把每個待查字符,和前面所有字符挨個打分,再選分數(shù)最高的。

文本長度L越長,這個打分的工作量是L的平方級增長。比如長度翻倍,工作量就會翻4倍。

到超長文本時,這個索引器的平方級成本,反而成了拖慢速度的元兇,甚至反而比真正的注意力計算還耗時。

基于此,研究團隊開始思考一個問題:能否在不改變最終稀疏注意力結(jié)果的前提下,降低索引器的搜索成本?

于是,他們提出了HISA(分層索引稀疏注意力),核心思路也很簡單:

既然挨個打分太費時間,那就先按塊篩掉大部分無關(guān)內(nèi)容,再在剩下的小塊里精細選。



在功能邏輯上實現(xiàn)對原有模塊的等價替換,無需修改后續(xù)注意力計算邏輯,相當于 “換了個更高效的篩子,篩出來的東西幾乎沒變”。

具體就兩步,全程復(fù)用原模型的打分規(guī)則,零學(xué)習(xí)成本:

塊級粗過濾

  • 把長文本切成固定大小的 “字符塊”(比如128個字符一塊),給每個塊算一個 “整體特征向量”(相當于給每塊貼個總標簽)
  • 用原索引器的打分方式,只給這些塊標簽打分
  • 挑出分數(shù)最高的m個塊(比如64個),直接扔掉剩下的所有塊——塊的數(shù)量遠少于字符數(shù)。

這一步能省掉絕大部分工作量。

塊內(nèi)精挑字符

只在第一步選出來的m個塊里,用原索引器的規(guī)則給單個字符打分,再挑出最終需要的k個相關(guān)字符。

還加了個小優(yōu)化:文本的第一個塊和最后一個塊必選,保證開頭的背景信息、結(jié)尾的最新上下文不被誤篩,也能處理文本拼接的邊界問題。



HISA的關(guān)鍵優(yōu)勢在于:復(fù)雜度驟降,還能 “無縫替換”

HISA把原索引器每一層 O (L2) 的算力成本,降到了O(L2/B + L×m×B)(B 是塊大小、m 是選的塊數(shù))

文本越長、塊選得越精準,提速效果越明顯。

更重要的是它的工程友好性

輸出和原索引器完全一致,下游的注意力計算模塊不用改;

不用重新訓(xùn)練模型、不用調(diào)整KV緩存結(jié)構(gòu),直接替換原索引器就行;

短文本時會自動 “退化” 成原方法,只有超長文本時才觸發(fā)分層篩選,全程自適應(yīng)。

實測提速超猛,精度幾乎沒丟

論文在DeepSeek-V3.2、GLM-5兩大主流大模型上做了全面測試,結(jié)果很亮眼:

速度上,在64K長度的文本下,HISA 比原DSA索引器最高提速3.75倍,常規(guī)設(shè)置也能提速2倍多。



上下文長度越長,HISA的提速效果越顯著,完全契合超長上下文(128K/1M)的實際應(yīng)用需求。

精度上,HISA也幾乎完全保留原DSA的精度,且顯著優(yōu)于純塊稀疏方法。

論文進行了“大海撈針”測試,該測試衡量在超長無關(guān)文本中,精準檢索指定位置關(guān)鍵信息的能力。

結(jié)果HISA和DSA幾乎一樣準,在所有長度和插入深度下,檢索精度均接近DSA的近乎滿分。



長文本理解(LongBench 基準)上,HISA的分數(shù)也和DSA基本持平。

甚至在部分場景,比如合成檢索、少樣本學(xué)習(xí)等對token篩選精度要求高的任務(wù)中,HISA做到了小幅反超。



而在超參數(shù)測試中,不同塊大小、選塊數(shù)量下,HISA表現(xiàn)都很穩(wěn)定,分數(shù)均與DSA高度接近,無顯著性能差異



這也說明HISA對超參數(shù)的選擇不敏感,魯棒性強,工程落地時無需精細調(diào)參。

不過目前HISA還有小瑕疵,作者也提出了后續(xù)改進思路:

第一,現(xiàn)在塊是固定大小的,若一個塊里混了無關(guān)和相關(guān)內(nèi)容,塊的 “整體標簽” 會不準。

未來可以搞自適應(yīng)塊、重疊塊,或換更好的塊特征計算方式。

第二,目前只是推理時直接用,未來可以把塊篩選和模型一起訓(xùn)練,讓篩選更精準。

第三,現(xiàn)在只測了索引器的速度,未來整合到完整的大模型服務(wù)框架里,測端到端的吞吐量和延遲。

團隊背景

這篇論文出自北京大學(xué)的張牧涵團隊。

張牧涵,北京大學(xué)人工智能研究院的Tanure-track助理教授和博士生導(dǎo)師。

回國前曾在Facebook AI(現(xiàn)為 Meta AI)擔任研究員,從事大規(guī)模圖學(xué)習(xí)系統(tǒng)和問題的研究。



其Google Scholar總引用量超過13000次,其中兩篇一作文章引用量分別達到3100+和2400+次,連續(xù)多年入選Elsevier全球前2%頂尖科學(xué)家(生涯影響力榜單)

Yufei Xu(徐宇飛)和Fanxu Meng(孟繁續(xù))為論文的共同一作。


[1]https://arxiv.org/abs/2603.28458

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
昆凌素顏化妝畫面曝光!五官變化大到離譜,周杰倫見了都得愣三秒

昆凌素顏化妝畫面曝光!五官變化大到離譜,周杰倫見了都得愣三秒

觀魚聽雨
2026-04-12 20:28:25
創(chuàng)造歷史!柏林聯(lián)盟任命五大聯(lián)賽首位女性主教練

創(chuàng)造歷史!柏林聯(lián)盟任命五大聯(lián)賽首位女性主教練

體壇周報
2026-04-12 19:42:10
美官員稱伊朗拒絕停止鈾濃縮及開放海峽等多項要求

美官員稱伊朗拒絕停止鈾濃縮及開放海峽等多項要求

財聯(lián)社
2026-04-13 00:22:04
對于明天后的A股,我只說四句話:第一,4000點絕對不會是牢不可破

對于明天后的A股,我只說四句話:第一,4000點絕對不會是牢不可破

風風順
2026-04-12 19:18:13
伊朗消息人士:美國尋找借口退出談判,伊方暫無下一輪談判計劃

伊朗消息人士:美國尋找借口退出談判,伊方暫無下一輪談判計劃

界面新聞
2026-04-12 11:42:11
二甲雙胍抗衰老再獲證據(jù)!新研究發(fā)現(xiàn):中年開始用,減輕衰弱、保持肌肉骨骼健康,從源頭延緩衰老

二甲雙胍抗衰老再獲證據(jù)!新研究發(fā)現(xiàn):中年開始用,減輕衰弱、保持肌肉骨骼健康,從源頭延緩衰老

醫(yī)諾維
2026-04-12 12:35:26
快訊!鄭麗文太讓人吃驚了!

快訊!鄭麗文太讓人吃驚了!

達文西看世界
2026-04-12 19:38:07
中央明確了!社保最低繳費年限要提高,70、80后得早做準備

中央明確了!社保最低繳費年限要提高,70、80后得早做準備

云鵬敘事
2026-04-12 16:36:39
1959年,18歲陳麗華與北京電信系統(tǒng)某位高管結(jié)婚,生下一子二女

1959年,18歲陳麗華與北京電信系統(tǒng)某位高管結(jié)婚,生下一子二女

鑒史錄
2026-04-12 20:00:55
反映66盞路燈不亮,卻被威脅“先拘留15天”:湖南男子的真實遭遇

反映66盞路燈不亮,卻被威脅“先拘留15天”:湖南男子的真實遭遇

聽心堂
2026-04-12 14:50:13
王石被抓?回應(yīng):“造謠”“已去報案路上”

王石被抓?回應(yīng):“造謠”“已去報案路上”

新京報
2026-04-12 19:58:08
鄭麗文:絕不放棄武力保臺,洪秀柱怒懟:兩岸和平,豈能不統(tǒng)一?

鄭麗文:絕不放棄武力保臺,洪秀柱怒懟:兩岸和平,豈能不統(tǒng)一?

安夢入天下
2026-04-12 17:01:16
伊朗總統(tǒng):伊朗已做好準備達成平衡且公平的協(xié)議

伊朗總統(tǒng):伊朗已做好準備達成平衡且公平的協(xié)議

新華社
2026-04-12 23:26:02
“你怎么在這?”女子商場驚魂:閨蜜上趟洗手間,竟跟著陌生人走

“你怎么在這?”女子商場驚魂:閨蜜上趟洗手間,竟跟著陌生人走

一絲不茍的法律人
2026-04-11 19:27:49
2%失業(yè)率、80%店鋪關(guān)停淪為“空城”... 新加坡經(jīng)濟陷斷崖危機!

2%失業(yè)率、80%店鋪關(guān)停淪為“空城”... 新加坡經(jīng)濟陷斷崖危機!

新加坡萬事通
2026-04-12 18:24:53
我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

草莓解說體育
2026-04-12 17:05:01
參加會見連正裝都不穿了!鄭麗文抵達首都第2天更加放松了!

參加會見連正裝都不穿了!鄭麗文抵達首都第2天更加放松了!

阿龍聊軍事
2026-04-12 12:09:16
0-1!熱刺14輪不勝+近8場僅1分 無緣逃離降級區(qū) 德澤爾比遭開門黑

0-1!熱刺14輪不勝+近8場僅1分 無緣逃離降級區(qū) 德澤爾比遭開門黑

我愛英超
2026-04-12 23:07:29
某車起火文章被投訴下架!

某車起火文章被投訴下架!

電動知家
2026-04-12 19:53:03
3女1男擠30平深圳合租房,小伙被隨意使喚,這樣的合租你能接受嗎

3女1男擠30平深圳合租房,小伙被隨意使喚,這樣的合租你能接受嗎

搗蛋窩
2026-04-12 07:46:25
2026-04-13 00:43:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12463文章數(shù) 176449關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風日產(chǎn):尊重同行

頭條要聞

特朗普:將封鎖任何試圖進出霍爾木茲海峽的船只

頭條要聞

特朗普:將封鎖任何試圖進出霍爾木茲海峽的船只

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭

財經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

教育
數(shù)碼
家居
手機
游戲

教育要聞

小班教學(xué),9月開校,樹德派校長!這所中學(xué),正在招老師

數(shù)碼要聞

蘋果版套娃 買臺Mac Pro回家:打開一看里面還藏著一臺Mac Pro

家居要聞

復(fù)古風格 自然簡約

手機要聞

華為闊折疊設(shè)計圖曝光!這外觀你喜歡嗎?

《識質(zhì)存在》發(fā)售/《朋友收集 夢想生活》登陸NS| 下周玩什么

無障礙瀏覽 進入關(guān)懷版