国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

上交聯(lián)合UCSD突破LLM推理瓶頸,模型代碼全開源

0
分享至



在大語言模型(LLM)落地應用中,推理速度始終是制約效率的核心瓶頸。傳統(tǒng)自回歸(AR)解碼雖能保證生成質(zhì)量,卻需逐 token 串行計算,速度極為緩慢;擴散型 LLM(dLLMs)雖支持并行解碼,卻面臨訓練成本高昂、質(zhì)量下降及 KV 緩存兼容問題;投機解碼(Speculative Decoding)則需額外引入草稿模型,系統(tǒng)復雜度大增。





Jacobi Forcing Model 與 AR LLM 推理速度對比示意

近期,來自 UCSD Hao AI Lab 和上海交大 Deng Lab 的團隊提出了一種突破性解決方案 ——Jacobi Forcing,該方案無需重構模型架構,即可將標準 AR 模型轉化為原生因果并行解碼器,在編碼、數(shù)學等任務中實現(xiàn)最高 4 倍 wall-clock 提速和 4.5 倍 tokens-per-forward 提升,同時保持接近 AR 模型的生成質(zhì)量,為 LLM 高效推理開辟了新路徑。



  • 論文地址: https://arxiv.org/pdf/2512.14681
  • 代碼地址:https://github.com/hao-ai-lab/JacobiForcing
  • 模型倉庫:http://huggingface.co/JacobiForcing

Jacobi Forcing 核心優(yōu)勢:

破解并行解碼的 "三元悖論"

Jacobi Forcing 的創(chuàng)新之處在于打破了 "低代價、高速度、高質(zhì)量" 的不可能三角,其核心優(yōu)勢體現(xiàn)在三大維度:

1. 原生因果架構,部署與訓練成本低:

不同于 dLLMs 的雙向注意力機制,Jacobi Forcing 保留了 AR 模型的因果注意力結構,完美適配現(xiàn)有 KV 緩存復用機制和 AR 優(yōu)化內(nèi)核,可作為現(xiàn)有 AR 模型的 "即插即用" 替代方案,極大降低部署與訓練成本。

2. 高效并行解碼,速度提升顯著:

通過在模型自己生成的 Jacobi 解碼軌跡做漸進蒸餾訓練,模型能夠快速在每輪前向傳播中并行更新多個 token。結合多塊并行解碼(Multiblock decoding)和拒絕回收(Rejection recycling)策略,可同時維護多個解碼塊,緩存高質(zhì)量 n-gram 片段重復利用,在編碼任務中實現(xiàn) 181.8 TPS 的生成速度,遠超 AR 基線的 39.8 TPS。

3. 質(zhì)量損失極小,任務表現(xiàn)優(yōu)異:

針對 AR 到擴散模型的預訓練 - 后訓練目標不匹配問題,Jacobi Forcing 設計了使用模型自己生成的數(shù)據(jù)做學習,通過漸進式一致性蒸餾損失和 AR 損失的聯(lián)合優(yōu)化,讓模型在噪聲環(huán)境下仍能生成貼近 AR 分布的高質(zhì)量結果,學習高效且保持了 AR 模型的高質(zhì)量特性。在 HumanEval 編碼基準中,以 83.5% 的準確率實現(xiàn) 4 倍提速;在 GSM8K 數(shù)學任務中,91.4% 的解題率接近 AR 基線,速度提升 3.7 倍。



Jacobi Forcing 與 dllm 在速度,質(zhì)量與訓練成本上的對比圖

Jacobi Forcing 技術路線:

從訓練到推理的全鏈路優(yōu)化


Jacobi Forcing 以因果并行解碼為核心目標,基于 Jacobi 解碼框架進行深度優(yōu)化,通過訓練機制創(chuàng)新與推理策略升級的全鏈路設計,在保留 AR 模型因果骨干與 KV 緩存兼容性的同時,實現(xiàn)高效并行解碼。

其技術路線具體細節(jié)如下:

1. 技術基礎:基于 Jacobi 解碼的因果并行框架

Jacobi 解碼是一種因果并行解碼過程,核心邏輯是:在保留 AR 模型因果注意力機制的前提下,對一個塊內(nèi)的所有 token 進行并行迭代更新,直到所有 token 與貪心 AR 輸出完全匹配(即達到 “定點” 狀態(tài))。這一過程形成了一條 “并行精煉軌跡”,既維持了因果依賴關系,又突破了逐 token 串行的限制。 此前的相關工作(如 CLLMs)已驗證:通過在 Jacobi 軌跡上微調(diào)模型,可縮短迭代軌跡、提升解碼速度,但存在一個關鍵局限:在大 block size 下由于上文噪聲過多無法并行解碼出更多的 token 數(shù)。Jacobi Forcing 在此基礎上進一步推進,核心突破是:訓練模型在含噪聲的上文下,仍能生成貼近 AR 分布的高質(zhì)量草稿,同時通過推理策略優(yōu)化,最大化并行效率。

2. 訓練階段優(yōu)化:噪聲感知的漸進式學習

Jacobi Forcing 首先利用自回歸語言模型對提示詞(prompt)集合執(zhí)行 Jacobi 解碼,采集從噪聲塊到干凈定點的完整 Jacobi 解碼軌跡。為使模型具備應對高噪聲上文場景下的并行解碼能力,Jacobi Forcing 設計漸進式噪聲調(diào)度策略,以學習噪聲塊到干凈定點的映射關系:具體而言,先為采集軌跡中的中間未收斂噪聲塊賦予噪聲等級(噪聲等級越高,與干凈定點狀態(tài)的偏差越大),再按 “低噪聲→高噪聲” 的漸進式順序對噪聲塊進行打包,構建訓練序列,從而提升去噪任務的可學習性;其核心訓練目標為將打包后的含噪聲訓練序列映射至全干凈定點序列。為實現(xiàn)高效訓練,Jacobi Forcing 進一步設計噪聲感知注意力掩碼,該掩碼支持通過單次模型前向傳播即可完成上述映射關系的學習。此外,為平衡并行解碼效率與自回歸(AR)生成質(zhì)量,方案設計了加權雙項聯(lián)合損失函數(shù):其一為漸進式一致性蒸餾損失,用于引導模型掌握任意噪聲等級塊到干凈定點塊的映射;其二為 AR 損失,確保模型生成質(zhì)量與原始自回歸模型保持一致。



訓練數(shù)據(jù)打包與噪聲感知注意力掩碼圖解

3. 推理階段優(yōu)化:高效并行解碼策略

訓練后的 Jacobi Forcing 模型仍是標準 AR checkpoint,但通過針對性的推理策略,可最大化并行解碼效率,核心包括 “高質(zhì)量草稿利用 + 多塊調(diào)度” 兩大模塊。

1.高質(zhì)量草稿挖掘與復用:訓練后模型的 Jacobi 解碼軌跡呈現(xiàn)顯著特性:軌跡中未收斂點包含大量高質(zhì)量 n-gram,這些 n-gram 雖可能位置暫錯,但內(nèi)容與最終 AR 定點輸出完全一致,且在迭代中保持穩(wěn)定?;诖颂匦裕评頃r會緩存 n-gram 并在后續(xù)迭代中直接將這些緩存的 n-gram 作為候選草稿,減少迭代次數(shù)(見下圖軌跡可視化:紅色標注為可復用的高質(zhì)量 n-gram)。



高質(zhì)量草稿復用圖解

2.多塊并行調(diào)度: 同時維護 K 個塊(實驗中 K=2 為最優(yōu)),分為 “真實活躍塊” 和 “偽活躍塊”; 真實活躍塊中的 token 會被驗證并提交到 KV 緩存,成為后續(xù)塊的因果前綴;偽活躍塊會基于當前前綴進行 Jacobi 迭代更新,但暫不提交到 KV 緩存; 當真實活躍塊收斂(所有 token 匹配定點),從偽活躍塊中選擇一個晉升為真實活躍塊,基于更新后的完整前綴重新驗證其所有 token。



推理階段優(yōu)化策略圖解

實測表現(xiàn):優(yōu)于主流并行解碼方案

在 A100 GPU 上的 7B 模型基準測試中,Jacobi Forcing 超越 dLLMs、投機解碼等主流方案,展現(xiàn)出更優(yōu)的速度 - 質(zhì)量 trade-off。



Jacobi Forcing 模型性能展示

無論是編碼、數(shù)學等專業(yè)任務,還是通用文本生成場景,Jacobi Forcing 都能在保證結果可靠性的前提下,將推理速度提升一個量級,尤其適合對延遲敏感的工業(yè)級 LLM 應用。

Jacobi Forcing 的出現(xiàn),不僅解決了 LLM 推理的效率瓶頸,更重新定義了因果模型的并行化可能。隨著大模型應用向低延遲、高并發(fā)場景滲透,這種兼顧兼容性、高性能和高質(zhì)量的解碼方案,有望成為工業(yè)級 LLM 部署的首選技術,推動 AI 應用效率邁入新階段。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
Steam熱搜榜第一!含媽量最高的游戲,沒有之一!

Steam熱搜榜第一!含媽量最高的游戲,沒有之一!

17173游戲網(wǎng)
2026-01-12 11:45:05
朱棣死在榆木川,榆木川位于現(xiàn)在的哪里?說出來你可能不信

朱棣死在榆木川,榆木川位于現(xiàn)在的哪里?說出來你可能不信

小豫講故事
2026-01-12 06:00:05
電池巨頭再暴大雷!

電池巨頭再暴大雷!

電動知家
2026-01-12 10:25:26
剛剛!Bondi奪槍英雄赴美,與澳媒公開鬧翻,被控“言而無信”!赴美FBI全程陪同

剛剛!Bondi奪槍英雄赴美,與澳媒公開鬧翻,被控“言而無信”!赴美FBI全程陪同

澳洲紅領巾
2026-01-12 13:42:30
俄東正教大牧首稱 不認同國家核心政策的俄羅斯人當屬祖國叛徒

俄東正教大牧首稱 不認同國家核心政策的俄羅斯人當屬祖國叛徒

老馬拉車莫少裝
2026-01-11 08:07:06
48小時里,一連3個壞消息,特朗普氣炸!對中俄連說兩個“必須”

48小時里,一連3個壞消息,特朗普氣炸!對中俄連說兩個“必須”

墨山看客
2026-01-12 14:01:37
才八天就黃了,越南670億高鐵項目崩盤,這次中國不做“冤大頭”

才八天就黃了,越南670億高鐵項目崩盤,這次中國不做“冤大頭”

泠泠說史
2026-01-09 18:58:05
四川一大學迎來一位年輕副校長,僅39歲,履歷優(yōu)秀學歷堪稱天花板

四川一大學迎來一位年輕副校長,僅39歲,履歷優(yōu)秀學歷堪稱天花板

凱旋學長
2026-01-12 12:37:15
百萬網(wǎng)紅疑似感染臟病,被挖出吃抗艾滋的藥,醫(yī)院梅毒的就診記錄

百萬網(wǎng)紅疑似感染臟病,被挖出吃抗艾滋的藥,醫(yī)院梅毒的就診記錄

花哥扒娛樂
2026-01-11 20:48:43
美軍或用對付伊拉克的方法,對付中國?一旦開戰(zhàn),衛(wèi)星肯定不保

美軍或用對付伊拉克的方法,對付中國?一旦開戰(zhàn),衛(wèi)星肯定不保

妙知
2025-12-09 00:16:52
閆學晶“哭窮”后多平臺賬號禁止關注 其代言調(diào)料品牌老總:將向她索賠 不再請明星代言

閆學晶“哭窮”后多平臺賬號禁止關注 其代言調(diào)料品牌老總:將向她索賠 不再請明星代言

紅星新聞
2026-01-10 14:19:18
勇士完?。炖?1+5創(chuàng)紀錄,快船舊將爆發(fā)立功,巴特勒30+7也無奈

勇士完?。炖?1+5創(chuàng)紀錄,快船舊將爆發(fā)立功,巴特勒30+7也無奈

魚崖大話籃球
2026-01-12 12:01:30
瘋傳!王石的瓜,好狗血!

瘋傳!王石的瓜,好狗血!

財經(jīng)要參
2026-01-05 22:13:08
廣東的冷要把老外逼瘋了:8℃比我老家-30℃還難熬

廣東的冷要把老外逼瘋了:8℃比我老家-30℃還難熬

大象新聞
2026-01-12 07:41:04
領導突然問你“要不要考慮去別的崗位”,千萬不要說“我考慮下”,高情商這么回,反客為主!

領導突然問你“要不要考慮去別的崗位”,千萬不要說“我考慮下”,高情商這么回,反客為主!

二胡的歲月如歌
2026-01-03 18:02:12
再次見證歷史!金價,又爆了!

再次見證歷史!金價,又爆了!

三農(nóng)老歷
2026-01-12 12:03:35
降!大降!東莞全市暴跌!

降!大降!東莞全市暴跌!

東莞好生活
2026-01-11 12:57:21
演員閆某晶之子林某霏曾就讀“新疆班”?中戲回應:2012年未招“新疆班”,其以戶籍地北京生源報考

演員閆某晶之子林某霏曾就讀“新疆班”?中戲回應:2012年未招“新疆班”,其以戶籍地北京生源報考

每日經(jīng)濟新聞
2026-01-11 21:14:06
上海一男子泡了3年的人參酒,人參突然長出綠葉!當事人:50度散白酒泡的,鹿鞭味較腥,人參味基本嘗不出來

上海一男子泡了3年的人參酒,人參突然長出綠葉!當事人:50度散白酒泡的,鹿鞭味較腥,人參味基本嘗不出來

臺州交通廣播
2026-01-12 00:34:48
變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個時候的欲言又止

變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個時候的欲言又止

夜深愛雜談
2026-01-09 21:32:55
2026-01-12 14:36:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12096文章數(shù) 142535關注度
往期回顧 全部

科技要聞

小米二手車價大跳水:SU7半年跌5萬元

頭條要聞

臺媒:大陸在朱日和基地復制"總統(tǒng)府" 不可掉以輕心

頭條要聞

臺媒:大陸在朱日和基地復制"總統(tǒng)府" 不可掉以輕心

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學晶:脫離群眾太久 忘了自己的根

財經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項目騙局

汽車要聞

增配不加價 北京現(xiàn)代 第五代 勝達2026款上市

態(tài)度原創(chuàng)

教育
房產(chǎn)
手機
健康
游戲

教育要聞

學霸思維訓練:巧求陰影部分的面積

房產(chǎn)要聞

國家海岸 有鳳來儀|全維實景示范區(qū)首映海棠

手機要聞

消息稱泡泡瑪特本月推“潮玩手機”,或與“年輕化主流品牌”合作

血常規(guī)3項異常,是身體警報!

《P5》外網(wǎng)噴爛引發(fā)熱議 無聊透頂被人高估?

無障礙瀏覽 進入關懷版