国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Parallel-Probe問世,并行推理效率提升35.8%

0
分享至



當(dāng)大模型推理進(jìn)入Parallel Thinking時代,一個關(guān)鍵問題隨之出現(xiàn):

模型在并行推理的過程中,究竟發(fā)生了什么?多條推理路徑同時展開,看似為模型帶來了更強(qiáng)的能力,卻也引入了一個長期被忽視的問題——大量計(jì)算是否正在被浪費(fèi)在已經(jīng)「沒有必要繼續(xù)」的思考上?

為了回答這一問題,來自馬里蘭大學(xué)、圣路易斯華盛頓大學(xué)、北卡羅來納大學(xué)教堂山分校等機(jī)構(gòu)的研究團(tuán)隊(duì)提出了Parallel-Probe。不同于直接從算法設(shè)計(jì)出發(fā),該研究首先通過引入2D Probing,對 online 并行推理過程中的全局動態(tài)性進(jìn)行了系統(tǒng)性刻畫。研究發(fā)現(xiàn),并行推理并非一個「算得越多越好」的過程:全局共識往往在所有分支結(jié)束之前就已提前穩(wěn)定,而少數(shù)冗長的長尾路徑卻持續(xù)占據(jù)大量計(jì)算資源,成為并行推理效率的主要瓶頸。

基于這些關(guān)鍵發(fā)現(xiàn),研究團(tuán)隊(duì)進(jìn)一步提出了一個 training-free 的并行推理控制算法 Parallel-Probe,能夠在不犧牲核心準(zhǔn)確率的前提下,顯著減少無效計(jì)算,將推理延遲降低35.8%,總 token 成本降低25.8%。



  • 論文名稱:Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing
  • 論文鏈接:
  • https://arxiv.org/pdf/2602.03845
  • Code:
  • https://github.com/zhengkid/Parallel-Probe
  • Online Judge:
  • https://huggingface.co/spaces/EfficientReasoning/efficient_reasoning_online_judgement

核心痛點(diǎn):孤立的

「并行路徑」到底帶來了什么?

目前的并行推理方法(如多數(shù)投票機(jī)制)存在一個顯著缺陷:各推理分支彼此獨(dú)立。這意味著,即使大部分分支已經(jīng)達(dá)成了共識,系統(tǒng)仍需等待所有分支(包括那些冗余的長尾路徑)全部生成完畢。



研究人員提出,這種「局部視角」導(dǎo)致了嚴(yán)重的效率低下。通過系統(tǒng)2D 探測接口,研究團(tuán)隊(duì)揭示了并行推理的三大底層動態(tài)特征:

  • 非單調(diào)縮放:準(zhǔn)確率并非隨著算力投入單調(diào)增加,而是取決于「寬度」與「深度」的精細(xì)平衡(Figure (a))。
  • 路徑長度不均:并行分支的生成長度差異極大,計(jì)算資源往往被少數(shù)「長尾」路徑占據(jù)(Figure (b))。
  • 共識提早穩(wěn)定:全局共識往往在所有分支結(jié)束前就已經(jīng)達(dá)成(平均共識達(dá)成率僅為 0.31)(Figure (c))。

技術(shù)突破:基于全局信號的

「外科手術(shù)式」 2D Budget Control

即插即用:Parallel-Probe 是一種模型無關(guān)的方法,可直接適配各種現(xiàn)成的開源或閉源大語言模型。



針對上述發(fā)現(xiàn),Parallel-Probe采用了一種 Training-Free 的輕量級控制器,通過兩個核心機(jī)制優(yōu)化同時從寬度和深度優(yōu)化在線并行思考:

  • 基于共識的早期停止(Consensus-based Early Stopping):該機(jī)制周期性地從各分支中提取中間結(jié)果。一旦探測到全局多數(shù)答案在連續(xù)幾個周期內(nèi)保持穩(wěn)定,控制器將直接終止整組推理,避免后續(xù)冗余步驟。

  • 基于偏差的分支剪枝(Deviation-based Branch Pruning):實(shí)時監(jiān)控每一條路徑。如果某條路徑顯著偏離了當(dāng)前的全局大趨勢(即出現(xiàn)異常),系統(tǒng)會果斷對其進(jìn)行「剔除」,將資源傾注在更有潛力的路徑上。

實(shí)驗(yàn)結(jié)果:刷新帕累托前

研究團(tuán)隊(duì)在Qwen3系列模型(0.6B 至 8B)上進(jìn)行了廣泛測試,涵蓋了 AIME 2024/2025 和 HMMT 2025 等高難度競賽題庫。



實(shí)驗(yàn)結(jié)果表明,Parallel-Probe 在性能、成本效率和延遲效率之間建立了更優(yōu)的平衡點(diǎn),系統(tǒng)性地優(yōu)于現(xiàn)有的 ESC 和 SC 等基準(zhǔn)方法。

基礎(chǔ)設(shè)施貢獻(xiàn):SCOUT 測試床

為了推動該領(lǐng)域的持續(xù)研究,團(tuán)隊(duì)還推出了SCOUT(順序與并發(fā)離線利用測試床)。該平臺實(shí)現(xiàn)了推理生成與控制策略的解耦,允許開發(fā)者在極低開銷下模擬各種縮放策略,極大提升了測試效率。



代碼及 Online Judge 平臺已開源:

  • GitHub:
  • https://github.com/zhengkid/Parallel-Probe
  • 平臺:Efficient Reasoning Online Judge

本文作者

鄭童,馬里蘭大學(xué)計(jì)算機(jī)科學(xué)系二年級博士生,研究方向聚焦于Reasoning尤其是Parallel Thinking(并行思考)。他的研究關(guān)注如何打破傳統(tǒng)順序推理在效率與魯棒性上的瓶頸,使大語言模型能夠以更結(jié)構(gòu)化、更高效的方式進(jìn)行并行推理。代表性工作包括Parallel-R1,該工作首次提出基于強(qiáng)化學(xué)習(xí)的框架,在真實(shí)世界推理任務(wù)中自適應(yīng)地激勵并行思考行為;以及MoT(Mixture of Thoughts),系統(tǒng)性地構(gòu)建多推理模態(tài)的并行思考機(jī)制,在訓(xùn)練與推理階段統(tǒng)一整合自然語言、代碼與符號推理等不同模態(tài),從而實(shí)現(xiàn)更高效、更具表達(dá)力的并行推理。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
兩會新華鮮報|這些小事得到回應(yīng)!高質(zhì)量司法守護(hù)高品質(zhì)生活

兩會新華鮮報|這些小事得到回應(yīng)!高質(zhì)量司法守護(hù)高品質(zhì)生活

新華社
2026-03-09 23:46:17
“養(yǎng)龍蝦”狂潮來了:一款開源AI如何攪動資本、產(chǎn)業(yè)與政策

“養(yǎng)龍蝦”狂潮來了:一款開源AI如何攪動資本、產(chǎn)業(yè)與政策

國際金融報
2026-03-10 11:47:38
值得珍藏:電力+衛(wèi)星互聯(lián)網(wǎng)+光刻機(jī)+商業(yè)航天+英偉達(dá)+硅+半導(dǎo)體等

值得珍藏:電力+衛(wèi)星互聯(lián)網(wǎng)+光刻機(jī)+商業(yè)航天+英偉達(dá)+硅+半導(dǎo)體等

Thurman在昆明
2026-03-10 00:16:42
如果你買的是小米汽車,那么恭喜你,百分百是“純血”小米!

如果你買的是小米汽車,那么恭喜你,百分百是“純血”小米!

i王石頭
2026-03-08 23:26:37
喜歡把家里打掃得很干凈的人,往往會有這3種命運(yùn),很準(zhǔn)!

喜歡把家里打掃得很干凈的人,往往會有這3種命運(yùn),很準(zhǔn)!

品讀時刻
2026-02-12 00:06:27
“龍蝦補(bǔ)貼”密集出爐:龍崗、合肥、常熟、無錫…最高1000萬!

“龍蝦補(bǔ)貼”密集出爐:龍崗、合肥、常熟、無錫…最高1000萬!

華爾街見聞官方
2026-03-10 14:41:43
兒科醫(yī)生不光會看病更得會斷案!網(wǎng)友:嘴巴跟不上腦子的速度

兒科醫(yī)生不光會看病更得會斷案!網(wǎng)友:嘴巴跟不上腦子的速度

夜深愛雜談
2026-03-09 21:19:47
注資20億元!寧德時代落子泉州!計(jì)劃二季度開工!

注資20億元!寧德時代落子泉州!計(jì)劃二季度開工!

泉州熱榜
2026-03-10 11:06:54
納斯:馬克西精神狀態(tài)良好 本周將去看??漆t(yī)生確定治療方案

納斯:馬克西精神狀態(tài)良好 本周將去看??漆t(yī)生確定治療方案

北青網(wǎng)-北京青年報
2026-03-10 19:23:36
皇馬新帥候選?波切蒂諾:傳聞一直都會有,這種情況很正常

皇馬新帥候選?波切蒂諾:傳聞一直都會有,這種情況很正常

懂球帝
2026-03-11 02:05:13
新一代寶馬3系外觀預(yù)覽 隱藏式門把手 這個顏值打幾分?

新一代寶馬3系外觀預(yù)覽 隱藏式門把手 這個顏值打幾分?

CNMO科技
2026-03-10 14:06:10
馬克龍:派出10艘軍艦

馬克龍:派出10艘軍艦

環(huán)球時報國際
2026-03-11 00:08:58
負(fù)債后別再以貸養(yǎng)貸!3 個動作切斷債務(wù)滾雪球,幫你快速止損

負(fù)債后別再以貸養(yǎng)貸!3 個動作切斷債務(wù)滾雪球,幫你快速止損

負(fù)債老莫
2026-03-09 19:23:11
特朗普稱伊朗也有戰(zhàn)斧導(dǎo)彈

特朗普稱伊朗也有戰(zhàn)斧導(dǎo)彈

界面新聞
2026-03-10 08:51:57
北京炒股冠軍罕見發(fā)聲:炒股其實(shí)很簡單,只是沒有人愿意慢慢變富

北京炒股冠軍罕見發(fā)聲:炒股其實(shí)很簡單,只是沒有人愿意慢慢變富

股經(jīng)縱橫談
2026-03-10 20:38:58
飛奪瀘定橋英雄團(tuán)長高燒后舉槍自盡,多年后楊成武表示:并非自盡

飛奪瀘定橋英雄團(tuán)長高燒后舉槍自盡,多年后楊成武表示:并非自盡

章潱解說體育
2026-03-09 16:06:45
中國退無可退,美軍已選好他們的主戰(zhàn)場,正逼著我們跳進(jìn)戰(zhàn)爭陷阱

中國退無可退,美軍已選好他們的主戰(zhàn)場,正逼著我們跳進(jìn)戰(zhàn)爭陷阱

南權(quán)先生
2026-03-02 15:26:15
被人當(dāng)傻子是什么體驗(yàn)?網(wǎng)友:天王老子來了,我也只給100

被人當(dāng)傻子是什么體驗(yàn)?網(wǎng)友:天王老子來了,我也只給100

夜深愛雜談
2026-03-10 21:17:15
不顧央視警告頂風(fēng)作案,與劉濤傳出緋聞的楊爍,到底是誰給的底氣

不顧央視警告頂風(fēng)作案,與劉濤傳出緋聞的楊爍,到底是誰給的底氣

白色得季節(jié)
2026-03-10 23:59:39
柳某、王某等4人被西安警方查獲

柳某、王某等4人被西安警方查獲

91.6陜西交通廣播
2026-03-10 08:09:25
2026-03-11 03:07:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12467文章數(shù) 142581關(guān)注度
往期回顧 全部

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

體育要聞

加蘭沒那么差,但鱸魚會用嗎?

娛樂要聞

《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷

財(cái)經(jīng)要聞

“龍蝦補(bǔ)貼”密集出爐 最高1000萬!

汽車要聞

MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

態(tài)度原創(chuàng)

家居
本地
時尚
數(shù)碼
教育

家居要聞

自然肌理 溫度質(zhì)感婚房

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

看來看去這些才是適合普通人的穿搭!不花哨、不繁瑣,提氣質(zhì)

數(shù)碼要聞

M5 Max 版 16 英寸 MacBook Pro 體驗(yàn):算力巔峰與專業(yè)視界

教育要聞

南京十三中發(fā)來邀請函!

無障礙瀏覽 進(jìn)入關(guān)懷版