国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

RouteMoA:無需預推理的動態(tài)路由,實現(xiàn)高效多智能體混合

0
分享至



本篇論文已被 ACL 2026 接收,主要作者來自上海交通大學自動化與感知學院 IWIN 中心團隊。團隊負責人為關(guān)新平教授,指導老師為陳彩蓮教授和樂心怡教授,合作作者還包括南洋理工大學陶大程教授。其他作者來自騰訊、上海人工智能實驗室、香港中文大學等機構(gòu)。第一作者王驥澤為上海交通大學博士生,研究方向為大模型智能體。

近年來,大語言模型的發(fā)展,正在從 “單模型能力提升” 走向 “多模型協(xié)作”。這是一個很自然的方向:既然不同模型各有所長,有的擅長數(shù)學,有的擅長代碼,有的更懂醫(yī)學,那為什么不讓它們協(xié)同起來,共同解決更復雜的問題?

Mixture-of-Agents(MoA)正是在這樣的背景下提出的。它通過讓多個模型并行生成、逐層交互、反復融合,往往能夠得到比單一模型更強的結(jié)果。問題也很明顯:性能提升的同時,成本和延遲也隨之迅速上升。

在標準 MoA 中,每一輪通常都要調(diào)用多個模型,再基于它們的輸出進行篩選和融合。但究竟該讓哪些模型參與、哪些模型可以跳過,往往缺乏明確的選擇機制。模型越多、層數(shù)越深,整體開銷就越高,在大規(guī)模模型池場景下,系統(tǒng)效率和可擴展性都會面臨很大挑戰(zhàn)。

也正因如此,研究者開始嘗試讓 MoA 變稀疏。例如,一些方法如 Sparse MoA 會先讓模型池中的所有模型生成回答,再通過額外的評審模型進行打分和篩選,只保留一部分模型進入后續(xù)協(xié)作。這樣雖然減少了后續(xù)融合的負擔,但本質(zhì)上仍然繞不開一個問題:為了決定該選誰,系統(tǒng)還是得先讓所有模型都推理一遍。

于是,這篇工作的核心問題就變得非常直接:我們真的需要先讓所有模型都回答一遍,才能決定該選誰嗎?



  • 論文標題:RouteMoA: Dynamic Routing without Pre-Inference Boosts Efficient Mixture-of-Agents
  • 論文鏈接:https://arxiv.org/abs/2601.18130
  • 代碼鏈接:https://github.com/Jize-W/RouteMoA

一句話總結(jié):RouteMoA 的核心思想是,通過在推理前進行模型能力預測,避免對所有模型進行無效推理。





現(xiàn)有方法的問題:

效率瓶頸不在融合,而在全量推理

當前 MoA 系列方法的一個共同假設(shè)是:要判斷哪個模型更好,必須先看到它的輸出。因此,無論是經(jīng)典 MoA,還是引入 judge 的 Sparse MoA,本質(zhì)上都繞不開一個步驟:所有模型先推理 -> 再篩選 -> 再融合。

這帶來兩個問題:

第一,計算成本無法下降。即使最后只用少數(shù)模型,前面已經(jīng)為所有模型付出了推理代價。

第二,難以擴展到大模型池。當模型數(shù)量增加時,全量推理會迅速變得不可承受,甚至超出上下文限制。

也就是說,瓶頸并不在 “如何選”,而在 “選之前已經(jīng)太貴了”。

RouteMoA:

把 “選模型” 前移到推理之前



RouteMoA 的關(guān)鍵創(chuàng)新,是把模型選擇從 “后驗判斷” 變成 “先驗預測 + 輕量修正”。

整個流程可以分為三個步驟:

1. 先驗篩選:不推理,也能判斷誰更可能做對

RouteMoA 引入了一個輕量級 scorer,只根據(jù)用戶 query,就預測每個模型的潛在表現(xiàn)。這個過程不需要調(diào)用大模型推理,只做一個粗粒度打分,把模型池縮小到一個潛力子集。本質(zhì)上,這是在做一件過去被忽略的事情:用 query 本身的信息,提前判斷模型能力匹配度。

2. 后驗修正:用已有輸出做低成本評審

初篩不可避免會有誤差,因此 RouteMoA 引入了 mixture-of-judges:

  • self-assessment:模型對自己的答案打分
  • cross-assessment:高質(zhì)量模型評估其他模型

關(guān)鍵在于:這些評估只基于已經(jīng)生成的輸出,不引入額外推理調(diào)用。也就是說,系統(tǒng)通過已有信息進行糾錯,而不是再算一輪。

3. 綜合排序:性能、成本、延遲一起優(yōu)化

最終,RouteMoA 在模型選擇時不僅僅考慮性能,而是同時考慮:

  • 輸出質(zhì)量
  • token 成本
  • 推理延遲

從而在實際系統(tǒng)中實現(xiàn)一個更接近工程最優(yōu)的決策,而不是單純追求 accuracy。

實驗結(jié)果:

少花 90% 的錢,反而更強

在包含 15 個模型的大規(guī)模模型池實驗中,RouteMoA 的結(jié)果非常直觀:

  • 成本降低 89.8%
  • 延遲降低 63.6%
  • 同時整體準確率相對 MoA 和 SMoA 有所提升

這說明一件事:減少無效計算,不僅不會傷害性能,反而會讓系統(tǒng)更專注于對的模型。



一個關(guān)鍵洞察:

多模型系統(tǒng)的本質(zhì)是稀疏的

論文中一個非常重要的觀察是:在絕大多數(shù) query 上,真正關(guān)鍵的模型只占少數(shù)。只要初始階段能把這些模型保留下來,后續(xù)協(xié)作就足以放大正確答案。實驗中,scorer 在 Top-3 內(nèi)命中正確模型的概率接近 98%,這意味著:系統(tǒng)并不需要看所有答案,只需要別漏掉對的模型。

進一步分析:

失敗不在選錯模型,而在融合階段



一個很有意思的發(fā)現(xiàn)是,在失敗案例中:

  • 超過 50% 的錯誤來自最終答案融合(aggregation drift)
  • 而真正因為選錯模型的比例要低得多

可見,多模型系統(tǒng)的瓶頸正在發(fā)生轉(zhuǎn)移:從 “選誰來回答”,轉(zhuǎn)向 “如何整合多個答案”。

總結(jié):多模型時代,調(diào)度很重要

RouteMoA 的意義,并不只是一個更高效的 MoA 變體,而是提供了一種新的范式:

  • 不再默認所有模型都要參與
  • 而是先判斷誰值得參與
  • 再用協(xié)作機制校正和放大正確答案

換句話說,隨著多模型協(xié)作的興起,系統(tǒng)層的調(diào)度與協(xié)同,正變得與模型能力同樣重要。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
廣東男籃出發(fā)北京!陳家政、黃明依隨隊,杜鋒或調(diào)整12人大名單

廣東男籃出發(fā)北京!陳家政、黃明依隨隊,杜鋒或調(diào)整12人大名單

籃球大陸
2026-05-05 09:29:32
4月車市,誰吃肉誰喝湯?

4月車市,誰吃肉誰喝湯?

鳳凰網(wǎng)財經(jīng)
2026-05-03 19:05:56
吳宜澤奪冠后發(fā)文,分享身披國旗、親吻獎杯照片,蘭州吳宜澤臺球俱樂部回應:正籌備慶祝活動,后續(xù)還能線下見面

吳宜澤奪冠后發(fā)文,分享身披國旗、親吻獎杯照片,蘭州吳宜澤臺球俱樂部回應:正籌備慶?;顒樱罄m(xù)還能線下見面

極目新聞
2026-05-05 13:09:19
“木頭姐”頂著暴跌強行抄底!4000萬美元殺入金融科技股

“木頭姐”頂著暴跌強行抄底!4000萬美元殺入金融科技股

新浪財經(jīng)
2026-05-05 11:52:59
禁產(chǎn)十年再回看!賓陽和瀏陽,兩條路結(jié)局天差地別

禁產(chǎn)十年再回看!賓陽和瀏陽,兩條路結(jié)局天差地別

娛樂洞察點點
2026-05-05 12:13:06
卡里克談謝什科中場被換下;庫尼亞:即將加盟的球員都知道曼聯(lián)是唯一選擇

卡里克談謝什科中場被換下;庫尼亞:即將加盟的球員都知道曼聯(lián)是唯一選擇

MUREDS
2026-05-04 23:43:42
吳石案揭露:為何三人獲烈士稱號,聶曦卻被排除?

吳石案揭露:為何三人獲烈士稱號,聶曦卻被排除?

鑒史錄
2026-05-04 10:25:18
曼城13分鐘崩盤:冠軍經(jīng)驗為何失效了

曼城13分鐘崩盤:冠軍經(jīng)驗為何失效了

體壇觀察猿
2026-05-05 15:30:06
賴清德返臺獲4架F-16護航,解放軍或有軍事大動作

賴清德返臺獲4架F-16護航,解放軍或有軍事大動作

真正能保護你的
2026-05-05 16:26:24
黑龍江“頭號女殺手”蘇紅,7年殺害4人藏尸菜窖,常年開燈睡覺

黑龍江“頭號女殺手”蘇紅,7年殺害4人藏尸菜窖,常年開燈睡覺

莫地方
2026-05-05 00:04:32
5月車市“神仙打架”!這10款大六/七座SUV殺瘋了,最高純電950km

5月車市“神仙打架”!這10款大六/七座SUV殺瘋了,最高純電950km

侃故事的阿慶
2026-05-04 14:57:34
已婚女性出軌自述:兩個真實案例

已婚女性出軌自述:兩個真實案例

時光慢郵啊
2026-05-04 11:50:18
俄羅斯挖出千年古墓,墓主竟是中國名將,一代戰(zhàn)神為何葬身異鄉(xiāng)

俄羅斯挖出千年古墓,墓主竟是中國名將,一代戰(zhàn)神為何葬身異鄉(xiāng)

抽象派大師
2026-05-05 15:36:55
韓專家金在吉:中國文化歷史不是上下5000年,韓國古代屬于中國

韓專家金在吉:中國文化歷史不是上下5000年,韓國古代屬于中國

抽象派大師
2026-05-05 15:24:18
廣東今明大部多云間陰天,局部有陣雨!后天弱冷空氣逼近南嶺

廣東今明大部多云間陰天,局部有陣雨!后天弱冷空氣逼近南嶺

南方都市報
2026-05-05 12:16:05
王晶沒撒謊!退出春晚、和沈騰決裂,性格大變的賈玲印證他說的話

王晶沒撒謊!退出春晚、和沈騰決裂,性格大變的賈玲印證他說的話

胡一舸南游y
2026-01-25 14:54:04
特斯拉 Model Y 將大改款?網(wǎng)傳有 5 項升級,每個都是車主想要的!

特斯拉 Model Y 將大改款?網(wǎng)傳有 5 項升級,每個都是車主想要的!

新浪財經(jīng)
2026-05-04 22:51:52
55年韓先楚擬授中將軍銜,毛主席得知后直言:別忘了在海南的功勞

55年韓先楚擬授中將軍銜,毛主席得知后直言:別忘了在海南的功勞

涼州辭
2026-05-05 15:50:03
謝賢前女友回應分手原因:一次爬山的時候,謝賢意識到與她的差距

謝賢前女友回應分手原因:一次爬山的時候,謝賢意識到與她的差距

韓小娛
2026-05-03 10:20:58
中美放下電話,不到24小時,聯(lián)合國傳來重要消息,中方身份變了

中美放下電話,不到24小時,聯(lián)合國傳來重要消息,中方身份變了

健身狂人
2026-05-04 20:03:17
2026-05-05 17:08:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12917文章數(shù) 142642關(guān)注度
往期回顧 全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設(shè)備處理器

頭條要聞

伊朗警告阿聯(lián)酋:勿當以色列棋子 否則將得到難忘教訓

頭條要聞

伊朗警告阿聯(lián)酋:勿當以色列棋子 否則將得到難忘教訓

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

英皇25周年演唱會 張敬軒被救護車拉走

財經(jīng)要聞

五一假期,中國年輕人的“首爾病”犯了

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

游戲
房產(chǎn)
親子
本地
公開課

“百萬元”買不到國產(chǎn)大作的廁所!玩家:美少女不需要

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

親子要聞

吃糖對孩子的危害不只是牙齒!家長一定要注意

本地新聞

用青花瓷的方式,打開西溪濕地

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版