国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

單個LLM已不夠?華盛頓大學開源多模型協(xié)同框架MoCo

0
分享至



在訓練與開發(fā)單個通用大語言模型 (LLM) 之外,越來越多的研究開始關注多模型協(xié)同(model collaboration):由不同群體、基于不同數(shù)據(jù)、以不同目的訓練的多個大語言模型,通過多樣化的協(xié)同算法與系統(tǒng)架構,形成組合式人工智能系統(tǒng)。

多個模型可以通過路由算法而因材施用,通過生成文本相互溝通協(xié)作,或是在概率分布或模型參數(shù)空間做協(xié)同運算…… 各種各樣的多模型協(xié)同研究共同揭示了一種 AI 新未來的可能:由去中心化訓練的多樣化小模型通過協(xié)同算法構建模塊化、組合式的 AI 系統(tǒng),使得人人都能參與共建一種不為任何人單獨所有的公共人工智能系統(tǒng)。

為了支持多模型協(xié)同研究并加速這一未來愿景的實現(xiàn),華盛頓大學 (University of Washington) 馮尚彬團隊聯(lián)合斯坦福大學、哈佛大學等研究人員提出MoCo—— 一個針對多模型協(xié)同研究的 Python 框架。MoCo 支持 26 種在不同層級實現(xiàn)多模型交互的算法,研究者可以靈活自定義數(shù)據(jù)集、模型以及硬件配置,比較不同算法,優(yōu)化自身算法,以此構建組合式人工智能系統(tǒng)。MoCo 為設計、評估與分享新的模型協(xié)同算法、組合式智能以及協(xié)同開發(fā)策略提供了重要基礎。



  • 論文標題:MoCo: A One-Stop Shop for Model Collaboration Research
  • 論文鏈接:https://arxiv.org/abs/2601.21257
  • 代碼鏈接:https://github.com/BunsenFeng/model_collaboration

多模型協(xié)同算法

多模型協(xié)同算法按模型間信息傳遞的層級主要分為以下四大類:

  • API 層級(API-level collaboration):多個模型如同多個備選的 API,根據(jù)不同任務與需求選擇不同的模型。主要方法包括 routing、cascading、switched generation 等。
  • 文本層級(Text-level collaboration):多個模型通過生成文本的交互而協(xié)作,從而分工解決問題、優(yōu)化模型輸出。主要方法包括 debate、feedback、response aggregation、structured interaction 等。
  • logit 層級(Logit-level collaboration):多個模型的 next-token distribution 之間進行代數(shù)運算,再根據(jù)共同的 distribution 進行 decoding 以生成文本。主要方法包括 logit aggregation、contrast 等。
  • 權重層級(Weight-level collaboration):多個模型在權重空間進行信息傳遞與交互,以獲得對當前任務更有效的新模型或系統(tǒng)。主要方法包括 model merging、parameter arithemetic 等。

MoCo 框架當前支持來自四個層級的 26 種多模型協(xié)同算法,便于研究人員在統(tǒng)一標準下對多模型協(xié)同算法進行評測,并為拓展新思路、設計新方法奠定堅實基礎。



MoCo 框架

現(xiàn)有的多模型協(xié)同研究大多分散在不同的代碼庫中且各自使用不同的訓練與推理框架,這對系統(tǒng)性研究與對比多模型協(xié)同算法造成了很大的阻礙。MoCo 匯集眾多模型協(xié)同研究者的力量,將多樣的方法統(tǒng)合到一個框架與 Python package 中。

使用 MoCo 非常簡便:下載代碼庫或通過 pip install modelco 安裝 Python 包,通過 config 文件設置參與協(xié)同的模型、目標數(shù)據(jù)集、硬件配置以及各類超參數(shù),再通過一個命令就能執(zhí)行從簡單到復雜的各式協(xié)同算法。



MoCo 自帶 25 個評估數(shù)據(jù)集,囊括問答、數(shù)學、推理、代碼、安全等應用場景,而用戶也可輕松引入自己的評估數(shù)據(jù)集,或者僅用 MoCo 生成回答而另做評估。

MoCo 中的絕大部分算法采用了極為靈活的實現(xiàn)方式,支持任何數(shù)量的任何模型通過任何數(shù)量的常見 GPU 進行執(zhí)行,從而使得小模型與少資源的研究場景也被充分支持。

MoCo 支持下的新發(fā)現(xiàn)

基于 MoCo 提供的靈活實現(xiàn),我們擴大模型協(xié)同系統(tǒng)的規(guī)模,以期找出其 scaling laws。將模型的數(shù)量從 2 個一路擴充至 16 個,我們發(fā)現(xiàn)普遍的向上趨勢:這揭示了一種新的 AI system 的可能性,即很多小模塊自底向上組成大系統(tǒng)。

除了擴大規(guī)模之外,我們也探討在同等規(guī)模的情況下,模型多樣性的作用。我們發(fā)現(xiàn)在模型數(shù)量均為 8 的情況下,8 個多樣的 LLM 協(xié)作顯著優(yōu)于 8 個同質(zhì)的 LLM 協(xié)作,揭示了多個模型之間取長補短、互相成就的重要性。



我們還發(fā)現(xiàn)多模型協(xié)作系統(tǒng)能夠解決此前單一模型所不能解決的問題。實驗結果表明,在所有單一模型都不能解決的問題中,其協(xié)同系統(tǒng)平均能夠解決 18.5% 的問題。這也揭示了模型協(xié)作不僅僅是簡單的能力并集,而是在交互的過程中涌現(xiàn)了單一模型所不具有的能力。



歡迎您的貢獻

如果您在研究工作中探索或提出過多個大語言模型協(xié)同的算法,歡迎聯(lián)系作者團隊將您的算法加入 MoCo。我們衷心希望通過更多研究人員的參與和貢獻,將模型協(xié)同打造成一種獨特的方法論,為模塊化、組合式、去中心化以及共同開發(fā)的未來 AI 系統(tǒng)添磚加瓦。

作者介紹:馮尚彬是美國華盛頓大學 (University of Washington) 計算機系博士生,導師為 Dr. Yulia Tsvetkov。他的研究曾獲得 ACL 2023 最佳論文獎、ACL 2024 杰出論文獎、the IBM PhD Fellowship、the Jane Street Graduate Research Fellowship、百度獎學金、the NVIDIA Graduate Fellowship。本文的共同第一作者還包括德州農(nóng)工大學的白雨洋同學以及華盛頓大學的楊梓源同學。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
云南一男子刷朋友圈得知彩票店出了超級大獎,一看中獎者竟是自己:喜中669萬元,準備先還房貸

云南一男子刷朋友圈得知彩票店出了超級大獎,一看中獎者竟是自己:喜中669萬元,準備先還房貸

深圳晚報
2026-02-26 12:36:31
中華人民共和國和德意志聯(lián)邦共和國聯(lián)合新聞聲明

中華人民共和國和德意志聯(lián)邦共和國聯(lián)合新聞聲明

新華社
2026-02-25 21:46:25
馬刺逆轉雙殺猛龍豪取10連勝 文班12+8+5帽鶯歌20+11丟絕平球

馬刺逆轉雙殺猛龍豪取10連勝 文班12+8+5帽鶯歌20+11丟絕平球

醉臥浮生
2026-02-26 11:12:28
女子嘴角長水泡沒重視 當晚被宣告腦死亡

女子嘴角長水泡沒重視 當晚被宣告腦死亡

閃電新聞
2026-02-26 15:27:39
小學階段的大實話:小學差的,那是真的差,基本沒有逆襲的可能

小學階段的大實話:小學差的,那是真的差,基本沒有逆襲的可能

好爸育兒
2026-02-25 19:22:49
歐洲一超豪華車企入不敷出,將裁員20%

歐洲一超豪華車企入不敷出,將裁員20%

第一財經(jīng)資訊
2026-02-25 20:58:56
吏部尚書、兵部尚書、戶部尚書,三者相比,誰在實權上更勝一籌?

吏部尚書、兵部尚書、戶部尚書,三者相比,誰在實權上更勝一籌?

掠影后有感
2026-02-26 11:28:52
中國禁止手機搭載WiFi的禁令,為何無疾而終了?

中國禁止手機搭載WiFi的禁令,為何無疾而終了?

真的好愛你
2026-02-25 00:53:59
劉少昂女友曬照力挺:我看到你的付出!她曾是花滑運動員身材曼妙

劉少昂女友曬照力挺:我看到你的付出!她曾是花滑運動員身材曼妙

Emily說個球
2026-02-26 12:35:25
巴強硬接管港口后,美媒得意忘形,話音剛落,中方反手掐住七寸!

巴強硬接管港口后,美媒得意忘形,話音剛落,中方反手掐住七寸!

午夜搭車a
2026-02-26 03:08:34
張扣扣走了七年,他父親的手機還在坐牢

張扣扣走了七年,他父親的手機還在坐牢

鄧學平律師
2026-02-25 16:51:53
極氪公布春節(jié)十大獵裝旅行路線,揭秘深度自駕游版圖

極氪公布春節(jié)十大獵裝旅行路線,揭秘深度自駕游版圖

魯中晨報
2026-02-26 12:29:41
沉默整整9天,毛寧一錘定音,中美戰(zhàn)機已交手,美方要見中國代表

沉默整整9天,毛寧一錘定音,中美戰(zhàn)機已交手,美方要見中國代表

聚焦真實瞬間
2026-02-26 10:09:37
給領導送禮,這4種行為最招厭,送了不如不送

給領導送禮,這4種行為最招厭,送了不如不送

第一管理
2026-02-25 15:51:03
A股:大家要做好準備,明天(2月27日),股市或將這樣變化

A股:大家要做好準備,明天(2月27日),股市或將這樣變化

財經(jīng)大拿
2026-02-26 14:11:37
哈登重傷!騎士爆冷惜敗,施羅德26分,阿倫27+11,一戰(zhàn)看穿3件事

哈登重傷!騎士爆冷惜敗,施羅德26分,阿倫27+11,一戰(zhàn)看穿3件事

籃球掃地僧
2026-02-26 17:53:36
在縣城,“月薪三千”屬于高工資

在縣城,“月薪三千”屬于高工資

星海情報局
2026-02-26 11:17:25
梅婷過年請“德華”劉琳到家做客,烤肉做海鮮湯,家里又大又敞亮

梅婷過年請“德華”劉琳到家做客,烤肉做海鮮湯,家里又大又敞亮

離離言幾許
2026-02-26 12:39:31
以前日本對中國是有用的,你就算再挑釁中國,有個臺階中國就下了

以前日本對中國是有用的,你就算再挑釁中國,有個臺階中國就下了

阿萊美食匯
2026-02-26 18:14:48
美軍活捉馬杜羅細節(jié)曝光:機師中彈四次強行降落,獲頒榮譽勛章!

美軍活捉馬杜羅細節(jié)曝光:機師中彈四次強行降落,獲頒榮譽勛章!

像夢一場a
2026-02-26 14:00:03
2026-02-26 19:28:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12368文章數(shù) 142569關注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

金與正"轉正"了 戴著黑白色發(fā)箍坐在候補委員的第一位

頭條要聞

金與正"轉正"了 戴著黑白色發(fā)箍坐在候補委員的第一位

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

人民幣離岸價升破6.83 什么原因?

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

藝術
游戲
時尚
數(shù)碼
手機

藝術要聞

趙孟頫珍藏的一部《金剛經(jīng)》,曾是南宋皇家至寶,這才叫“最美中國字”!

Xbox用戶遭短信轟炸 官方道歉稱Xbox APP過于熱情

無論幾歲,好心態(tài)萬歲!

數(shù)碼要聞

英特爾發(fā)布8531顯卡驅動,支持《生化危機:安魂曲》等游戲

手機要聞

OPPO Find X9 Ultra四月見:首發(fā)史上最強10倍光變 機圈望遠鏡

無障礙瀏覽 進入關懷版