国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

告別昂貴賬單,Token直降68%,多智能體動(dòng)態(tài)協(xié)作編程來了

0
分享至



本文的主要作者來自上海交通大學(xué)自動(dòng)化與感知學(xué)院 i-WiN 中心團(tuán)隊(duì),團(tuán)隊(duì)負(fù)責(zé)人是上海交通大學(xué)講席教授關(guān)新平。本文的通訊作者為 i-WiN 中心陳彩蓮教授和關(guān)新平教授,指導(dǎo)老師還包括中心的許齊敏副研究員、徐磊和張延洲助理研究員。本文的第一作者為上海交通大學(xué)博士生王思宇,研究方向涉及多模態(tài)大模型、CAD 生成、多智能體、Agentic RL 等。

在當(dāng)下 Vibe Coding 火熱的背景下,軟件開發(fā)正迅速從 “人寫代碼” 轉(zhuǎn)向 “人指揮智能體寫代碼”。以 Claude Code、OpenClaw 為代表的系統(tǒng),讓智能體能夠自主完成編碼、調(diào)試乃至完整任務(wù)流程。然而,面對系統(tǒng)級開發(fā)或競賽級算法等復(fù)雜問題,單一模型的能力邊界依然明顯,多智能體協(xié)作逐漸成為主流范式

但現(xiàn)有方法大多仍停留在兩種典型路徑。一類如 Claude Code 的Agent Teams,通過并行調(diào)用多個(gè)模型來提升能力上限,但也帶來了極高的 Token 成本;另一類則以當(dāng)下熱門的 OpenClaw 為代表,通過技能組合與流程編排實(shí)現(xiàn)多智能體管理,在工程上更可控。

然而,這類方法的協(xié)作結(jié)構(gòu)大多仍依賴預(yù)定義規(guī)則或靜態(tài)流程,本質(zhì)上解決的是 “如何組織調(diào)用”,而非 “如何根據(jù)任務(wù)動(dòng)態(tài)調(diào)整協(xié)作方式”。這就像不論修自行車還是造火箭,都派同一個(gè)十人專家組開三天會,導(dǎo)致智能體冗余通訊與大量的 Token 消耗,最終給用戶帶來了極高的自主編程成本

上海交通大學(xué) i-WiN 團(tuán)隊(duì)最新提出多智能體框架AgentConductor,通過引入一個(gè)經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練后的3B 參數(shù)指揮智能體,從根本上解決了這個(gè)問題。它會先評估任務(wù)難度,并生成一張以 YAML 表示的交互拓?fù)鋱D:簡單任務(wù)使用輕量團(tuán)隊(duì),復(fù)雜任務(wù)則使用更復(fù)雜的交互圖,實(shí)現(xiàn)能力與成本的自適應(yīng)匹配。



圖 1.(a) 拓?fù)浣Y(jié)構(gòu)的 YAML 表示與實(shí)際圖結(jié)構(gòu)的映射;(b) AgentConductor 拓?fù)渖膳c演化過程展示

更關(guān)鍵的是,AgentConductor 并非一次性規(guī)劃:當(dāng)生成代碼運(yùn)行失敗時(shí),指揮智能體會根據(jù)環(huán)境反饋的錯(cuò)誤信息,結(jié)合記憶中的歷史軌跡,對拓?fù)溥M(jìn)行端到端重新生成,從而探索新的協(xié)作形式。實(shí)驗(yàn)結(jié)果表明,該方法在顯著提升編碼準(zhǔn)確率(+14.6%)的同時(shí),將 Token 成本降低了 68%。這說明真正高效的 AI 編程團(tuán)隊(duì)需要的是一種面向任務(wù)、可隨執(zhí)行反饋動(dòng)態(tài)演化的協(xié)作結(jié)構(gòu),而非僵化的一刀切工作流。相關(guān)論文已經(jīng)公開,代碼將于近期開源。



  • 論文名稱:AgentConductor: Topology Evolution for Multi-Agent Competition-Level Code Generation
  • 論文鏈接:https://arxiv.org/abs/2602.17100

社區(qū)影響力

圖 2 展示了 AgentConductor 工作在國際 AI 社區(qū) (X, 前身 Twitter) 引發(fā)的廣泛關(guān)注與認(rèn)可。這項(xiàng)工作被知名 AI 分享博主 DAIR.AI 當(dāng)日置頂宣傳并評為 2026 年 2 月 23 日–3 月 1 日 Top AI Papers,并獲得新銳 AI 科技博主 Rohan Paul 對 i-WiN 團(tuán)隊(duì)和論文的高度評價(jià)。



圖 2.AgentConductor 得到 DAIR.AI 與 Rohan Paul 等賬號推薦

核心特色與方法介紹

1. 基于 YAML 的新型多智能體交互圖結(jié)構(gòu)

相比傳統(tǒng)多智能體拓?fù)?,我們在表示形式與交互機(jī)制兩個(gè)層面進(jìn)行了設(shè)計(jì)與優(yōu)化。

1.1 表示形式

傳統(tǒng)方法多采用連接矩陣等數(shù)學(xué)形式來描述交互圖,不僅可讀性差,也難以直接編輯與校驗(yàn),更無法由大模型端到端生成;近期工作嘗試使用自然語言描述,但存在拓?fù)洳粐?yán)格、難以結(jié)構(gòu)化約束等問題。我們使用 YAML 結(jié)構(gòu)化表示交互圖 (圖 1 (a)),使其既具備可讀性,又支持程序化校驗(yàn)與約束,并可由 LLM 直接生成。這種形式在設(shè)計(jì)上與當(dāng)前流行的Skill 配置文件具有一致性,便于理解與落地。



圖 3. 本文交互拓?fù)浣Y(jié)構(gòu)與傳統(tǒng)方法的對比

1.2 交互形式

如圖 3 所示,傳統(tǒng)鏈?zhǔn)?、樹狀拓?fù)浞謩e限制并行性、通信范圍或連接靈活性,而全連接結(jié)構(gòu)又過于復(fù)雜。我們?nèi)诤隙喾N拓?fù)鋬?yōu)勢,支持層內(nèi)并行和跨層通訊且每個(gè)智能體可任意鏈接之前的歷史節(jié)點(diǎn),在提升表達(dá)能力的同時(shí)避免不必要的通信開銷

2. 訓(xùn)練范式

2.1 SFT + GRPO 的兩階段訓(xùn)練范式

AgentConductor 采用兩階段訓(xùn)練策略,只訓(xùn)練一個(gè)指揮智能體:

監(jiān)督微調(diào)(SFT):基于 GPT-4o 生成的 4,500 個(gè)高質(zhì)量拓?fù)錁颖荆ǜ采w三檔難度),賦予基礎(chǔ)模型拓?fù)湎闰?yàn);

基于 GRPO 的多輪端到端 Agentic 強(qiáng)化學(xué)習(xí)訓(xùn)練:將環(huán)境反饋的代碼報(bào)錯(cuò)和多輪的拓?fù)湮谋疽黄鹱鳛檐壽E (Trajectory) 來用于智能體的強(qiáng)化學(xué)習(xí)訓(xùn)練,基于 GRPO 算法優(yōu)化模型的拓?fù)渖刹呗砸宰畲蠡瘡?fù)合獎(jiǎng)勵(lì),最終實(shí)現(xiàn)低 Token 成本的高質(zhì)量代碼生成。



圖 4. AgentConductor 的總體框架

2.2 拓?fù)涿芏仍u估函數(shù)

為實(shí)現(xiàn)任務(wù)自適應(yīng),我們將問題分成三檔難度,并根據(jù)從 Token 成本到拓?fù)涿芏鹊男问交成?,提出了拓?fù)涿芏仍u估函數(shù)并作為獎(jiǎng)勵(lì)函數(shù)一部分。綜合刻畫節(jié)點(diǎn)數(shù)、邊密度與圖深度對通信成本的影響。

我們在論文中證明,多智能體系統(tǒng)的平均通信成本可形式化為:



其中 d 為圖深度, m 為提示詞最大長度。相比之下,傳統(tǒng)方法大多簡單的通過矩陣的秩來衡量交互密度,丟失了多智能體交互的數(shù)學(xué)含義

實(shí)驗(yàn)結(jié)果展示

我們在三個(gè)競賽級(APPS, LiveCodeBench, CodeContests)與兩個(gè)基礎(chǔ)代碼數(shù)據(jù)集(HumanEval, MBPP)上評估 AgentConductor(基于 Qwen-2.5-3B-Instruct):



表 1. AgentConductor 的 pass@1 準(zhǔn)確率對比



表 2. AgentConductor 在性能、成本及平均拓?fù)涿芏确矫娴谋容^結(jié)果

表 1 說明,AgentConductor 以僅 3B 參數(shù)量,在 APPS 上顯著超越最強(qiáng)基線,同時(shí)減少了最多 68% 的 completion token 消耗,并實(shí)現(xiàn)最高拓?fù)湎∈瓒?。更重要的是,系統(tǒng)展現(xiàn)出細(xì)粒度難度適配能力:在 easy 任務(wù)上使用極簡拓?fù)洌ㄆ骄?3–4 節(jié)點(diǎn)),在 hard 任務(wù)上自動(dòng)擴(kuò)展至 8–10 節(jié)點(diǎn),而多數(shù)基線無論難度均維持固定密度。(* 更多結(jié)果詳見論文)

結(jié)語:多智能體系統(tǒng)正在學(xué)會組織自己

過去,多智能體系統(tǒng)常被視為“堆人力”的暴力解法:越多AI越好。但AgentConductor 證明,智能協(xié)作的關(guān)鍵不在于數(shù)量,更在于結(jié)構(gòu)的適應(yīng)性。它標(biāo)志著多智能體研究從“靜態(tài)工作流”邁向“動(dòng)態(tài)生態(tài)系統(tǒng)”。 AgentConductor 不僅是一項(xiàng)工程優(yōu)化,更代表了一種新范式:將多智能體協(xié)作視為可學(xué)習(xí)、可演化的結(jié)構(gòu)化決策過程。 通過將任務(wù)難度、執(zhí)行反饋與通信成本統(tǒng)一納入強(qiáng)化學(xué)習(xí)框架,我們實(shí)現(xiàn)了準(zhǔn)確率與效率的協(xié)同提升。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鄭永年:不用糾結(jié)特朗普到底什么意思,中美客觀上已經(jīng)是G2了

鄭永年:不用糾結(jié)特朗普到底什么意思,中美客觀上已經(jīng)是G2了

上觀新聞
2026-04-11 14:49:04
A股:不用等周一開盤了,明天(4月13日),不出意外會這么走

A股:不用等周一開盤了,明天(4月13日),不出意外會這么走

財(cái)經(jīng)大拿
2026-04-12 07:10:10
上海二手房單日成交1632套:連續(xù)打破5年峰值紀(jì)錄,高端房源成交占比提升

上海二手房單日成交1632套:連續(xù)打破5年峰值紀(jì)錄,高端房源成交占比提升

澎湃新聞
2026-04-12 13:52:27
角力伊斯蘭堡,美伊都到了!宮殿風(fēng)格酒店里,美伊或“遞紙條”談判,雙方“主將”均無外交經(jīng)驗(yàn);預(yù)計(jì)雙方各占酒店一邊,避免走廊偶遇

角力伊斯蘭堡,美伊都到了!宮殿風(fēng)格酒店里,美伊或“遞紙條”談判,雙方“主將”均無外交經(jīng)驗(yàn);預(yù)計(jì)雙方各占酒店一邊,避免走廊偶遇

每日經(jīng)濟(jì)新聞
2026-04-11 16:34:11
明天周一A股將會怎么走?到底是漲是跌?我做了一個(gè)大膽的預(yù)判

明天周一A股將會怎么走?到底是漲是跌?我做了一個(gè)大膽的預(yù)判

股市皆大事
2026-04-12 11:30:57
馬筱梅帶汪寶回北京,張?zhí)m沒反應(yīng),汪小菲稱母親張總,關(guān)系微妙

馬筱梅帶汪寶回北京,張?zhí)m沒反應(yīng),汪小菲稱母親張總,關(guān)系微妙

楓塵余往逝
2026-04-11 23:52:17
48歲拉爾薩魅力不減,17歲年齡差,讓NBA球星賭上人生與家庭

48歲拉爾薩魅力不減,17歲年齡差,讓NBA球星賭上人生與家庭

羅氏八卦
2026-04-11 18:00:03
美媒預(yù)測本賽季奪冠概率:湖人0.2%!馬刺16.2%第二,榜首高達(dá)48%

美媒預(yù)測本賽季奪冠概率:湖人0.2%!馬刺16.2%第二,榜首高達(dá)48%

你的籃球頻道
2026-04-12 12:01:46
笑噴全網(wǎng)!高速路上妻子數(shù)落丈夫停不下來,貓咪聽不下去直接捂嘴

笑噴全網(wǎng)!高速路上妻子數(shù)落丈夫停不下來,貓咪聽不下去直接捂嘴

搗蛋窩
2026-04-11 10:57:44
48 小時(shí) 2 架飛機(jī):鄭麗文做了馬英九連戰(zhàn)沒做的事!引美專機(jī)抵臺

48 小時(shí) 2 架飛機(jī):鄭麗文做了馬英九連戰(zhàn)沒做的事!引美專機(jī)抵臺

眼界看視野
2026-04-11 20:50:20
鎮(zhèn)嵩軍的真實(shí)面目有多可怕?閹割男童,奸淫所有婦女,天良喪盡!

鎮(zhèn)嵩軍的真實(shí)面目有多可怕?閹割男童,奸淫所有婦女,天良喪盡!

混沌錄
2026-04-09 14:51:04
浪姐7一公排名:蕭薔團(tuán)墊底,李小冉團(tuán)喜劇效果拉滿,大黑馬誕生

浪姐7一公排名:蕭薔團(tuán)墊底,李小冉團(tuán)喜劇效果拉滿,大黑馬誕生

娛樂圈筆娛君
2026-04-12 11:17:01
巴拿馬總統(tǒng)尋求緩和與中國關(guān)系

巴拿馬總統(tǒng)尋求緩和與中國關(guān)系

參考消息
2026-04-11 19:52:15
太復(fù)雜了!天津一司機(jī)把奔馳開進(jìn)了中心路的地道…差幾步就到平地了…

太復(fù)雜了!天津一司機(jī)把奔馳開進(jìn)了中心路的地道…差幾步就到平地了…

天津人
2026-04-11 15:34:18
4人輪休+2人缺陣!火箭隊(duì)超級殘陣對戰(zhàn)灰熊!預(yù)計(jì)全新首發(fā)出爐

4人輪休+2人缺陣!火箭隊(duì)超級殘陣對戰(zhàn)灰熊!預(yù)計(jì)全新首發(fā)出爐

熊哥愛籃球
2026-04-12 12:36:12
不要錯(cuò)過!下周,光通信測試龍頭來了

不要錯(cuò)過!下周,光通信測試龍頭來了

新浪財(cái)經(jīng)
2026-04-12 13:37:47
投資群2947人,2946人是托:殺豬盤進(jìn)化史,只有你一個(gè)獵物

投資群2947人,2946人是托:殺豬盤進(jìn)化史,只有你一個(gè)獵物

覺叔說
2026-04-11 13:57:01
伊朗代表團(tuán)離開巴基斯坦

伊朗代表團(tuán)離開巴基斯坦

上觀新聞
2026-04-12 12:54:04
體檢報(bào)告出現(xiàn)這幾個(gè)字,距離腦梗只有一步之遙!別等嚴(yán)重了才后悔

體檢報(bào)告出現(xiàn)這幾個(gè)字,距離腦梗只有一步之遙!別等嚴(yán)重了才后悔

荊醫(yī)生科普
2026-04-11 14:23:04
解放軍唯一的一次烏龍,一野和二野打了一個(gè)晚上,各自傷亡多少人

解放軍唯一的一次烏龍,一野和二野打了一個(gè)晚上,各自傷亡多少人

舊史新譚
2026-04-05 17:00:22
2026-04-12 16:16:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12729文章數(shù) 142623關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

"賭王"何鴻燊女兒何超蕸去世 臨終前家人陪伴在側(cè)

頭條要聞

"賭王"何鴻燊女兒何超蕸去世 臨終前家人陪伴在側(cè)

體育要聞

五大聯(lián)賽首冠出爐?拜仁或提前4輪衛(wèi)冕德甲

娛樂要聞

46歲趙達(dá)官宣結(jié)婚!曾與殷桃談婚論嫁

財(cái)經(jīng)要聞

三輪磋商談至深夜 美伊談判三大議題仍待解

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

教育
本地
時(shí)尚
家居
藝術(shù)

教育要聞

Q開頭的單詞!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

伊姐周六熱推:電視劇《八千里路云和月》;綜藝《乘風(fēng)2026》......

家居要聞

復(fù)古風(fēng)格 自然簡約

藝術(shù)要聞

日本建筑大師的中國首個(gè)住宅項(xiàng)目,被防盜網(wǎng)毀了?

無障礙瀏覽 進(jìn)入關(guān)懷版