国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI協(xié)同框架讓「小模型」能完成復(fù)雜任務(wù),媲美主流大模型推理表現(xiàn)

0
分享至



隨著如 GPT-4o 這類大型語(yǔ)言模型(LLMs)在復(fù)雜推理任務(wù)中占據(jù)領(lǐng)先,人們常認(rèn)為只有這樣規(guī)模的模型才能勝任高難度問(wèn)題。但這種能力背后伴隨著高成本、長(zhǎng)時(shí)間推理和巨量算力消耗。

就比如一個(gè)簡(jiǎn)單的數(shù)獨(dú),現(xiàn)有大型語(yǔ)言模型能解決,但小模型往往無(wú)能為力。無(wú)論是模型模型(LM)試圖解決高級(jí)謎題、設(shè)計(jì)分子,還是編寫數(shù)學(xué)證明,系統(tǒng)都難以應(yīng)對(duì)那些有嚴(yán)格規(guī)則的開(kāi)放式請(qǐng)求。

MIT 計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)提出了一種全新的協(xié)作策略:讓大型模型負(fù)責(zé)「策略規(guī)劃」,而把實(shí)際細(xì)節(jié)任務(wù)分發(fā)給低成本的小模型執(zhí)行。這種方法稱為DisCIPL,它能使小模型在復(fù)雜任務(wù)上達(dá)到與頂級(jí)大模型接近的性能,同時(shí)顯著降低成本。

相關(guān)的研究?jī)?nèi)容以「Self-Steering Language Models」為題發(fā)布在arxiv。



論文鏈接:https://arxiv.org/abs/2504.07081

讓小模型處理復(fù)雜任務(wù)

語(yǔ)言模型目前面臨一個(gè)基本困境:小模型算力低、參數(shù)少,推理能力有限,它們難以解決涉及嚴(yán)格約束、長(zhǎng)程依賴或高級(jí)邏輯的問(wèn)題;大型模型推理能力強(qiáng),但成本極高:需要大量算力、內(nèi)存和時(shí)間,在很多應(yīng)用場(chǎng)景(邊緣設(shè)備、實(shí)時(shí)交互)并不適用。

傳統(tǒng)的提升方式主要還是擴(kuò)大模型規(guī)模,但這并不是一個(gè)可持續(xù)發(fā)展路線。DisCIPL 策略的出發(fā)點(diǎn)也正是基于這種考慮。對(duì)于復(fù)雜任務(wù),需要明確任務(wù)的「策略層邏輯」,并將推理過(guò)程進(jìn)行拆解,協(xié)調(diào)小模型合作。



圖示:帶有概率程序的自導(dǎo)向語(yǔ)言模型。

更具體來(lái)說(shuō),該策略能夠在撰寫諸如文本摘要、帶預(yù)算的購(gòu)物清單和旅行計(jì)劃等內(nèi)容時(shí),引導(dǎo)較大的模型將較小的「跟隨」模型導(dǎo)向精確的響應(yīng)。換而言之,大模型作為規(guī)劃者,小模型作為執(zhí)行者。

團(tuán)隊(duì)對(duì)該策略的實(shí)現(xiàn)建立在 LLaMPPL 之上,該程序由 MIT 的概率計(jì)算項(xiàng)目于 2023 年開(kāi)發(fā),允許用戶編碼特定規(guī)則以引導(dǎo)模型朝著期望的結(jié)果發(fā)展。LLaMPPL 程序通過(guò)反復(fù)擴(kuò)展候選生成序列一個(gè)或多個(gè)標(biāo)記,并對(duì)提出的擴(kuò)展進(jìn)行評(píng)分來(lái)運(yùn)行。

DisCIPL 中的程序遵循幾種常見(jiàn)的推理模式:

  • 逐步問(wèn)題分解;
  • 先驗(yàn)提示與提案提示;
  • 帶權(quán)重校正的約束生成;
  • 自提示;
  • 自檢。

這些推理模式已經(jīng)實(shí)現(xiàn)庫(kù)支持,并在規(guī)劃工具提示中予以展示。

測(cè)試與結(jié)果

研究團(tuán)隊(duì)采取了多方驗(yàn)證以評(píng)估 DisCIPL 的性能,這包括寫約束性強(qiáng)的段落(例如固定單詞數(shù)量、固定關(guān)鍵詞位置)、復(fù)雜推理任務(wù)(邏輯結(jié)構(gòu)、規(guī)則性輸出)與標(biāo)準(zhǔn)大模型推理用例。

團(tuán)隊(duì)將 DisCIPL 協(xié)作框架與這些系統(tǒng)作對(duì)比:Follower-only baseline:僅用小模型執(zhí)行任務(wù);GPT-4o 單體執(zhí)行:大型模型獨(dú)立完成;O1(另一先進(jìn)推理系統(tǒng))。



圖示:在 Collie 的句子層級(jí)任務(wù)上的有效性。

DisCIPL 首次展示了按照顯性規(guī)則生成句子和段落的能力。在準(zhǔn)確性與連貫性方面,DisCIPL 的輸出質(zhì)量接近甚至在某些約束任務(wù)上優(yōu)于 GPT-4o 與 O1,遠(yuǎn)超 follower-only baseline。在實(shí)際應(yīng)用中,研究人員發(fā)現(xiàn),與 o1 相比,DisCIPL 的推理時(shí)間縮短了 40.1%,成本降低了 80.2%。

全方位提升

DisCIPL 的效率提升部分歸功于使用小型 Llama 模型作為執(zhí)行者,這些模型每 token 的成本比類似的推理模型低 1000 到 10000 倍。這讓 DisCIPL 更具「可擴(kuò)展性」——研究人員能夠以極低的成本并行運(yùn)行數(shù)十個(gè) Llama 模型。

DisCIPL 證明,即便是規(guī)模小、資源消耗低的語(yǔ)言模型,也可以在協(xié)作框架下完成本來(lái)只有大型模型才能勝任的復(fù)雜任務(wù),且效率更高、成本更低。這種將復(fù)雜問(wèn)題分散為子任務(wù)的結(jié)果整合機(jī)制有望在更廣闊的任務(wù)空間中普及。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
南京這把火,直燒到了北京一位“通天“人物的心坎上

南京這把火,直燒到了北京一位“通天“人物的心坎上

鶴羽說(shuō)個(gè)事
2025-12-24 15:00:47
浙江省紀(jì)委監(jiān)委通報(bào):蔣松海主動(dòng)投案

浙江省紀(jì)委監(jiān)委通報(bào):蔣松海主動(dòng)投案

新浪財(cái)經(jīng)
2025-12-25 21:02:32
不得不說(shuō)這兩位阿姨真的很會(huì)打扮,既優(yōu)雅又有女人味

不得不說(shuō)這兩位阿姨真的很會(huì)打扮,既優(yōu)雅又有女人味

牛彈琴123456
2025-12-25 10:19:13
廣州一家5口墜江遇難!4大1小,原因令人憤怒,村民透露更多

廣州一家5口墜江遇難!4大1小,原因令人憤怒,村民透露更多

千言?shī)蕵?lè)記
2025-12-26 00:56:06
山西官宣廢止煙花爆竹禁令,陜西、四川已清理禁燃相關(guān)文件

山西官宣廢止煙花爆竹禁令,陜西、四川已清理禁燃相關(guān)文件

南方都市報(bào)
2025-12-25 18:09:34
他真是最低調(diào)的“星二代”了,父母姐姐都超牛,卻從未公開(kāi)提及過(guò)

他真是最低調(diào)的“星二代”了,父母姐姐都超牛,卻從未公開(kāi)提及過(guò)

娛人細(xì)品
2025-12-25 15:54:07
30場(chǎng)打完,雷霆26勝4負(fù),16年勇士隊(duì)?wèi)?zhàn)績(jī)?nèi)绾??差距比想象還要大

30場(chǎng)打完,雷霆26勝4負(fù),16年勇士隊(duì)?wèi)?zhàn)績(jī)?nèi)绾危坎罹啾认胂筮€要大

大西體育
2025-12-25 16:38:09
廣東臺(tái)的衰?。簭摹叭f(wàn)人空巷”到“無(wú)人問(wèn)津”,被誰(shuí)奪走了靈魂

廣東臺(tái)的衰?。簭摹叭f(wàn)人空巷”到“無(wú)人問(wèn)津”,被誰(shuí)奪走了靈魂

阿訊說(shuō)天下
2025-12-24 17:14:51
曼聯(lián)連續(xù)兩次在聯(lián)賽中不敵紐卡,上次3連敗追溯到1922年

曼聯(lián)連續(xù)兩次在聯(lián)賽中不敵紐卡,上次3連敗追溯到1922年

懂球帝
2025-12-26 02:18:22
獨(dú)行俠官宣:濃眉哥腹股溝痙攣退賽 連續(xù)兩年圣誕大賽傷退

獨(dú)行俠官宣:濃眉哥腹股溝痙攣退賽 連續(xù)兩年圣誕大賽傷退

醉臥浮生
2025-12-26 08:03:08
雷軍有沒(méi)有吹牛?小米SU7到底賣了多少輛?這數(shù)據(jù)很打臉

雷軍有沒(méi)有吹牛?小米SU7到底賣了多少輛?這數(shù)據(jù)很打臉

互聯(lián)網(wǎng).亂侃秀
2025-12-25 10:24:19
當(dāng)黑人選民看到,奧巴馬越老越白的時(shí)候,產(chǎn)生了強(qiáng)烈的被背叛感!

當(dāng)黑人選民看到,奧巴馬越老越白的時(shí)候,產(chǎn)生了強(qiáng)烈的被背叛感!

看盡人間百態(tài)
2025-12-24 01:28:42
盧秀燕罕見(jiàn)痛批賴清德“擺爛”:整個(gè)臺(tái)灣都因政治紛爭(zhēng)而停滯不前

盧秀燕罕見(jiàn)痛批賴清德“擺爛”:整個(gè)臺(tái)灣都因政治紛爭(zhēng)而停滯不前

海峽導(dǎo)報(bào)社
2025-12-26 07:36:06
癱子娘、瘋子爹!744分高考狀元被清華錄取8年后,現(xiàn)狀令人淚目

癱子娘、瘋子爹!744分高考狀元被清華錄取8年后,現(xiàn)狀令人淚目

阿柒的訊
2025-12-22 18:46:40
光刻機(jī)大消息!國(guó)產(chǎn)設(shè)備龍頭1.1億元中標(biāo),660億概念股直線拉升

光刻機(jī)大消息!國(guó)產(chǎn)設(shè)備龍頭1.1億元中標(biāo),660億概念股直線拉升

21世紀(jì)經(jīng)濟(jì)報(bào)道
2025-12-25 23:10:48
不到24小時(shí)美國(guó)扣押第三艘油輪,遭遇強(qiáng)硬對(duì)手引發(fā)海上追逐戰(zhàn)

不到24小時(shí)美國(guó)扣押第三艘油輪,遭遇強(qiáng)硬對(duì)手引發(fā)海上追逐戰(zhàn)

優(yōu)趣紀(jì)史記
2025-12-23 16:23:38
曼聯(lián)下賽季若無(wú)緣歐冠,阿莫林難逃下課!羅杰斯發(fā)展令其相形見(jiàn)絀

曼聯(lián)下賽季若無(wú)緣歐冠,阿莫林難逃下課!羅杰斯發(fā)展令其相形見(jiàn)絀

羅米的曼聯(lián)博客
2025-12-26 07:21:34
海南“零關(guān)稅”豪車真相:寶馬X5、保時(shí)捷卡宴鮮有符合要求車型,免稅進(jìn)口車僅限企業(yè)營(yíng)運(yùn)

海南“零關(guān)稅”豪車真相:寶馬X5、保時(shí)捷卡宴鮮有符合要求車型,免稅進(jìn)口車僅限企業(yè)營(yíng)運(yùn)

每日經(jīng)濟(jì)新聞
2025-12-23 16:32:04
國(guó)際乒聯(lián)確認(rèn)!王楚欽王曼昱、張本智和金琴英已入選亞洲杯單打

國(guó)際乒聯(lián)確認(rèn)!王楚欽王曼昱、張本智和金琴英已入選亞洲杯單打

全言作品
2025-12-26 01:41:12
中國(guó)游客不來(lái)了,京都酒店價(jià)格暴跌至每晚135元!日本人高興壞了…

中國(guó)游客不來(lái)了,京都酒店價(jià)格暴跌至每晚135元!日本人高興壞了…

東京新青年
2025-12-25 18:41:52
2025-12-26 08:11:00
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1190文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

“不再是機(jī)器人大國(guó)”,日本錯(cuò)過(guò)了什么?

頭條要聞

美國(guó)始料未及:日本防衛(wèi)開(kāi)支若到GDP3% "安保條約"作廢

頭條要聞

美國(guó)始料未及:日本防衛(wèi)開(kāi)支若到GDP3% "安保條約"作廢

體育要聞

約基奇有多喜歡馬?

娛樂(lè)要聞

朱孝天把阿信好意當(dāng)球踢!

財(cái)經(jīng)要聞

新規(guī)來(lái)了,年化超24%的小貸被即刻叫停

汽車要聞

速來(lái)!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

游戲
本地
手機(jī)
公開(kāi)課
軍事航空

逆水寒頂流主播沉迷倩女!三界的魅力藏不住了

本地新聞

這輩子要積多少德,下輩子才能投胎到德國(guó)當(dāng)狗

手機(jī)要聞

行業(yè)唯一徠卡2億像素連續(xù)光變長(zhǎng)焦!小米17 Ultra星空綠圖賞

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄方:歐洲“根本沒(méi)有考慮和平”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版