国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

解構(gòu)AI Agent智能體范式:單體推理、多模型智能體和RAG中心化三種核心架構(gòu)

0
分享至

最近陸陸續(xù)續(xù)的發(fā)布了很多的智能體,有拿Agent做唯一產(chǎn)品的Manus這樣的明星產(chǎn)品,還有@夕小瑤團隊開發(fā)的Teamo;以及本身就是大模型產(chǎn)品基于自己模型開發(fā)的Agent,比如Kimi的Kimi-researcher,以及MiniMax最近開源周放出來的MiniMax Agent。

但如果仔細觀察的話,這些公司的產(chǎn)品中有一個大類是共通的,那就是去解決一個問題:「怎么去寫好一份報告?」

這幾個產(chǎn)品,包括古早就出現(xiàn)的OpenAI和Gemini都有的Deep Research功能,其實也是在做類似的事情,而這件事情想要做好,想要依靠單獨的某個模型,在現(xiàn)在的技術(shù)體系下絕無可能,從問題到結(jié)果,最少需要三個能力。

  1. 聯(lián)網(wǎng)搜索:大模型的記憶大多停留在2024年,這是因為大模型的固有訓(xùn)練邏輯,從訓(xùn)練好,到微調(diào),再到最終發(fā)布,幾個月到半年起,所以你問他現(xiàn)在的事情,必須通過聯(lián)網(wǎng)搜索獲取。

  2. 推理思考:資料搜集是一方面,而搜索大多依賴于關(guān)鍵字,很多關(guān)鍵字對應(yīng)的信息其實是有沖突的,信息沖突只是其中一方面,而碰到?jīng)_突就需要大模型得具備推理和思考的能力,像人一樣的去做判斷。

  3. 訪問信息:搜集到的信息可能有很多種類型,最普通的就是網(wǎng)頁上的文字,但如果碰到的是圖片上的文字,視頻信息甚至一些質(zhì)量很差但是唯一信源的聲音信息,起碼的廣泛的信息訪問技術(shù)是必要的。

你會發(fā)現(xiàn),不可能有任何一個單一的大模型可以完成「怎么去寫好一份報告這件事」,不管怎么樣,都需要給現(xiàn)有的大模型加一些插件才行,而這個過程,其實跟“人類和動物的最大區(qū)別是對于工具的使用”異曲同工。

AI Agent并沒有本質(zhì)上提升某個模型的智力,只不過是學(xué)會了如何使用工具而已。

而如何使用工具,使用說明工具以及多大程度的依靠工具,就產(chǎn)生了現(xiàn)有的實現(xiàn)AI Agent智能體的三種方法:

  • 單體推理模型:典型如OpenAI,這種架構(gòu)的核心思想是依賴一個單一、巨大且能力全面的大語言模型來統(tǒng)一處理任務(wù)的各個方面,包括理解查詢、規(guī)劃步驟、執(zhí)行工具(如搜索)以及綜合信息生成最終答案。


  • 多模型智能體模型:Teamo非常典型,這種架構(gòu)將一個復(fù)雜的任務(wù)分解成多個子任務(wù),并為每個子任務(wù)分配一個專門的、角色清晰的AI智能體。這些智能體在一個“主管”或協(xié)調(diào)者的管理下協(xié)同工作,共同完成最終目標(biāo)。并且根據(jù)不同任務(wù)的特性使用不同的模型,比如寫代碼用Claude,論文寫作用Gemini,講究的是借力。


  • RAG中心化智能體:Perplexity是代表,這種架構(gòu)的設(shè)計哲學(xué)將事實準確性置于最高優(yōu)先級。其核心是檢索增強生成(Retrieval-Augmented Generation, RAG)。整個工作流程圍繞“先檢索,后生成”展開:首先,系統(tǒng)實時從可信的外部來源(如互聯(lián)網(wǎng))檢索與查詢相關(guān)的信息;然后,利用大語言模型將這些檢索到的、有事實依據(jù)的信息進行綜合、提煉和組織,最終生成答案。

單體推理模型

對于單體推理模型來說,最常見的就是大模型公司,比如OpenAI的Deep Research,MiniMax,以及Kimi的Researcher,他們的Agent就是基于自身大模型的產(chǎn)品,所以于情于理也不可能用別家的,這是大模型公司做應(yīng)用的執(zhí)念,即使只是暫時的。

下圖從左到右,從上到下分別是OpenAI的Deep Research,MiniMaX Agent,Kimi Researcher,Gemini的Deep Research。

這4個例子的背后公司肯定會有一個主打的模型,比如OpenAI的o系列,Kimi的k系列,以及MiniMax最近剛剛出的M1模型,Gemini的Gemini-2.5系列,都是在大模型領(lǐng)域非常能打的存在。也依靠他們的明星產(chǎn)品擁有不少的忠實用戶,這是他們能做單體推理模型的底氣。

優(yōu)勢

  1. 強大的通用推理與靈活性:由于所有任務(wù)都在一個統(tǒng)一的“思維空間”內(nèi)完成,單體模型可能發(fā)展出更強的通用問題解決能力。它不受限于預(yù)設(shè)的、僵化的角色分工,因此在面對從未見過或結(jié)構(gòu)模糊的復(fù)雜任務(wù)時,可能表現(xiàn)出更高的靈活性和適應(yīng)性。

  2. 整體性理解:模型能夠?qū)θ蝿?wù)形成一個連貫、整體的理解,因為從輸入到輸出的所有中間步驟和思考過程都是內(nèi)在關(guān)聯(lián)的,而不是在不同模塊間傳遞。

劣勢

  1. 更高的“幻覺”風(fēng)險:這是該架構(gòu)最主要的弱點。強大的生成能力意味著模型在信息不足或推理出錯時,更容易“編造”事實,即產(chǎn)生幻覺。OpenAI也明確指出,其Deep Research智能體雖然比普通模型出錯率低,但仍會偶爾產(chǎn)生幻覺,并且在區(qū)分權(quán)威信息和網(wǎng)絡(luò)謠言方面存在困難。

  2. 不透明的“黑箱”問題:推理過程是模型內(nèi)部的復(fù)雜神經(jīng)活動,外界難以精確地審視其決策邏輯。當(dāng)模型給出一個答案時,我們很難完全理解它是如何一步步推導(dǎo)出來的,這在需要高可靠性和可解釋性的關(guān)鍵應(yīng)用中是一個重大障礙。

  3. 巨大的計算成本:訓(xùn)練和運行一個能處理所有任務(wù)的、最前沿的單一模型,需要極其龐大的計算資源和資金投入。

總的來說,單體推理模型需要一個非常強的AI大模型,不然智力程度完全不夠,但這也需要前提投入大量的資金先去做模型,然后再基于此作應(yīng)用。再加上在做應(yīng)用的時候只用自家模型,所以模型的缺點肯定也會帶到Agent上。

多模型智能體模型

多模型智能體模型,往往存在于主營業(yè)務(wù)甚至就智能體這一個業(yè)務(wù),他們要實現(xiàn)的就是極致的效果和性能,所以他們會針對于不同的任務(wù)采用不同的模型,選擇的多樣性和靈活度要遠高于單體推理模型。

比如Teamo,非常的經(jīng)典多模型智能體,下圖就是Teamo設(shè)置不同Agent,主要分為幾個組,比如搜索組、寫作組、咨詢組和一些未上線的組別,并且每個組都有組長和組員不同角色。

細看的話,搜索組的搜索員就只有兩個模型可以用,Claude-4-sonnet和Opus,這么說吧,這倆模型在大模型領(lǐng)域的定價算是非常貴的那種了,如果不是在實踐中發(fā)現(xiàn)這倆模型的性能最好,或者說只有這倆模型的性能才能滿足需求,那斷然不會只用這倆的。

通用深度寫作員就是一個例子,你可以看到它可用的模型有很多,Gemini-2.5-Pro,DeepSeek-V3,GPT,Claude,甚至不常見的Grok3都有。

這幾個之間的價格差別還是比較明顯的,像DeepSeek這種開源模型價格要遠低于閉源模型,但是實踐中發(fā)現(xiàn)這些模型之間的實際表現(xiàn)估計差別不明顯。

Manus也一樣,據(jù)其中一個創(chuàng)始人,Manus主要用的兩家模型,Claude和Qwen,估計也是考慮到了性能和價格之間的平衡,只用Claude的確要貴不少。

優(yōu)勢

  1. 流程透明且可控:由于任務(wù)被明確地分解到不同的專業(yè)智能體,整個工作流程變得清晰可見。例如,可以看到“生成”智能體提出了哪些假設(shè),“反思”智能體又如何對其進行評估。這種模塊化設(shè)計使得調(diào)試、監(jiān)督和干預(yù)變得更加容易。

  2. 專業(yè)分工帶來的高質(zhì)量:每個智能體都可以被專門優(yōu)化以精通其特定任務(wù)。就像人類團隊一樣,讓“創(chuàng)意專家”負責(zé)頭腦風(fēng)暴,讓“批判專家”負責(zé)評估,理論上可以在每個環(huán)節(jié)都達到更高的質(zhì)量水平。

  3. 任務(wù)并行處理:不同的子任務(wù)可以由多個智能體同時執(zhí)行,從而可能提高整體的效率和速度。

劣勢

  1. 通信與協(xié)調(diào)開銷:智能體之間需要高效地溝通和傳遞信息,這會引入額外的計算開銷和系統(tǒng)復(fù)雜性。如果協(xié)調(diào)機制設(shè)計不當(dāng),可能會導(dǎo)致效率瓶頸。

  2. 管理復(fù)雜性高:設(shè)計和管理“主管”智能體與各個專業(yè)智能體之間的復(fù)雜互動是一項挑戰(zhàn)。整個系統(tǒng)的最終表現(xiàn)高度依賴于這種協(xié)調(diào)與管理機制的優(yōu)劣。

創(chuàng)業(yè)公司青睞這種方式,畢竟不需要自己做模型,只需要用現(xiàn)成的,還可以什么好用就用什么,不好用立馬下線,但缺點也很明顯,就是被復(fù)制的概率非常大,因為核心技術(shù)依賴于大模型,而次核心的工程技術(shù)容易被大公司用人海戰(zhàn)術(shù)迅速追上甚至反超。

RAG中心化智能體

這種智能體其實不算多,因為它的設(shè)計哲學(xué)偏向于「索引」,這就意味著「檢索」的優(yōu)先級最高,簡單來說就是收集更多的信息,然后交給大模型去整理。而這里面資料的儲存和利用就用了RAG這個技術(shù),它的全名叫檢索增強生成(Retrieval-Augmented Generation)。

可以根據(jù)下面的圖來理解,比如我們問2025年6月22日人民幣和美元的匯率是多少,那么沒有聯(lián)網(wǎng)的大模型絕對不可能知道,因為它的固有缺陷(訓(xùn)練數(shù)據(jù)滯后于模型發(fā)布時間)。所以這個時候就需要先去聯(lián)網(wǎng)獲取外部資料,然后大模型去根據(jù)外部資料去做回答。

這里面的典型模型其實就有知乎直答、秘塔AI搜索和Perplexity AI,都是先做大量的檢索,然后根據(jù)檢索資料進行匯總和分析。

這里面的區(qū)別就是檢索信息來源的不同,每家平臺會采用不同的信源,像知乎就用的自己平臺回答多一些,微博和騰訊元寶也有類似的功能,都是優(yōu)先采用自己的信源。

這種用的模型一般都是自研或者開源模型,因為它的核心在于信息的“可溯源”,而這一點兒只需要大模型照章辦事即可。

優(yōu)勢

  1. 極高的事實準確性與可追溯性:這是該架構(gòu)最突出的優(yōu)點。由于所有答案都牢固地植根于檢索到的真實世界信息,并且總是附帶來源引用,用戶可以輕松驗證信息的真?zhèn)?。其核心原則是“不生成任何未檢索到的信息”。

  2. 幻覺風(fēng)險極低:大語言模型在這里的主要角色是“組織者”和“轉(zhuǎn)述者”,而非“創(chuàng)作者”。因為它不依賴其內(nèi)部記憶來生成事實性內(nèi)容,所以產(chǎn)生幻覺的風(fēng)險被降到了最低。

  3. 來源透明:用戶能清晰地看到每一條信息來自何處,這在學(xué)術(shù)研究、新聞?wù){(diào)查等需要嚴肅事實核查的場景中至關(guān)重要。

劣勢

  1. 能力受限于可檢索的信息:系統(tǒng)的能力上限被其信息檢索系統(tǒng)所束縛。如果一個問題的答案無法通過現(xiàn)有渠道檢索到,那么該系統(tǒng)也無法憑空創(chuàng)造出來。

  2. 純粹抽象推理和創(chuàng)造力受限:對于那些需要超越現(xiàn)有數(shù)據(jù)、進行純粹邏輯推演或提出全新原創(chuàng)概念的任務(wù),這種方法表現(xiàn)不佳。它擅長綜合已知,而非探索未知。

它的優(yōu)劣勢很明顯,信息可溯源就是最大的優(yōu)勢,但同樣限制了大模型的能力,就是嚴重受限于檢索到的數(shù)據(jù)質(zhì)量,同時它也不太可能突破現(xiàn)有信息的限制,去創(chuàng)造新的知識。

這三種當(dāng)下的Agent范式都有各自的優(yōu)缺點,特別是在實現(xiàn)上其實重合的地方很多,不過各自的側(cè)重點是能讓各自都能在領(lǐng)域里面脫穎而出的主要原因。這個新興市場的未來演進路徑正逐漸清晰。

當(dāng)前一代的研究智能體,主要專注于自動化現(xiàn)有的「人類資料密集型工作」流程,例如文獻綜述、事實查找、行動規(guī)劃等。不過未來不管是AI還是AI Agent,都不可能止步于總結(jié)現(xiàn)有人類的知識或者經(jīng)驗,而是更多的將精力投入到「發(fā)現(xiàn)或者發(fā)明」新的知識上。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
小米也漲價了!內(nèi)存壓力傳導(dǎo)至手機廠商,業(yè)界稱終端再不漲明年必定虧損

小米也漲價了!內(nèi)存壓力傳導(dǎo)至手機廠商,業(yè)界稱終端再不漲明年必定虧損

澎湃新聞
2025-12-26 20:22:27
3-0,40歲C羅騰空轉(zhuǎn)體180度:雙響+無敵腳后跟破門+率隊10連勝領(lǐng)跑

3-0,40歲C羅騰空轉(zhuǎn)體180度:雙響+無敵腳后跟破門+率隊10連勝領(lǐng)跑

側(cè)身凌空斬
2025-12-28 00:46:09
利物浦淚奔!1.36億水貨斬首球+獲MVP 炸裂7次過人 3送妙傳遭吐餅

利物浦淚奔!1.36億水貨斬首球+獲MVP 炸裂7次過人 3送妙傳遭吐餅

我愛英超
2025-12-28 01:25:30
中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

回旋鏢
2025-12-27 19:14:15
貝克漢姆26歲長子跟富豪岳父拍全家福,抱嬌妻很滿足,與父母斷聯(lián)

貝克漢姆26歲長子跟富豪岳父拍全家福,抱嬌妻很滿足,與父母斷聯(lián)

譯言
2025-12-27 09:33:47
比韓建林還硬!徐湖平大靠山,竟是江蘇“一把手”,父親的老戰(zhàn)友

比韓建林還硬!徐湖平大靠山,竟是江蘇“一把手”,父親的老戰(zhàn)友

阿天愛旅行
2025-12-28 00:49:02
一新能源汽車高速上電量耗盡,2人慢車道上推車被撞身亡,距服務(wù)區(qū)約500米

一新能源汽車高速上電量耗盡,2人慢車道上推車被撞身亡,距服務(wù)區(qū)約500米

臺州交通廣播
2025-12-27 09:15:55
律師全部失業(yè)!佛山一律所被吊銷執(zhí)照,起因是非法“購買案源”…

律師全部失業(yè)!佛山一律所被吊銷執(zhí)照,起因是非法“購買案源”…

火山詩話
2025-12-27 14:50:55
金燦榮與“聽風(fēng)的蠶”首次同框,開聊中美關(guān)系

金燦榮與“聽風(fēng)的蠶”首次同框,開聊中美關(guān)系

大象新聞
2025-12-26 12:41:08
終于明白了!為啥農(nóng)民寧愿斷繳醫(yī)保,也不愿再掏這400塊錢?

終于明白了!為啥農(nóng)民寧愿斷繳醫(yī)保,也不愿再掏這400塊錢?

復(fù)轉(zhuǎn)這些年
2025-12-25 23:30:29
他們吸過毒,曾經(jīng)是“爛人”,想要個機會

他們吸過毒,曾經(jīng)是“爛人”,想要個機會

大風(fēng)新聞
2025-12-27 15:04:03
全線暴漲、斷貨限購!有人一覺醒來賺18萬,有人后悔搶少了!史詩級行情來了?

全線暴漲、斷貨限購!有人一覺醒來賺18萬,有人后悔搶少了!史詩級行情來了?

新民晚報
2025-12-27 21:53:15
銀行女經(jīng)理挪用12個儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

銀行女經(jīng)理挪用12個儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

觀世記
2025-12-27 15:02:35
中新網(wǎng)報道:中國赴柬埔寨游客增長43.5%,你會去俄、柬旅游嗎?

中新網(wǎng)報道:中國赴柬埔寨游客增長43.5%,你會去俄、柬旅游嗎?

名人茍或
2025-12-27 06:04:21
“萬稅之國”加拿大被冤枉了?實際稅負比例竟然比中國還要低

“萬稅之國”加拿大被冤枉了?實際稅負比例竟然比中國還要低

回旋鏢
2025-12-27 13:46:40
老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報: 已刑拘

老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報: 已刑拘

社會日日鮮
2025-12-27 05:29:43
交警私下透露:車險別買全險,只買這2樣,每年白省2000塊

交警私下透露:車險別買全險,只買這2樣,每年白省2000塊

老特有話說
2025-12-27 14:45:28
林強涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

林強涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

千言娛樂記
2025-12-27 20:07:06
南博前院長被帶走不到12小時,令人"厭惡"的事發(fā)生了,不止一件

南博前院長被帶走不到12小時,令人"厭惡"的事發(fā)生了,不止一件

社會日日鮮
2025-12-26 11:09:21
我發(fā)現(xiàn),80%的中產(chǎn)還沒意識到降息的嚴重性。

我發(fā)現(xiàn),80%的中產(chǎn)還沒意識到降息的嚴重性。

流蘇晚晴
2025-12-27 17:34:29
2025-12-28 07:48:49
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

山西大同一小區(qū)物業(yè)禁止新能源車進入地庫:擔(dān)心自燃

頭條要聞

山西大同一小區(qū)物業(yè)禁止新能源車進入地庫:擔(dān)心自燃

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

本地
時尚
手機
數(shù)碼
軍事航空

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

穿好雪地靴的4個訣竅,還挺有效!

手機要聞

榮耀WIN系列全球首發(fā)10000mAh電池:友商短時間內(nèi)很難超越

數(shù)碼要聞

2025全球智能手表出貨量預(yù)計回暖 重回增長軌道

軍事要聞

與特朗普會晤前 澤連斯基亮明“紅線”

無障礙瀏覽 進入關(guān)懷版