国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Cognition 2億估值背后:AI Agent的4層架構(gòu)拆解

0
分享至


1750萬美元融資,20億美元估值,產(chǎn)品還沒公開上線。Cognition的Devin把AI Agent這個(gè)概念炒到了頂點(diǎn)。但GitHub Copilot的agent模式已經(jīng)在處理多文件重構(gòu),Cursor的Composer能重寫整個(gè)項(xiàng)目代碼——這些不是聊天機(jī)器人,是能推理、能規(guī)劃、能調(diào)用工具、能記住上下文的系統(tǒng)。

它們的架構(gòu)模式,現(xiàn)在是AI工程領(lǐng)域最熱的議題。本文拆解這套架構(gòu)的四個(gè)核心組件,以及為什么傳統(tǒng)的大語(yǔ)言模型(Large Language Model,LLM)應(yīng)用模式已經(jīng)不夠用了。

從"一問一答"到"觀察-思考-行動(dòng)"循環(huán)

傳統(tǒng)LLM應(yīng)用很簡(jiǎn)單:輸入提示詞,輸出回答。但很多真實(shí)任務(wù)需要多步驟、做決策、調(diào)用工具、反復(fù)迭代。你不可能用一次對(duì)話就訂好機(jī)票、調(diào)試完代碼庫(kù)、或者做完競(jìng)品調(diào)研。

AI Agent的解決方式是跑循環(huán)——觀察環(huán)境、思考策略、執(zhí)行動(dòng)作、從結(jié)果學(xué)習(xí),然后重來。

這個(gè)循環(huán)不是裝飾。Cognition的Devin在演示中處理GitHub issue時(shí),會(huì)自己打開代碼編輯器、閱讀文件、寫代碼、運(yùn)行測(cè)試、看報(bào)錯(cuò)、再改——全程無人干預(yù)。GitHub Copilot的agent模式同理,遇到復(fù)雜重構(gòu)會(huì)先分析依賴關(guān)系,再分步驟執(zhí)行。

關(guān)鍵區(qū)別在于:?jiǎn)未翁崾驹~響應(yīng)是"無狀態(tài)"的,每次調(diào)用都從零開始;Agent循環(huán)是"有狀態(tài)"的,每次行動(dòng)都基于之前的觀察和記憶。

規(guī)劃模塊:把"大目標(biāo)"切成"能執(zhí)行的小塊"

規(guī)劃模塊是Agent把復(fù)雜目標(biāo)拆解成可行動(dòng)子任務(wù)的能力。當(dāng)你讓Agent"調(diào)研競(jìng)品定價(jià)并做對(duì)比報(bào)告",它需要自動(dòng)分解為:識(shí)別競(jìng)品→找到定價(jià)頁(yè)面→提取數(shù)據(jù)→整理成表→撰寫分析。

常見的規(guī)劃策略有三種。思維鏈推理(Chain-of-Thought):讓模型一步步想,顯式寫出中間推理過程。任務(wù)分解:把目標(biāo)拆成子目標(biāo),可能用遞歸方式繼續(xù)拆分。計(jì)劃-執(zhí)行模式:先完整生成計(jì)劃,再按步驟執(zhí)行,適合需要預(yù)審批的場(chǎng)景。

Cursor的Composer用的是計(jì)劃-執(zhí)行模式的變體。用戶描述需求后,它會(huì)先展示要修改的文件列表和每處的改動(dòng)概要,用戶確認(rèn)后才執(zhí)行。這給了一個(gè)"人類在環(huán)"(Human-in-the-Loop)的檢查點(diǎn)——不是完全自動(dòng),而是人機(jī)協(xié)作。

沒有規(guī)劃模塊的Agent會(huì)陷入"下一步該干嘛"的迷茫。有規(guī)劃的Agent能把"幫我優(yōu)化網(wǎng)站"這種模糊指令,轉(zhuǎn)化成具體的性能測(cè)試、瓶頸定位、代碼修改、回歸驗(yàn)證等步驟。

記憶系統(tǒng):從"金魚"到"有經(jīng)驗(yàn)的老手"

沒有記憶的Agent會(huì)重復(fù)犯錯(cuò)、丟失上下文。一個(gè)設(shè)計(jì)良好的記憶系統(tǒng)有兩層:

短期記憶:當(dāng)前任務(wù)的上下文窗口。比如正在處理的代碼文件內(nèi)容、剛執(zhí)行的命令輸出、用戶的最新指令。這部分通常直接放在提示詞里,受限于模型的上下文長(zhǎng)度。


長(zhǎng)期記憶:持久化的知識(shí)存儲(chǔ)。比如用戶偏好的代碼風(fēng)格、項(xiàng)目的架構(gòu)約定、之前解決過的類似bug。這部分需要外部數(shù)據(jù)庫(kù),通過檢索增強(qiáng)生成(Retrieval-Augmented Generation,RAG)或向量搜索在需要時(shí)調(diào)取。

代碼示例展示了典型的AgentMemory結(jié)構(gòu):short_term列表存當(dāng)前上下文,long_term字典存鍵值對(duì),帶時(shí)間戳。recall方法按需檢索,remember方法持久化存儲(chǔ)。

記憶讓Agent從"無狀態(tài)的函數(shù)調(diào)用"變成"越用越順手的系統(tǒng)"。Devin據(jù)說能記住用戶之前教過的工作流程,遇到類似任務(wù)自動(dòng)復(fù)用。Cursor的@符號(hào)可以引用整個(gè)代碼庫(kù),本質(zhì)上也是長(zhǎng)期記憶的一種形式——把整個(gè)項(xiàng)目當(dāng)作可檢索的記憶庫(kù)。

工具層:從"只能說話"到"能動(dòng)手干活"

沒有工具的Agent只能生成文本。有了工具,它能查天氣、調(diào)API、執(zhí)行代碼、操作瀏覽器、讀寫文件。

工具層設(shè)計(jì)成插件系統(tǒng):每個(gè)工具有名稱、描述、輸入輸出模式。Agent通過函數(shù)調(diào)用(Function Calling)機(jī)制選擇工具,傳遞參數(shù),解析返回結(jié)果。

Devin的工具集包括:代碼編輯器(讀寫文件)、終端(執(zhí)行命令)、瀏覽器(搜索信息、查看文檔)。GitHub Copilot agent模式的工具包括:文件搜索、代碼替換、終端命令、測(cè)試運(yùn)行。Cursor的工具更偏向IDE集成:代碼理解、重構(gòu)建議、錯(cuò)誤診斷。

工具調(diào)用本身也需要規(guī)劃。一個(gè)復(fù)雜任務(wù)可能涉及"搜索API文檔→寫代碼→運(yùn)行測(cè)試→看報(bào)錯(cuò)→搜索錯(cuò)誤信息→修改代碼"的多輪工具鏈。每次調(diào)用后,Agent需要解析結(jié)果、判斷任務(wù)進(jìn)度、決定下一步動(dòng)作。

這里有個(gè)設(shè)計(jì)取舍:工具粒度。太粗(比如"重構(gòu)整個(gè)項(xiàng)目")靈活性差,太細(xì)(比如"移動(dòng)光標(biāo)到第5行")效率低。主流Agent傾向于中等粒度:"修改這個(gè)函數(shù)的參數(shù)列表"或"在文件末尾添加導(dǎo)入語(yǔ)句"。

推理引擎:ReAct模式,讓"想"和"做"交替進(jìn)行

推理引擎是Agent的"大腦",決定什么時(shí)候思考、什么時(shí)候行動(dòng)。目前最主流的模式是ReAct(Reason + Act,推理+行動(dòng)):交替進(jìn)行推理步驟和行動(dòng)步驟,每步都基于之前的觀察。

ReAct的循環(huán)結(jié)構(gòu):Thought(思考當(dāng)前狀態(tài)和目標(biāo))→ Action(選擇工具并執(zhí)行)→ Observation(接收工具返回)→ 重復(fù)。

這種模式的優(yōu)勢(shì)是"可解釋性"。Agent的每一步都有顯式的推理痕跡,出了問題可以追溯。相比端到端的黑盒模型,ReAct像"白盒",每個(gè)決策點(diǎn)都可見。

但ReAct也有代價(jià):延遲。每個(gè)行動(dòng)都要等模型生成推理、選擇工具、執(zhí)行、返回結(jié)果,一輪循環(huán)可能幾秒到幾十秒。復(fù)雜任務(wù)可能需要幾十輪,總時(shí)間不可忽視。

優(yōu)化方向包括:批處理(一次生成多步計(jì)劃)、工具并行(同時(shí)調(diào)用多個(gè)獨(dú)立工具)、推理緩存(相似狀態(tài)直接復(fù)用之前的推理)。


guardrails:預(yù)算、權(quán)限、人類檢查點(diǎn)

Agent能執(zhí)行代碼、調(diào)用API、訪問網(wǎng)絡(luò)——這既是能力也是風(fēng)險(xiǎn)。架構(gòu)設(shè)計(jì)必須包含guardrails(防護(hù)欄)。

預(yù)算上限:?jiǎn)未稳蝿?wù)的最大token消耗、最大工具調(diào)用次數(shù)、最大執(zhí)行時(shí)間。超出即終止,防止無限循環(huán)或資源耗盡。

權(quán)限控制:工具的分級(jí)授權(quán)。讀操作(查看代碼、搜索信息)可以自動(dòng)執(zhí)行;寫操作(修改文件、提交代碼)需要確認(rèn);危險(xiǎn)操作(刪除數(shù)據(jù)、部署生產(chǎn))必須人工審批。

人類檢查點(diǎn):關(guān)鍵步驟暫停,等待人類輸入。Cursor的Composer在批量修改前展示計(jì)劃,Devin演示中也會(huì)在關(guān)鍵決策點(diǎn)"請(qǐng)示"用戶——雖然演示視頻有剪輯,但產(chǎn)品設(shè)計(jì)中明顯留了這個(gè)口子。

這些限制不是"降級(jí)",是產(chǎn)品化必需。完全自動(dòng)的Agent在demo里很酷,但在真實(shí)工作流中,用戶需要控制感和糾錯(cuò)機(jī)會(huì)。

架構(gòu)選型:什么時(shí)候需要Agent,什么時(shí)候不需要

不是所有場(chǎng)景都需要Agent架構(gòu)。判斷標(biāo)準(zhǔn):任務(wù)是否需要多步驟決策?是否需要調(diào)用外部工具?是否需要跨會(huì)話保持上下文?迭代空間是否大(即不太可能一次做對(duì))?

如果四個(gè)都是"否",傳統(tǒng)LLM應(yīng)用更簡(jiǎn)單可靠。如果是"是",Agent架構(gòu)的復(fù)雜性才有回報(bào)。

當(dāng)前Agent產(chǎn)品的分化也反映了這點(diǎn)。Cursor和GitHub Copilot聚焦代碼場(chǎng)景——代碼天然結(jié)構(gòu)化、工具明確(編輯器、終端、測(cè)試)、反饋即時(shí)(編譯錯(cuò)誤、測(cè)試失敗),是Agent的理想試驗(yàn)田。

Devin試圖泛化到"AI軟件工程師",但公開信息有限,實(shí)際能力邊界不清。2億美元估值更多是對(duì)"第一個(gè)AI工程師"概念的押注,而非已驗(yàn)證的產(chǎn)品價(jià)值。

更務(wù)實(shí)的落地可能是"Agent作為工作流組件":在特定環(huán)節(jié)調(diào)用Agent能力,而非端到端替代人類。比如自動(dòng)處理標(biāo)準(zhǔn)化的代碼審查意見、生成初版文檔、執(zhí)行預(yù)定義的測(cè)試套件——這些有明確邊界、可驗(yàn)證輸出、失敗可回滾。

架構(gòu)上,這意味著Agent需要設(shè)計(jì)"優(yōu)雅降級(jí)":當(dāng)規(guī)劃失敗、工具報(bào)錯(cuò)、預(yù)算超支時(shí),能保存狀態(tài)、通知人類、提供上下文以便接手。不是"全或無"的自動(dòng)化,而是"人機(jī)協(xié)作"的漸進(jìn)替代。

Cursor的用戶反饋里有個(gè)細(xì)節(jié):有人讓Composer重構(gòu)一個(gè)遺留模塊,AI生成了看似合理的改動(dòng),但運(yùn)行后性能反而下降。用戶回滾,手動(dòng)分析,發(fā)現(xiàn)AI沒理解某個(gè)隱式的業(yè)務(wù)約束——這個(gè)約束沒寫在代碼里,只在老員工的記憶里。

這個(gè)案例說明:Agent能處理"顯式知識(shí)"(代碼、文檔、API),但"隱性知識(shí)"(組織慣例、歷史決策、未文檔化的約束)仍是短板。記憶系統(tǒng)可以存儲(chǔ)顯式事實(shí),但難以捕獲這種默會(huì)知識(shí)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
喪心病狂!河南14歲少年被虐死案:死時(shí)穿紙尿褲,胃里空無一物

喪心病狂!河南14歲少年被虐死案:死時(shí)穿紙尿褲,胃里空無一物

春日在捕月
2026-03-25 01:00:23
烏克蘭摧毀波羅的海最大的俄方港口!圣彼得堡機(jī)場(chǎng)被迫關(guān)閉

烏克蘭摧毀波羅的海最大的俄方港口!圣彼得堡機(jī)場(chǎng)被迫關(guān)閉

項(xiàng)鵬飛
2026-03-23 20:18:18
短短1年,靈活就業(yè)者暴增4千萬

短短1年,靈活就業(yè)者暴增4千萬

深度報(bào)
2026-03-23 21:47:58
毛主席看完工資方案沉默良久,對(duì)周總理說:這不是把我架爐子上烤嗎

毛主席看完工資方案沉默良久,對(duì)周總理說:這不是把我架爐子上烤嗎

文史明鑒
2026-03-26 15:22:47
世預(yù)賽歐洲區(qū)開打!明晨將有8隊(duì)出局 8隊(duì)進(jìn)決賽 意大利生死戰(zhàn)

世預(yù)賽歐洲區(qū)開打!明晨將有8隊(duì)出局 8隊(duì)進(jìn)決賽 意大利生死戰(zhàn)

葉青足球世界
2026-03-26 08:47:10
來俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,殺全族都行

來俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,殺全族都行

銘記歷史呀
2026-03-09 15:28:19
大反轉(zhuǎn)!U23國(guó)足球員勸架染紅原因終于找到了,球迷曝光現(xiàn)場(chǎng)視頻

大反轉(zhuǎn)!U23國(guó)足球員勸架染紅原因終于找到了,球迷曝光現(xiàn)場(chǎng)視頻

侃球熊弟
2026-03-26 00:36:57
馬英九真正翻臉原因是鄭麗文聘請(qǐng)王金平為最高顧問,把馬晾在一邊

馬英九真正翻臉原因是鄭麗文聘請(qǐng)王金平為最高顧問,把馬晾在一邊

雪中風(fēng)車
2026-03-26 09:16:02
美國(guó)收到糟糕信號(hào)!中方72歲老將剛回國(guó),東盟十一國(guó)使節(jié)齊聚北京

美國(guó)收到糟糕信號(hào)!中方72歲老將剛回國(guó),東盟十一國(guó)使節(jié)齊聚北京

通鑒史智
2026-03-26 15:20:48
軍統(tǒng)天津站組長(zhǎng)羅鎮(zhèn)被抓,羅榮桓:他就是軍區(qū)司令邢仁甫,大叛徒

軍統(tǒng)天津站組長(zhǎng)羅鎮(zhèn)被抓,羅榮桓:他就是軍區(qū)司令邢仁甫,大叛徒

抽象派大師
2026-03-25 12:55:59
這是目前為止,我見過腰最細(xì)的女生,沒有之一

這是目前為止,我見過腰最細(xì)的女生,沒有之一

草莓解說體育
2026-03-03 19:15:05
東契奇創(chuàng)4大紀(jì)錄仍無緣日最佳,抱歉約基奇打出前無古人的數(shù)據(jù)

東契奇創(chuàng)4大紀(jì)錄仍無緣日最佳,抱歉約基奇打出前無古人的數(shù)據(jù)

毒舌NBA
2026-03-26 13:11:59
一瓶3塊,爆賣2億!喝一口能把人送走的廣東神飲,讓老表們瘋搶了

一瓶3塊,爆賣2億!喝一口能把人送走的廣東神飲,讓老表們瘋搶了

毒sir財(cái)經(jīng)
2026-03-16 21:37:01
“戲混子”又來霍霍年代?。坷蠚鈾M秋、演技拉胯,難怪觀眾不買賬

“戲混子”又來霍霍年代?。坷蠚鈾M秋、演技拉胯,難怪觀眾不買賬

翰飛觀事
2026-03-24 17:00:30
雷軍曬成績(jī):小米SU7、YU7雙雙第一!

雷軍曬成績(jī):小米SU7、YU7雙雙第一!

快科技
2026-03-26 13:09:04
14.99萬!“史上最便宜”特斯拉來了

14.99萬!“史上最便宜”特斯拉來了

首席品牌觀察
2026-03-24 16:18:39
貌美如花卻身高2.26米,母親為婚嫁發(fā)愁

貌美如花卻身高2.26米,母親為婚嫁發(fā)愁

流云隨風(fēng)去遠(yuǎn)方
2026-03-01 18:22:40
長(zhǎng)護(hù)險(xiǎn)制度全面推開!國(guó)家醫(yī)保局:參保人無論來自農(nóng)村還是城市,從同一個(gè)資金池報(bào)銷費(fèi)用

長(zhǎng)護(hù)險(xiǎn)制度全面推開!國(guó)家醫(yī)保局:參保人無論來自農(nóng)村還是城市,從同一個(gè)資金池報(bào)銷費(fèi)用

紅星新聞
2026-03-26 11:28:05
1989年哈梅內(nèi)伊在北京吃烤鴨時(shí),一張罕見留影,此后再未踏出國(guó)門

1989年哈梅內(nèi)伊在北京吃烤鴨時(shí),一張罕見留影,此后再未踏出國(guó)門

動(dòng)物奇奇怪怪
2026-03-07 01:52:57
20年后再看《亮劍》:軍事上漏洞百出,政治上莫名其妙

20年后再看《亮劍》:軍事上漏洞百出,政治上莫名其妙

明月清風(fēng)閣
2026-03-25 14:50:09
2026-03-26 16:23:00
硬核玩家2哈
硬核玩家2哈
沉淀中,勿擾
156文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

上海媽媽尋親27年懸賞市區(qū)一套房:不用盡孝 要個(gè)擁抱

頭條要聞

上海媽媽尋親27年懸賞市區(qū)一套房:不用盡孝 要個(gè)擁抱

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡(jiǎn)

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

時(shí)尚
手機(jī)
房產(chǎn)
數(shù)碼
軍事航空

皮衣+裙,高級(jí)到炸

手機(jī)要聞

蘋果回應(yīng)iPhone自動(dòng)打電話 升級(jí)系統(tǒng)可解決

房產(chǎn)要聞

質(zhì)價(jià)比標(biāo)桿!三亞首創(chuàng)浮島全景艙亮相,還得是萬科!

數(shù)碼要聞

三星更新870 EVO系列SATA SSD:最高8TB 定價(jià)超1萬元

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版