国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Devin估值20億卻未上線,AI Agent架構(gòu)藏著什么狠招

0
分享至


175億美元估值,產(chǎn)品還沒公開。Cognition的Devin創(chuàng)下這個紀(jì)錄時,很多人以為又是硅谷的泡沫游戲。但GitHub Copilot的Agent模式已經(jīng)在處理多文件重構(gòu),Cursor的Composer能重寫整個項目代碼——這些不是聊天機(jī)器人,是能規(guī)劃、能調(diào)用工具、能記住教訓(xùn)的AI Agent。

它們的架構(gòu)設(shè)計,正在成為AI工程領(lǐng)域最燙手的話題。

從"一問一答"到"觀察-思考-行動"循環(huán)

傳統(tǒng)大語言模型應(yīng)用像個盡職的客服:你給提示,它給回答。但現(xiàn)實世界的問題需要多步驟、決策、工具調(diào)用和迭代。訂機(jī)票、調(diào)試代碼、深度調(diào)研——這些都沒法在一個提示-響應(yīng)周期里完成。

AI Agent的解法是把流程改成循環(huán):觀察環(huán)境,思考策略,執(zhí)行動作,從結(jié)果學(xué)習(xí),再重復(fù)。

這個循環(huán)不是裝飾。Devin能獨立完成編程任務(wù),核心就在于它不會寫兩行代碼就交差,而是持續(xù)檢查運(yùn)行結(jié)果,遇到報錯就回溯修復(fù)。GitHub Copilot的Agent模式處理復(fù)雜重構(gòu)時,同樣會分階段驗證每個修改是否破壞了現(xiàn)有功能。

架構(gòu)層面,這個循環(huán)由四個模塊支撐:規(guī)劃模塊拆解任務(wù),記憶系統(tǒng)保留上下文,工具層對接外部能力,推理引擎驅(qū)動決策。

規(guī)劃模塊:把"大目標(biāo)"切成"可執(zhí)行塊"

當(dāng)你讓Agent"調(diào)研競品定價并輸出對比報告",它得自動拆解成:識別競品→找到定價頁面→提取數(shù)據(jù)→整理表格→撰寫分析。規(guī)劃模塊就是做這個的。

常見策略有三種。思維鏈推理(Chain-of-Thought):讓模型一步步想,顯式寫出中間步驟。任務(wù)分解:把目標(biāo)拆成子目標(biāo),逐個攻克。計劃-執(zhí)行模式:先完整制定計劃,再按步驟執(zhí)行,適合需要預(yù)審批的場景。

Cursor的Composer選擇了一種混合策略。面對跨文件重構(gòu),它會先掃描項目結(jié)構(gòu)生成依賴圖,再按風(fēng)險等級排序修改順序——核心模塊最后動,邊緣代碼先試手。這種規(guī)劃方式把大型重構(gòu)的失敗率從"頻繁崩潰"壓到了"偶爾需要人工介入"。

沒有規(guī)劃模塊的Agent,就像拿到食材就直接下鍋的廚師——可能做出東西,但大概率不是你要的那道菜。


記憶系統(tǒng):從"無狀態(tài)函數(shù)"到"越用越順手"

沒有記憶的Agent會重復(fù)犯錯,丟失上下文。一個設(shè)計良好的記憶系統(tǒng)分兩層:

短期記憶:當(dāng)前任務(wù)的上下文窗口,對話歷史、最近操作、中間結(jié)果都存在這里。長期記憶:持久化知識庫,存儲用戶偏好、過往教訓(xùn)、領(lǐng)域知識。

Cognition公開的代碼片段顯示,Devin的記憶系統(tǒng)用鍵值對存儲長期記憶,帶時間戳。這意味著它能記住"用戶上次要求React組件用函數(shù)式寫法"這類偏好,也能追蹤"這個API有速率限制"這類踩過的坑。

記憶讓Agent從"無狀態(tài)函數(shù)調(diào)用"變成"隨時間改進(jìn)的系統(tǒng)"。GitHub Copilot的個性化建議就依賴長期記憶——它記得你常用哪些庫、偏好的命名風(fēng)格、甚至常犯的語法錯誤模式。

但記憶也是把雙刃劍。Cursor早期版本曾因長期記憶污染導(dǎo)致建議質(zhì)量下降:舊項目的代碼風(fēng)格被錯誤應(yīng)用到新項目中。現(xiàn)在的解法是給記憶加權(quán)重衰減,越久遠(yuǎn)的記錄影響越小。

工具層:讓Agent長出"手"和"腳"

沒有工具,Agent只能生成文本。有了工具,它能執(zhí)行代碼、調(diào)用API、搜索網(wǎng)絡(luò)、操作文件系統(tǒng)。

工具層設(shè)計為插件系統(tǒng):每個工具有名稱、描述、輸入輸出模式。Agent通過推理引擎決定何時調(diào)用哪個工具,把自然語言意圖轉(zhuǎn)化為結(jié)構(gòu)化調(diào)用。

Devin的工具集包括:代碼編輯器、Shell終端、瀏覽器、計劃管理器。它能自己打開瀏覽器查文檔,用終端運(yùn)行測試,根據(jù)報錯定位問題。這套組合拳讓它在SWE-bench基準(zhǔn)測試中解決了13.86%的真實GitHub Issue——而GPT-4單獨完成率只有1.96%。

工具調(diào)用也是主要的失敗來源。Agent可能選錯工具、填錯參數(shù)、或者陷入"調(diào)用-報錯-再調(diào)用"的循環(huán)。Guardrails(護(hù)欄機(jī)制)在這里關(guān)鍵:預(yù)算上限防止無限循環(huán),人工檢查點卡住高風(fēng)險操作,工具權(quán)限分級限制破壞范圍。

GitHub Copilot的Agent模式就設(shè)置了隱性護(hù)欄:涉及刪除文件、修改配置等操作前,會暫停等待確認(rèn)。這種設(shè)計犧牲了部分"自主性",換取了用戶信任。


推理引擎:ReAct,讓"想"和"做"交替進(jìn)行

推理引擎是Agent的決策中樞。目前最主流的范式是ReAct(Reason + Act):交替進(jìn)行推理(Thought)和行動(Action)。

具體流程:Agent觀察當(dāng)前狀態(tài),生成思考("我需要先獲取天氣數(shù)據(jù)"),選擇行動(調(diào)用天氣API),觀察結(jié)果("北京今天晴,25度"),再生成下一步思考。這種交錯讓Agent能處理開放式任務(wù),動態(tài)調(diào)整策略。

ReAct的優(yōu)勢在于可解釋性。每個行動前有顯式推理,調(diào)試時能追蹤"它為什么這么做"。相比之下,端到端訓(xùn)練的Agent像個黑箱,出錯時難定位。

但ReAct也有代價。交替生成思考和行動增加了延遲,對實時性要求高的場景不友好。一些團(tuán)隊正在實驗"批量推理"——讓Agent先規(guī)劃多步,再批量執(zhí)行,減少LLM調(diào)用次數(shù)。

Cursor的Composer采用了變體方案:在代碼生成場景,它先做一次性思維鏈規(guī)劃,生成完整修改方案,用戶確認(rèn)后再批量執(zhí)行。這種"先想后做"模式犧牲了部分靈活性,但換來了效率和可控性。

Guardrails:給自主性套上韁繩

Agent的自主性是把雙刃劍。Cognition給Devin設(shè)計了多層防護(hù):預(yù)算上限(單次任務(wù)最大LLM調(diào)用次數(shù))、人工檢查點(關(guān)鍵操作前暫停)、沙箱環(huán)境(代碼執(zhí)行隔離)。

這些不是事后補(bǔ)丁,是架構(gòu)設(shè)計的核心部分。沒有Guardrails的Agent,可能在生產(chǎn)環(huán)境里刪庫、泄露密鑰、或者陷入無限循環(huán)燒光API額度。

一個被低估的設(shè)計是"優(yōu)雅降級"。當(dāng)Agent遇到無法處理的情況,不該硬撐,而該明確移交人類。Devin在SWE-bench測試中的失敗案例,很多是"自信地給出錯誤解法"而非"承認(rèn)不會"?,F(xiàn)在的迭代版本增加了不確定性量化——當(dāng)置信度低于閾值時主動求助。

GitHub Copilot的做法更保守:Agent模式默認(rèn)關(guān)閉,需要用戶顯式啟用;高風(fēng)險操作始終需要確認(rèn)。這種"漸進(jìn)式放權(quán)"策略,或許更適合企業(yè)級部署。

架構(gòu)層面,Guardrails應(yīng)該內(nèi)嵌而非外掛。在規(guī)劃模塊加入"可行性檢查",在工具層加入"權(quán)限校驗",在記憶系統(tǒng)加入"隱私過濾"——每一層都有自己的護(hù)欄,而非依賴最終的安全層。

Devin的20億美元估值是否合理?產(chǎn)品正式上線后,它的Agent架構(gòu)能否經(jīng)住真實開發(fā)場景的考驗——比如處理遺留代碼、協(xié)調(diào)多人協(xié)作、或者面對模糊需求時的表現(xiàn)?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
塞爾維亞購買中國超音速導(dǎo)彈?國防部:正常軍貿(mào)合作,不針對第三方

塞爾維亞購買中國超音速導(dǎo)彈?國防部:正常軍貿(mào)合作,不針對第三方

澎湃新聞
2026-03-26 17:24:26
周杰倫繼續(xù)割韭菜!網(wǎng)友一針見血:他唯一和華流關(guān)系最大的是割大陸韭菜

周杰倫繼續(xù)割韭菜!網(wǎng)友一針見血:他唯一和華流關(guān)系最大的是割大陸韭菜

爆角追蹤
2026-03-26 08:56:24
張少康辭去廣東省人民政府副省長職務(wù)

張少康辭去廣東省人民政府副省長職務(wù)

新快報新聞
2026-03-26 11:50:03
張雪峰去世真相!網(wǎng)友:偌大的公司靠他個人ip養(yǎng)活,早死是必然的

張雪峰去世真相!網(wǎng)友:偌大的公司靠他個人ip養(yǎng)活,早死是必然的

火山詩話
2026-03-25 09:18:58
Agentic AI元年,網(wǎng)絡(luò)進(jìn)入安全智聯(lián)時刻

Agentic AI元年,網(wǎng)絡(luò)進(jìn)入安全智聯(lián)時刻

ITPUB學(xué)院
2026-03-26 14:57:36
收評:三大指數(shù)均跌超1% 兩市成交額跌破2萬億

收評:三大指數(shù)均跌超1% 兩市成交額跌破2萬億

財聯(lián)社
2026-03-26 15:02:09
原來她是張雪峰前妻,90后歷史學(xué)博士?,兩人離婚后曾一起上節(jié)目

原來她是張雪峰前妻,90后歷史學(xué)博士?,兩人離婚后曾一起上節(jié)目

大鐵貓娛樂
2026-03-25 13:03:57
黎真主黨導(dǎo)彈襲擊以國防部及軍營

黎真主黨導(dǎo)彈襲擊以國防部及軍營

北青網(wǎng)-北京青年報
2026-03-26 10:19:17
“親媽霸占消防通道,兒子被火燒死”,這件事,簡直太魔幻了……

“親媽霸占消防通道,兒子被火燒死”,這件事,簡直太魔幻了……

桌子的生活觀
2026-03-26 12:28:04
扎哈羅娃警告日本:任何試圖向烏提供致命武器之舉,都將招致強(qiáng)硬回應(yīng)

扎哈羅娃警告日本:任何試圖向烏提供致命武器之舉,都將招致強(qiáng)硬回應(yīng)

環(huán)球網(wǎng)資訊
2026-03-26 08:55:12
我與63歲老同學(xué)搭伙,他退休金13000全給我,僅僅7天我就受不了了

我與63歲老同學(xué)搭伙,他退休金13000全給我,僅僅7天我就受不了了

蟬吟槐蕊
2026-03-26 13:19:09
1000億背后的陽謀:拼多多利用中國制造的優(yōu)勢,要狂掃國外市場

1000億背后的陽謀:拼多多利用中國制造的優(yōu)勢,要狂掃國外市場

風(fēng)向觀察
2026-03-25 20:46:14
首秀庫拉索,國足主帥邵佳一:國家隊的比賽沒有友誼賽

首秀庫拉索,國足主帥邵佳一:國家隊的比賽沒有友誼賽

澎湃新聞
2026-03-26 15:58:27
中國買了歐洲1000億人民幣的飛機(jī):東航向空客購買101架A320

中國買了歐洲1000億人民幣的飛機(jī):東航向空客購買101架A320

觀察者網(wǎng)
2026-03-25 18:00:06
張雪峰死因:吃外賣撐住了?

張雪峰死因:吃外賣撐住了?

李萬卿
2026-03-26 10:48:19
是什么,讓這個日本自衛(wèi)官竟敢對中國大使館舉刀?

是什么,讓這個日本自衛(wèi)官竟敢對中國大使館舉刀?

環(huán)球時報國際
2026-03-26 00:13:51
俄羅斯警告日本!俄輸油重港接連遭攻擊,“現(xiàn)場濃煙滾滾”;俄烏戰(zhàn)場驚現(xiàn)持槍機(jī)器人:身高180cm,可AI評估戰(zhàn)場并偵察射擊

俄羅斯警告日本!俄輸油重港接連遭攻擊,“現(xiàn)場濃煙滾滾”;俄烏戰(zhàn)場驚現(xiàn)持槍機(jī)器人:身高180cm,可AI評估戰(zhàn)場并偵察射擊

每日經(jīng)濟(jì)新聞
2026-03-26 15:53:05
萬科高管被要求退還薪酬

萬科高管被要求退還薪酬

地產(chǎn)微資訊
2026-03-26 12:22:04
我國航空發(fā)動機(jī)領(lǐng)域著名專家嚴(yán)紅病逝,年僅57歲

我國航空發(fā)動機(jī)領(lǐng)域著名專家嚴(yán)紅病逝,年僅57歲

澎湃新聞
2026-03-26 11:40:26
堅決反對中國任何城市申辦奧運(yùn)會,國際奧委會這次怕是真失算了

堅決反對中國任何城市申辦奧運(yùn)會,國際奧委會這次怕是真失算了

南權(quán)先生
2026-03-25 15:25:11
2026-03-26 17:51:00
硬核玩家2哈
硬核玩家2哈
沉淀中,勿擾
156文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

男子從四家公司貸出共計356萬元 實際到手卻僅8萬多元

頭條要聞

男子從四家公司貸出共計356萬元 實際到手卻僅8萬多元

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財經(jīng)要聞

長護(hù)險誰能享受?享受多少?解答來了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

本地
數(shù)碼
旅游
教育
家居

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

數(shù)碼要聞

蘋果MacBook Neo將重塑整個筆電行業(yè)!分析師紛紛強(qiáng)調(diào):打不過

旅游要聞

視點|陶然亭公園海棠春花文化節(jié),解鎖春日新體驗

教育要聞

中小學(xué)家長必看數(shù)據(jù),看與不看都會后悔

家居要聞

傍海而居 靜觀蝴蝶海

無障礙瀏覽 進(jìn)入關(guān)懷版