国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Devin估值20億卻未上線,AI Agent架構(gòu)藏了3個(gè)反直覺

0
分享至


175萬美元融資、20億美元估值,Cognition的Devin還沒公開發(fā)布就已經(jīng)讓硅谷瘋狂。GitHub Copilot的Agent模式能跨文件重構(gòu)代碼,Cursor的Composer能重寫整個(gè)項(xiàng)目——這些不是聊天機(jī)器人,是能思考、規(guī)劃、執(zhí)行任務(wù)的AI Agent。它們的架構(gòu)設(shè)計(jì),正在成為AI工程領(lǐng)域最熱門的話題。

傳統(tǒng)大語言模型應(yīng)用是"提問-回答"的單次循環(huán)。但訂機(jī)票、調(diào)試代碼、研究競品這些真實(shí)任務(wù),需要多步驟決策、工具調(diào)用和迭代優(yōu)化。AI Agent的突破在于:它們運(yùn)行在"觀察-思考-執(zhí)行"的循環(huán)里,而非一次性響應(yīng)。

規(guī)劃模塊:把模糊目標(biāo)切成可執(zhí)行的碎片

當(dāng)你讓Agent"調(diào)研競品定價(jià)并生成對比報(bào)告",它不會直接瞎編。規(guī)劃模塊會把這個(gè)目標(biāo)拆解為:識別競品→找到定價(jià)頁面→提取數(shù)據(jù)→整理成表→撰寫分析。

常見的規(guī)劃策略包括思維鏈推理(逐步思考)、任務(wù)分解(拆分子目標(biāo))、計(jì)劃-執(zhí)行模式(先定計(jì)劃再執(zhí)行)。沒有規(guī)劃能力的Agent,就像讓實(shí)習(xí)生直接"做個(gè)市場分析"卻不給任何指導(dǎo)——結(jié)果大概率是災(zāi)難。

Devin的演示視頻里有個(gè)細(xì)節(jié):接到任務(wù)后它會先列出待辦清單(To-do List),每完成一項(xiàng)就打勾。這個(gè)看似簡單的交互,背后是任務(wù)分解算法的具象化。Cognition團(tuán)隊(duì)沒公開技術(shù)細(xì)節(jié),但這種"人類可讀的規(guī)劃過程"本身就是產(chǎn)品設(shè)計(jì)的一部分。

規(guī)劃模塊的設(shè)計(jì)陷阱在于過度樂觀。工程師常假設(shè)AI能一次性生成完美計(jì)劃,但真實(shí)場景需要?jiǎng)討B(tài)調(diào)整。GitHub Copilot的Agent模式采用"計(jì)劃-執(zhí)行-反思"的三段式,每執(zhí)行一步都會評估是否需要回溯。這種保守策略犧牲了速度,換取了復(fù)雜任務(wù)的成功率。

記憶系統(tǒng):從"金魚"到"有經(jīng)驗(yàn)的老手"

沒有記憶的Agent會重復(fù)犯錯(cuò)、丟失上下文。一個(gè)設(shè)計(jì)良好的記憶系統(tǒng)有兩層架構(gòu):

短期記憶存儲當(dāng)前任務(wù)的上下文窗口——正在改哪行代碼、剛才查到了什么數(shù)據(jù)、用戶的最新指令。長期記憶則是持久化的知識庫,記錄用戶偏好、項(xiàng)目規(guī)范、歷史決策。

原文給了一段簡潔的Python偽代碼:AgentMemory類用列表存短期記憶,用字典存長期記憶,每個(gè)條目帶時(shí)間戳。這看起來樸素,但工程實(shí)現(xiàn)遠(yuǎn)比示例復(fù)雜。

短期記憶的挑戰(zhàn)在于上下文窗口限制。當(dāng)Agent處理大型代碼庫時(shí),如何篩選相關(guān)信息塞進(jìn)有限的Token?Cursor的做法是維護(hù)一個(gè)"工作集"(Working Set)——只保留當(dāng)前關(guān)注的文件和符號,而非整個(gè)項(xiàng)目。這類似于程序員自己在IDE里打開的標(biāo)簽頁。


長期記憶的核心難題是檢索。向量數(shù)據(jù)庫(Vector Database)是主流方案,但"語義相似≠任務(wù)相關(guān)"的問題始終存在。一個(gè)經(jīng)典踩坑案例:Agent記得"用戶喜歡用React",但在Next.js項(xiàng)目里這個(gè)偏好應(yīng)該被覆蓋——如何設(shè)計(jì)記憶的優(yōu)先級和失效機(jī)制,沒有標(biāo)準(zhǔn)答案。

記憶的本質(zhì)是把無狀態(tài)的函數(shù)調(diào)用,變成隨時(shí)間進(jìn)化的系統(tǒng)。這也是為什么同樣基座模型,加上記憶層后用戶體驗(yàn)天差地別。

工具層:Agent的"手"和"腳"

沒有工具,Agent只能生成文本。有了工具,它能調(diào)用API、執(zhí)行代碼、搜索網(wǎng)頁、操作文件系統(tǒng)。工具層被設(shè)計(jì)為插件系統(tǒng):每個(gè)工具有名稱、描述、輸入輸出Schema,Agent通過自然語言理解何時(shí)調(diào)用哪個(gè)。

工具調(diào)用的可靠性是工程噩夢。大語言模型生成JSON格式的工具調(diào)用參數(shù),但幻覺可能導(dǎo)致字段缺失、類型錯(cuò)誤、甚至編造不存在的工具。OpenAI的Function Calling模式通過強(qiáng)制Schema驗(yàn)證緩解這個(gè)問題,但邊界情況依然層出不窮。

Devin的工具集包括:代碼編輯器、瀏覽器、Shell命令行。它的演示視頻里有個(gè)驚艷場景:遇到報(bào)錯(cuò)后自動(dòng)搜索Stack Overflow,找到解決方案后嘗試修復(fù)。這個(gè)流程對人類程序員稀松平常,但對AI Agent來說需要協(xié)調(diào)三個(gè)工具的狀態(tài)——瀏覽器獲取的信息如何影響代碼編輯器的決策?

GitHub Copilot的Agent模式選擇更保守的工具策略。它主要操作代碼文件,瀏覽器和命令行權(quán)限受限。這種"戴著鐐銬跳舞"的設(shè)計(jì),降低了風(fēng)險(xiǎn),也限制了能力邊界。Cursor則走中間路線:Composer可以跨文件編輯,但關(guān)鍵操作需要用戶確認(rèn)。

工具層的設(shè)計(jì)哲學(xué)是信任梯度。讀文件最可控,寫文件次之,執(zhí)行命令風(fēng)險(xiǎn)最高,調(diào)用外部API則完全不可預(yù)測。不同產(chǎn)品在這個(gè)光譜上的選擇,定義了它們的性格。

推理引擎:ReAct模式的流行與爭議

當(dāng)前主流的推理架構(gòu)是ReAct(Reason + Act):觀察環(huán)境→思考下一步→執(zhí)行動(dòng)作→循環(huán)。這個(gè)模式把"思考過程"顯式化,讓Agent的行為可解釋、可調(diào)試。

ReAct的論文發(fā)表于2022年,原本用于增強(qiáng)語言模型的推理能力。但在Agent架構(gòu)里,它變成了控制循環(huán)的核心協(xié)議。每個(gè)迭代周期,Agent輸出一段"內(nèi)心獨(dú)白"(Thought),然后選擇工具執(zhí)行(Action),最后觀察結(jié)果(Observation)。

這種設(shè)計(jì)有個(gè)副作用:Token消耗爆炸。一個(gè)復(fù)雜任務(wù)可能需要幾十輪迭代,每輪都要把歷史記錄塞進(jìn)上下文。Devin能處理數(shù)小時(shí)的任務(wù),背后必然是激進(jìn)的上下文壓縮策略——但Cognition沒有公開具體方案。


替代方案正在涌現(xiàn)。Anthropic的Claude 3.5采用"計(jì)算機(jī)使用"(Computer Use)模式,直接輸出鼠標(biāo)鍵盤操作,跳過顯式思考步驟。這種端到端訓(xùn)練減少了中間環(huán)節(jié)的Token浪費(fèi),但黑箱程度更高,調(diào)試更困難。

推理架構(gòu)的選擇,本質(zhì)是透明度與效率的權(quán)衡。ReAct像詳細(xì)的日志,適合復(fù)雜任務(wù)的可追溯;端到端模式像直覺反應(yīng),適合高頻簡單操作。

guardrails:被忽視的架構(gòu)支柱

原文TL;DR里埋了個(gè)關(guān)鍵建議:始終設(shè)置防護(hù)欄(Guardrails)、預(yù)算上限、人工介入檢查點(diǎn)。這三點(diǎn)在Demo視頻里看不到,卻是生產(chǎn)環(huán)境的生死線。

人工介入檢查點(diǎn)的設(shè)計(jì)更微妙。完全自動(dòng)的Agent是科幻,半自動(dòng)的Agent是產(chǎn)品。Cursor的Composer在修改關(guān)鍵文件前會高亮提示,GitHub Copilot的Agent模式在跨目錄操作時(shí)要求確認(rèn)。這些"摩擦點(diǎn)"不是技術(shù)限制,是刻意為之的安全設(shè)計(jì)。

最隱蔽的風(fēng)險(xiǎn)是權(quán)限隔離。Devin的演示里它有自己的代碼倉庫和云環(huán)境,與用戶的生產(chǎn)環(huán)境物理隔離。如果直接讓Agent操作真實(shí)系統(tǒng),一個(gè)幻覺導(dǎo)致的`rm -rf /`就是災(zāi)難。SandBox(沙盒)技術(shù)在這里是標(biāo)配,但配置和維護(hù)成本常被低估。

防護(hù)欄不是錦上添花,是Agent架構(gòu)的第四根支柱。沒有它,前面三個(gè)模塊設(shè)計(jì)得再精巧,也只是實(shí)驗(yàn)室玩具。

Devin的20億美元估值引發(fā)過爭議:沒發(fā)布的產(chǎn)品憑什么這么貴?一種解釋是,Cognition押注的不是某個(gè)功能,而是"AI軟件工程師"這個(gè)品類的定義權(quán)。就像早期的iPhone定義了智能手機(jī)的交互范式,Devin的架構(gòu)選擇可能成為行業(yè)模板。

但定義權(quán)之爭遠(yuǎn)未結(jié)束。GitHub背靠微軟的代碼數(shù)據(jù),Cursor吃透了開發(fā)者的交互細(xì)節(jié),Anthropic有最強(qiáng)的模型能力。每家對"Agent該怎么做"有不同的答案:規(guī)劃要多細(xì)、記憶要多長、工具要多開放、人工介入要多頻繁。

這些選擇沒有標(biāo)準(zhǔn)答案,只有場景適配。企業(yè)級代碼生成需要保守的權(quán)限策略,個(gè)人自動(dòng)化腳本可以激進(jìn)一些。研究型Agent需要詳細(xì)的推理日志,客服Agent需要快速響應(yīng)。

一個(gè)值得玩味的細(xì)節(jié):Devin的官網(wǎng)至今沒有開放注冊,只有預(yù)約演示。Cognition在等什么?可能是模型能力的躍升,可能是安全性的打磨,也可能是在觀察競爭對手的踩坑——畢竟,第一個(gè)發(fā)布的不一定是贏家,第一個(gè)穩(wěn)定運(yùn)行的才是。

如果你正在設(shè)計(jì)或評估AI Agent系統(tǒng),哪個(gè)模塊的取舍最讓你糾結(jié)——是規(guī)劃的靈活性、記憶的準(zhǔn)確性、工具的權(quán)限邊界,還是人工介入的時(shí)機(jī)?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
學(xué)醫(yī)后才知道,保護(hù)心血管最好的運(yùn)動(dòng),不是快走慢跑,而是這個(gè)

學(xué)醫(yī)后才知道,保護(hù)心血管最好的運(yùn)動(dòng),不是快走慢跑,而是這個(gè)

垚垚分享健康
2026-03-26 13:09:39
奧恰洛夫:我從圈內(nèi)聽說,樊振東明年甚至有可能再換一次俱樂部

奧恰洛夫:我從圈內(nèi)聽說,樊振東明年甚至有可能再換一次俱樂部

懂球帝
2026-03-26 11:24:21
巴蒂:曾想成為大羅那樣的前鋒但我做不到;哈蘭德讓我很驚訝

巴蒂:曾想成為大羅那樣的前鋒但我做不到;哈蘭德讓我很驚訝

懂球帝
2026-03-26 11:02:09
一路走好!中醫(yī)大師黃貴華疑因心臟驟停去世,和張雪峰有相同習(xí)慣

一路走好!中醫(yī)大師黃貴華疑因心臟驟停去世,和張雪峰有相同習(xí)慣

冷紫葉
2026-03-26 18:24:16
英國以國家安全為由否決了中企在蘇格蘭建廠計(jì)劃,外交部:中英經(jīng)貿(mào)綠色合作的本質(zhì)是互利共贏,不應(yīng)受到泛政治化、泛安全化的沖擊

英國以國家安全為由否決了中企在蘇格蘭建廠計(jì)劃,外交部:中英經(jīng)貿(mào)綠色合作的本質(zhì)是互利共贏,不應(yīng)受到泛政治化、泛安全化的沖擊

瀟湘晨報(bào)
2026-03-26 16:25:20
美軍繼續(xù)調(diào)兵,伊朗已在哈爾克島布雷備戰(zhàn)!鴿派將軍們堅(jiān)持打下去

美軍繼續(xù)調(diào)兵,伊朗已在哈爾克島布雷備戰(zhàn)!鴿派將軍們堅(jiān)持打下去

鷹眼Defence
2026-03-26 16:06:38
美軍第82空降師3000人出兵,危急時(shí)刻,伊朗特種兵亮劍56沖和FPV

美軍第82空降師3000人出兵,危急時(shí)刻,伊朗特種兵亮劍56沖和FPV

滄海旅行家
2026-03-26 13:11:41
高速停車區(qū)衛(wèi)生間,滿地手紙無從下腳;甘肅高速回應(yīng):是個(gè)待開發(fā)停車區(qū),已打掃干凈

高速停車區(qū)衛(wèi)生間,滿地手紙無從下腳;甘肅高速回應(yīng):是個(gè)待開發(fā)停車區(qū),已打掃干凈

大風(fēng)新聞
2026-03-26 18:19:03
蠱惑人心 1:獨(dú)狼瘸東

蠱惑人心 1:獨(dú)狼瘸東

金昔說故事
2026-03-26 19:57:07
經(jīng)濟(jì)學(xué)家巴曙松被帶走調(diào)查?港交所回應(yīng)

經(jīng)濟(jì)學(xué)家巴曙松被帶走調(diào)查?港交所回應(yīng)

澎湃新聞
2026-03-25 20:01:16
60年前,金門戰(zhàn)役里被俘的3000名我軍將士,如今都怎么樣了

60年前,金門戰(zhàn)役里被俘的3000名我軍將士,如今都怎么樣了

老范談史
2026-03-17 09:58:57
紀(jì)念張雪峰的三個(gè)理由

紀(jì)念張雪峰的三個(gè)理由

阿亮評論
2026-03-25 09:20:28
騎士兩大敗因出爐,哈登賽季新高!阿特金森直言不諱,米切爾無奈

騎士兩大敗因出爐,哈登賽季新高!阿特金森直言不諱,米切爾無奈

魚崖大話籃球
2026-03-26 11:49:12
A股最慘股票!43個(gè)跌停從106元跌到0.07元,股民被連根拔起

A股最慘股票!43個(gè)跌停從106元跌到0.07元,股民被連根拔起

財(cái)經(jīng)市界
2026-03-10 08:42:16
小米把這套系統(tǒng)藏了15年,今天終于拔了插頭

小米把這套系統(tǒng)藏了15年,今天終于拔了插頭

我是一個(gè)粉刷匠2
2026-03-26 10:29:50
以軍對伊朗基礎(chǔ)設(shè)施發(fā)動(dòng)大規(guī)模打擊

以軍對伊朗基礎(chǔ)設(shè)施發(fā)動(dòng)大規(guī)模打擊

新華社
2026-03-26 12:29:02
大意了!張雪峰不同時(shí)段坐姿,證明他越來越疲憊了,可惜錯(cuò)過了

大意了!張雪峰不同時(shí)段坐姿,證明他越來越疲憊了,可惜錯(cuò)過了

魔都姐姐雜談
2026-03-26 10:53:11
“14天12板”!000908,復(fù)牌后上演“地天板”

“14天12板”!000908,復(fù)牌后上演“地天板”

大眾證券報(bào)
2026-03-26 17:58:54
淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

獨(dú)角showing
2025-12-31 21:08:57
男子買菜順手買體彩!花4元中698萬 先上班再領(lǐng)獎(jiǎng) 現(xiàn)場捐2000元

男子買菜順手買體彩!花4元中698萬 先上班再領(lǐng)獎(jiǎng) 現(xiàn)場捐2000元

念洲
2026-03-26 13:12:32
2026-03-26 20:31:00
硬核玩家2哈
硬核玩家2哈
沉淀中,勿擾
170文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

旅游
親子
家居
手機(jī)
軍事航空

旅游要聞

魯冰花開啦!快來新鄉(xiāng)南太行八里溝 赴一場春日之約

親子要聞

這就是引導(dǎo)型老師的厲害嗎?

家居要聞

傍海而居 靜觀蝴蝶海

手機(jī)要聞

狂攬307萬!紅米殺瘋了:K90破150萬、Turbo 5破百萬,性價(jià)比贏麻

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版