国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

構(gòu)建Claude Code的經(jīng)驗教訓(xùn):從智能體的視角觀察

0
分享至


作者 | Michael Redlich

譯者 | 劉雅夢

策劃 | 褚杏娟

構(gòu)建智能體工具帶中最困難的部分之一是構(gòu)建其動作空間。

Claude 通過工具調(diào)用來執(zhí)行操作,但是在 Claude API 中有很多方法可以使用原語,比如 bash、skills 和最近添加的代碼執(zhí)行來構(gòu)造工具(閱讀 @RLanceMartin 的新文章,了解更多關(guān)于 Claude API 的編程工具調(diào)用)。

考慮到所有這些選項,你如何設(shè)計智能體的工具?你是否只需要一個像代碼執(zhí)行或 bash 這樣的工具嗎?如果你有 50 個工具,每個工具對應(yīng)一個智能體可能遇到的用例,那會怎么樣?

為了將自己置于模型的思維中,我喜歡想象被給予一個困難的數(shù)學(xué)問題。你想用什么工具來解它?這要看你自己的技術(shù)了!

紙張是最基本的,但你將受限于手動計算。計算器會更好,但你需要知道如何操作更高級的選項。最快和最強大的選擇是計算機,但你必須知道如何使用它來編寫和執(zhí)行代碼。

這是一個設(shè)計智能體的有用框架。你想給它提供適合它自身能力的工具。但你怎么知道這些能力是什么呢?你要集中注意力,閱讀它的輸出,進行實驗。你要學(xué)著像智能體一樣看問題。

以下是我們在構(gòu)建 Claude Code 時從關(guān)注 Claude 中學(xué)到的一些經(jīng)驗教訓(xùn)。

改進 Elicitation 和
AskUserQuestion 工具


在構(gòu)建 AskUserQuestion 工具時,我們的目標(biāo)是提高 Claude 提問的能力(通常稱為啟發(fā))。

雖然 Claude 可以直接問問題,但我們發(fā)現(xiàn)回答這些問題似乎花費了不必要的時間。我們怎樣才能降低這種摩擦,增加用戶和 Claude 之間的交流帶寬呢?

嘗試 1:編輯 ExitPlanTool

我們首先嘗試的是向 ExitPlanTool 添加一個參數(shù),以便在計劃旁邊放置一系列問題。這是最容易實現(xiàn)的事情,但這讓 Claude 感到困惑,因為我們同時要求制定一個計劃,并提出一系列關(guān)于計劃的問題。如果用戶的回答與計劃內(nèi)容相沖突怎么辦?Claude 需要調(diào)用 ExitPlanTool 兩次嗎?我們需要另一種方法。

(你可以在我們關(guān)于提示緩存的文章中閱讀更多關(guān)于我們?yōu)槭裁?要創(chuàng)建 ExitPlanTool 的信息)

嘗試 2:改變輸出格式

接下來,我們嘗試修改 Claude 的輸出指令,以使用稍微修改的 markdown 格式來提問。例如,我們可以要求它輸出一個帶有括號中替代選項的要點問題列表。然后,我們可以解析該問題并將其格式化為用戶的 UI。

雖然這是我們能做的最通用的更改,Claude 甚至似乎能夠很好地輸出這個,但這并不能保證。Claude 會附加額外的句子,省略選項,或者完全使用不同的格式。

嘗試 3:AskUserQuestion 工具


最后,我們決定創(chuàng)建一個 Claude 可以在任何時候調(diào)用的工具,但特別提示在計劃模式期間這樣做。當(dāng)工具觸發(fā)時,我們會顯示一個模態(tài)框來顯示問題,并阻止智能體的循環(huán)直到用戶回答。

這個工具允許我們提示 Claude 進行結(jié)構(gòu)化輸出,并幫助我們確保 Claude 給用戶提供多個選項。它還為用戶提供了組合此功能的方法,例如在代理式 SDK 中調(diào)用它或在技能中引用它。

最重要的是,Claude 似乎很喜歡調(diào)用這個工具,我們發(fā)現(xiàn)它的輸出效果很好。即使是最好的設(shè)計工具,如果 Claude 不知道如何調(diào)用它,也是行不通的。

這是 Claude Code 中啟發(fā)的最終形式嗎?我們不確定。正如你將在下一個例子中看到的,適用于一個模型的方法可能不適用于另一個模型。

更新能力:任務(wù)和待辦事項


當(dāng)我們第一次發(fā)布 Claude Code 時,我們意識到模型需要一個待辦事項列表來保持它的正常運行??梢栽陂_始時編寫待辦事項,并在模型工作時進行檢查。為此,我們給了 Claude TodoWrite 工具,它可以編寫或更新待辦事項并將其顯示給用戶。

但即便如此,我們也經(jīng)??吹?Claude 忘記了它的職責(zé)。為了適應(yīng)這種情況,我們每 5 個回合就會插入系統(tǒng)提醒,提醒 Claude 它的目標(biāo)。

但隨著模型的改進,它們不僅不需要被提醒待辦事項列表,而且還會發(fā)現(xiàn)它的局限性。收到待辦事項清單的提醒使 Claude 認(rèn)為它必須堅持而不是修改它。我們還看到 Opus 4.5 在使用子智能體方面做得更好,但是子智能體如何在共享的待辦事項列表進行協(xié)調(diào)呢?

看到這一點,我們用任務(wù)工具代替了 TodoWrite(閱讀更多 關(guān)于任務(wù)的內(nèi)容)。待辦事項的作用是保持模型的正常運行,而任務(wù)的作用更多的是幫助智能體相互溝通。任務(wù)可以包括依賴關(guān)系,在子智能體之間共享更新,模型可以更改和刪除它們。

隨著模型功能的增加,你的模型曾經(jīng)需要的工具現(xiàn)在可能會限制它們。重要的是要不斷地回顧之前關(guān)于需要什么工具的假設(shè)。這也是為什么堅持支持一小組具有相當(dāng)相似的功能配置文件的模型是有用的。

設(shè)計一個搜索界面

對 Claude 來說,一組特別重要的工具是搜索工具,可以用來構(gòu)建自己的上下文。

當(dāng) Claude Code 首次推出時,我們使用了一個 RAG 向量數(shù)據(jù)庫來查找 Claude 的上下文。雖然 RAG 功能強大且速度快,但它需要索引和設(shè)置,并且在許多不同的環(huán)境中可能很脆弱。更重要的是,Claude 被賦予了這個上下文,而不是自己找到上下文。

但如果 Claude 能在網(wǎng)絡(luò)上搜索,為什么不搜索你的代碼庫呢?通過給 Claude 一個 Grep 工具,我們可以讓它自己搜索文件和構(gòu)建上下文。

這是我們看到的一個模式,隨著 Claude 變得越來越聰明,如果給它合適的工具,它就會越來越善于構(gòu)建它的環(huán)境。

當(dāng)我們引入智能體技能時,我們正式定義了漸進式披露的概念,它允許智能體通過探索逐步發(fā)現(xiàn)相關(guān)的上下文。

Claude 可以讀取技能文件,然后這些文件可以引用模型可以遞歸讀取的其他文件。事實上,技能的一個常見用途是為 Claude 添加更多的搜索功能,比如告訴它如何使用 API 或查詢數(shù)據(jù)庫。

在一年的時間里,Claude 從不能真正建立自己的上下文,到能夠在幾層文件中進行嵌套搜索,以找到它所需要的確切上下文。

漸進式披露現(xiàn)在是我們在不添加工具的情況下添加新功能的常用技術(shù)。

漸進式披露:
Claude Code 指南智能體

Claude Code 目前有大約 20 個工具,我們不斷地問自己是否需要所有這些工具。添加新工具的門檻很高,因為這給模型提供了更多的選擇。

例如,我們注意到 Claude 對如何使用 Claude Code 了解不夠。如果你問它如何添加 MCP 或者斜杠命令的作用,它將無法回答。

我們本可以將所有這些信息放在系統(tǒng)提示中,但考慮到用戶很少詢問這些信息,這將增加上下文的腐朽并干擾 Claude Code 的主要工作:編寫代碼。

相反,我們嘗試了一種漸進披露的形式。我們給了 Claude 一個文檔的鏈接,他可以下載這個鏈接來搜索更多的信息。這是有效的,但我們發(fā)現(xiàn) Claude 會把很多結(jié)果放到上下文中來找到正確的答案,而你真正需要的只是答案。

因此,我們構(gòu)建了 Claude Code 指南子智能體,當(dāng)你詢問它自己時,Claude 會被提示調(diào)用,子智能體有關(guān)于如何很好地搜索文檔以及返回什么內(nèi)容的大量說明。

雖然這不是完美的,Claude 仍然會感到困惑,當(dāng)你問它如何設(shè)置自己,它是比以前好得多!我們能夠在不添加工具的情況下向 Claude 的動作空間添加?xùn)|西。

是藝術(shù),不是科學(xué)

如果你希望有一套關(guān)于如何構(gòu)建工具的嚴(yán)格規(guī)則,很遺憾,這不是本指南。為模型設(shè)計工具既是一門科學(xué),也是一門藝術(shù)。這在很大程度上取決于你正在使用的模型,智能體的目標(biāo)以及它所處的環(huán)境。

經(jīng)常實驗,閱讀你的成果,嘗試新事物。像一個智能體一樣看待問題。

https://x.com/trq212/status/2027463795355095314

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

南方都市報
2026-04-26 20:40:18
男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢也怕堵車

男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢也怕堵車

丫頭舫
2026-04-27 17:39:57
38歲王思聰近照認(rèn)不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

38歲王思聰近照認(rèn)不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

橙星文娛
2026-04-27 14:17:09
2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補時絕平,曼聯(lián)險勝

2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補時絕平,曼聯(lián)險勝

足球狗說
2026-04-28 05:07:09
“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

未央看點
2026-04-27 22:13:40
從排隊入籍到集體觀望?美國入籍申請驟降,綠卡人群態(tài)度變了?

從排隊入籍到集體觀望?美國入籍申請驟降,綠卡人群態(tài)度變了?

紐約時間
2026-04-28 02:29:16
看完女排最新集訓(xùn),心里五味雜陳!別說里約,連倫敦周期都比不上

看完女排最新集訓(xùn),心里五味雜陳!別說里約,連倫敦周期都比不上

金毛愛女排
2026-04-28 00:00:04
Deepseek,光通信之后的下一個主升浪

Deepseek,光通信之后的下一個主升浪

靜姐的財富第六感
2026-04-26 22:31:06
淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

風(fēng)過鄉(xiāng)
2026-04-27 06:15:09
有的人為了當(dāng)官,把老婆送給領(lǐng)導(dǎo)睡

有的人為了當(dāng)官,把老婆送給領(lǐng)導(dǎo)睡

斜杠人生
2026-04-28 00:00:04
金價:大家不用等候了!不出意外,金價可能將歷史重演!

金價:大家不用等候了!不出意外,金價可能將歷史重演!

殘夢重生來
2026-04-28 04:40:09
不到72小時,俞敏洪再迎兩大壞消息,主播集體辭職只是“開胃菜”

不到72小時,俞敏洪再迎兩大壞消息,主播集體辭職只是“開胃菜”

阿廢冷眼觀察所
2026-04-28 00:24:36
皮蛋再次成為關(guān)注對象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

皮蛋再次成為關(guān)注對象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

健康科普365
2026-04-25 09:27:08
七萬匹東洋大馬的覆滅:國民黨三年敗光日本四十五年心血

七萬匹東洋大馬的覆滅:國民黨三年敗光日本四十五年心血

小莜讀史
2026-04-26 22:44:33
特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

線裝史冊
2026-04-28 02:38:29
東南亞隱藏的“電詐大佬”,一個個正在浮出水面

東南亞隱藏的“電詐大佬”,一個個正在浮出水面

現(xiàn)實的聲音
2026-04-27 20:36:14
大姑子一家9口住進來,老公說他5200養(yǎng)活全家足夠,我?guī)夯啬锛?>
    </a>
        <h3>
      <a href=麥子情感故事
2026-04-27 21:34:15
沒人再提激光雷達數(shù)量?直擊北京車展:今年智能駕駛“卷”什么

沒人再提激光雷達數(shù)量?直擊北京車展:今年智能駕駛“卷”什么

時代周報
2026-04-26 18:14:26
涉黃被傳喚,馬斯克出事了

涉黃被傳喚,馬斯克出事了

營銷頭版
2026-04-27 14:42:14
中國排協(xié)官宣!16點30分,女排訓(xùn)練將直播,第二批球員恐揭曉

中國排協(xié)官宣!16點30分,女排訓(xùn)練將直播,第二批球員恐揭曉

跑者排球視角
2026-04-27 23:48:17
2026-04-28 05:28:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
12309文章數(shù) 51863關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀(jì)元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

本地
藝術(shù)
家居
時尚
手機

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

藝術(shù)要聞

他的油畫筆觸粗獷又細膩,透著一種不可言說的美!

家居要聞

江景風(fēng)格 流動的秩序

絲巾的10種系法,愛美的女人必看

手機要聞

一加Nord CE6 Lite官宣5月7日發(fā)布,7000mAh電池

無障礙瀏覽 進入關(guān)懷版