国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

30天養(yǎng)蝦秘籍公開!第4天差點團滅,最后跑出“AI軍團”,超全避坑干貨在此

0
分享至


智東西
作者|江宇
編輯|漠影

一套“24小時運轉”的龍蝦團隊,在上線第4天,差點被主人親手“團滅”。

智東西3月10日報道,海外知名AI科技博主、前谷歌產品經理Shubham Saboo近日在社交平臺公開復盤了自己連續(xù)運行30天的AI Agent系統(tǒng)。


在他的設想中,這支“龍蝦團隊”應該像一個自動運轉的小型內容工作室:有人負責研究行業(yè)信息,有人負責寫內容,還有人負責發(fā)布和運營賬號,整個流程全天候自動運行。但現(xiàn)實很快給了他一記悶棍。

最初幾天,這套系統(tǒng)幾乎可以用“災難”來形容:負責寫內容的Agent寫出來的推文又長又空,讀起來像模板拼接;負責搜集信息的Agent一天抓回47條所謂的“行業(yè)線索”,其中40條都是沒用的假消息。

Saboo后來回憶,那幾天他幾乎一直在給Agent“擦屁股”。他花在修改Agent輸出上的時間,甚至比自己手動把這些事情做完還多。上線第4天,他差點直接把整套系統(tǒng)關掉。

但事情在幾周后開始出現(xiàn)轉折。同樣的模型、同樣的提示詞,第4周時,這些Agent生成的內容已經可以直接拿來用,大多數(shù)草稿只需要改兩三個詞就能發(fā)布。原本需要他反復返工的任務,開始自動跑通。

在這份復盤里,他回答了一個問題:為什么那么多人“養(yǎng)蝦”時,第一周就速速放棄,而有些人卻能把龍蝦變成同事,效率倍增。

一、第1周幾乎是“負收益”:改Agent比自己干活還累

Saboo最早上線的Agent是運營Agent——“Kelly”,負責運營他的X賬號。第一天只是搭建環(huán)境,第二天開始生成推文,但結果并不理想。

Kelly寫出來的內容既冗長又套路化,經常使用列表和箭頭符號,開頭是“我很高興宣布……”,結尾再配上一串標簽,整體風格不是作者平時的表達方式。

Saboo回憶,在第一周里,他幾乎每天都在修改這些內容,花在修正Agent輸出上的時間,比自己直接寫一條推文還多。原本期待AI帶來效率提升,現(xiàn)實卻是不斷修補錯誤輸出,同時還要維護系統(tǒng)本身。

后來復盤這段經歷時,他把這個過程稱為 “糾錯式Prompt工程(Corrective Prompt Engineering)”。與其一開始就設計完美提示詞,不如先在SOUL.md(Agent行為設定文件) 中寫一個粗略設定,然后通過持續(xù)反饋不斷修正,就像管理新員工一樣。第一版通常很普通,第十版開始能用,第三十版才會真正穩(wěn)定

Saboo坦言,在第一周結束前,他一度差點把整個系統(tǒng)關掉。

二、把具體反饋寫進文件,而不是停留在聊天里

Saboo發(fā)現(xiàn),Agent真正變好的關鍵在于具體規(guī)則的積累。在“運營Agent”Kelly第一次生成推文后,他把一組明確規(guī)則寫入Agent的記憶文件


這個記憶文件后來逐漸形成兩個部分:一個叫“BAD”,記錄所有被否定的寫作模式,比如使用bullet points(項目符號列表)、箭頭格式或領英帖子的語氣;另一個叫“GOOD”,里面放的是作者過去表現(xiàn)最好的推文,讓Agent在每次寫作時進行模仿。

隨著這些規(guī)則不斷累積,Kelly的表現(xiàn)逐漸改善。第10天時emoji基本消失,第15天開始模仿作者的句式結構,到第20天時,大部分草稿只需要改一兩個詞就能發(fā)布。

Saboo認為,很多人使用Agent時會忽略一個關鍵環(huán)節(jié):反饋必須寫入文件,而不是停留在聊天記錄里。如果反饋只存在對話記錄中,下一次任務Agent就會再次犯同樣的錯誤。只有當這些經驗被寫入可持續(xù)加載的文件,系統(tǒng)才會真正進化。

三、一次錯誤,讓研究Agent學會判斷“信號”和“噪音”

Saboo的第二個Agent是研究Agent——“Dwight”,負責每天掃描AI行業(yè)信息,為內容團隊尋找選題線索。第一次掃描時,Dwight推送了47條信息,其中40條都屬于噪音:包括各種小更新、未經驗證的傳聞,以及幾乎沒有價值的項目。

于是Saboo給了它一個非常嚴格的規(guī)則:如果讀者Alex今天無法據(jù)此做任何事情,就不要推送。Alex是Saboo設定的目標讀者畫像:一位AI產品開發(fā)者。

這個規(guī)則很快改變了Agent的行為。第10天時,Dwight每天只推送18條信息,而且大多有價值;到第25天時,數(shù)量減少到7條,但每一條都值得閱讀。

此外,一次錯誤也讓系統(tǒng)進一步優(yōu)化。Dwight曾把一個工具當成“新發(fā)布項目”推薦給Saboo,后來才發(fā)現(xiàn),這個工具早已存在,只是當天有人在X上提到它。Dwight誤把“被討論”當成“剛發(fā)布”。

Saboo隨后調整流程,要求Agent在推薦項目之前必須驗證發(fā)布時間,例如檢查GitHub倉庫創(chuàng)建日期、Hacker News發(fā)布時間以及實際發(fā)布記錄。如果項目已經存在一周以上且沒有明顯更新,就直接跳過。

他還徹底移除了GitHub趨勢榜作為信息源,因為那里噪音太多,很多項目只是被重新討論而已。取而代之的是goodailist.com(專門篩選新AI項目的網站)。

四、Agent團隊也會“發(fā)胖”:上下文太多反而拖慢系統(tǒng)

隨著系統(tǒng)不斷積累經驗,一個新的問題出現(xiàn)了:上下文膨脹

Kelly的上下文一度達到161000個token,Dwight也超過156000個token。大量歷史記錄占據(jù)了模型的上下文空間,導致響應變慢,輸出質量也開始下降。

Saboo最終對兩個Agent進行了“壓縮”:Kelly的上下文從161K減少到40K,Dwight從156K減少到43K。做法很簡單,只保留當前真正有用的規(guī)則和記憶,其余內容全部歸檔。

他后來把這件事變成固定流程,每兩周檢查一次Agent記憶文件。Saboo形容,這個過程就像軟件項目里的代碼重構,如果長期不清理,系統(tǒng)就會越來越臃腫。

同一時期,他還解決了另一個系統(tǒng)問題。

第三周時,定時任務調度器出現(xiàn)Bug:任務在隊列中推進,但實際上并沒有執(zhí)行。Saboo幾個小時后才發(fā)現(xiàn)問題,因為系統(tǒng)表面狀態(tài)看起來一切正常。

于是他新增了一個“首席運營Agent”——Monica。Monica負責定期檢查系統(tǒng)“heartbeat(任務心跳信號)”。如果某個任務超過26小時沒有運行,她會自動觸發(fā)重新執(zhí)行。

五、每個Agent團隊都會經歷的三個階段

根據(jù)自己的實踐經驗,Saboo認為大多數(shù)Agent團隊都會經歷三個階段。

第一階段是混亂期,通常發(fā)生在上線后的前一周。Agent輸出內容普遍比較普通,修改成本甚至高于人工完成任務,很多人會在這一階段放棄。

第二階段是穩(wěn)定期,大約在第8到第21天之間。隨著反饋不斷積累,明顯錯誤逐漸消失,輸出開始接近可用狀態(tài),只需要少量編輯。

第三階段是復利期。當系統(tǒng)積累了足夠多的規(guī)則和上下文后,Agent會逐漸理解用戶的表達習慣和判斷標準,新任務也能繼承過去的經驗,整體效率明顯提升。


在他看來,能夠堅持度過“混亂期”的人,最終得到的是一套會不斷學習的自動化系統(tǒng);而那些中途放棄的人,則每一次都要從零開始。

六、真正提升效率的是:兩類文件和一個閉環(huán)

Saboo在復盤這30天時特別強調,真正會隨著時間不斷變好的,其實只有三樣東西,其他部分基本都沒有本質變化。

第一類是記憶文件。記憶文件存放的是Agent從反饋里學到的“偏好”,每一條反饋一旦寫進記憶文件,就意味著這類錯誤以后不必再糾正一次。

第二類是技能文件。和記憶文件不同,技能文件記錄的是從失敗中提煉出來的“操作規(guī)則”。Saboo認為,技能文件更像是任務說明書,它告訴Agent這項工作到底該怎么做,而不僅僅是用戶個人偏好是什么。也正因為更具指令性,技能文件往往比記憶文件積累得更快,效果也更直接

第三類真正持續(xù)起作用的東西,是反饋閉環(huán)。Saboo認為,這是最容易被忽略的一環(huán)。很多人搭完Agent之后就讓它自己運行,過幾天發(fā)現(xiàn)效果沒提升,便覺得系統(tǒng)沒有用。但問題往往不在模型,而在于反饋沒有真正進入系統(tǒng)。

比如“運營Agent”Kelly寫完一條推文,如果Saboo只是當場說一句“太長了,把第一段刪掉”,但這句反饋沒有被寫進文件,那么下一次Kelly還是會犯同樣的錯誤。只有當這條反饋被記錄進記憶文件或技能文件,并在下一次任務開始時重新加載,Agent才會真正“記住”這件事。

Saboo自己后來形成了一套固定動作:先給反饋,再由Agent更新記憶文件或技能文件,下一輪任務開始時把這條經驗重新加載進去。整個流程并不復雜,但前提是執(zhí)行上必須足夠嚴格。

在他看來,模型在第1天和第30天其實沒有變化,不會越用越“聰明”。真正發(fā)生變化的,是圍繞模型構建的系統(tǒng)——包括規(guī)則文件、記憶記錄以及持續(xù)反饋形成的工作流程。

七、他踩過的坑,也正是多數(shù)人會放棄的地方

回頭看這30天,Saboo也總結了幾個自己最典型的失誤。

第一個問題是Agent上得太快、太多了。

他在兩周之內一口氣搭了6個Agent,結果很快發(fā)現(xiàn):單個Agent本身都還沒有進入穩(wěn)定狀態(tài),多個Agent之間的銜接自然更容易混亂。更合理的方式應該是先把一個Agent做到穩(wěn)定可用狀態(tài),再去加第二個。

第二個問題是文件結構一開始就設計錯了

最初兩周里,他把所有內容都塞進同一個文件:偏好、規(guī)則、經驗、教訓混在一起。結果就是,Agent加載到的上下文經常互相打架。比如第一周形成的是一種表達偏好,第二周又寫入了一條更明確的規(guī)則,二者之間可能彼此沖突,最終反而讓Agent理解混亂。

Saboo后來才把記憶文件和技能文件徹底拆開,并給自己定了一條更明確的要求:當上下文達到15萬token以上時,就必須強力壓縮,不能再拖。

第三個問題是反饋給得太模糊。

Saboo認為,“把這個改好一點”這種話幾乎不會留下任何有效積累,因為它無法寫成一條規(guī)則,也無法指導下一次任務。真正有用的反饋,必須具體到足以直接寫進文件??煽康姆答伈粌H能解釋為什么有問題,也能直接告訴Agent下次應該怎么改。換句話說,只有能被規(guī)則化的反饋,才有復利價值。

八、如果從零開始,前30天應該怎么跑

在文章最后,Saboo也給出了一套更適合新手照著執(zhí)行的30天方案。

第一周,最重要的不是追求復雜系統(tǒng),而是只挑一個自己每天最重復、最機械的任務。

圍繞這個任務搭建一個Agent,寫好SOUL.md,設置一條簡單的定時任務,讓它先跑起來。Saboo提醒,這一周產出的內容大概率會很普通,甚至很糟糕,這本來就是正?,F(xiàn)象。第一周唯一的任務是把所有錯誤都具體地糾正出來,不是簡單說“這個不行”,而是明確告訴它:“這條不行,是因為X;下次請按Y來做。”

第二周,要開始檢查這些經驗到底有沒有真正留下來。

Saboo建議,可以讓同一個Agent跑兩次相似任務,然后觀察它是否還會犯同樣的錯誤。如果同樣的問題再次出現(xiàn),就說明反饋閉環(huán)沒有成型,也就是經驗沒有真正進入可持續(xù)存儲的文件。這一階段,用戶應該開始建立自己的技能文件,把那些反復重復的規(guī)則正式寫下來。

第三周,如果前兩周執(zhí)行得比較扎實,Agent通常會逐漸進入第二階段,也就是“內容需要編輯,但不需要重寫”。這個階段可以開始記錄一個更實際的指標:每次審稿到底花了多久。

Saboo認為,這個數(shù)字應該是一周比一周下降的。如果沒有下降,通常不是模型不行,而是反饋仍然不夠具體。

到了第四周,才適合考慮引入第二個Agent,而且前提是第一個Agent已經能夠穩(wěn)定產出有用結果。

Saboo建議,這時兩個Agent之間的配合也不要設計得太復雜,最簡單的方式就是基于文件協(xié)作:第一個Agent把產出寫進共享文件,第二個Agent去讀取這個文件再繼續(xù)處理。集成方式越簡單,系統(tǒng)越不容易失控。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網傳信達證券研究所所長左前明猥褻下屬,公司:正在核實處理

網傳信達證券研究所所長左前明猥褻下屬,公司:正在核實處理

南方都市報
2026-03-25 13:15:09
3月25日今日金價:真是一夜大反轉!現(xiàn)在入手劃算嗎?

3月25日今日金價:真是一夜大反轉!現(xiàn)在入手劃算嗎?

三農老歷
2026-03-25 16:20:44
日媒:闖中國大使館的日本人身份被曝光,高市十天前的話細思極恐

日媒:闖中國大使館的日本人身份被曝光,高市十天前的話細思極恐

諦聽骨語本尊
2026-03-25 13:28:36
微粒貸逾期遇催收糾紛 用戶稱個人信息被多方轉包 拒絕和解維權到底 微眾銀行暫未回應

微粒貸逾期遇催收糾紛 用戶稱個人信息被多方轉包 拒絕和解維權到底 微眾銀行暫未回應

半島官網
2026-03-25 16:23:36
俄羅斯裝錢的麻袋都不夠了,每天多掙500億,四年戰(zhàn)爭,一朝回血

俄羅斯裝錢的麻袋都不夠了,每天多掙500億,四年戰(zhàn)爭,一朝回血

健身狂人
2026-03-20 19:49:55
25日最新:美軍基地被炸視頻,在外網瘋傳,戰(zhàn)損比很驚人

25日最新:美軍基地被炸視頻,在外網瘋傳,戰(zhàn)損比很驚人

消失的電波
2026-03-25 16:52:47
騎士續(xù)約哈登有兩種方式哈登選哪一種? 明夏再離開騎士?

騎士續(xù)約哈登有兩種方式哈登選哪一種? 明夏再離開騎士?

仰臥撐FTUer
2026-03-25 09:29:35
大反轉!明天抵達無錫

大反轉!明天抵達無錫

江南晚報
2026-03-25 20:17:21
曾投資阿里140億,還投資恒大200億,如今只剩一套68平小房子

曾投資阿里140億,還投資恒大200億,如今只剩一套68平小房子

小明嘩撲
2026-03-19 10:50:52
18歲的姚晨在肯德基工作時的一張照片,那時就難掩渾身的好氣質

18歲的姚晨在肯德基工作時的一張照片,那時就難掩渾身的好氣質

娛你同歡
2026-03-17 16:08:28
4月1日起,醫(yī)保大變!癌癥、尿毒癥、慢病看病,報銷迎來新規(guī)

4月1日起,醫(yī)保大變!癌癥、尿毒癥、慢病看病,報銷迎來新規(guī)

夜深愛雜談
2026-03-24 21:18:21
離開曼聯(lián),你啥都不是!加納喬在為自己的任性買單

離開曼聯(lián),你啥都不是!加納喬在為自己的任性買單

卡靈頓分析師
2026-03-25 15:45:55
霍爾木茲,最新消息!黃金,直線拉升

霍爾木茲,最新消息!黃金,直線拉升

中國基金報
2026-03-25 08:22:04
瞞報500+美軍陣亡?中東戰(zhàn)損真相被戳穿,霸權謊言碎一地

瞞報500+美軍陣亡?中東戰(zhàn)損真相被戳穿,霸權謊言碎一地

華山穹劍
2026-03-25 20:40:25
私生子只是冰山一角,釋永信“開光”內幕曝光,4位女星無妄之災

私生子只是冰山一角,釋永信“開光”內幕曝光,4位女星無妄之災

八斗小先生
2026-03-24 15:52:15
于東來:從30歲開始吃藥,拍CT上百次,身體出什么問題都不足為奇,哪天說不定沒了就沒了,幾乎99%的企業(yè)家都不太尊重自己的生命

于東來:從30歲開始吃藥,拍CT上百次,身體出什么問題都不足為奇,哪天說不定沒了就沒了,幾乎99%的企業(yè)家都不太尊重自己的生命

瀟湘晨報
2026-03-25 17:52:11
國乒名單再變!澳門世界杯:林詩棟退賽后新增1人,世界第九無緣

國乒名單再變!澳門世界杯:林詩棟退賽后新增1人,世界第九無緣

郝小小看體育
2026-03-25 21:03:38
歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進了

歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進了

西樓知趣雜談
2026-03-24 14:38:30
遲遲都等不到中企復工,巴拿馬頭號幫手已介入,中方加強港口管制

遲遲都等不到中企復工,巴拿馬頭號幫手已介入,中方加強港口管制

阿策聊實事
2026-03-25 11:19:58
90歲老中醫(yī)掏心窩子:戒掉2種“享?!?,晚年少跑醫(yī)院多享壽

90歲老中醫(yī)掏心窩子:戒掉2種“享?!保砟晟倥茚t(yī)院多享壽

普陀動物世界
2026-03-23 01:12:36
2026-03-25 21:36:49
智東西 incentive-icons
智東西
聚焦智能變革,服務產業(yè)升級。
11431文章數(shù) 117015關注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

頭條要聞

伊朗放話愿意與"主和派"萬斯談 特朗普表態(tài)

頭條要聞

伊朗放話愿意與"主和派"萬斯談 特朗普表態(tài)

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰經搶救無效不幸去世 年僅41歲

財經要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

藝術
親子
房產
旅游
軍事航空

藝術要聞

《百花譜》,這個春天畫花不用愁!

親子要聞

幼兒園3年,家長培養(yǎng)寶寶4個好習慣,孩子成績比同齡人優(yōu)秀

房產要聞

41億!259畝!建學?!齺嗊@個大城更,最新方案曝光!

旅游要聞

從滑雪技巧到林海秘境,盡覽冰韻雪姿與人文清歡

軍事要聞

伊朗重申非交戰(zhàn)國家船只可安全通過霍爾木茲海峽

無障礙瀏覽 進入關懷版