国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

否認降配!Claude Code 降智風波復盤:鍋在推理強度、緩存、提示詞

0
分享至


Claude Code 近期遭遇的一輪“變笨”爭議,終于等來了 Anthropic 的正式回應。


在用戶連續(xù)數(shù)周抱怨 Claude Code 輸出質(zhì)量下降后,Anthropic 承認,這款編程工具的體驗確實出現(xiàn)了問題。

但同時否認外界關(guān)于其“故意削弱模型能力”的猜測,稱問題并不在底層模型,而是出在 Claude Code 產(chǎn)品層的一系列調(diào)整上。

之前,AMD AI 負責人 Stella Laurenzo 發(fā)帖稱,Claude Code 已經(jīng)退化到“不能被信任去完成復雜工程任務”的程度,并給出了 6852 個 Claude Code 會話文件、234760 次工具調(diào)用和 17871 個 thinking block 的分析。

Anthropic 在 4 月 23 日發(fā)布的復盤文章中表示,排查后發(fā)現(xiàn),近期體驗下降主要由 3 個問題疊加造成。

第一個問題發(fā)生在 3 月 4 日。

Anthropic 將 Claude Code 的默認推理強度從 high 調(diào)整為 medium,原本是為了降低部分用戶在 high 模式下遇到的超長延遲,因為有時界面看起來像是卡住了。但現(xiàn)在承認,這是一個錯誤的取舍。用戶更希望默認獲得更高智能表現(xiàn),而不是為了簡單任務犧牲能力。Anthropic 已在 4 月 7 日撤回這一調(diào)整。該問題影響了 Sonnet 4.6 和 Opus 4.6。

第二個問題發(fā)生在 3 月 26 日。

Anthropic 上線了一項緩存優(yōu)化,目標是在會話閑置超過 1 小時后,清理 Claude 較早的 thinking 內(nèi)容,從而降低用戶恢復會話時的延遲。但其中一個 bug 導致系統(tǒng)不是只清理一次,而是在之后的每一輪對話里持續(xù)清理舊 reasoning 內(nèi)容。這讓 Claude 看起來更健忘、更容易重復,也更容易做出奇怪的工具調(diào)用選擇。該問題已在 4 月 10 日修復,影響范圍同樣包括 Sonnet 4.6 和 Opus 4.6。

第三個問題發(fā)生在 4 月 16 日。

Anthropic 為了減少 Claude Code 的冗長輸出,在系統(tǒng)提示詞中加入了更強的長度限制。但這一調(diào)整與其他提示詞變更疊加后,意外損害了編碼質(zhì)量。Anthropic 后續(xù)通過更廣泛的評測發(fā)現(xiàn),這一改動會讓 Opus 4.6 和 Opus 4.7 的相關(guān)評測結(jié)果下降約 3%,因此已在 4 月 20 日回滾。該問題影響了 Sonnet 4.6、Opus 4.6 和 Opus 4.7。

Claude Code 不是單點故障,而是幾次看似合理的產(chǎn)品優(yōu)化疊在一起,最終讓用戶感知成了一場大范圍“降智”。

Anthropic 表示,從 3 月初就開始調(diào)查相關(guān)反饋,但一開始很難把這些反饋和正常的用戶體驗波動區(qū)分開來,內(nèi)部使用和評測也沒有立刻復現(xiàn)這些問題。

但 Anthropic 強調(diào),沒有故意削弱模型,也沒有讓 API 或推理層發(fā)生降級。底層模型本身沒有受影響,問題來自 Claude Code 的默認參數(shù)、上下文管理和系統(tǒng)提示詞調(diào)整。


但上線后,用戶很快開始反饋 Claude Code “沒有以前聰明”。

Anthropic 后來嘗試通過啟動提醒、內(nèi)聯(lián)推理強度選擇器、恢復 ultrathink 等設(shè)計調(diào)整,讓用戶更容易看到當前設(shè)置并手動切換。

但大多數(shù)用戶仍停留在 medium 默認設(shè)置。聽取更多客戶反饋后,Anthropic 在 4 月 7 日撤銷這一決定。

現(xiàn)在,Opus 4.7 默認使用 xhigh 推理強度,其他模型默認使用 high。

關(guān)于緩存 bug。

Anthropic 解釋稱,Claude 在執(zhí)行任務時,reasoning 通常會保留在對話歷史中,這樣后續(xù)每一輪都能看到此前為什么做出某些編輯和工具調(diào)用。3 月 26 日的優(yōu)化原本是為了在長時間閑置會話恢復時減少未緩存 token,降低成本和延遲。但實現(xiàn)中出現(xiàn) bug,導致舊 thinking 在之后每一輪都被持續(xù)丟棄。隨著對話繼續(xù),Claude 會越來越缺少此前決策依據(jù),于是表現(xiàn)為健忘、重復和工具選擇異常。

Anthropic 還認為,這個 bug 可能也是一些用戶反饋“使用額度消耗比預期更快”的原因,因為持續(xù)丟棄 thinking block 會導致后續(xù)請求反復出現(xiàn)緩存未命中。

這個問題位于 Claude Code 的上下文管理、Anthropic API 和 extended thinking 的交叉處,因此不容易排查。相關(guān)變更經(jīng)過了人工審查、自動代碼審查、單元測試、端到端測試、自動驗證和內(nèi)部試用,但仍然沒有被及時發(fā)現(xiàn)。

關(guān)于系統(tǒng)提示詞問題。

Anthropic 表示,Opus 4.7 相比前代有一個明顯行為特點:更啰嗦。

雖然這種傾向有助于提升復雜問題上的表現(xiàn),但也會產(chǎn)生更多輸出 token。為此,在 Claude Code 中加入了更強的簡潔性要求,限制工具調(diào)用之間的文字和最終回復長度。經(jīng)過數(shù)周內(nèi)部測試后,這一調(diào)整隨 Opus 4.7 在 4 月 16 日上線。

但在后續(xù)調(diào)查中,Anthropic 通過更廣泛的 ablation 測試發(fā)現(xiàn),系統(tǒng)提示詞中的某些限制確實會損害編碼質(zhì)量。于是在 4 月 20 日版本中回滾了相關(guān)提示詞。

后續(xù)改進方面。

Anthropic 表示,將采取幾項措施避免類似問題再次發(fā)生。會讓更多內(nèi)部員工使用與公眾完全一致的 Claude Code 版本,而不是主要使用帶有新功能測試的內(nèi)部版本;同時會改進內(nèi)部使用的 Code Review 工具,并把改進后的版本提供給客戶。

Anthropic 還會加強對系統(tǒng)提示詞變更的控制。

未來,Claude Code 的每一次系統(tǒng)提示詞調(diào)整,都將經(jīng)過更廣泛的分模型評測,并繼續(xù)通過 ablation 分析每一行提示詞的影響。公司還開發(fā)了新的工具,讓提示詞變更更容易被審查和審計。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
福特:解散電動汽車事業(yè)部

福特:解散電動汽車事業(yè)部

中國能源網(wǎng)
2026-04-22 17:39:14
震驚!大學教師分享女兒留學與歐洲旅行見聞被舉報!網(wǎng)友:活該吧

震驚!大學教師分享女兒留學與歐洲旅行見聞被舉報!網(wǎng)友:活該吧

火山詩話
2026-04-24 09:20:07
張雪機車召回大反轉(zhuǎn)!63歲專家實錘:O型圈不是裝反,是位置裝錯

張雪機車召回大反轉(zhuǎn)!63歲專家實錘:O型圈不是裝反,是位置裝錯

芭比衣櫥
2026-04-24 18:20:05
騎士慘負猛龍被追到2-1:哈登18+8失誤雙里程碑 猛龍雙星66分

騎士慘負猛龍被追到2-1:哈登18+8失誤雙里程碑 猛龍雙星66分

醉臥浮生
2026-04-24 10:33:50
福建保安與女車主起沖突,“女司機遭掌摑”最新進展:警方稱雙方均有錯,會依法依規(guī)處理;相關(guān)人員:該地不允許停車,保安多次勸阻無果

福建保安與女車主起沖突,“女司機遭掌摑”最新進展:警方稱雙方均有錯,會依法依規(guī)處理;相關(guān)人員:該地不允許停車,保安多次勸阻無果

三湘都市報
2026-04-24 14:48:19
20余萬元尚未解救被困緬甸園區(qū)女孩,同園區(qū)逃生者講述驚魂一刻

20余萬元尚未解救被困緬甸園區(qū)女孩,同園區(qū)逃生者講述驚魂一刻

界面新聞
2026-04-24 13:05:29
毛主席:李克農(nóng)是好人,當年我靠邊站沒有秘書,是他送來了葉子龍

毛主席:李克農(nóng)是好人,當年我靠邊站沒有秘書,是他送來了葉子龍

史之銘
2026-04-24 15:06:18
德云社墨爾本團建,董事長王惠和郭汾陽都在,郭德綱的莊園真氣派

德云社墨爾本團建,董事長王惠和郭汾陽都在,郭德綱的莊園真氣派

蹲坑看世界
2026-04-24 13:58:17
停工16個月!趙露思證實接拍新劇 直播哭紅雙眼「我們都在一起」

停工16個月!趙露思證實接拍新劇 直播哭紅雙眼「我們都在一起」

ETtoday星光云
2026-04-24 14:36:07
實在搞不懂黃圣依到底怎么想的!
明明今年已經(jīng)43歲

實在搞不懂黃圣依到底怎么想的! 明明今年已經(jīng)43歲

小光侃娛樂
2026-04-24 20:35:03
余承東最后的倔強:比小米便宜100塊,然后呢?

余承東最后的倔強:比小米便宜100塊,然后呢?

虎嗅APP
2026-04-24 04:36:06
一場120-107讓西部季后賽大亂!雷霆巨星傷退,湖人沖擊決賽有望

一場120-107讓西部季后賽大亂!雷霆巨星傷退,湖人沖擊決賽有望

古史青云啊
2026-04-24 11:53:35
嗜賭成性只是冰山一角,婚內(nèi)出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內(nèi)出軌、睡有婦之夫,體壇丑聞毀三觀

夢想總會變成真
2026-04-23 01:11:47
后果嚴重的一巴掌!

后果嚴重的一巴掌!

鈞言堂
2026-04-23 21:09:45
秦皇島大姐逃單偷狗后續(xù):正臉曝光,被人認出已社死,攤主不和解

秦皇島大姐逃單偷狗后續(xù):正臉曝光,被人認出已社死,攤主不和解

奇思妙想草葉君
2026-04-24 11:33:43
何鴻燊最后11年過得是什么樣的日子?說出來可能顛覆很多人的認知

何鴻燊最后11年過得是什么樣的日子?說出來可能顛覆很多人的認知

人生錄
2026-04-22 19:01:34
李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級骨相美到發(fā)光完全不像55歲

李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級骨相美到發(fā)光完全不像55歲

喜歡歷史的阿繁
2026-04-24 11:57:41
刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

刺殺老蔣失敗,殺手投奔延安,毛主席:你絕對不能留在這里

抽象派大師
2026-04-24 12:06:13
女歌手因搶不到“五一”高鐵票取消演唱會:全額退款!主辦方:她怕飛行過多

女歌手因搶不到“五一”高鐵票取消演唱會:全額退款!主辦方:她怕飛行過多

上觀新聞
2026-04-24 10:48:08
大數(shù)據(jù)分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

大數(shù)據(jù)分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

深度報
2026-04-18 23:37:27
2026-04-24 23:24:49
云頭條 incentive-icons
云頭條
引領(lǐng)科技變革,連接技術(shù)與商業(yè)。
19923文章數(shù) 27302關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經(jīng)要聞

LG財閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

時尚
房產(chǎn)
手機
教育
軍事航空

春天穿衣千萬別老氣橫秋!短長搭配、多穿裙子,優(yōu)雅舒適顯高

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!?冢_始瘋狂建學校!

手機要聞

曝榮耀600系列發(fā)布在即,參數(shù)細節(jié)已曝光

教育要聞

公辦高校:著力提升研究生“抬頭率”

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進入關(guān)懷版