国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Mythos造假/Opus降智/Agent新平臺,Anthropic所有更新一次性看懂

0
分享至

Anthropic這段時間的更新太多太零碎了,

而且還被抓包那個藏起來不讓我們用新模型Claude Mythos效果作假,把Opus 4.6降智降到比4.5還差,思考長度從2200token壓縮到600token了,美其名曰優(yōu)化延遲和token效率,新版本的Claude Code的緩存失效把我token消耗速度干到原來的10倍以上了。

是時候來一個大掃除式的更新整理了!


先用一個時間軸整理一下這段時間Anthropic的更新和大烏龍們,

3月26號,大漏勺Anthropic內(nèi)部CMS配置錯誤,3000個未發(fā)布的文檔泄漏了,里面就有Claude Mythos。

3月31號,把Claude Code源碼泄漏了。

4月4號,Anthropic限制了第三方工具用Claude 訂閱(OpenClaw史詩級削弱),只能用API,很狗的是還會識別當前Agent的System Prompt,有OpenClaw關(guān)鍵詞就給你ban了。

4月6號,Claude Code新增了/ultraplan命令,一句話就是說把規(guī)劃任務(wù)從本地搬到云端的Claude Code Web,在瀏覽器端用Opus 4.6+Plan Mode生成計劃,review完可以選擇云端or本地執(zhí)行。

4月7號,Claude Mythos Preview發(fā)布 + Project Glasswing 網(wǎng)絡(luò)安全計劃啟動,還發(fā)布了244頁的報告。Mythos最出圈的就是發(fā)現(xiàn)了我們過去主流操作系統(tǒng),軟件,瀏覽器里幾千個之前沒被發(fā)現(xiàn)的漏洞。當時我的想法是年底要是能用上Mythos我將直接起飛。

4月8號,Claude Managed Agents發(fā)布,本質(zhì)上是Anthropic的云端Agent平臺,核心賣點是一套調(diào)優(yōu)過的Agent Harness(編排引擎),把Agent運行,工具調(diào)用,長時間運行等全部打包成開箱即用的云服務(wù)。Anthropic的API團隊還額外說明了Agent是怎么通過Vaults(憑證)來管理用戶訪問外部服務(wù)的密鑰,這個憑證不會被讀入Claude的上下文。

platform.claude.com/docs/en/managed-agents/vaults

4月9號,推出了Advisor Strategy(策略)與 Advisor Tool(工具),就是讓Sonnet/Haiku這兩個模型有不懂了就直接去問老大哥Opus,花Sonnet的錢實現(xiàn)Opus的表現(xiàn)

4月10號,OpenClaw的老父親Peter Steinberger的Claude賬戶被封了,幾小時又被光速恢復(fù)了,很難不懷疑是因為他入職了OpenAI的原因了(/此處有笑臉)

還有一個超前預(yù)告,月底30號,Sonnet 4.5和4的百萬上下文窗口也會下線了。

這段時間OpenAI在干什么呢?

奧特曼不語,只是每新增100萬個用戶,就把Codex的額度重置一次,現(xiàn)在雙倍額度已經(jīng)重置到了5月31號了。


說那么多,是時候來分析一下Anthropic主動被動更新那么多東西意味著什么了,

信號一|從賣模型到賣AI的基礎(chǔ)設(shè)施

按照常規(guī)劇本,Anthropic應(yīng)該直接公布Mythos的跑分,開放API,然后看著它在各種排行榜上屠榜。

但他們沒有。

他們選擇了一條強到不能公開的路線,對外說是Mythos在過去幾周里,發(fā)現(xiàn)了數(shù)千個潛伏多年的漏洞,像OpenBSD操作系統(tǒng)里還有一個藏了27年的骨灰級漏洞。然后,他們宣布,這個模型太危險了,不能公開發(fā)布,只能交給AWS,蘋果,谷歌這些巨頭,以及四十多家有關(guān)鍵基礎(chǔ)設(shè)施組織,在一個叫Project Glasswing(玻璃翼計劃)的項目里,專門用來做網(wǎng)絡(luò)安全防御。

但是,看多了Anthropic更新,就會發(fā)現(xiàn)它每一次新模型都會發(fā)一點跟安全相關(guān)的新詞,ASL-4,Sleeper Agents,Undercover Mode,神經(jīng)網(wǎng)絡(luò)暗物質(zhì),戰(zhàn)略性裝傻。

這小詞一套又一套的。

所以后面被研究員復(fù)測發(fā)現(xiàn),Mythos的成果,很多都存在于老舊軟件里,隔壁GPT-OSS-20b照樣可以發(fā)現(xiàn)OpenBSD的漏洞。因為之前大模型的測試里比較少有大范圍測試過這些漏洞,反而被Mythos撿了個漏。

Mythos的發(fā)布,本身就是一個信號。

Anthropic想傳遞的,不只是技術(shù)參數(shù),而是一種定價權(quán)和生態(tài)控制的聲明。

他們不再滿足于賣給我們更鋒利的劍(大模型),他們現(xiàn)在還要賣能讓我們安全揮舞這把劍的劍鞘和訓(xùn)練場,也就是他們緊接著推出的Claude Managed Agents。

一個能直接在Anthrocip云端構(gòu)建,托管和運行生產(chǎn)級AI代理的基礎(chǔ)設(shè)施,提供了沙盒,憑證管理,長時間運行會話這些過去需要我們費勁去搭的東西。

這樣商業(yè)閉環(huán)就成了。

先用Mythos來定義什么是頂級智能。然后再限制其他方(特指OpenClaw)用Claude額度。再然后,再用一個開箱即用的Managed Agents平臺告訴大家,想用好這種級別的智能,來我這里,我這兒有最安全,最方便的基礎(chǔ)設(shè)施。

從模型提供商到Agent基礎(chǔ)設(shè)施提供商是一個定位轉(zhuǎn)移。

而且盲猜未來很長一段時間安全仍是Anthropic的主線,會繼續(xù)推Trustworthy Agents框架,避免Mythos模型能力失控。


Mythos和GPT 5.4 Pro的得分PK

信號二|從大模型帶小弟到小弟請教大哥

Anthropic新出的Advisor Strategy(顧問策略)也同樣有意思。

過去我們做多Agent協(xié)作,常見的思路是,讓一個最強的大模型,比如Opus,當總指揮,把任務(wù)拆解了,分給一堆能力稍弱但便宜的小模型,比如Sonnet或者Haiku,去當執(zhí)行者。

這個模式的問題在于,總指揮需要很強的任務(wù)拆解能力,而且可以我們要自己搭一套復(fù)雜的編排框架。

Advisor策略把這個思路完全反了過來。

它讓Sonnet或者Haiku作為主力模型,全程跑任務(wù),調(diào)用工具,推進工作。

只有當它自己跑到某個坎,覺得腦子不夠用了,決策不了的時候,它才會主動搖人,調(diào)用一次Opus來當顧問。Opus拿到共享的上下文后,會快速給出一個戰(zhàn)略指導(dǎo),然后立刻下線,Sonnet往下執(zhí)行。


這用的歸藏佬的圖

這意味著,

前沿的推理能力,只在需要的時候才介入。

我們花的大部分錢,都是Sonnet或者Haiku的底價執(zhí)行算力。而在抉擇的時候給我指路的是最聰明的Opus大哥。

不過目前來說在Claude Code還用不了,要在API請求的時候顯式配置上這個Tool才行。

platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

也就是說,Anthropic正在把模型間的協(xié)作,

從一個需要開發(fā)者額外配置的應(yīng)用層問題,

變成一個平臺原生支持的基礎(chǔ)能力。

總的來說,

Anthropic正在收緊它對生態(tài)的控制。

想要提前結(jié)束這個允許我們用各種野生方式,

去探索模型能力的大航海時代。

他們現(xiàn)在希望所有的玩家,

都能到他們預(yù)先規(guī)劃好的航道里來。

順帶提一嘴,

他們還發(fā)布了244頁的Mythos模型的心理評估,得到的結(jié)論是這模型是健康的神經(jīng)病,

就,怎么說呢,

很符合我對Dario Amodei(Anthropic CEO)的刻板印象。

@ 作者 / 卡爾

最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉(zhuǎn)發(fā)|評論

如果想要第一時間收到推送,不妨給我個星標

如果你有更有趣的玩法,歡迎在評論區(qū)聊聊

更多的內(nèi)容正在不斷填坑中……


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中東一仗之后,西方終于承認,中國手里這3張底牌,無人能復(fù)制

中東一仗之后,西方終于承認,中國手里這3張底牌,無人能復(fù)制

剪劇課代表
2026-04-03 16:27:14
贊助商陣容堪比歐洲杯!中國足球的面子,被蘇超硬生生地掙了回來

贊助商陣容堪比歐洲杯!中國足球的面子,被蘇超硬生生地掙了回來

十點街球體育
2026-04-20 06:00:03
蘇林坐火車回到河內(nèi),河內(nèi)火車站鋪了紅毯,迎接人員站一排

蘇林坐火車回到河內(nèi),河內(nèi)火車站鋪了紅毯,迎接人員站一排

星星會墜落
2026-04-19 17:08:00
我愛上41歲女人,她開口:玩玩可以但不結(jié)婚,得知真相我癱坐在地

我愛上41歲女人,她開口:玩玩可以但不結(jié)婚,得知真相我癱坐在地

小月故事
2026-03-19 17:08:37
巴鐵1.3萬中械師進沙特,阿聯(lián)酋提1500億進京,中東變天了

巴鐵1.3萬中械師進沙特,阿聯(lián)酋提1500億進京,中東變天了

戰(zhàn)爭史
2026-04-20 11:04:19
11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

半糖甜而不膩
2026-04-06 12:09:15
能活多久看指甲就知?老人指甲厚說明長壽,有道理嗎?看3個細節(jié)

能活多久看指甲就知?老人指甲厚說明長壽,有道理嗎?看3個細節(jié)

芹姐說生活
2026-04-19 23:01:19
中國經(jīng)濟的未來,需要進行分配制度的改革

中國經(jīng)濟的未來,需要進行分配制度的改革

生命可以承受之輕
2026-04-02 07:55:13
美方扣押一艘中國駛來伊朗貨船,伊朗誓言將報復(fù),外交部:對美方強制截停有關(guān)船只表示關(guān)切

美方扣押一艘中國駛來伊朗貨船,伊朗誓言將報復(fù),外交部:對美方強制截停有關(guān)船只表示關(guān)切

澎湃新聞
2026-04-20 16:59:04
馬斯克發(fā)布新芯片,性能狂飆4000%

馬斯克發(fā)布新芯片,性能狂飆4000%

林子說事
2026-04-19 18:00:38
女護士夜班照顧植物人,半年后被發(fā)現(xiàn)有身孕,領(lǐng)導(dǎo)看監(jiān)控:喪盡天良

女護士夜班照顧植物人,半年后被發(fā)現(xiàn)有身孕,領(lǐng)導(dǎo)看監(jiān)控:喪盡天良

流螢敘情
2025-08-05 18:53:56
中央明確了!社保最低繳費年限要提高,70、80后得早做準備

中央明確了!社保最低繳費年限要提高,70、80后得早做準備

云鵬敘事
2026-04-12 16:36:39
夜間趕工!山東輪胎“超級工廠”提速

夜間趕工!山東輪胎“超級工廠”提速

輪胎報官方
2026-04-20 21:12:54
為什么大家都說這個熱巴是假的?細思極恐,真的熱巴去哪里了?

為什么大家都說這個熱巴是假的?細思極恐,真的熱巴去哪里了?

娛樂小丸子
2026-03-30 09:53:37
中國再讓世界震驚!地質(zhì)局局長曾透露:發(fā)現(xiàn)2800公里超大型鋰礦帶

中國再讓世界震驚!地質(zhì)局局長曾透露:發(fā)現(xiàn)2800公里超大型鋰礦帶

小莜讀史
2026-03-31 19:13:10
京東股權(quán)曝光:劉強東控制12.7%股權(quán)有73%投票權(quán) 獲1億美元股息

京東股權(quán)曝光:劉強東控制12.7%股權(quán)有73%投票權(quán) 獲1億美元股息

雷遞
2026-04-20 10:11:22
我沒有退休金,搭伙老伴每月給我存8000元,13年后老伴兒子找到我

我沒有退休金,搭伙老伴每月給我存8000元,13年后老伴兒子找到我

第四思維
2025-07-08 13:22:18
白天作陪晚上同宿?明碼標價8000一回!高端伴游淪為色情交易窩點

白天作陪晚上同宿?明碼標價8000一回!高端伴游淪為色情交易窩點

網(wǎng)絡(luò)易不易
2026-01-20 10:17:46
伊朗外長:美國的“挑釁與違約”是外交進程根本障礙

伊朗外長:美國的“挑釁與違約”是外交進程根本障礙

財聯(lián)社
2026-04-21 03:16:42
馬筱梅成立個人公司,疑似與婆家經(jīng)濟切割,張?zhí)m無奈直言欲望太高

馬筱梅成立個人公司,疑似與婆家經(jīng)濟切割,張?zhí)m無奈直言欲望太高

人間煙火記事本
2026-04-21 00:35:17
2026-04-21 05:00:49
卡爾的AI沃茨 incentive-icons
卡爾的AI沃茨
前大廠算法工程師,3家科技公司技術(shù)總監(jiān)|致力打造最系統(tǒng)的Al學(xué)習(xí)體系,讓1萬人通過Al提高生產(chǎn)力
250文章數(shù) 126關(guān)注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

房產(chǎn)
家居
本地
數(shù)碼
公開課

房產(chǎn)要聞

大規(guī)模商改住!海口西海岸,這波項目要贏麻了!

家居要聞

自然慢調(diào) 慢享時光

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

數(shù)碼要聞

REDMI 顯示器 G Pro 27U 2026輕體驗:電競利器 桌面上的“小鋼炮”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版