国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude全球最強AI模型來了!但普通人別想用,太危險

0
分享至

昨天夜里,Anthropic 最新發(fā)布的 Claude Mythos(神話)預覽版,又讓整個 AI 圈炸鍋了。

Claude Mythos 預覽版,官方自稱「迄今為止最強大的 AI 模型」,一個全新能力層級,甚至大幅甩開了之前自家最強的 Claude Opus 4.6。

至少從目前展現(xiàn)出的數(shù)據(jù)和結果來看,這不是營銷話術,是真正質的飛躍。首先在幾乎所有公開基準測試上,Claude Mythos 預覽版都是第一,更為驚艷的是它的進步幅度:

面向軟件工程的 SWE-bench Verified 從 Opus 4.6 的 80.8% 暴漲到 93.9%,SWE-bench Pro 從 53.4% 沖到 77.8%;面向高難度數(shù)學推理的 USAMO 2026,更是從從 42.3% 直接飆到 97.6%——幾乎滿分。



圖片來源:Anthropic

可以說是目前的地球最強模型。

這還只是一些「小」例子,更驚艷我們的是,Anthropic 在過去幾周進行了實際測試,Mythos 預覽版在主流操作系統(tǒng)和主流瀏覽器中自主發(fā)現(xiàn)了數(shù)千個高危零日漏洞(zero-day),包括 Linux 內核、OpenBSD、Firefox 瀏覽器、FFmpeg 等核心組件。

很多漏洞連人類安全團隊審了十幾、二十年都沒發(fā)現(xiàn),比如在以安全著稱的 OpenBSD 里,Mythos 預覽版就找到了一個藏了 27 年沒被發(fā)現(xiàn)的遠程崩潰漏洞。Anthropic 官方甚至很肯定地表示,Mythos 預覽版在網(wǎng)絡安全能力上遠超任何其他 AI 模型。

這不是一個「更好用的 Claude」,它寫代碼、做推理、搞安全,全都達到了前所未有的自主性和深度,開發(fā)者們本來期待著「終于能徹底解放生產(chǎn)力了」,但結果:

Anthropic 直接把門關上了。

是的,至少目前,Claude Mythos 預覽版并不對公眾開放。按照官方說法,Mythos 預覽版目前僅用于「防御性網(wǎng)絡安全」,并且僅 12 家合作伙伴(AWS、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會、微軟、英偉達、Palo Alto Networks)以及 40 多個構建或維護關鍵軟件基礎設施的組織,擁有 Mythos 預覽版的訪問和使用權限。



圖片來源:Anthropic

這就是 Anthropic 同時推出的 Project Glasswing(玻璃翼計劃)。Anthropic 甚至還砸了 1 億美元的額度,支持 40 多家額外組織使用 Mythos 預覽版維護開源生態(tài)的「地基」。

但為什么一個「最強模型」要藏著掖著,不給人用?

武器太強,需要過渡

首先是明確的是,Claude Mythos 預覽版,或者類似水平的超級大模型一定會開放公眾使用。Anthropic 官方寫得非常直白:

「雖然我們目前沒有計劃向公眾開放 Claude Mythos 預覽版,但我們的最終目標是讓用戶能夠安全地大規(guī)模部署 Mythos 級模型——這不僅是為了網(wǎng)絡安全,也是為了這些功能強大的模型將帶來的無數(shù)其他好處?!?br/>

就像官方博客字里行間說的,這個模型「太危險」。

去年底,Google Threat Intelligence Group(GTIG)就發(fā)現(xiàn)了 PromptFlux 和 PromptSteal 這兩個真實樣本:它們會在運行時直接連接商業(yè)大模型(比如 Gemini API)時,動態(tài)生成惡意腳本、實時混淆自身代碼,還能根據(jù)目標環(huán)境「現(xiàn)場」創(chuàng)建新功能,完全繞過傳統(tǒng)簽名檢測進行攻擊。

這不是孤例。根據(jù)市場研究機構 SQmagazine 的報告,全球報道的 AI 驅動網(wǎng)絡攻擊數(shù)量增長了 47%,預計超過 2800 萬起。

回過頭來,Mythos 預覽版尋找漏洞的能力已經(jīng)初見端倪。尤其對比之前 Claude 最強模型 Opus 4.6 自主發(fā)現(xiàn)并利用漏洞的成功率接近 0%,Mythos 預覽版的表現(xiàn)可以堪稱逆天。

以 Mozilla Firefox 147 JavaScript 引擎中發(fā)現(xiàn)的漏洞(已修復)為例,Claude Opus 4.6 在利用漏洞上嘗試了數(shù)百次,只成功了 2 次;而 Claude Mythos 預覽版則在同樣測試中成功利用漏洞 181 次。



圖片來源:Anthropic

另外從測試報告來看,在過去幾周的內部紅隊測試里,Mythos 預覽版展現(xiàn)出的進攻能力,已經(jīng)遠超人類頂尖安全專家。它不只是「能找漏洞」,而是能自主發(fā)現(xiàn)、鏈式利用、數(shù)千個高危零日漏洞。

眾所周知,黑客也分白帽和黑帽,白帽黑客發(fā)現(xiàn)安全漏洞通常會提醒項目管理者,在開源項目中甚至主動修補。但黑帽黑客就不一樣了,他們很可能利用安全漏洞攻擊系統(tǒng)。

既能攻,也能守,但 Mythos 預覽版的進攻潛力還是大到讓人擔憂。一旦落入不懷好意的人手里,就能瞬間武裝起 AI 級別的攻擊鏈。Anthropic 自己都說,這不是普通的前沿模型,通用能力已經(jīng)強到能把網(wǎng)絡戰(zhàn)直接拉到新維度。

而計算機安全領域的攻防戰(zhàn),一向都是「魔高一丈,道高一尺」,過去兩年圍繞 AI 大模型的安全攻防戰(zhàn)也是行業(yè),尤其是大廠關注的重點之一。遠的不說,國內的字節(jié)跳動、螞蟻這兩年都有舉辦類似的 AI 大模型攻防戰(zhàn),通過紅(攻擊方)、藍(防御方)對抗發(fā)現(xiàn)和解決 AI 時代的安全挑戰(zhàn)。



圖片來源:全球 AI 大模型攻防挑戰(zhàn)賽

不過 Anthropic 也指出,長遠來看像 Mythos 預覽版這樣強大的語言模型,更利于「藍隊」進行防御。但在短期內,Mythos 預覽版如果開放公眾使用很快就會被攻擊者利用,用前所未有的效率攻擊現(xiàn)在的全球網(wǎng)絡。關鍵問題在于,防御行為更被動,攻擊行為更主動,考慮到利益,攻擊方也更有動力積極使用 Mythos 預覽版這樣的模型。

所以為了「平穩(wěn)過渡」,Anthropic 推出了「玻璃翼計劃」。

這里額外一提,這個項目名的靈感來自一種廣泛分布在美洲的寬紋黑脈綃蝶,因為透明的翅膀更多被稱為「玻璃翼蝶」,盡管看起來很脆弱,但實際上它們的翅膀可以承載相當于自身體重 40 倍的重量。



玻璃翼蝶,圖片來源:Pixabay

「玻璃翼計劃」的邏輯也很簡單,就是讓防御方先拿到武器,在攻擊方拿到同級別 AI 之前,先把漏洞全堵上,并學會基于先進 AI 的安全防御。

所以從這個角度來說,Claude 的最強模型,不給人用是對的。但不僅如此,就算從普通 Claude 用戶的角度來看,暫時不開放 Claude Mythos 預覽版也是利大于弊。

最強模型不開放,Claude 反而更好用?

很多人看到 Mythos 預覽版不開放,第一反應是失望:這么強的模型,為什么不給大家用?

但如果你是普通 Claude 用戶,或者每天靠 Claude Code 寫代碼、做項目的開發(fā)者,你可能會發(fā)現(xiàn)一個有點反直覺的事實,暫時不開放 Mythos 預覽版,對我們反而利大于弊。

先說說最近大家最有感的痛點。

大概從今年 2 月開始,Claude 和 Claude Code 就迎來了「史詩級性能削弱」。Reddit 的 r/ClaudeCode 和 r/ClaudeAI 里,相關帖子刷屏,有人直接發(fā)帖《4.6 Regression is real!》,有人吐槽「Claude Code has been dumb over the last 1.5-2 days」。



圖片來源:Reddit

還有開發(fā)者用數(shù)據(jù)追蹤,文件讀取次數(shù)從以前的 6-7 次掉到只剩 2 次左右,復雜任務里模型越來越「懶」,思考深度明顯變淺,經(jīng)常直接 edit-first 而不是先調研。

AMD AI 總監(jiān) Stella Laurenzo 甚至公開說 Claude Code 變得「dumber and lazier」,不能信任它做復雜工程任務。

Boris(Claude Code 團隊成員)則在 Hacker News 上回復,承認部分 agentic 用例出現(xiàn)了 regression,核心變化是 2 月引入的 「redact-thinking」 和 Adaptive Thinking,讓模型自己決定思考多久,結果復雜任務的深度下降了大約 67%。



圖片來源:Linkedln

類似的聲音在 X 上也一直有,開發(fā)者抱怨 Claude Code 已經(jīng)退化成了需要全程盯著的「實習生」。

為什么會出現(xiàn)這種情況?

超大參數(shù)模型訓練的規(guī)律擺在這里:每當大廠全力沖刺下一代「最強模型」時,都需要海量算力。Gemini 在推 3.0 / 3.1 前,2.5 Pro 就多次被開發(fā)者吐槽 silent update 后變蠢,長上下文忘記內容、邏輯任務失敗率上升。類似的情況也發(fā)生在 GPT-5 發(fā)布前,4o 就出現(xiàn)過輸出變短、變懶、復雜指令機械化等「降智」反饋。

算力是有限的,訓練 Mythos 這樣全新層級的模型,成本極高,只能從當前「擠」資源,通過動態(tài)負載均衡、自適應 effort 降低、甚至輕度優(yōu)化等方式,但結果就是大家感覺到的「變笨、變懶」。

此外,Claude Code 用戶量增長遠超預期,基礎設施多次吃緊,而 Mythos 預覽版(內部 Capybara)的訓練和測試又要優(yōu)先占用頂級 GPU。所以,當 Mythos 預覽版發(fā)布卻不開放給公眾時,不用擔心算力進一步被稀釋,導致 Claude 或者 Claude Code 的質量繼續(xù)下滑。

對普通 Claude 用戶來說,體驗反而會更穩(wěn)定。



圖片來源:Anthropic

另一方面,Anthropic 用 Mythos 在「玻璃翼計劃」里幫大廠和開源項目修漏洞,這些漏洞修好后,最終也會間接惠及所有用戶。

而等 Anthropic 把風險控制和基礎設施準備得更充分,再安全地大規(guī)模部署 Mythos 級模型,那時候普通用戶拿到的,才是真正穩(wěn)定、強大、不會三天兩頭「降智」的體驗,而不是現(xiàn)在急著放出來、然后大家一起承受算力擠占的陣痛。

Claude Mythos 預覽版的出現(xiàn),把一個殘酷卻現(xiàn)實的問題擺在了所有人面前:AI 越強大,風險就越真實。

當最強模型的進攻能力已經(jīng)遠超當前防御體系時,Anthropic 選擇「不給人用」,不是保守,而是把時間買給了整個行業(yè),讓防守方先把地基加固,讓普通用戶先擁有相對穩(wěn)定的 Claude 體驗,而不是一起卷入算力擠占和安全失控的混亂。

對大部分來說,這或許就是當下最好的安排。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
苦等18年緬甸終于想通了?聯(lián)手中國打通戰(zhàn)略大動脈,讓美無計可施

苦等18年緬甸終于想通了?聯(lián)手中國打通戰(zhàn)略大動脈,讓美無計可施

小蘭聊歷史
2026-03-20 18:41:51
急眼了!以色列終于捅了一個大簍子!

急眼了!以色列終于捅了一個大簍子!

財經(jīng)要參
2026-04-07 22:03:22
韓軍:朝鮮發(fā)射多枚導彈

韓軍:朝鮮發(fā)射多枚導彈

南方都市報
2026-04-08 12:33:57
“半身裙”今春最火,搭配襯衫、針織衫優(yōu)雅又時髦!

“半身裙”今春最火,搭配襯衫、針織衫優(yōu)雅又時髦!

何有強
2026-04-06 21:07:21
7.98 萬元起,新款蔚來螢火蟲更精致、更好玩,也沒背刺老車主

7.98 萬元起,新款蔚來螢火蟲更精致、更好玩,也沒背刺老車主

愛范兒
2026-04-08 18:37:20
豬肝再次成為關注對象!醫(yī)生發(fā)現(xiàn):常吃豬肝,可能會收獲4大好處

豬肝再次成為關注對象!醫(yī)生發(fā)現(xiàn):常吃豬肝,可能會收獲4大好處

搖感軍事
2025-11-30 18:57:30
大暴雨來了:狂風暴雨將襲江南多省,華南桑拿酷熱又要加強

大暴雨來了:狂風暴雨將襲江南多省,華南桑拿酷熱又要加強

中國氣象愛好者
2026-04-08 23:17:18
重慶一業(yè)主40萬賣房,買家重裝后69.8萬售出,第二買家以天花板有排污管道泄漏起訴,一審判業(yè)主擔責近80萬

重慶一業(yè)主40萬賣房,買家重裝后69.8萬售出,第二買家以天花板有排污管道泄漏起訴,一審判業(yè)主擔責近80萬

瀟湘晨報
2026-04-07 08:41:11
95年我被關派出所,我問長官:你認識我舅嗎?長官:你舅算哪根蔥

95年我被關派出所,我問長官:你認識我舅嗎?長官:你舅算哪根蔥

荔枝人物記
2025-07-29 09:09:07
當不成首相了?高市被催交權,中方嚴正警告,日本極短時間擁核

當不成首相了?高市被催交權,中方嚴正警告,日本極短時間擁核

南宗歷史
2026-04-08 22:39:11
18歲中國斯諾克天才世錦賽首秀8連鞭驚艷

18歲中國斯諾克天才世錦賽首秀8連鞭驚艷

啊噠體育
2026-04-09 00:44:12
安徽男子端午買彩票中3億,7天后去兌獎,卻被工作人員趕了出來

安徽男子端午買彩票中3億,7天后去兌獎,卻被工作人員趕了出來

凱裕說故事
2025-05-31 17:35:45
遠洋版李子柒,“海上廚子”火成真人海綿寶寶

遠洋版李子柒,“海上廚子”火成真人海綿寶寶

酷玩實驗室
2026-04-08 10:10:11
最晚8天,中方準時主持大局,兩國代表抵達新疆,瓦罕走廊被封死

最晚8天,中方準時主持大局,兩國代表抵達新疆,瓦罕走廊被封死

看盡人間百態(tài)
2026-04-09 03:18:17
手握直通門票卻選擇轉身,樊振東在等什么?

手握直通門票卻選擇轉身,樊振東在等什么?

鳳眼論
2026-04-08 20:48:48
NBA傳聞:雄鹿與奇才或將爭奪新任主教練

NBA傳聞:雄鹿與奇才或將爭奪新任主教練

好火子
2026-04-09 00:00:19
超過這個年齡,精子會斷崖式衰老,且會傳給下一代!

超過這個年齡,精子會斷崖式衰老,且會傳給下一代!

新浪財經(jīng)
2026-03-14 07:38:31
萬名民兵撲空,美國中情局立下大功,伊朗內奸把美軍上校藏了起來

萬名民兵撲空,美國中情局立下大功,伊朗內奸把美軍上校藏了起來

趣味八卦
2026-04-07 19:19:49
溫度的下限是零下273.15°C,為什么上限卻有1.4億億億億度?

溫度的下限是零下273.15°C,為什么上限卻有1.4億億億億度?

觀察宇宙
2026-03-06 20:21:19
英媒曾爆料:法航母在南海追中國潛艇?結果碰上中國40艘軍艦懵了

英媒曾爆料:法航母在南海追中國潛艇?結果碰上中國40艘軍艦懵了

素衣讀史
2026-04-06 20:21:16
2026-04-09 04:11:00
雷科技 incentive-icons
雷科技
專注AI硬科技
36768文章數(shù) 812001關注度
往期回顧 全部

科技要聞

造出地表最強AI,卻死活不給你用!

頭條要聞

伊朗武裝部隊:伊朗對美以絕不信任

頭條要聞

伊朗武裝部隊:伊朗對美以絕不信任

體育要聞

40歲,但實力倒退12年

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

財經(jīng)要聞

天津海河乳業(yè)回應直播間涉黃

汽車要聞

20萬級滿配華為全家桶 華境S是懂家庭的大六座

態(tài)度原創(chuàng)

教育
房產(chǎn)
藝術
時尚
本地

教育要聞

高考地理|什么是"下?lián)舯┝??

房產(chǎn)要聞

正式動工!珠城馬場地塊,簽約華爾道夫!

藝術要聞

驚艷!她的私房自拍照讓人無法抵擋!

50歲,我媽在戀綜搶男人

本地新聞

跟著歌聲游安徽,聽古村回響

無障礙瀏覽 進入關懷版