網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

造出地表最強AI，卻死活不給你用！Claude神級大模型被緊急雪藏

2026-04-08 08:27:15　來源: 網(wǎng)易智能

北京舉報

分享至

出品 | 網(wǎng)易智能

作者 | 小小

編輯 | 王鳳枝

最牛的大模型誕生了，但你根本沒資格用。

北京時間4月8日凌晨，Anthropic干了一件違背商業(yè)常理的事。他們不僅親手按死了自家超級模型Claude Mythos（神話）的公開發(fā)布，還破天荒地聯(lián)手蘋果與谷歌等一眾宿敵，試圖把這個剛造出的重量級武器徹底隱藏起來。

它究竟有多強？

在沒有任何專屬安全訓(xùn)練的前提下，它僅靠邏輯能力的自然演進就全面超越了前代頂級模型。在權(quán)威的工程難題測試中，Mythos解決復(fù)雜Bug的成功率直接提升了近五成，而在科學(xué)界的極限測試里更是拿下了94.6%的高分。

更讓人警惕的是它在實戰(zhàn)中的破壞力。過去幾周內(nèi)，Mythos在完全自主的狀態(tài)下，不僅一眼看穿了潛伏在頂級防火墻系統(tǒng)中長達27年的深層漏洞，甚至還能在Linux內(nèi)核里自主串聯(lián)多個隱蔽漏洞，瞬間完成對核心服務(wù)器的徹底接管。

這種自主尋找漏洞并開發(fā)利用工具的強大能力，正是它被緊急封殺的直接原因。

Anthropic的前沿紅隊負責(zé)人洛根·格雷厄姆（Logan Graham）坦言，全人類必須現(xiàn)在就為一個新世界做好準備。他極其嚴肅地警告，在未來6到24個月內(nèi)，這類能力將變得隨處可見，屆時安全領(lǐng)域的許多規(guī)則將被徹底改寫，我們構(gòu)建現(xiàn)代安全體系時所依賴的諸多基本假設(shè)也將被全盤打破。

為此他們寧可放棄巨大的商業(yè)流量，也要拋出一項高達1億美元的防御聯(lián)盟計劃。他們試圖用嚴格受控的內(nèi)部開放策略，為科技巨頭們爭取寶貴的系統(tǒng)加固時間。

01數(shù)據(jù)不會撒謊：編碼與推理的絕對降維碾壓

正如Anthropic官方所釋義的，Mythos一詞源自古希臘語中的話語或敘事，代表著文明借以理解世界的故事系統(tǒng)。這個內(nèi)部代號，本身就宣告了一場跨維度的能力躍遷。

Mythos在沒有任何專門網(wǎng)絡(luò)安全訓(xùn)練的前提下，僅僅靠代碼能力的自然進化，就實現(xiàn)了對上一代最強模型Claude Opus 4.6的全面超越。

在衡量AI解決實際工程問題能力的SWE-bench Pro測試中，Mythos預(yù)覽版得分高達77.8%，而Opus 4.6只有53.4%。這意味著在面對復(fù)雜的生產(chǎn)級代碼庫時，Mythos解決問題的成功率提升了近百分之五十，在多語言環(huán)境下，它更是跑出了87.3%的高分。

在極具挑戰(zhàn)性的人類最后一場考試（Humanity’s Last Exam）中，有工具輔助的Mythos達到了64.7%，將前代模型遠遠甩在身后。而在針對科學(xué)領(lǐng)域難題的GPQA Diamond測試中，Mythos的得分更是高達94.6%，幾乎逼近了人類專家認知的極限。

Mythos不僅會寫代碼，它還會像高級工程師一樣接管電腦。在驗證操作系統(tǒng)執(zhí)行任務(wù)能力的OSWorld-Verified測試中，它斬獲了79.6%的分數(shù)。這意味著它能夠流暢地在各種軟件界面間切換、搜索核心信息并執(zhí)行復(fù)雜的破壞或防御指令。

02實戰(zhàn)獵殺記錄：揪出蟄伏27年的代碼幽靈

如果說測試分數(shù)只是實驗室數(shù)據(jù)，那么Mythos在過去幾周里自主揪出的數(shù)千個零日漏洞，則是實打?qū)嵉膽?zhàn)績。Anthropic披露了三個典型的危險案例，每一個都足以讓頂尖的安全專家冷汗直流。

OpenBSD一直被譽為全球安全性最強的操作系統(tǒng)，廣泛用于防火墻等關(guān)鍵基礎(chǔ)設(shè)施。然而，Mythos在完全自主的情況下，直接識別出了一個潛伏了27年之久的深層漏洞。這個漏洞的后果非常直接，攻擊者只需簡單連接，就能遠程導(dǎo)致任何運行該系統(tǒng)的機器瞬間崩潰，而在這漫長的27年里，無數(shù)頂級安全研究人員和審計工具對它一無所知。

FFmpeg是現(xiàn)代互聯(lián)網(wǎng)視頻處理的底層基石，幾乎每一款主流軟件都在依賴它。Mythos在其中發(fā)現(xiàn)了一個存在了16年之久的隱蔽漏洞。極具諷刺意味的是，自動化測試工具曾對出問題的這行代碼進行了多達五百萬次的反復(fù)掃描，卻從未檢測到任何異常，而Mythos卻一眼看穿了這行代碼背后的邏輯陷阱。

在運行著全球絕大部分服務(wù)器的Linux內(nèi)核中，Mythos展示了更高級的思考能力。它不僅敏銳地發(fā)現(xiàn)了漏洞，還能自主將多個邊緣漏洞串聯(lián)起來，完成了一次從普通用戶權(quán)限到完全控制核心機器的致命逆轉(zhuǎn)。

03一億美元的保命屏障：玻璃翼計劃如何運作

面對Mythos這種足以摧毀現(xiàn)有互聯(lián)網(wǎng)雙刃劍，Anthropic并沒有選擇閉門造車，而是緊急發(fā)起了一項名為玻璃翼計劃（Project Glasswing）的全球防御倡議。

這個名字的寓意意味深長，Glasswing是一種以透明翅膀著稱的透翅蝶。Anthropic官方解釋稱，透明的翅膀讓蝴蝶能隱藏在眾目睽睽之下，就像那些難以察覺的軟件漏洞，同時這種透明度也讓它們能躲避捕食者的傷害，正如該計劃所倡導(dǎo)的防御透明度。

為了確保人類防御者能夠跑贏未來的攻擊者，Anthropic投入了龐大的資源：

首先，Anthropic承諾向Glasswing合作伙伴及相關(guān)組織提供最高一億美元的Mythos預(yù)覽版使用額度，確保他們有充裕的算力資源來加固自己的代碼庫。

其次，為了不讓開源社區(qū)在這場安全競賽中掉隊，Anthropic通過Linux基金會向Alpha-Omega、OpenSSF等開源安全組織捐贈了250萬美元，并向Apache軟件基金會捐贈了150萬美元。

最關(guān)鍵的一步是，目前Mythos絕對不會向公眾發(fā)布。只有通過該計劃，合作伙伴才能通過AWS、Google Cloud Vertex AI或Microsoft Foundry等平臺獲得嚴格受控的預(yù)覽權(quán)限。

這種極度保守的分階段發(fā)布策略，實際上是在為全球基礎(chǔ)設(shè)施爭取時間。正如Anthropic前沿紅隊負責(zé)人所言，這早已不是一家公司的問題，而是全行業(yè)乃至各國政府都必須面對的挑戰(zhàn)，我們必須讓防御者占據(jù)先機。

04巨頭們的罕見結(jié)盟：連對手都坐不住了

在這場史無前例的合作中，曾經(jīng)的商業(yè)競爭對手們表現(xiàn)出了罕見的共識。八家創(chuàng)始合作伙伴在實測Mythos后，給出了最真實的反饋：

亞馬遜AWS副總裁艾米·赫爾佐格（Amy Herzog）透露，他們已經(jīng)在關(guān)鍵代碼庫中測試Mythos，每天分析超過四百萬億個網(wǎng)絡(luò)流量，而Mythos正在幫助他們在大規(guī)模防御中進行底層的代碼加固。

微軟網(wǎng)絡(luò)安全執(zhí)行副總裁伊戈爾·齊甘斯基（Igor Tsyganskiy）指出，Mythos表現(xiàn)出了超越以往所有模型的改進。他嚴肅地判定，網(wǎng)絡(luò)安全已經(jīng)正式進入了一個不再受人力限制的全新階段。

谷歌安全工程副總裁希瑟·阿德金斯（Heather Adkins）對這一倡議表示了歡迎。盡管谷歌擁有Big Sleep和CodeMender等自研安全工具，但她深刻意識到，面對基于下一代AI的攻擊，跨行業(yè)的巨頭結(jié)盟至關(guān)重要。

思科高級副總裁安東尼·格里科（Anthony Grieco）則強調(diào)，AI的能力已經(jīng)跨越了臨界點，過去那種緩慢修補系統(tǒng)的方法已經(jīng)行不通了。思科加入計劃是為了以前所未有的速度和規(guī)模識別修復(fù)漏洞。

CrowdStrike首席技術(shù)官伊利亞·扎伊采夫（Elia Zaitsev）發(fā)出的警告最為直接，從漏洞被發(fā)現(xiàn)到被利用的窗口期，已經(jīng)從數(shù)月被壓縮至幾分鐘，他告誡所有人，如果你想部署AI，安全必須是第一位的。

Palo Alto Networks首席產(chǎn)品官李·克拉里奇（Lee Klarich）證實，Mythos能識別出前代模型完全漏掉的復(fù)雜漏洞。他呼吁所有人必須現(xiàn)代化自己的網(wǎng)絡(luò)安全棧，迎接更頻繁、更復(fù)雜的AI輔助攻擊。

摩根大通首席信息安全官帕特·奧佩特（Pat Opet）表示，這是金融機構(gòu)在關(guān)鍵基礎(chǔ)設(shè)施防御方面的一次早期機會，必須通過協(xié)作來評估下一代AI工具。

Linux基金會首席執(zhí)行官吉姆·澤姆林（Jim Zemlin）則認為，AI增強的安全將成為每一位維護者的得力助手，而不再是大型組織的專屬特權(quán)。

05終極清算還是變相的敲詐勒索

當Claude Mythos這種能夠自主獵殺系統(tǒng)漏洞的模型被公之于眾時，全球輿論場呈現(xiàn)出了兩極分化。這種復(fù)雜的反饋，不僅折射出了技術(shù)帶來的震撼，更揭示了人們對于失去網(wǎng)絡(luò)安全主導(dǎo)權(quán)的焦慮。

知名科技投資人布拉德·格斯特納（Brad Gerstner）高度贊揚了這種務(wù)實的做法。他認為通過推遲發(fā)布并組建防線，Anthropic實際上是用一種市場協(xié)作模式，為脆弱的互聯(lián)網(wǎng)筑起了一道屏障。

然而，批評的聲音同樣尖銳，甚至帶著對技術(shù)霸權(quán)的憤怒。

科技專欄作家尼克·奧尼爾（Nick O'Neill）的觀點顯得十分激進，他認為對于全球軟件公司來說，這更像是一場打著創(chuàng)新旗號的人質(zhì)劫持。如果不向Anthropic支付昂貴的模型使用費，這些公司在未來被攻破的概率將高達85%，在他眼里，這種領(lǐng)先的安全能力更像是一種新型的敲詐勒索。

在競爭格局上，業(yè)界的嗅覺極其敏銳。盡管OpenAI曾宣稱擁有最強網(wǎng)絡(luò)安全模型，但Mythos顯然在能力上實現(xiàn)了跨代式的飛躍?？萍疾┲髦赋?，原本屬于OpenAI的先發(fā)優(yōu)勢正在發(fā)生轉(zhuǎn)移，安全防御已然成為未來一年AI大廠之間最核心的較量場。

此外，多位重量級觀察家對這一現(xiàn)象進行了深層剖析，試圖理清Mythos問世的真實意義：

知名科技博主羅伯特·斯考伯（Robert Scoble）從AGI管理的角度指出，如果手中掌握了足以危害世界的強大技術(shù)，明智的做法絕不是貿(mào)然公開，而是先用它來修復(fù)世界的漏洞。只有讓正確的人管理它，技術(shù)才能真正造福于人。

未來學(xué)家拉米茲·納姆（Ramez Naam）則將這看作一場AI與AI之間的對決。他認為安全必須在整個生態(tài)系統(tǒng)層面得到保障，而“好人利用AI”，是阻止“壞人”利用AI的唯一出路。

《紐約時報》專欄作家凱文·魯斯（Kevin Roose）則察覺到了一個更本質(zhì)的變化。他在推文中直言：除了網(wǎng)絡(luò)安全方面的影響之外，Claude Mythos的未發(fā)布是自GPT-2以來，主要人工智能實驗室首次因安全問題而推遲發(fā)布已公布的模型。

如果Anthropic的說法正確，那么公開可用的模型和私人模型之間現(xiàn)在存在著巨大的差距，這可能是多年來第一次出現(xiàn)這種情況。

結(jié)語：沙漏已經(jīng)倒轉(zhuǎn)，留給人類的時間不多了

Anthropic CEO達里奧·阿莫代伊（Dario Amodei）的最后通牒非常清晰，網(wǎng)絡(luò)安全僅僅是前沿模型帶來的第一個緊迫危險，但它絕對不會是最后一個。Glasswing計劃僅僅是一個起點，保衛(wèi)全球網(wǎng)絡(luò)基礎(chǔ)設(shè)施的工作可能還需要數(shù)月乃至數(shù)年時間。