国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

造出地表最強AI,卻死活不給你用!Claude神級大模型被緊急雪藏

0
分享至

出品 | 網(wǎng)易智能

作者 | 小小

編輯 | 王鳳枝

最牛的大模型誕生了,但你根本沒資格用。

北京時間4月8日凌晨,Anthropic干了一件違背商業(yè)常理的事。他們不僅親手按死了自家超級模型Claude Mythos(神話)的公開發(fā)布,還破天荒地聯(lián)手蘋果與谷歌等一眾宿敵,試圖把這個剛造出的重量級武器徹底隱藏起來。


它究竟有多強?

在沒有任何專屬安全訓(xùn)練的前提下,它僅靠邏輯能力的自然演進就全面超越了前代頂級模型。在權(quán)威的工程難題測試中,Mythos解決復(fù)雜Bug的成功率直接提升了近五成,而在科學(xué)界的極限測試里更是拿下了94.6%的高分。

更讓人警惕的是它在實戰(zhàn)中的破壞力。過去幾周內(nèi),Mythos在完全自主的狀態(tài)下,不僅一眼看穿了潛伏在頂級防火墻系統(tǒng)中長達27年的深層漏洞,甚至還能在Linux內(nèi)核里自主串聯(lián)多個隱蔽漏洞,瞬間完成對核心服務(wù)器的徹底接管。

這種自主尋找漏洞并開發(fā)利用工具的強大能力,正是它被緊急封殺的直接原因。

Anthropic的前沿紅隊負責(zé)人洛根·格雷厄姆(Logan Graham)坦言,全人類必須現(xiàn)在就為一個新世界做好準備。他極其嚴肅地警告,在未來6到24個月內(nèi),這類能力將變得隨處可見,屆時安全領(lǐng)域的許多規(guī)則將被徹底改寫,我們構(gòu)建現(xiàn)代安全體系時所依賴的諸多基本假設(shè)也將被全盤打破。

為此他們寧可放棄巨大的商業(yè)流量,也要拋出一項高達1億美元的防御聯(lián)盟計劃。他們試圖用嚴格受控的內(nèi)部開放策略,為科技巨頭們爭取寶貴的系統(tǒng)加固時間。

01數(shù)據(jù)不會撒謊:編碼與推理的絕對降維碾壓

正如Anthropic官方所釋義的,Mythos一詞源自古希臘語中的話語或敘事,代表著文明借以理解世界的故事系統(tǒng)。這個內(nèi)部代號,本身就宣告了一場跨維度的能力躍遷。

Mythos在沒有任何專門網(wǎng)絡(luò)安全訓(xùn)練的前提下,僅僅靠代碼能力的自然進化,就實現(xiàn)了對上一代最強模型Claude Opus 4.6的全面超越。


在衡量AI解決實際工程問題能力的SWE-bench Pro測試中,Mythos預(yù)覽版得分高達77.8%,而Opus 4.6只有53.4%。這意味著在面對復(fù)雜的生產(chǎn)級代碼庫時,Mythos解決問題的成功率提升了近百分之五十,在多語言環(huán)境下,它更是跑出了87.3%的高分。

在極具挑戰(zhàn)性的人類最后一場考試(Humanity’s Last Exam)中,有工具輔助的Mythos達到了64.7%,將前代模型遠遠甩在身后。而在針對科學(xué)領(lǐng)域難題的GPQA Diamond測試中,Mythos的得分更是高達94.6%,幾乎逼近了人類專家認知的極限。

Mythos不僅會寫代碼,它還會像高級工程師一樣接管電腦。在驗證操作系統(tǒng)執(zhí)行任務(wù)能力的OSWorld-Verified測試中,它斬獲了79.6%的分數(shù)。這意味著它能夠流暢地在各種軟件界面間切換、搜索核心信息并執(zhí)行復(fù)雜的破壞或防御指令。

02實戰(zhàn)獵殺記錄:揪出蟄伏27年的代碼幽靈

如果說測試分數(shù)只是實驗室數(shù)據(jù),那么Mythos在過去幾周里自主揪出的數(shù)千個零日漏洞,則是實打?qū)嵉膽?zhàn)績。Anthropic披露了三個典型的危險案例,每一個都足以讓頂尖的安全專家冷汗直流。

OpenBSD一直被譽為全球安全性最強的操作系統(tǒng),廣泛用于防火墻等關(guān)鍵基礎(chǔ)設(shè)施。然而,Mythos在完全自主的情況下,直接識別出了一個潛伏了27年之久的深層漏洞。這個漏洞的后果非常直接,攻擊者只需簡單連接,就能遠程導(dǎo)致任何運行該系統(tǒng)的機器瞬間崩潰,而在這漫長的27年里,無數(shù)頂級安全研究人員和審計工具對它一無所知。

FFmpeg是現(xiàn)代互聯(lián)網(wǎng)視頻處理的底層基石,幾乎每一款主流軟件都在依賴它。Mythos在其中發(fā)現(xiàn)了一個存在了16年之久的隱蔽漏洞。極具諷刺意味的是,自動化測試工具曾對出問題的這行代碼進行了多達五百萬次的反復(fù)掃描,卻從未檢測到任何異常,而Mythos卻一眼看穿了這行代碼背后的邏輯陷阱。

在運行著全球絕大部分服務(wù)器的Linux內(nèi)核中,Mythos展示了更高級的思考能力。它不僅敏銳地發(fā)現(xiàn)了漏洞,還能自主將多個邊緣漏洞串聯(lián)起來,完成了一次從普通用戶權(quán)限到完全控制核心機器的致命逆轉(zhuǎn)。

03一億美元的保命屏障:玻璃翼計劃如何運作

面對Mythos這種足以摧毀現(xiàn)有互聯(lián)網(wǎng)雙刃劍,Anthropic并沒有選擇閉門造車,而是緊急發(fā)起了一項名為玻璃翼計劃(Project Glasswing)的全球防御倡議。

這個名字的寓意意味深長,Glasswing是一種以透明翅膀著稱的透翅蝶。Anthropic官方解釋稱,透明的翅膀讓蝴蝶能隱藏在眾目睽睽之下,就像那些難以察覺的軟件漏洞,同時這種透明度也讓它們能躲避捕食者的傷害,正如該計劃所倡導(dǎo)的防御透明度。

為了確保人類防御者能夠跑贏未來的攻擊者,Anthropic投入了龐大的資源:

首先,Anthropic承諾向Glasswing合作伙伴及相關(guān)組織提供最高一億美元的Mythos預(yù)覽版使用額度,確保他們有充裕的算力資源來加固自己的代碼庫。

其次,為了不讓開源社區(qū)在這場安全競賽中掉隊,Anthropic通過Linux基金會向Alpha-Omega、OpenSSF等開源安全組織捐贈了250萬美元,并向Apache軟件基金會捐贈了150萬美元。

最關(guān)鍵的一步是,目前Mythos絕對不會向公眾發(fā)布。只有通過該計劃,合作伙伴才能通過AWS、Google Cloud Vertex AI或Microsoft Foundry等平臺獲得嚴格受控的預(yù)覽權(quán)限。

這種極度保守的分階段發(fā)布策略,實際上是在為全球基礎(chǔ)設(shè)施爭取時間。正如Anthropic前沿紅隊負責(zé)人所言,這早已不是一家公司的問題,而是全行業(yè)乃至各國政府都必須面對的挑戰(zhàn),我們必須讓防御者占據(jù)先機。

04巨頭們的罕見結(jié)盟:連對手都坐不住了

在這場史無前例的合作中,曾經(jīng)的商業(yè)競爭對手們表現(xiàn)出了罕見的共識。八家創(chuàng)始合作伙伴在實測Mythos后,給出了最真實的反饋:

亞馬遜AWS副總裁艾米·赫爾佐格(Amy Herzog)透露,他們已經(jīng)在關(guān)鍵代碼庫中測試Mythos,每天分析超過四百萬億個網(wǎng)絡(luò)流量,而Mythos正在幫助他們在大規(guī)模防御中進行底層的代碼加固。

微軟網(wǎng)絡(luò)安全執(zhí)行副總裁伊戈爾·齊甘斯基(Igor Tsyganskiy)指出,Mythos表現(xiàn)出了超越以往所有模型的改進。他嚴肅地判定,網(wǎng)絡(luò)安全已經(jīng)正式進入了一個不再受人力限制的全新階段。

谷歌安全工程副總裁希瑟·阿德金斯(Heather Adkins)對這一倡議表示了歡迎。盡管谷歌擁有Big Sleep和CodeMender等自研安全工具,但她深刻意識到,面對基于下一代AI的攻擊,跨行業(yè)的巨頭結(jié)盟至關(guān)重要。

思科高級副總裁安東尼·格里科(Anthony Grieco)則強調(diào),AI的能力已經(jīng)跨越了臨界點,過去那種緩慢修補系統(tǒng)的方法已經(jīng)行不通了。思科加入計劃是為了以前所未有的速度和規(guī)模識別修復(fù)漏洞。

CrowdStrike首席技術(shù)官伊利亞·扎伊采夫(Elia Zaitsev)發(fā)出的警告最為直接,從漏洞被發(fā)現(xiàn)到被利用的窗口期,已經(jīng)從數(shù)月被壓縮至幾分鐘,他告誡所有人,如果你想部署AI,安全必須是第一位的。

Palo Alto Networks首席產(chǎn)品官李·克拉里奇(Lee Klarich)證實,Mythos能識別出前代模型完全漏掉的復(fù)雜漏洞。他呼吁所有人必須現(xiàn)代化自己的網(wǎng)絡(luò)安全棧,迎接更頻繁、更復(fù)雜的AI輔助攻擊。

摩根大通首席信息安全官帕特·奧佩特(Pat Opet)表示,這是金融機構(gòu)在關(guān)鍵基礎(chǔ)設(shè)施防御方面的一次早期機會,必須通過協(xié)作來評估下一代AI工具。

Linux基金會首席執(zhí)行官吉姆·澤姆林(Jim Zemlin)則認為,AI增強的安全將成為每一位維護者的得力助手,而不再是大型組織的專屬特權(quán)。

05終極清算還是變相的敲詐勒索

當Claude Mythos這種能夠自主獵殺系統(tǒng)漏洞的模型被公之于眾時,全球輿論場呈現(xiàn)出了兩極分化。這種復(fù)雜的反饋,不僅折射出了技術(shù)帶來的震撼,更揭示了人們對于失去網(wǎng)絡(luò)安全主導(dǎo)權(quán)的焦慮。

知名科技投資人布拉德·格斯特納(Brad Gerstner)高度贊揚了這種務(wù)實的做法。他認為通過推遲發(fā)布并組建防線,Anthropic實際上是用一種市場協(xié)作模式,為脆弱的互聯(lián)網(wǎng)筑起了一道屏障。


然而,批評的聲音同樣尖銳,甚至帶著對技術(shù)霸權(quán)的憤怒。

科技專欄作家尼克·奧尼爾(Nick O'Neill)的觀點顯得十分激進,他認為對于全球軟件公司來說,這更像是一場打著創(chuàng)新旗號的人質(zhì)劫持。如果不向Anthropic支付昂貴的模型使用費,這些公司在未來被攻破的概率將高達85%,在他眼里,這種領(lǐng)先的安全能力更像是一種新型的敲詐勒索。

在競爭格局上,業(yè)界的嗅覺極其敏銳。盡管OpenAI曾宣稱擁有最強網(wǎng)絡(luò)安全模型,但Mythos顯然在能力上實現(xiàn)了跨代式的飛躍??萍疾┲髦赋?,原本屬于OpenAI的先發(fā)優(yōu)勢正在發(fā)生轉(zhuǎn)移,安全防御已然成為未來一年AI大廠之間最核心的較量場。

此外,多位重量級觀察家對這一現(xiàn)象進行了深層剖析,試圖理清Mythos問世的真實意義:

知名科技博主羅伯特·斯考伯(Robert Scoble)從AGI管理的角度指出,如果手中掌握了足以危害世界的強大技術(shù),明智的做法絕不是貿(mào)然公開,而是先用它來修復(fù)世界的漏洞。只有讓正確的人管理它,技術(shù)才能真正造福于人。

未來學(xué)家拉米茲·納姆(Ramez Naam)則將這看作一場AI與AI之間的對決。他認為安全必須在整個生態(tài)系統(tǒng)層面得到保障,而“好人利用AI”,是阻止“壞人”利用AI的唯一出路。


《紐約時報》專欄作家凱文·魯斯(Kevin Roose)則察覺到了一個更本質(zhì)的變化。他在推文中直言:除了網(wǎng)絡(luò)安全方面的影響之外,Claude Mythos的未發(fā)布是自GPT-2以來,主要人工智能實驗室首次因安全問題而推遲發(fā)布已公布的模型。

如果Anthropic的說法正確,那么公開可用的模型和私人模型之間現(xiàn)在存在著巨大的差距,這可能是多年來第一次出現(xiàn)這種情況。

結(jié)語:沙漏已經(jīng)倒轉(zhuǎn),留給人類的時間不多了

Anthropic CEO達里奧·阿莫代伊(Dario Amodei)的最后通牒非常清晰,網(wǎng)絡(luò)安全僅僅是前沿模型帶來的第一個緊迫危險,但它絕對不會是最后一個。Glasswing計劃僅僅是一個起點,保衛(wèi)全球網(wǎng)絡(luò)基礎(chǔ)設(shè)施的工作可能還需要數(shù)月乃至數(shù)年時間。

在這場能力的狂飆中,我們正處在一個極其不確定的節(jié)點上。

而對于數(shù)以十億計的普通用戶來說,這才是最讓人后背發(fā)涼的現(xiàn)實。我們每天賴以生存的社交隱私、銀行存款和智能設(shè)備,在這場即將到來的風(fēng)暴面前猶如紙糊一般脆弱。

Mythos的封印,到底能為這個世界換取多少防御時間?

相關(guān)推薦
熱點推薦
以色列南部遭伊朗導(dǎo)彈襲擊

以色列南部遭伊朗導(dǎo)彈襲擊

財聯(lián)社
2026-04-08 05:26:29
被忽悠入局萬科 深鐵開始清算了

被忽悠入局萬科 深鐵開始清算了

經(jīng)濟那道理
2026-04-07 19:37:14
美伊巴代表徹夜談?;穑√乩势瞻l(fā)帖:打開那該死的海峽 伊朗:不會為臨時停火重開

美伊巴代表徹夜談?;?!特朗普發(fā)帖:打開那該死的海峽 伊朗:不會為臨時?;鹬亻_

紅星新聞
2026-04-06 18:18:25
太膈應(yīng)?。【W(wǎng)傳湛江高鐵站門前,分布著密密麻麻的墳堆和墓碑…

太膈應(yīng)??!網(wǎng)傳湛江高鐵站門前,分布著密密麻麻的墳堆和墓碑…

火山詩話
2026-04-07 12:46:50
蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

老謝談史
2026-03-18 18:33:35
湖南2名男子騎車過湘江溺亡,是附近村民不聽勸非要騎

湖南2名男子騎車過湘江溺亡,是附近村民不聽勸非要騎

九方魚論
2026-04-08 05:38:56
伊朗腸子都悔青了!怎么能讓美軍深入100多公里救走F-15飛行員?

伊朗腸子都悔青了!怎么能讓美軍深入100多公里救走F-15飛行員?

頭條爆料007
2026-04-05 18:55:00
浴巾發(fā)現(xiàn)用過的“偉哥”……女子住桔子酒店,一夜換三次房

浴巾發(fā)現(xiàn)用過的“偉哥”……女子住桔子酒店,一夜換三次房

政法頻道
2026-04-07 12:56:31
美國完全陷入中國的圈套!紐約時報:特朗普正在領(lǐng)導(dǎo)超級大國自殺

美國完全陷入中國的圈套!紐約時報:特朗普正在領(lǐng)導(dǎo)超級大國自殺

混沌錄
2026-04-07 22:00:06
看了孫儷《危險關(guān)系》主人公原型,現(xiàn)實遠比電視劇更加令人痛心

看了孫儷《危險關(guān)系》主人公原型,現(xiàn)實遠比電視劇更加令人痛心

糊咖娛樂
2026-04-07 17:16:43
裁委會承認馬丁直紅,馬競官方轉(zhuǎn)發(fā):承認錯誤值得稱贊

裁委會承認馬丁直紅,馬競官方轉(zhuǎn)發(fā):承認錯誤值得稱贊

懂球帝
2026-04-08 07:43:06
CBA焦點戰(zhàn)今晚打響:廣東對陣青島,3好消息2壞消息傳來

CBA焦點戰(zhàn)今晚打響:廣東對陣青島,3好消息2壞消息傳來

阿薎美食
2026-04-08 08:59:34
英媒:美軍飛行員靠“嗑藥”飛到伊朗

英媒:美軍飛行員靠“嗑藥”飛到伊朗

參考消息
2026-04-06 21:14:36
李蘭迪身材跟哺乳期了一樣

李蘭迪身材跟哺乳期了一樣

可樂談情感
2026-04-08 01:58:32
阿爾卡拉斯自嘲將丟世界第一:我要保太多分,辛納卻一身輕松!

阿爾卡拉斯自嘲將丟世界第一:我要保太多分,辛納卻一身輕松!

仰臥撐FTUer
2026-04-08 07:41:02
不黑不吹,聰明人,其實都買了iPhoneAir

不黑不吹,聰明人,其實都買了iPhoneAir

互聯(lián)網(wǎng).亂侃秀
2026-04-07 12:09:01
吉利要殺死合資!長超5米2,續(xù)航1505km,雙叉臂+6座,才賣13萬

吉利要殺死合資!長超5米2,續(xù)航1505km,雙叉臂+6座,才賣13萬

生活魔術(shù)專家
2026-04-08 03:22:06
寶媽哭訴:脫褲子那一刻就沒了尊嚴!生娃七個尷尬瞬間,你中幾個

寶媽哭訴:脫褲子那一刻就沒了尊嚴!生娃七個尷尬瞬間,你中幾個

菁媽育兒
2026-04-04 21:42:23
某些媒體這次被罵一點也不無辜!

某些媒體這次被罵一點也不無辜!

胖胖說他不胖
2026-04-08 09:00:15
美媒:16萬年前的“中國制造”重塑創(chuàng)新認知

美媒:16萬年前的“中國制造”重塑創(chuàng)新認知

北青網(wǎng)-北京青年報
2026-04-07 08:42:05
2026-04-08 10:31:00

科技要聞

造出地表最強AI,卻死活不給你用!

頭條要聞

美國、伊朗全面?;鹆⒓瓷?特朗普最新發(fā)聲

頭條要聞

美國、伊朗全面停火立即生效 特朗普最新發(fā)聲

體育要聞

官宣簽約“AI球員”,這支球隊被罵慘了...

娛樂要聞

女首富陳麗華離世 被曝生前已分好遺產(chǎn)

財經(jīng)要聞

特朗普同意?;饍芍?伊朗:接受?;鹛嶙h

汽車要聞

不止是大 極狐首款MPV問道V9靜態(tài)體驗

態(tài)度原創(chuàng)

本地
親子
藝術(shù)
時尚
公開課

本地新聞

跟著歌聲游安徽,聽古村回響

親子要聞

砸了8000塊,兒子的眼軸還是漲了0.1mm

藝術(shù)要聞

鄭麗文書法爭議:她的字真的不是自己寫的嗎?

闊腿褲失寵了?今年這幾條褲子最時髦!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版
×