国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

能力太強,Mythos被Anthropic“凍結(jié)”

0
分享至


出品|虎嗅科技組

作者|趙致格

編輯|苗正卿

頭圖|視覺中國

4月8日,關(guān)注AI圈動態(tài)的極客們收到了一個好消息和一個壞消息。好消息是Anthropic那個被傳得神乎其神的新模型Claude Mythos終于發(fā)布了預(yù)覽版,而各種公開的數(shù)據(jù)也顯示出Mythos確實全方面碾壓了Opus4.6。

但壞消息是,因為相關(guān)防護機制尚未成熟,Mythos當(dāng)前不對公眾開放,Anthropic還為其定制了一個安全項目玻璃墻計劃(Project Glasswing)。根據(jù)這一安全項目,僅有12家機構(gòu)能訪問Mythos。與此同時,Anthropic還承諾提供最高1億美元的模型使用額度,用于防御性網(wǎng)絡(luò)安全研究。


過去一段時間,關(guān)于Mythos的傳聞一直在滿天飛。早在3月26日,Anthropic的一個內(nèi)容管理系統(tǒng)出現(xiàn)了錯誤,曝光了一篇還沒有正式發(fā)布的草稿。這篇草稿稱Mythos是“史上最強大的模型”。

X上同樣有人爆料稱,某家實驗室完成了迄今為止最大的一次成功訓(xùn)練,而新模型的表現(xiàn)遠(yuǎn)遠(yuǎn)超過內(nèi)部預(yù)期,也超過了大家根據(jù)模型縮放定律(scaling law)能預(yù)測的水平。


雖然普通人無法親自體會這個傳說中的又一次“GPT時刻”,但Anthropic公布的一系列數(shù)據(jù)確實顯示出Mythos 強得可怕。

在專業(yè)漏洞復(fù)現(xiàn)測試CyberGym上,Mythos的得分是83.1%,而此前Anthropic 的最強模型Opus4.6的分?jǐn)?shù)是66.6%。


在編程能力方面,Mythos在SWE-bench Pro、Terminal-Bench 2.0、SWE-bench Multimodal (internal implementation)、SWE-bench Multilingual、SWE-bench Verified中的測試分?jǐn)?shù)均顯著高于Opus4.6。Anthropic稱,新模型的能力已經(jīng)達到“可以與最頂尖人類安全專家競爭”的水平。

在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。


Mythos不僅是在編程能力上表現(xiàn)強悍。在研究生水平科學(xué)問答測試(GPQA Diamond)測試中,Mythos以94.6%的分?jǐn)?shù)超過Opus4.6的91.3%;在Humanity‘s Last Exam的有工具和無工具測試中,Mythos 56.8%和64.7%的分?jǐn)?shù)均超過Opus4.6十個百分點。

在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。

不過,上述維護的優(yōu)異表現(xiàn)并不是Anthropic不敢上線Mythos的原因。Mythos真正的可怕之處在它突破軟件安全防線的能力太強了。

理論上,所有軟件都可能會有漏洞,但是Mythos在發(fā)現(xiàn)并攻擊漏洞上的能力遠(yuǎn)超人類水平。根據(jù)Anthropic的博文介紹,Mythos已經(jīng)在在操作系統(tǒng)、網(wǎng)絡(luò)瀏覽器和其他軟件中發(fā)現(xiàn)了“幾千個”重大漏洞,其中包括OpenBSD中一個存在27年的錯誤,以及FFmpeg中一個存在16年、在自動測試工具運行500萬次后仍未被檢測到的漏洞。

可以說,全世界所有的軟件和系統(tǒng)在Mythos面前都顯得漏洞百出,脆弱不堪。假如Mythos的能力在當(dāng)下被黑客掌握,無疑會有無數(shù)數(shù)字基礎(chǔ)設(shè)施會遭殃。

Anthropic的CEO達里奧·阿莫迪(Dario Amodei)Mythos發(fā)布的同時也在X上表達了自己的擔(dān)憂和信心。他表示:“網(wǎng)絡(luò)安全是前沿AI模型帶來的首個明確且現(xiàn)實的危險,但絕不會是最后一個。若我們能共同迎接挑戰(zhàn)、應(yīng)對這一風(fēng)險,這或?qū)⒊蔀橐环菟{(lán)圖,用以解決未來更為艱巨的挑戰(zhàn)?!?/p>

達里奧隨后又進一步解釋:“一旦應(yīng)對失誤,其危險顯而易見;但倘若應(yīng)對得當(dāng),我們將真正迎來機遇:建造一個比AI網(wǎng)絡(luò)安全能力出現(xiàn)之前更加安全的互聯(lián)網(wǎng)與世界?!?/p>


面對AI發(fā)展帶來的危險和機遇,Anthropic 提出的應(yīng)對方法是發(fā)起玻璃翼計劃(Project Glasswing)。這個項目將向特定組織開放其未公開發(fā)布的通用AI模型“Claude Mythos預(yù)覽版”,用于防御性網(wǎng)絡(luò)安全工作。12個合作伙伴包括亞馬遜、微軟、蘋果、谷歌、英偉達、CrowdStrike和Palo Alto Networks等科技與網(wǎng)絡(luò)安全公司。


這12家公司覆蓋了云計算、瀏覽器、芯片、金融基礎(chǔ)設(shè)施、操作系統(tǒng)等各個領(lǐng)域的巨頭??梢哉f,全球數(shù)字基礎(chǔ)設(shè)施的核心參與者都在其中了。而這些參與者將作為防守方搶先一步用上頂級的AI模型,補上現(xiàn)有的系統(tǒng)漏洞。

一直以來,Anthropic都被認(rèn)為是最重視安全的AI的科技公司,不過與之伴隨的也有不少爭議,很多人認(rèn)為Anthropic只是說說漂亮話,真實目的是想通過提升AI安全標(biāo)準(zhǔn)來提升中小公司的入場門檻。

但就此次的玻璃翼計劃(Project Glasswing)而言,Anthropic的行動無疑是值得人們贊許的。在研發(fā)出了最強模型后,Anthropic沒有將它第一時間推向市場謀取最大曝光,而是先讓全球信息基礎(chǔ)設(shè)施來完善自己,為全球軟件安全筑起新一代屏障,也為為未來高風(fēng)險 AI 治理提供了可復(fù)制的藍(lán)圖。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4848866.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

共工之錨
2026-04-08 00:37:29
滅頂之災(zāi)!伊朗發(fā)起斬首,500美軍被導(dǎo)彈殲滅,特朗普徹底失聲

滅頂之災(zāi)!伊朗發(fā)起斬首,500美軍被導(dǎo)彈殲滅,特朗普徹底失聲

小蔑談事
2026-04-09 05:53:40
我今年55了,想用血淚教訓(xùn)告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這4件事

我今年55了,想用血淚教訓(xùn)告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這4件事

東林夕亭
2026-03-27 09:07:57
英超9隊歐戰(zhàn)創(chuàng)紀(jì)錄,意甲卻只剩18%話語權(quán),活成足球界大冤種

英超9隊歐戰(zhàn)創(chuàng)紀(jì)錄,意甲卻只剩18%話語權(quán),活成足球界大冤種

狗哥是一名內(nèi)拉
2026-04-08 12:55:23
中俄反對涉霍爾木茲海峽決議草案,草案未獲通過;伊朗代表:感謝中俄!

中俄反對涉霍爾木茲海峽決議草案,草案未獲通過;伊朗代表:感謝中俄!

大風(fēng)新聞
2026-04-08 11:03:05
為了伊朗,法國時隔37年首次投出反對票

為了伊朗,法國時隔37年首次投出反對票

遠(yuǎn)方青木
2026-04-07 23:59:18
斯諾克世錦賽最新戰(zhàn)報,兩大世界冠軍被業(yè)余選手淘汰,中國全勝

斯諾克世錦賽最新戰(zhàn)報,兩大世界冠軍被業(yè)余選手淘汰,中國全勝

籃球看比賽
2026-04-08 09:59:09
“這次穿得算保守了”,女老師短裙配蕾絲襪,學(xué)生上課頭都不敢抬

“這次穿得算保守了”,女老師短裙配蕾絲襪,學(xué)生上課頭都不敢抬

妍妍教育日記
2026-03-21 10:05:03
被認(rèn)定辱罵浙江外援!曝22歲重慶國腳遭追加處罰 至少禁2場+罰2萬

被認(rèn)定辱罵浙江外援!曝22歲重慶國腳遭追加處罰 至少禁2場+罰2萬

我愛英超
2026-04-08 15:23:11
廣東險勝青島,麥考爾43分創(chuàng)紀(jì)錄,五大事實值得承認(rèn)

廣東險勝青島,麥考爾43分創(chuàng)紀(jì)錄,五大事實值得承認(rèn)

鏗鏘格斗
2026-04-08 22:20:04
烏克蘭清除安全局前叛徒負(fù)責(zé)人利亞普金!連續(xù)擊中兩座俄軍機場

烏克蘭清除安全局前叛徒負(fù)責(zé)人利亞普金!連續(xù)擊中兩座俄軍機場

項鵬飛
2026-04-06 22:06:05
美股漲幅有所收窄,標(biāo)普500指數(shù)漲幅收窄至2%,此前一度上漲2.7%

美股漲幅有所收窄,標(biāo)普500指數(shù)漲幅收窄至2%,此前一度上漲2.7%

每日經(jīng)濟新聞
2026-04-08 23:08:03
榮耀官宣與張雪機車戰(zhàn)略合作!張雪發(fā)聲感謝

榮耀官宣與張雪機車戰(zhàn)略合作!張雪發(fā)聲感謝

小南看車
2026-04-08 21:20:38
一夜醒來,都軟了!

一夜醒來,都軟了!

梳子姐
2026-04-08 08:33:04
兄弟倆名震甲A,退役后靠餐飲發(fā)家,如今財富自由,哥哥身居要職

兄弟倆名震甲A,退役后靠餐飲發(fā)家,如今財富自由,哥哥身居要職

削桐作琴
2026-04-08 16:30:30
清明后,這5種水果盡量別買,不是迷信,老祖宗的經(jīng)驗要記牢

清明后,這5種水果盡量別買,不是迷信,老祖宗的經(jīng)驗要記牢

江江食研社
2026-04-08 18:30:11
當(dāng)代年輕人的“躺平副業(yè)”:游戲搬磚月入3000,比送外賣香在哪?

當(dāng)代年輕人的“躺平副業(yè)”:游戲搬磚月入3000,比送外賣香在哪?

游戲陀螺
2026-04-07 10:26:11
百萬粉網(wǎng)紅狗頭蘿莉推出7777元商務(wù)套餐, 已經(jīng)賣出777元老板套餐

百萬粉網(wǎng)紅狗頭蘿莉推出7777元商務(wù)套餐, 已經(jīng)賣出777元老板套餐

墜入二次元的海洋
2026-04-08 05:31:18
特朗普稱伊朗將不會進行鈾濃縮活動;美防長:伊朗絕不能擁有核武器;美軍高官稱停火只是暫時,美軍隨時準(zhǔn)備戰(zhàn)斗

特朗普稱伊朗將不會進行鈾濃縮活動;美防長:伊朗絕不能擁有核武器;美軍高官稱停火只是暫時,美軍隨時準(zhǔn)備戰(zhàn)斗

每日經(jīng)濟新聞
2026-04-08 23:22:43
歐冠1/4決賽首回合:大巴黎2-0利物浦,10人巴薩0-2不敵馬競

歐冠1/4決賽首回合:大巴黎2-0利物浦,10人巴薩0-2不敵馬競

全景體育V
2026-04-09 06:24:10
2026-04-09 07:31:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
26071文章數(shù) 687664關(guān)注度
往期回顧 全部

科技要聞

造出地表最強AI,卻死活不給你用!

頭條要聞

特朗普認(rèn)為北約未通過“考驗” 將考慮“退群”

頭條要聞

特朗普認(rèn)為北約未通過“考驗” 將考慮“退群”

體育要聞

40歲,但實力倒退12年

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

財經(jīng)要聞

天津海河乳業(yè)回應(yīng)直播間涉黃

汽車要聞

20萬級滿配華為全家桶 華境S是懂家庭的大六座

態(tài)度原創(chuàng)

健康
親子
房產(chǎn)
數(shù)碼
本地

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

親子要聞

胡圖圖說他差幾分就能兌換發(fā)卡

房產(chǎn)要聞

正式動工!珠城馬場地塊,簽約華爾道夫!

數(shù)碼要聞

最輕ThinkPad來了!ThinkPad X13 Gen 7發(fā)布

本地新聞

跟著歌聲游安徽,聽古村回響

無障礙瀏覽 進入關(guān)懷版