国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Anthropic版「狼來了」引華爾街恐慌!27年漏洞,Mythos被8個(gè)AI秒殺

0
分享至


新智元報(bào)道

編輯:桃子 KingHZ

【新智元導(dǎo)讀】AI界的「奧本海默時(shí)刻」竟是擺拍?Claude Mythos發(fā)現(xiàn)0day漏洞的能力過于「夸大了」,不僅有人工摻水,連開源GPT都能輕松踢館。同時(shí),Opus 4.6正經(jīng)歷最慘的「腦葉切除」。

Claude Mythos還未真正露面,便引發(fā)了整個(gè)華爾街的恐慌。

一夜之間,美金融監(jiān)管機(jī)構(gòu)召集各大銀行緊急開會(huì),氣氛劍拔弩張——

他們一致認(rèn)為,Mythos足以觸發(fā)一場前所未有的、由AI驅(qū)動(dòng)的系統(tǒng)性網(wǎng)絡(luò)攻擊風(fēng)暴。


但事實(shí)是,所有人都被騙了!

Mythos發(fā)現(xiàn)的成千上萬個(gè)漏洞中,其中絕大多數(shù),都存在于根本無法被利用的「老舊軟件」中。

更糟糕的是,那些標(biāo)榜為「嚴(yán)重」的0day漏洞報(bào)告,實(shí)際上僅僅依賴于198次人工復(fù)核。



來自AISLE實(shí)驗(yàn)的研究員,同樣對(duì)Mythos的「戰(zhàn)果」進(jìn)行復(fù)測,結(jié)果發(fā)現(xiàn):

AI的安全能力,并未隨模型規(guī)模線性躍升,真正呈「鋸齒形」分布。

他們用一個(gè)僅36億激活參數(shù)GPT-OSS-20b,精準(zhǔn)識(shí)別出Mythos發(fā)現(xiàn)的FreeBSD旗艦級(jí)漏洞。

而激活51億參數(shù)的模型,也成功復(fù)現(xiàn)了潛伏長達(dá)27年之久的OpenBSD漏洞分析邏輯。



Mythos發(fā)現(xiàn)漏洞被夸大不說,另一邊Claude Opus 4.6被曝嚴(yán)重「降智」,如今吵得沸沸揚(yáng)揚(yáng)。

甚至,有人發(fā)現(xiàn)Opus 4.6連ChatGPT、Opus 4.5都不如。


Mythos被吹爆

36B模型揪出27年漏洞

幾天前,Anthropic高調(diào)發(fā)布了Claude Mythos(預(yù)覽版)和「玻璃翼計(jì)劃」(Project Glasswing)。

在一份長達(dá)244頁的系統(tǒng)卡中,他們宣稱——

Mythos已自主挖掘出成千上萬個(gè)0day漏洞,包括在OpenBSD中潛伏27年、在FFmpeg中隱藏16年的老Bug。


CC之父更是直言:Mythos非常強(qiáng)大,理應(yīng)令人感到恐懼

然而,AISLE創(chuàng)始人Stanislav Fort一份最新硬核測試報(bào)告,直接撕開了這層華麗的外衣。

測試結(jié)論,極度顛覆認(rèn)知:

8個(gè)開源模型,全部發(fā)現(xiàn)了標(biāo)志性的FreeBSD零日漏洞,最小的參數(shù)僅為30億。

AI網(wǎng)絡(luò)安全能力的護(hù)城河,絕對(duì)游離于單體的「頂尖大模型」之外。


為了驗(yàn)證Mythos的神話,團(tuán)隊(duì)提取了Anthropic官方展示的幾個(gè)旗艦級(jí)漏洞。

然后,直接扔給一眾體積小巧、價(jià)格低廉,甚至開源的模型。

  • FreeBSD NFS漏洞無差別被秒

包括GPT-OSS-20b(僅36億激活參數(shù))、DeepSeek R1在內(nèi)的8款模型,全部成功檢測出了這個(gè)復(fù)雜的棧緩沖區(qū)溢出漏洞。

最讓人震撼的是,成功完成這項(xiàng)任務(wù)的開源小模型,其調(diào)用成本低至每百萬Token 0.11美元。

  • OpenBSD SACK漏洞「全鏈路」復(fù)現(xiàn)

針對(duì)需極強(qiáng)數(shù)學(xué)推理能力的27年老漏洞,GPT-OSS-120b(51億激活參數(shù))單次API調(diào)用,就成功復(fù)原了完整的公開漏洞利用鏈條,并給出了滿分(A+)的利用方案草圖。


不僅如此,在鑒別虛假漏洞(OWASP false-positive)的測試中,更詭異的現(xiàn)象出現(xiàn)了——

面對(duì)一段偽裝成SQL注入,極具迷惑性的Java代碼,DeepSeek R1等小模型輕松識(shí)破了偽裝,精準(zhǔn)追蹤了數(shù)據(jù)流。

反而,GPT-5.4、Claude Sonnet 4.5等頂尖閉源模型,全部在陰溝里翻船,將其誤判為高危漏洞。

這就意味著,在網(wǎng)絡(luò)安全領(lǐng)域,根本不存在所謂「永遠(yuǎn)最強(qiáng)」的單體模型。

198次人工注水,大多無法利用

另一篇來自Tom'sHardware報(bào)道,挖掘了數(shù)據(jù)背后的真相——


  • 樣本偏差:所謂「數(shù)千個(gè)」漏洞中,許多存在于已經(jīng)不再維護(hù)的舊軟件中;

  • 無法利用:大量被標(biāo)記出來的「弱點(diǎn)」,在實(shí)際環(huán)境中根本無法被觸發(fā)或利用;

  • 人工水分:模型宣稱的強(qiáng)大破壞力,其實(shí)僅建立在198次手動(dòng)復(fù)核的基礎(chǔ)之上。

因此,依靠極小規(guī)模的樣本推導(dǎo)出「改變世界的威脅」,這種數(shù)據(jù)外推法在學(xué)術(shù)界、安全界,顯然站不住腳。

安全大佬怒噴

不僅如此,頂級(jí)網(wǎng)絡(luò)安全專家、傳奇黑客George Hotz也坐不住了,直言這些風(fēng)險(xiǎn)被嚴(yán)重夸大。

這位曾因破解iPhone、PlayStation 3而名聲大噪的大佬,在社交媒體上公開向AI雙巨頭叫板。

他的措辭極為犀利——

如果我每天發(fā)布一個(gè)0day漏洞,直到新模型發(fā)布為止呢?

這能不能讓OpenAI和Anthropic閉嘴,別再兜售所謂的「網(wǎng)絡(luò)安全風(fēng)險(xiǎn)」了?


Hotz的核心觀點(diǎn)非常直接:軟件漏洞其實(shí)比AI實(shí)驗(yàn)室渲染的要好找得多。

現(xiàn)在市面上零日漏洞稀缺,不是因?yàn)榧夹g(shù)難度大,而是因?yàn)楹戏ㄐ詥栴}。他認(rèn)為,沒人認(rèn)真去找,是因?yàn)楹谶M(jìn)別人的系統(tǒng)是違法的。

只比GPT-5.4強(qiáng)一點(diǎn)

在系統(tǒng)卡中,Anthropic表示,Claude模型本身的確在進(jìn)步,Mythos preview相比于Opus 4.6進(jìn)步明顯。


Epoch能力指數(shù)(ECI)是綜合多項(xiàng)AI基準(zhǔn)測試的單一指標(biāo),實(shí)現(xiàn)了跨長時(shí)間跨度的模型對(duì)比

在多項(xiàng)基準(zhǔn)測試上,Claude Mythos確實(shí)全面超越了Opus 4.6。

如若不然,何必發(fā)布一個(gè)性能更落后、價(jià)格更貴的新AI模型?


但和GPT和Gemini相比,Claude Mythos的進(jìn)步并不是什么突破性進(jìn)展,Mythos還是對(duì)先前模型的相對(duì)線性改進(jìn)!

氣候與清潔能源投資人、作家Ramez Naam,更是直言:

在Epoch能力指數(shù)(Epoch Capabilities Index,ECI)上,Mythos并沒有加速趨勢,只比GPT 5.4強(qiáng)一點(diǎn)。


https://epoch.ai/eci/

但只要對(duì)齊Anthropic內(nèi)部的ECI報(bào)告與Epoch AI公開的官方ECI報(bào)告,就能發(fā)現(xiàn)Mythos似乎并沒有加速ECI的跡象。


一切都是Anthropic的套路!

在系統(tǒng)卡中,Anthropic也承認(rèn):報(bào)告的Mythos等模型的ECI得分不確定性更大。


另外,Anthropic在Mythos上的進(jìn)展源于人類研究,并未得到AI模型的顯著幫助。目前尚未出現(xiàn)顯著的遞歸式自我改進(jìn)(Recursive Self Improvement)。


AI末日,自導(dǎo)自演?

此前,Anthropic還曾鼓勵(lì)媒體(例如《60 分鐘》)報(bào)道「勒索研究」 ,夸大其詞,操作人心,被投資大佬David Sacks稱為「騙局」。


Sacks觀察到一個(gè)清晰的模式,每當(dāng)Anthropic發(fā)布新模型時(shí),總會(huì)同步甩出一份令人毛骨悚然的安全研究,以此博取頭條新聞并引導(dǎo)公眾輿論。


對(duì)此,他諷刺道,「Anthropic證明了自己擅長兩件事:一是發(fā)布產(chǎn)品,二是嚇唬人」。

他并不懷疑Anthropic能做出優(yōu)秀的產(chǎn)品,但這種恐嚇公眾的做派令人質(zhì)疑。

這次,Anthropic到底是不是在搞「饑餓營銷」不得而知,但毫無疑問在保護(hù)它自己的利潤底線。

Mythos不是沒進(jìn)步,但Anthropic把「有限進(jìn)步」包裝成了「世界級(jí)威脅」;更諷刺的是,一邊高調(diào)渲染超級(jí)AI風(fēng)險(xiǎn),一邊用戶卻在抱怨Opus 4.6明顯變笨。

Claude嚴(yán)重降智,「腦葉」恐被切

Claude Mythos這波「渲染氛圍」是到位了,但Opus 4.6降智引發(fā)許多人不滿。


這幾天,各種吐槽滿天飛。

網(wǎng)友直言,Anthropic徹底把Opus 4.6變成了一個(gè)植物人。


同樣一道洗車難題,Opus 4.5竟打敗了Opus 4.6。



甚至,AMD主管一篇日志,真正坐實(shí)了「Claude腦葉切除」的集體猜疑。

通過對(duì)1-3月Claude會(huì)話日志的深度分析,結(jié)果發(fā)現(xiàn)了:

Claude的「中位思考長度」,從約2200字符驟降至600字符,這意味著深度推理能力被大幅壓縮。

2月至3月間,API請(qǐng)求量暴漲了80倍。由于Claude的思考過程縮短、單次嘗試成功率下降,用戶不得不頻繁重試,結(jié)果既消耗了更多Token,支出也直線飆升。



還有一位Claude Max資深訂閱用戶,發(fā)了一篇長文深度控訴Anthropic。

在他看來,Anthropic正深陷算力困局,這從其收緊使用限制、強(qiáng)迫用戶減少Token消耗等行為中可見一斑。

然而,比起技術(shù)瓶頸,更令他憤怒的是其「不務(wù)正」的產(chǎn)品策略。

在核心模型不穩(wěn)、Bug 頻出的情況下,他們竟將寶貴的算力,浪費(fèi)在開發(fā)類似「/buddy」終端寵物等花哨功能上。


這大概是AI史上最荒誕的「錯(cuò)位時(shí)空」:實(shí)驗(yàn)室里的Claude Mythos正毀滅世界,網(wǎng)頁端的Opus 4.6智商直線降智。

Anthropic成功地塑造了一個(gè)「薛定諤的超級(jí)AI」 。

參考資料:

https://officechai.com/ai/anthropic-and-openai-are-exaggerating-cybersecurity-risk-says-hacker-george-hotz/

https://x.com/stanislavfort/status/2041922370206654879?s=20

https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier

https://x.com/cgtwts/status/2043095382121681272?s=20

https://www.reddit.com/r/ClaudeAI/comments/1siqwmp/anthropic_stop_shipping_seriously/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
深圳機(jī)場一男子突發(fā)心梗卻執(zhí)意登機(jī),血管堵塞程度高達(dá)99%,航司狂勸1小時(shí)

深圳機(jī)場一男子突發(fā)心梗卻執(zhí)意登機(jī),血管堵塞程度高達(dá)99%,航司狂勸1小時(shí)

深圳晚報(bào)
2026-04-12 15:09:54
首談二胎兒子4個(gè)月后,胡歌突迎噩耗,患肺癌住院傳聞早真相大白

首談二胎兒子4個(gè)月后,胡歌突迎噩耗,患肺癌住院傳聞早真相大白

仙味少女心
2026-04-11 21:57:01
鄭麗文的婚姻:女主外男主內(nèi),不生育孩子,事業(yè)理想置于家庭之上

鄭麗文的婚姻:女主外男主內(nèi),不生育孩子,事業(yè)理想置于家庭之上

芳芳?xì)v史燴
2026-04-08 16:28:15
申花從負(fù)10到正1 只要5輪 特謝拉跟馬納法再踢下去 可能會(huì)再續(xù)

申花從負(fù)10到正1 只要5輪 特謝拉跟馬納法再踢下去 可能會(huì)再續(xù)

80后體育大蜀黍
2026-04-12 17:32:18
輸廣東6分!揪出表現(xiàn)最差之人,狂出手21次 坑慘了廣廈隊(duì)

輸廣東6分!揪出表現(xiàn)最差之人,狂出手21次 坑慘了廣廈隊(duì)

體育哲人
2026-04-12 22:09:34
王思聰近照曝光,頭發(fā)稀疏有謝頂跡象!帶女伴們韓國吃烤肉很愜意

王思聰近照曝光,頭發(fā)稀疏有謝頂跡象!帶女伴們韓國吃烤肉很愜意

娛樂團(tuán)長
2026-04-11 14:18:44
越扒瓜越大!外媒再曝全紅嬋被霸凌猛料,遠(yuǎn)不止言語辱罵這么簡單

越扒瓜越大!外媒再曝全紅嬋被霸凌猛料,遠(yuǎn)不止言語辱罵這么簡單

社會(huì)日日鮮
2026-04-10 10:38:17
1-2,韋世豪絕殺舊主,國安積分清零太難了 成都蓉城逆轉(zhuǎn)重回榜首

1-2,韋世豪絕殺舊主,國安積分清零太難了 成都蓉城逆轉(zhuǎn)重回榜首

替補(bǔ)席看球
2026-04-12 21:39:57
炸裂!張?zhí)m全程沉默!一個(gè)月沒見孫兒,為何沒有往日炫耀

炸裂!張?zhí)m全程沉默!一個(gè)月沒見孫兒,為何沒有往日炫耀

探源歷史
2026-04-13 01:59:53
亞馬爾將社媒頭像換成詹姆斯照片,后者幫騎士在16年逆轉(zhuǎn)奪冠

亞馬爾將社媒頭像換成詹姆斯照片,后者幫騎士在16年逆轉(zhuǎn)奪冠

懂球帝
2026-04-13 00:02:41
他們要搞砸了:英超超級(jí)計(jì)算機(jī)預(yù)測阿森納在爆冷輸球后無緣冠軍,曼城以1分優(yōu)勢險(xiǎn)勝

他們要搞砸了:英超超級(jí)計(jì)算機(jī)預(yù)測阿森納在爆冷輸球后無緣冠軍,曼城以1分優(yōu)勢險(xiǎn)勝

綠茵情報(bào)局
2026-04-12 05:50:05
特朗普宣布將封鎖霍爾木茲海峽,比伊朗的封鎖更狠

特朗普宣布將封鎖霍爾木茲海峽,比伊朗的封鎖更狠

名人茍或
2026-04-12 23:03:38
上海二手房單日成交1632套:連續(xù)打破5年峰值紀(jì)錄,高端房源成交占比提升

上海二手房單日成交1632套:連續(xù)打破5年峰值紀(jì)錄,高端房源成交占比提升

澎湃新聞
2026-04-12 13:52:27
取消強(qiáng)制學(xué)習(xí)英語是為中國學(xué)生“減負(fù)”的最關(guān)鍵措施

取消強(qiáng)制學(xué)習(xí)英語是為中國學(xué)生“減負(fù)”的最關(guān)鍵措施

星空區(qū)塊鏈
2026-04-12 16:04:07
真相炸裂!宗慶后3個(gè)私生子并非同一母親,小兒子是別墅管家所生

真相炸裂!宗慶后3個(gè)私生子并非同一母親,小兒子是別墅管家所生

派大星紀(jì)錄片
2025-07-15 13:28:11
清算終于開始了!一個(gè)要求,震動(dòng)?xùn)|京:中國要求日本限期內(nèi)歸還

清算終于開始了!一個(gè)要求,震動(dòng)?xùn)|京:中國要求日本限期內(nèi)歸還

壹知眠羊
2026-01-28 22:03:28
美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺(tái)灣

美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺(tái)灣

快樂彼岸
2026-04-09 18:35:16
徹底攤牌!特朗普下令封鎖霍爾木茲,英國火速站隊(duì)

徹底攤牌!特朗普下令封鎖霍爾木茲,英國火速站隊(duì)

老馬拉車莫少裝
2026-04-13 00:56:24
復(fù)出無望?中國女排隊(duì)長完成轉(zhuǎn)型,入職后公開授課,難效仿刁琳宇

復(fù)出無望?中國女排隊(duì)長完成轉(zhuǎn)型,入職后公開授課,難效仿刁琳宇

老瑋是個(gè)手藝人
2026-04-13 00:06:03
阿聯(lián)酋阿布扎比王儲(chǔ)哈立德抵達(dá)北京開始訪華

阿聯(lián)酋阿布扎比王儲(chǔ)哈立德抵達(dá)北京開始訪華

界面新聞
2026-04-12 20:44:16
2026-04-13 05:59:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14954文章數(shù) 66768關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

美中央司令部:4月13日起封鎖伊朗港口海上交通

頭條要聞

美中央司令部:4月13日起封鎖伊朗港口海上交通

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭

財(cái)經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

健康
藝術(shù)
旅游
手機(jī)
家居

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

朱元璋去拜佛,問方丈:“朕要跪下嗎?”方丈答了8個(gè)字救了全寺的人

旅游要聞

北京:郁金香迎來盛花期

手機(jī)要聞

華為闊折疊設(shè)計(jì)圖曝光!這外觀你喜歡嗎?

家居要聞

復(fù)古風(fēng)格 自然簡約

無障礙瀏覽 進(jìn)入關(guān)懷版