国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI 強到這一步了?發(fā)布上線,但不敢讓普通人用

0
分享至

我覺得,人類或許正在以一種超出常規(guī)認(rèn)知的速度在被 AI 追趕。

不知道你們的現(xiàn)狀是怎樣的,至少我現(xiàn)在已經(jīng)完全離不開 AI 了,我每天的工作中至少有 50% 是 AI 輔助完成的。

而且,這個比例還在持續(xù)提升。

與此同時,隨著一代又一代新模型的推出,不管是我的工作效率和質(zhì)量,還是我在 Token 上的每月消費,都在快速增長。

昨晚我看了個消息,Anthropic 發(fā)布了一個連他們自己都不敢公開給所有人使用的模型,因為真的太強了。

這個新模型的名字叫「Mythos」,翻譯成中文就是「神話」的意思。

目前是預(yù)覽版,所以官方叫它「Mythos Preview」。不過,這次是以一個叫「Project Glasswing」的項目形式推出的。

關(guān)于這個項目,我后面會講。


上個月,Anthropic 一份內(nèi)部文檔意外泄露,里面提到有一個比 Opus 更大、更強的模型正在開發(fā),代號就是 Mythos。

隨后,Anthropic 把這次泄露歸因于「人為錯誤」,也沒有進一步說明理由。

現(xiàn)在,這個代號是 Mythos 的模型算是正式官宣了。

官宣歸官宣,但它并沒有公開發(fā)布上線。也就是說,普通用戶還不能使用。

原因很直接,Anthropic 覺得這個模型太強了,在安全機制到位之前不適合向所有人開放。

我覺得,這句話值得停下來想一秒。

通常,一家 AI 公司發(fā)布新模型巴不得第一時間上線搶占市場,但這次 Anthropic 的做法明顯有點反常。

在我看來,不是他們不想發(fā),而是不敢發(fā)。

因為,這個叫 Mythos 的模型的確很強大。

先看幾個官方公布的測試數(shù)據(jù)。

在編碼能力上,Mythos 和目前公開最強的 Claude Opus 4.6 之間的差距不小,在各項基準(zhǔn)測試中,Mythos 基本是完勝 Opus 4.6。


推理能力上,在 GPQA Diamond(研究生水平科學(xué)問答)測試中,結(jié)果是 94.6% vs 91.3%,Mythos 勝。

在 Humanity's Last Exam 有工具和無工具測試中,也都是 Mythos 完勝。


跟 Agent 有關(guān)的計算機操作能力上,OSWorld-Verified(自主完成電腦任務(wù)),Mythos 以 79.6% 超過 Oputs 4.6 的 72.7%。

每一個維度上,Mythos 都強于 Opus 4.6,有些甚至是碾壓式超過。


在一些任務(wù)表現(xiàn)上,差距已經(jīng)不是小步迭代,而是大幅躍升。比如 SWE-bench Multimodal 從 27.1% 跳到 59%,幾乎翻了一倍。

讓他們不敢上線 Mythos 的一個最核心原因,就是它突破軟件世界的安全防線能力太強了。

說白了,全世界所有的系統(tǒng)和軟件都有漏洞,而 Mythos 可以用超過人類的水平發(fā)現(xiàn)并攻擊這些漏洞。

假設(shè),這種能力被黑客掌握,那全世界的操作系統(tǒng)和軟件都會遭殃,尤其是一些公共基礎(chǔ)設(shè)施和國家安全。

Anthropic 在公告里有這么一句話,看完后我覺得細思極恐。


翻譯過來就是:「 AI 模型的編碼能力已經(jīng)達到了極高水平,在發(fā)現(xiàn)和利用軟件漏洞方面,它們幾乎可以超越除最熟練的人類之外的所有人」。

關(guān)于這句話,我想多展開一下。

我是程序員出身,所以我知道軟件的構(gòu)建方式是怎樣的,以及不同人寫出來的代碼差異有多大。

還有,沒有哪個軟件敢說自己沒有漏斗,即便這個漏洞從來沒被發(fā)現(xiàn)過。

以前的漏洞之所以能幾十年安靜地躺在系統(tǒng)里,并不是因為系統(tǒng)足夠安全。

而是因為找漏洞這件事,需要極高的專業(yè)能力,極大的耐心和精力,以及大量的時間。

會的人太少,敢投入的人就更少了。

這種「能力稀缺」,構(gòu)成了整個軟件安全世界的隱性前提。AI 介入之后,這個前提就開始松動了。

AI 能以超過大多數(shù)非頂尖人類能力的方式開展工作,我們可以用它來攻擊漏洞,當(dāng)然也可以用它來堵住漏洞。

為了解決這個問題,接下來我說下 Anthropic 搞的這個 Project Glasswing 是什么。

簡單說,這是一個利用 Mythos 的能力幫全世界基礎(chǔ)設(shè)施系統(tǒng)找 bug 的項目。

參與方包括 AWS、蘋果、微軟、谷歌、英偉達、思科、Linux 基金會等共計 12 家機構(gòu)。


這個陣容覆蓋了云計算、操作系統(tǒng)、芯片、瀏覽器、金融基礎(chǔ)設(shè)施、網(wǎng)絡(luò)安全和開源生態(tài)。

換句話說,全球數(shù)字基礎(chǔ)設(shè)施的核心參與者幾乎都在這個項目里了。

這個項目的核心邏輯只有一條,讓防守方先用上這個頂級 AI 模型的能力。

因為如果攻擊方先拿到同等級的工具,窗口一旦打開就很難關(guān)上。Anthropic 承諾提供 1 億美元的模型使用額度,覆蓋研究預(yù)覽期。

除了 12 家核心機構(gòu),還有超過 40 個維護關(guān)鍵軟件基礎(chǔ)設(shè)施的組織獲得了訪問權(quán)限,可以用 Mythos 掃描自家系統(tǒng)和開源項目。

同時,Anthropic 向 Linux 基金會捐了 250 萬美元,向 Apache 軟件基金會捐了 150 萬美元,這二者都是軟件世界的基礎(chǔ)設(shè)施。

這么說吧,我們現(xiàn)在使用的各種 App、網(wǎng)站、系統(tǒng),基本上都是以他們?yōu)榈讓蛹軜?gòu)的。

在我看來,Anthropic 這次算是干了件好事,不僅推出了更強的模型,還花錢給全球信息基礎(chǔ)設(shè)施讓他們來完善自己。

畢竟,如果裸上的話,對誰都沒有好處。

可能說到這你還是感覺不到 Mythos 到底有多強,我從官方原文里看到了三個具體案例,我覺得比數(shù)字更能說明問題。


第一個,OpenBSD。

這是公認(rèn)安全性極高的操作系統(tǒng),很多關(guān)鍵基礎(chǔ)設(shè)施會跑在上面,包括我們用的蘋果手機 iOS 系統(tǒng)、Android 系統(tǒng)、甚至一些企業(yè)和機構(gòu)內(nèi)部系統(tǒng)。

Mythos 在里面發(fā)現(xiàn)了一個存在了 27 年的漏洞,攻擊者只要連上目標(biāo)機器,就能讓它遠程崩潰。

27 年!不是沒人在意,是壓根沒人找到。

第二個,F(xiàn)Fmpeg。

幾乎所有需要處理視頻的軟件都依賴它,你們用的各種視頻播放軟件基本上都有它的身影。

有個漏洞躲在一行寫于 16 年前的代碼里,自動化測試工具反復(fù)攻擊了整整 500 萬次,每次都沒找到。

但是,Mythos 找到了。

第三個,Linux 內(nèi)核。

這個就不用多說了,基本上可以說是整個互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施,也最值得警惕。

Mythos 不只是發(fā)現(xiàn)了幾個獨立漏洞,而是把多個漏洞串聯(lián)成一條攻擊鏈。

從普通用戶權(quán)限開始,一路提權(quán),最終實現(xiàn)對整臺機器的完全控制。

關(guān)于 Linux 這個,和前兩個案例的性質(zhì)完全不一樣。

找漏洞,是分析能力。

但串漏洞,就是策略能力了。

就像很多產(chǎn)品經(jīng)理,會畫原型圖會寫文檔會做數(shù)據(jù)分析,這些是單點能力。但把業(yè)務(wù)、產(chǎn)品、商業(yè)串起來,就是策略能力了。

一個能規(guī)劃攻擊路徑的模型,已經(jīng)不只是審計工具了,它更接近于一個可以在數(shù)字環(huán)境里主動行動的智能體。

以上三個案例,Anthropic 采取的都是先發(fā)現(xiàn)、先報告、先修復(fù)、再披露的方式,目前均已修復(fù)。

看到這,你就知道 Mythos 有多強了,就像一頭暫時不敢被放出籠的猛獸,現(xiàn)實世界需要先做好適應(yīng)它的準(zhǔn)備。

我想在這里說幾個觀察,或許也是接下來真正變化的開始。

第一,軟件世界的安全假設(shè)正在失效。

今天我們習(xí)以為常的軟件穩(wěn)定性,并不完全來自系統(tǒng)設(shè)計足夠好。很大程度上,它依賴的是攻擊能力的稀缺。

說得直白點,不是軟件足夠強,而是人不夠強。

找漏洞需要成本,構(gòu)造利用鏈需要時間,大規(guī)模掃描需要資源。所以很多技術(shù)債、陳年 bug、老舊系統(tǒng)就那樣活著,從沒被認(rèn)真清理過。

就像我們做產(chǎn)品一樣,我們覺得邏輯閉環(huán)了,沒問題了,并不代表真的萬事無憂了,很可能是我們的能力上限到了。

Mythos 展現(xiàn)的能力,是漏洞從被發(fā)現(xiàn)到被利用的時間窗口從過去的幾個月被壓縮到了幾分鐘。

幾分鐘意味著什么?

意味著補丁的節(jié)奏,修復(fù)的流程,已經(jīng)開始跟不上攻擊的速度了。

第二,開源世界會最先感受到壓力。

今天大多數(shù)現(xiàn)代軟件,底下都壓著大量開源依賴。平時看不見,一旦被打穿,就是全行業(yè)同時受影響。

可能有讀者不是很了解這個邏輯,用大白話說,就是我們現(xiàn)在使用的所有軟件都有開源項目作為底層,而這些項目的源代碼是對所有人可見的。

以后當(dāng)模型能持續(xù)地、大規(guī)模地掃描開源項目,開源社區(qū)維護者們面對的壓力級別會完全不一樣。

這也是為什么 Anthropic 要給 Linux 基金會和 Apache 基金會捐錢的原因。

不是做公益,而是承認(rèn)開源基礎(chǔ)設(shè)施是 AI 時代整個數(shù)字世界最脆弱、也最不能倒的那層地基,他們不想被當(dāng)做壞人和惡人而已。

第三,人會被弱化,AI 開始和 AI 博弈。

以前互聯(lián)網(wǎng)產(chǎn)品安全團隊的價值,在于人的判斷力、經(jīng)驗積累和對系統(tǒng)的深度理解。

未來,這件事會換個邏輯。

比的是誰的模型更強,誰的工具接得更快,誰能把 AI 審計嵌進開發(fā)流程的最前端。

這不是程序員被替代的問題,而是安全行業(yè)本身的生產(chǎn)方式會重組。

好的那面,是數(shù)千個高危漏洞可以在幾周內(nèi)被找出來。麻煩的是,攻擊方遲早也會有同等級的工具。

到那個時候,軟件產(chǎn)品的安全不再是人和人的對抗,而是模型和模型之間的攻防博弈。

這次,Anthropic 不只發(fā)布了能力,還發(fā)布了風(fēng)險??赡苁悄壳斑@個階段,整個行業(yè)最需要看到的那種誠實。

所有人都在談 AI 如何改變工作效率,這沒毛病。

但 Mythos 也在提醒我們,AI 能力的躍最終會從內(nèi)容世界傳導(dǎo)到軟件世界,再傳導(dǎo)到整個數(shù)字世界的基礎(chǔ)設(shè)施。

內(nèi)容世界被改寫,影響的是流量邏輯。

軟件世界被改寫,動的是地基。

此時,我想起了電影《2012》里的一句臺詞,也作為這篇文章的結(jié)尾吧。

「無論你是誰,不分種族,不分國家,明天我們都沒有區(qū)別!」

PS:我很少寫這種長文,看到這你至少已經(jīng)花了10分鐘,說明你是擁抱變化喜歡思考的人。那么,就來個點贊、在看、轉(zhuǎn)發(fā),讓更多人加入對明天的期待中。

················· 唐韌出品 ·················

安可時刻

昨天看完 Mythos 的官方介紹后,我起身走到窗邊發(fā)了一會兒呆。

沒想什么,只是有點恍惚,而我的幾個 AI 員工還在電腦上幫我干活,有的在分析數(shù)據(jù)、有的在搭建文章框架、有的在寫項目文檔。

昨天我還新招了個 AI 員工,取名唐小藝,以后我所有的封面圖、海報、甚至我的日常攝影需求都交給他了。


以下,就是他給我「拍」的一張照片,還原了上面我描述的場景。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
關(guān)于文章被處理的通知

關(guān)于文章被處理的通知

言立方
2026-04-15 18:22:17
0-2日本引發(fā)連鎖反應(yīng)!比輸球可怕的是,中國女足二十年逢日不勝

0-2日本引發(fā)連鎖反應(yīng)!比輸球可怕的是,中國女足二十年逢日不勝

大秦壁虎白話體育
2026-04-15 23:33:30
美國真正的幕后老板現(xiàn)身了,特朗普瑟瑟發(fā)抖

美國真正的幕后老板現(xiàn)身了,特朗普瑟瑟發(fā)抖

一個壞土豆
2026-04-15 19:35:37
港媒:香港“資深反派”演員江圖離世,享年89歲

港媒:香港“資深反派”演員江圖離世,享年89歲

界面新聞
2026-04-15 14:23:59
伊朗總統(tǒng)質(zhì)問美國和以色列:為什么攻擊伊朗,襲擊平民和兒童,破壞學(xué)校和醫(yī)院?其稱沒有任何力量能迫使伊朗人民屈服

伊朗總統(tǒng)質(zhì)問美國和以色列:為什么攻擊伊朗,襲擊平民和兒童,破壞學(xué)校和醫(yī)院?其稱沒有任何力量能迫使伊朗人民屈服

極目新聞
2026-04-15 17:45:12
公開認(rèn)罪后,人民日報對許家印稱呼變了,11字之差釋放信號不一般

公開認(rèn)罪后,人民日報對許家印稱呼變了,11字之差釋放信號不一般

小陸搞笑日常
2026-04-15 19:37:13
維尼修斯5個歐冠賽季參與進球上雙,成為皇馬繼C羅之后第二人

維尼修斯5個歐冠賽季參與進球上雙,成為皇馬繼C羅之后第二人

懂球帝
2026-04-16 04:23:15
東北人搬去海南,大腦會悄悄發(fā)生什么變化?

東北人搬去海南,大腦會悄悄發(fā)生什么變化?

果殼
2026-04-15 16:09:29
總部被賣,集團徹底垮了

總部被賣,集團徹底垮了

新浪財經(jīng)
2026-04-15 12:40:29
公務(wù)員巨額財產(chǎn)來源不明罪,只要低于300萬或不再需被追究責(zé)任

公務(wù)員巨額財產(chǎn)來源不明罪,只要低于300萬或不再需被追究責(zé)任

小蘿卜絲
2026-04-15 18:38:38
誰能想到,蘇林上任首訪中國,竟是自家人都擺不平的大麻煩

誰能想到,蘇林上任首訪中國,竟是自家人都擺不平的大麻煩

動物奇奇怪怪
2026-04-15 13:19:42
從大陸回來,李鴻源感慨:我們連人家的車尾燈都看不見!

從大陸回來,李鴻源感慨:我們連人家的車尾燈都看不見!

有態(tài)度的何總
2026-04-15 12:18:14
0-2!中國女足出局,亞洲杯決賽對陣出爐:日本女足對決朝鮮女足

0-2!中國女足出局,亞洲杯決賽對陣出爐:日本女足對決朝鮮女足

足球狗說
2026-04-15 22:54:41
今夜,太瘋狂!暴漲,熔斷!

今夜,太瘋狂!暴漲,熔斷!

中國基金報
2026-04-16 00:15:20
DeepSeek聘人去內(nèi)蒙古草原“守機房”,月薪最高3萬元

DeepSeek聘人去內(nèi)蒙古草原“守機房”,月薪最高3萬元

魯中晨報
2026-04-15 15:52:05
上萬美軍封鎖下,多艘貨船成功通過霍爾木茲海峽,美軍稱已完全切斷伊朗海上進出口貿(mào)易;美國為何在此時打出“封鎖牌”?伊朗如何反擊?

上萬美軍封鎖下,多艘貨船成功通過霍爾木茲海峽,美軍稱已完全切斷伊朗海上進出口貿(mào)易;美國為何在此時打出“封鎖牌”?伊朗如何反擊?

每日經(jīng)濟新聞
2026-04-15 10:59:49
楊某媛稱已找到工作,結(jié)果立馬被網(wǎng)友舉報了……

楊某媛稱已找到工作,結(jié)果立馬被網(wǎng)友舉報了……

麥杰遜
2026-04-15 11:53:46
隨著日本2-0完勝,女足亞洲杯決賽2席全誕生,中國女足無緣爭冠

隨著日本2-0完勝,女足亞洲杯決賽2席全誕生,中國女足無緣爭冠

側(cè)身凌空斬
2026-04-15 22:55:40
街上沒人,商場沒人,工廠沒人,就連農(nóng)村也沒人?人都上哪去了

街上沒人,商場沒人,工廠沒人,就連農(nóng)村也沒人?人都上哪去了

番外行
2026-04-15 10:23:23
王博被驅(qū)逐!三大核心缺席廣廈惜敗山西 布朗空砍41分

王博被驅(qū)逐!三大核心缺席廣廈惜敗山西 布朗空砍41分

醉臥浮生
2026-04-15 21:51:38
2026-04-16 04:40:49
唐韌 incentive-icons
唐韌
用產(chǎn)品思維解決難題
1452文章數(shù) 2026關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

法國全票通過 “將不義之財歸還中國”

頭條要聞

法國全票通過 “將不義之財歸還中國”

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

教育
房產(chǎn)
游戲
本地
公開課

教育要聞

黃岡小升初招生題,求面積,方法思路太絕了

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學(xué)用地!寶龍城這把穩(wěn)了?

《GTA6》搶劫玩法泄露引熱議!NPC與警察全面升級

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版