国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

當(dāng)Anthropic的安全人設(shè)崩塌:一場(chǎng)被泄露戳穿的生存游戲

0
分享至


本文來(lái)自微信公眾號(hào):青萍見,作者:舒書,頭圖來(lái)自:AI生成

過(guò)去兩天,AI圈最魔幻的一幕出現(xiàn)了:以安全潔癖著稱的Anthropic,因?yàn)橐粋€(gè)連實(shí)習(xí)生都不該犯的CMS配置失誤,讓3000份內(nèi)部文件在互聯(lián)網(wǎng)上裸奔。

網(wǎng)絡(luò)安全股應(yīng)聲暴跌,安全研究員們一邊吃瓜一邊炸鍋——誰(shuí)能想到,這家天天喊著“AI安全高于一切”的公司,自己的安全防線竟比紙糊的還脆?

但比這場(chǎng)低級(jí)泄露更諷刺的是,就在事發(fā)前一個(gè)月,Anthropic剛剛悄悄撕掉了自己最引以為傲的安全承諾。

新版《負(fù)責(zé)任擴(kuò)展政策》(RSP 3.0)里,那個(gè)曾讓OpenAI都顯得不道德的“若風(fēng)險(xiǎn)不可控,就暫停訓(xùn)練”的硬條款,被悄無(wú)聲息地刪除了。

這不是技術(shù)調(diào)整,這是一場(chǎng)精心包裝的人設(shè)崩塌。

一、從硬剎車到軟著陸:安全承諾的彈性變形記

2023年,當(dāng)Anthropic推出RSP時(shí),整個(gè)行業(yè)都在鼓掌。

這是第一次,有AI公司敢公開說(shuō):“如果模型太危險(xiǎn),我們就不做了。”

當(dāng)時(shí)的邏輯簡(jiǎn)單粗暴:設(shè)定危險(xiǎn)閾值(比如能輔助研發(fā)生物武器),一旦觸及,立刻暫停訓(xùn)練,直到安全措施到位。

這是一條死線,意味著安全優(yōu)先級(jí)高于商業(yè)進(jìn)度、融資節(jié)奏,甚至IPO窗口。

2026年2月,RSP 3.0來(lái)了。

那條死線沒了。

取而代之的是“前沿安全路線圖、風(fēng)險(xiǎn)報(bào)告、外部審查”——每3到6個(gè)月發(fā)布一次報(bào)告,由內(nèi)部專家起草,獨(dú)立評(píng)審,提交董事會(huì)。

官方說(shuō)法很漂亮:“技術(shù)邊界模糊,無(wú)法預(yù)設(shè)紅線,所以轉(zhuǎn)向透明披露?!?/p>

翻譯過(guò)來(lái)就是:從做不到就不許動(dòng)變成了邊做邊說(shuō)。

更直白點(diǎn):從硬剎車變成了軟著陸。

首席科學(xué)家Jared Kaplan在接受采訪時(shí),直接道出了真相:

“如果競(jìng)爭(zhēng)對(duì)手飛速前進(jìn),我們單方面承諾暫停訓(xùn)練沒有意義?!?/p>

說(shuō)白了就是:別人都在跑,我不能站著。

這不是技術(shù)判斷,是生存判斷。

在資本眼中,暫停訓(xùn)練等于暫停估值增長(zhǎng)。對(duì)于一家估值3800億美元、正被OpenAI(8500億+)、Google、xAI圍剿的公司,繼續(xù)自我設(shè)限等于商業(yè)自殺。

從硬剎車到透明監(jiān)控,中間差的不是技術(shù)認(rèn)知,是囚徒困境下的生存本能。


二、軍事合作的底線游戲:當(dāng)國(guó)家意志撞上安全紅線

如果說(shuō)RSP 3.0的調(diào)整是主動(dòng)妥協(xié),那么軍事合作的博弈,就是一場(chǎng)真正的底線戰(zhàn)爭(zhēng)。

Anthropic曾信誓旦旦:“拒絕參與全自主武器和國(guó)內(nèi)大規(guī)模監(jiān)控?!?/p>

這條紅線劃得比刀鋒還利。

2026年2月24日,一把更鋒利的刀架在了它的脖子上。

那一天,美國(guó)國(guó)防部長(zhǎng)皮特·赫格塞斯當(dāng)面向Anthropic CEO達(dá)里奧·阿莫迪下達(dá)了最后通牒:解除Claude模型的所有軍事用途限制(包括進(jìn)攻性網(wǎng)絡(luò)行動(dòng)),否則后果自負(fù)。

截止時(shí)間是2月27日17:01。

后果是什么?要么五角大樓動(dòng)用《國(guó)防生產(chǎn)法》強(qiáng)制接管模型,要么將Anthropic列為供應(yīng)鏈風(fēng)險(xiǎn)企業(yè)——這個(gè)標(biāo)簽通常用于敵對(duì)國(guó)家的公司,一旦貼上,Anthropic將失去所有國(guó)防承包商的商業(yè)聯(lián)系。

這是一道選擇題:放棄安全原則,或者放棄生存。

2月27日,最后期限到來(lái)。阿莫迪未能及時(shí)與五角大樓官員敲定最終條款。截止時(shí)間剛過(guò)14分鐘,赫格塞斯宣布談判破裂,將Anthropic正式列為供應(yīng)鏈風(fēng)險(xiǎn)。

特朗普隨后下令聯(lián)邦機(jī)構(gòu)停止使用Anthropic技術(shù)。

但故事沒有在這里結(jié)束。

3月9日,Anthropic正式向加州聯(lián)邦法院提起訴訟,指控美國(guó)政府的系列行動(dòng)“前所未有且不合法”。

3月26日,法院作出裁定。加州北區(qū)聯(lián)邦地區(qū)法院法官Rita Lin批準(zhǔn)了Anthropic的初步禁制令申請(qǐng),叫停了國(guó)防部的封殺令。

法庭文件顯示,Anthropic提供了關(guān)鍵技術(shù)證據(jù):其模型在部署于軍方封閉環(huán)境后,公司本身無(wú)法遠(yuǎn)程控制——這一證據(jù)戳穿了五角大樓的安全風(fēng)險(xiǎn)指控。

Anthropic贏了。

至少這一回合。

拒絕全自主武器,寧可被制裁也不妥協(xié)。這條線,是它的底線。但問題是:底線能守多久?法院的裁定只是初步禁制令,不是終局。五角大樓可以換一種方式再來(lái)。而Anthropic的客戶名單里,依然有國(guó)防部的名字——那些作戰(zhàn)規(guī)劃和情報(bào)分析的合作,依然在繼續(xù)。

拒絕全自主武器,但接受作戰(zhàn)規(guī)劃。這條線劃得清楚嗎?還是說(shuō),它只是在更大的博弈里,選了一個(gè)自己能承受的戰(zhàn)場(chǎng)?

這不是Anthropic的選擇,是它沒有選擇——但它選擇了抗?fàn)帯?/p>

三、內(nèi)部管理的燈下黑:最強(qiáng)安全AI,犯最低級(jí)錯(cuò)誤

一個(gè)CMS配置失誤,3000份文件裸奔。

這不是黑客攻擊,不是系統(tǒng)漏洞,是最基礎(chǔ)的權(quán)限設(shè)置問題——和AWS S3存儲(chǔ)桶忘記關(guān)權(quán)限一樣低級(jí)。

劍橋大學(xué)研究員驗(yàn)證了泄露材料的真實(shí)性:?jiǎn)T工育兒假記錄、CEO閉門峰會(huì)細(xì)節(jié)、甚至內(nèi)部安全評(píng)估報(bào)告,全部暴露在互聯(lián)網(wǎng)上。

最諷刺的是,泄露文件中有一句罕見的話:

“Mythos預(yù)示著即將到來(lái)的一波模型浪潮,屆時(shí)模型將以遠(yuǎn)超防御者努力的速度來(lái)利用漏洞?!?/p>

措辭之重,不像市場(chǎng)部寫的,更像造物主的恐懼清單。

一家正在打造史上最強(qiáng)網(wǎng)絡(luò)安全AI的公司,被最基礎(chǔ)的權(quán)限配置失誤扒了個(gè)精光。

這種燈下黑的現(xiàn)象在科技史上屢見不鮮:蘋果與FBI之爭(zhēng)、微軟補(bǔ)丁漏洞、Google內(nèi)部數(shù)據(jù)泄露……每一家科技巨頭都犯過(guò)類似的錯(cuò)誤。

但Anthropic的不同在于:它的核心價(jià)值就是安全。

當(dāng)一家以安全第一立身的公司,連自己的內(nèi)部文件都保護(hù)不好,它憑什么保護(hù)用戶?


四、AI安全的囚徒困境:當(dāng)好人活不下去

泄露文件里那句“模型將以遠(yuǎn)超防御者努力的速度來(lái)利用漏洞”,像一把刀懸在AI從業(yè)者頭頂。

而Dario Amodei在看到這份評(píng)估時(shí),是什么心態(tài)?是興奮、恐懼,還是兩者皆有?

他拒絕全自主武器,但接受作戰(zhàn)規(guī)劃。這條線劃得清楚嗎?還是說(shuō),它只是在更大的博弈里,選了一個(gè)自己能承受的戰(zhàn)場(chǎng)?

Anthropic不是唯一面臨“安全vs商業(yè)”悖論的公司。

OpenAI的“宮斗”暴露了治理結(jié)構(gòu)的脆弱:當(dāng)非營(yíng)利使命和商業(yè)利益沖突,決策權(quán)在誰(shuí)手里?

Google的“慢”暴露了官僚流程的拖沓:有最多的人才和算力,卻跑得最慢。

Anthropic的“泄露”暴露了安全流程的漏洞:當(dāng)核心價(jià)值是“安全”,卻連基礎(chǔ)流程都做不好。

當(dāng)模型能力越來(lái)越趨同——都用Transformer架構(gòu)、都做RLHF對(duì)齊、都卷推理能力——決定誰(shuí)能活下來(lái)的,不是誰(shuí)算力最多,不是誰(shuí)模型最強(qiáng),而是誰(shuí)的組織最扛造。

但更深的困境在于:當(dāng)安全承諾在資本壓力和國(guó)家意志面前被反復(fù)修改,這個(gè)行業(yè)的安全到底還有多少可信度?

RSP 3.0的變化,國(guó)防部的最后通牒,CMS的低級(jí)失誤——這三件事拼在一起,勾勒出一個(gè)殘酷的圖景:

AI行業(yè)正在經(jīng)歷一場(chǎng)安全敘事的破產(chǎn)。

監(jiān)管真空:政府沒有建立統(tǒng)一的紅線,導(dǎo)致企業(yè)不敢單方面踩剎車。

劣幣驅(qū)逐良幣:如果OpenAI和Google都在加速,Anthropic的道德潔癖反而成了競(jìng)爭(zhēng)劣勢(shì)。

公關(guān)化:安全正在從一種工程約束,變成一種公關(guān)語(yǔ)言。RSP 3.0的透明披露,本質(zhì)上是在告訴資本市場(chǎng):我們還在意安全,但請(qǐng)不要讓我們真的停下。

首席科學(xué)家Jared Kaplan的那句話,應(yīng)該被刻在每一家AI公司的會(huì)議室墻上:

“如果競(jìng)爭(zhēng)對(duì)手飛速前進(jìn),我們單方面承諾暫停訓(xùn)練沒有意義?!?/p>

翻譯過(guò)來(lái)就是:除非所有人一起踩剎車,否則誰(shuí)先停,誰(shuí)先死。

這就是AI安全的最大悖論。在監(jiān)管真空、競(jìng)爭(zhēng)白熱化的今天,沒有一家公司敢做唯一的好人。

每個(gè)修改都有合理的解釋。技術(shù)邊界確實(shí)在模糊,監(jiān)管環(huán)境確實(shí)在變化,商業(yè)競(jìng)爭(zhēng)確實(shí)在加速。但問題是:當(dāng)安全承諾可以被修改,它還是承諾嗎?當(dāng)人類在回路中成為免責(zé)聲明,安全還有意義嗎?


結(jié)語(yǔ):AI時(shí)代的護(hù)城河,不是算力,是誠(chéng)實(shí)

Anthropic的泄露事件,最終會(huì)被修復(fù)。

CMS權(quán)限會(huì)被重新設(shè)置,泄露的文件會(huì)從互聯(lián)網(wǎng)上消失,網(wǎng)絡(luò)安全股會(huì)漲回來(lái),RSP 3.0會(huì)繼續(xù)執(zhí)行。

但那個(gè)問題會(huì)一直存在:

當(dāng)一家以安全第一立身的公司,在資本壓力和國(guó)家意志面前,一次次被逼到墻角,它還能守住多少底線?

Anthropic用被制裁、被列為供應(yīng)鏈風(fēng)險(xiǎn)、失去巨額國(guó)防合同的代價(jià),守住了拒絕全自主武器這條線。但這條線能守多久?五角大樓會(huì)換一種方式再來(lái)嗎?

答案從來(lái)不是模型更強(qiáng)、算力更大。

答案是:把最基本的流程做好,把最基礎(chǔ)的承諾守住。

這是Anthropic給整個(gè)AI行業(yè)上的一課。

也是最難的一課。因?yàn)樵谶@一課里,Anthropic自己,既是那個(gè)抗?fàn)幍膶W(xué)生,也是那個(gè)不及格的學(xué)生。

本文來(lái)自微信公眾號(hào):青萍見,作者:舒書

本內(nèi)容由作者授權(quán)發(fā)布,觀點(diǎn)僅代表作者本人,不代表虎嗅立場(chǎng)。如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系 tougao@huxiu.com。

本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4846249.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
賈淺淺被查,拼爹失??!

賈淺淺被查,拼爹失敗!

新浪財(cái)經(jīng)
2026-04-14 15:56:51
曝大鬧昆明候機(jī)廳:狂踹工作人員,鬧事母女正臉曝光,孩子受牽連

曝大鬧昆明候機(jī)廳:狂踹工作人員,鬧事母女正臉曝光,孩子受牽連

奇思妙想草葉君
2026-04-14 17:03:12
43歲英超名帥官宣離任 率隊(duì)客勝阿森納+12輪不敗 2大豪門或成下家

43歲英超名帥官宣離任 率隊(duì)客勝阿森納+12輪不敗 2大豪門或成下家

我愛英超
2026-04-14 21:49:43
美軍開始攔截船只;伊朗學(xué)者警告中國(guó)護(hù)航將使美中直接對(duì)抗

美軍開始攔截船只;伊朗學(xué)者警告中國(guó)護(hù)航將使美中直接對(duì)抗

混沌錄
2026-04-14 17:28:26
好心也會(huì)坐牢!5月1號(hào)起,這3種“熱心幫忙”直接犯法,快停手

好心也會(huì)坐牢!5月1號(hào)起,這3種“熱心幫忙”直接犯法,快停手

小談食刻美食
2026-04-14 08:06:34
以黎代表在華盛頓舉行會(huì)談

以黎代表在華盛頓舉行會(huì)談

財(cái)聯(lián)社
2026-04-14 23:04:08
蘋果放出狠話:只要打開這個(gè)開關(guān),目前全球無(wú)人能黑進(jìn)你的 iPhone

蘋果放出狠話:只要打開這個(gè)開關(guān),目前全球無(wú)人能黑進(jìn)你的 iPhone

小兔子發(fā)現(xiàn)大事情
2026-04-13 14:13:39
許家印庭審連認(rèn)八罪:2.4萬(wàn)億從哪來(lái),去了哪里?

許家印庭審連認(rèn)八罪:2.4萬(wàn)億從哪來(lái),去了哪里?

黔有虎
2026-04-14 20:48:38
為何金庸武俠小說(shuō)依舊風(fēng)靡,古龍卻已無(wú)人問津?其實(shí)原因很簡(jiǎn)單

為何金庸武俠小說(shuō)依舊風(fēng)靡,古龍卻已無(wú)人問津?其實(shí)原因很簡(jiǎn)單

長(zhǎng)風(fēng)文史
2026-04-13 20:41:32
鄭麗文臺(tái)灣東吳大學(xué)演講:名人的話聽聽就好,原創(chuàng)比什么都重要

鄭麗文臺(tái)灣東吳大學(xué)演講:名人的話聽聽就好,原創(chuàng)比什么都重要

爆角追蹤
2026-04-14 14:38:45
2026一季度居民部門新增貸款僅2967億元,同比暴跌71.5%

2026一季度居民部門新增貸款僅2967億元,同比暴跌71.5%

知識(shí)圈
2026-04-14 20:47:13
曾獲“最美逆行者”稱號(hào),救護(hù)車司機(jī)工作13年因拒轉(zhuǎn)勞務(wù)派遣被辭退;院方:系臨時(shí)工,曾多次溝通

曾獲“最美逆行者”稱號(hào),救護(hù)車司機(jī)工作13年因拒轉(zhuǎn)勞務(wù)派遣被辭退;院方:系臨時(shí)工,曾多次溝通

大風(fēng)新聞
2026-04-14 14:39:05
120家門店倒閉了一半?又一個(gè)海鮮自助“大撤退”

120家門店倒閉了一半?又一個(gè)海鮮自助“大撤退”

藍(lán)鯨新聞
2026-04-13 10:19:47
剛剛,利好來(lái)了!直線爆拉,中東大消息!

剛剛,利好來(lái)了!直線爆拉,中東大消息!

中國(guó)基金報(bào)
2026-04-14 15:58:32
伊朗到現(xiàn)在都不敢相信,40天的血戰(zhàn),給自己打出了半個(gè)世紀(jì)的國(guó)運(yùn)

伊朗到現(xiàn)在都不敢相信,40天的血戰(zhàn),給自己打出了半個(gè)世紀(jì)的國(guó)運(yùn)

共工之錨
2026-04-14 00:36:53
美軍“冒死”營(yíng)救飛行員,救人還是“挽尊”?魏東旭:代價(jià)高昂,執(zhí)行秘密任務(wù)的特種部隊(duì)無(wú)奈“暴露”

美軍“冒死”營(yíng)救飛行員,救人還是“挽尊”?魏東旭:代價(jià)高昂,執(zhí)行秘密任務(wù)的特種部隊(duì)無(wú)奈“暴露”

上觀新聞
2026-04-14 19:45:02
他們?yōu)椤耙晾授A了”慶賀,完全看不見真實(shí)的場(chǎng)面

他們?yōu)椤耙晾授A了”慶賀,完全看不見真實(shí)的場(chǎng)面

走讀新生
2026-04-14 14:09:38
特朗普“反向封鎖”霍爾木茲海峽,伊朗8000萬(wàn)人恐難撐過(guò)一個(gè)月

特朗普“反向封鎖”霍爾木茲海峽,伊朗8000萬(wàn)人恐難撐過(guò)一個(gè)月

民間胡扯老哥
2026-04-14 06:00:51
尹錫悅雙眼通紅地望著金建希,金建希沒看他

尹錫悅雙眼通紅地望著金建希,金建希沒看他

天真無(wú)牙
2026-04-14 17:44:27
新華社18秒視頻,讓美國(guó)前高官“焦慮”了

新華社18秒視頻,讓美國(guó)前高官“焦慮”了

新華社
2026-04-14 20:53:52
2026-04-14 23:39:00
虎嗅APP incentive-icons
虎嗅APP
個(gè)性化商業(yè)資訊與觀點(diǎn)交流平臺(tái)
26098文章數(shù) 687672關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

54歲班主任帶15歲女孩到賓館開房猥褻:將她壓到床上

頭條要聞

54歲班主任帶15歲女孩到賓館開房猥褻:將她壓到床上

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊(duì)道歉”

娛樂要聞

網(wǎng)曝鐘麗緹代孕要了個(gè)男孩 備孕近10年

財(cái)經(jīng)要聞

許家印認(rèn)罪,他和恒大還有多少欠債?

汽車要聞

售12.99萬(wàn)起/續(xù)航2000km 風(fēng)云T9L上市

態(tài)度原創(chuàng)

健康
家居
數(shù)碼
教育
時(shí)尚

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

家居要聞

現(xiàn)代融合 自然靈動(dòng)

數(shù)碼要聞

三款小平板扎堆發(fā)布!紅魔、紅米、OPPO,誰(shuí)會(huì)是大家的菜?

教育要聞

他們眼里的光被點(diǎn)燃!中華中學(xué)首屆南大班學(xué)習(xí)成果匯報(bào)

壞事做盡的瘋女人,集體翻紅了

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版