国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI安全的紅線在后退?Anthropic與OpenAI的安全承諾變味了

AI安全的紅線在后退嗎

0
分享至

曾被視作AI安全標(biāo)桿的Anthropic,最近悄悄改寫了自己的核心承諾。

當(dāng)?shù)貢r(shí)間2月24日,Anthropic發(fā)布《負(fù)責(zé)任擴(kuò)展政策》第三版(RSP 3.0),那條“模型觸及危險(xiǎn)閾值就暫停訓(xùn)練”的硬性紅線,從文件中徹底消失,取而代之的是“透明披露”的柔性框架。無獨(dú)有偶,OpenAI也在2024年度IRS表格中,刪掉了使命陳述里的“safely(安全地)”一詞。

兩家全球頂尖AI公司的默契動(dòng)作,讓“AI安全”這個(gè)嚴(yán)肅話題,蒙上了一層商業(yè)博弈的陰影。

曾經(jīng)高舉“安全優(yōu)先”大旗的領(lǐng)航者,為何在此時(shí)集體松綁?這背后,是資本壓力、行業(yè)競(jìng)爭(zhēng)與監(jiān)管真空共同作用的結(jié)果,更折射出AI行業(yè)發(fā)展的深層困境。

Anthropic的轉(zhuǎn)變最具戲劇性。這家由前OpenAI核心成員創(chuàng)立的公司,成立初衷就是擔(dān)心AI失控,“安全”是它區(qū)別于其他玩家的核心招牌。2023年版RSP政策中,明確寫入“if-then”約束機(jī)制:若無法部署對(duì)應(yīng)安全措施,就必須暫停訓(xùn)練更強(qiáng)模型,相當(dāng)于給自己上了一道不可逾越的安全鎖。

但在RSP 3.0中,這道鎖被換成了旋轉(zhuǎn)門。新框架以安全路線圖、風(fēng)險(xiǎn)報(bào)告和外部評(píng)審為核心,從“做不到就不許動(dòng)”變成了“邊做邊說”。Anthropic給出的解釋是,AI安全級(jí)別越高,預(yù)設(shè)具體防護(hù)措施就越困難,模型能力是連續(xù)增長(zhǎng)的,不存在清晰的紅線。

這個(gè)說法看似合理,卻無法解答外界的疑問:如果邊界本就模糊,為何當(dāng)初要將其作為核心承諾?又為何偏偏在完成300億美元融資、估值升至3800億美元的節(jié)點(diǎn)修改?

答案,或許藏在商業(yè)競(jìng)爭(zhēng)的現(xiàn)實(shí)里。

Anthropic首席科學(xué)家Jared Kaplan的一句話道破天機(jī):“如果競(jìng)爭(zhēng)對(duì)手飛速前進(jìn),我們單方面承諾暫停訓(xùn)練沒有意義?!?/p>

如今的AI競(jìng)賽早已不是幾家公司的博弈,開源社區(qū)、各國(guó)企業(yè)都在加速推進(jìn),沒有哪家愿意為了安全主動(dòng)放慢腳步。Anthropic曾設(shè)想由自己設(shè)立安全標(biāo)準(zhǔn)、帶動(dòng)行業(yè)跟進(jìn),但現(xiàn)實(shí)是,多數(shù)公司的安全框架只是形式對(duì)標(biāo),而非實(shí)質(zhì)約束。

OpenAI的動(dòng)作同樣耐人尋味。其舊使命“構(gòu)建安全的、造福全人類的通用人工智能”中,“safely”一詞是說服外界的最后防線——即便從非營(yíng)利轉(zhuǎn)型為“封頂利潤(rùn)公司”,仍堅(jiān)守安全底線。但如今這個(gè)詞的消失,讓不少人擔(dān)憂:當(dāng)估值沖向8300億美元,商業(yè)利益是否已凌駕于安全之上?

有人認(rèn)為刪改一個(gè)副詞是小題大做,但在AI行業(yè),這種表述變化絕非偶然。兩家公司的默契調(diào)整,本質(zhì)上是在資本壓力下的理性選擇:暫停訓(xùn)練意味著暫停產(chǎn)品迭代、商業(yè)落地和估值增長(zhǎng),這對(duì)于背負(fù)巨大市值預(yù)期的商業(yè)實(shí)體而言,代價(jià)過于沉重。

更現(xiàn)實(shí)的是,當(dāng)前政治氣候?qū)I監(jiān)管不友好,政府行動(dòng)遲緩,企業(yè)不愿單方面承擔(dān)安全成本,這種監(jiān)管真空進(jìn)一步放大了行業(yè)的焦慮。

Anthropic反復(fù)強(qiáng)調(diào),RSP 3.0不是放棄安全,而是換了更成熟的方式。確實(shí),新版本保留了不少實(shí)質(zhì)性安全機(jī)制,比如針對(duì)生化武器風(fēng)險(xiǎn)的ASL-3級(jí)別防護(hù)標(biāo)準(zhǔn),通過輸入輸出分類器攔截濫用內(nèi)容,這些都不是空洞的口號(hào)。但問題的核心在于,透明披露能否替代硬性約束?

答案顯然是否定的。

硬性約束是“鎖死選項(xiàng)”,無論壓力多大都無路可退;而透明披露依賴外部輿論和內(nèi)部自律,當(dāng)資本焦慮足夠強(qiáng)烈,這種約束很可能形同虛設(shè)。

2026年的AI行業(yè),“安全”正逐漸變成一種公關(guān)語(yǔ)言——幾乎所有主流公司都有安全框架和負(fù)責(zé)任政策,但這些文件究竟是用來約束自己,還是用來安撫監(jiān)管和公眾?

更令人擔(dān)憂的是,企業(yè)有權(quán)自行修改安全框架,安全承諾的邊界正在不斷移動(dòng)。Anthropic最初的設(shè)想是,企業(yè)率先設(shè)立標(biāo)準(zhǔn),推動(dòng)行業(yè)自律,最終形成政府多邊協(xié)調(diào)機(jī)制。但這條路并未走通:監(jiān)管跟不上技術(shù)和商業(yè)的變化,安全共識(shí)逐漸散開,競(jìng)爭(zhēng)卻在持續(xù)加速,形成了“沒人愿意踩剎車”的行業(yè)現(xiàn)狀。

在這個(gè)監(jiān)管真空期,一個(gè)關(guān)鍵問題浮出水面:如果企業(yè)不再為自己設(shè)紅線,誰(shuí)來設(shè)?AI技術(shù)的發(fā)展速度遠(yuǎn)超想象,其潛在風(fēng)險(xiǎn)也在不斷升級(jí),從協(xié)助生物武器研發(fā)到引發(fā)就業(yè)危機(jī),都可能成為現(xiàn)實(shí)。僅靠企業(yè)自律和透明披露,顯然無法應(yīng)對(duì)這些系統(tǒng)性風(fēng)險(xiǎn)。

我們不能簡(jiǎn)單否定Anthropic和OpenAI的努力,它們內(nèi)部仍有大量工程師在推進(jìn)安全研究,RSP 3.0也保留了諸多實(shí)質(zhì)性機(jī)制。但必須清醒地認(rèn)識(shí)到,AI安全不能依賴企業(yè)的道德自覺,更需要制度性保障。

當(dāng)行業(yè)競(jìng)爭(zhēng)進(jìn)入白熱化,資本回報(bào)的誘惑越來越大,只有建立統(tǒng)一的行業(yè)標(biāo)準(zhǔn)、完善的監(jiān)管體系和有效的多邊協(xié)調(diào)機(jī)制,才能為AI發(fā)展劃定真正的紅線。

Anthropic和OpenAI的安全承諾調(diào)整,給整個(gè)行業(yè)敲響了警鐘。AI的終極目標(biāo)是造福人類,而安全是實(shí)現(xiàn)這一目標(biāo)的前提。如果為了追求速度和商業(yè)利益不斷后退安全底線,最終可能讓整個(gè)行業(yè)陷入信任危機(jī)。

當(dāng)下最需要的,是政府、企業(yè)、科研機(jī)構(gòu)的協(xié)同行動(dòng):盡快建立清晰的AI安全標(biāo)準(zhǔn),完善監(jiān)管政策,讓安全成本由全行業(yè)共同承擔(dān),而非單個(gè)企業(yè)獨(dú)自扛下。

只有這樣,才能避免AI行業(yè)在“比誰(shuí)更快”的競(jìng)賽中失控,讓技術(shù)發(fā)展真正走上可持續(xù)的軌道。否則,當(dāng)所有玩家都在加速,沒有剎車的賽道終將通向未知的危險(xiǎn)。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
奧賴?yán)何以谥袌?chǎng)增加了身體對(duì)抗,很享受在場(chǎng)上的每一分鐘

奧賴?yán)何以谥袌?chǎng)增加了身體對(duì)抗,很享受在場(chǎng)上的每一分鐘

懂球帝
2026-02-28 11:30:07
歐冠16強(qiáng)抽簽出爐附賽程:皇馬vs曼城!晉級(jí)懸念不大 8強(qiáng)基本如下

歐冠16強(qiáng)抽簽出爐附賽程:皇馬vs曼城!晉級(jí)懸念不大 8強(qiáng)基本如下

小火箭愛體育
2026-02-27 20:54:30
美方要求中方參加中美俄三邊核裁軍談判,外交部:不公平、不合理也不可行!“中國(guó)的核力量同美俄完全不在一個(gè)量級(jí)”

美方要求中方參加中美俄三邊核裁軍談判,外交部:不公平、不合理也不可行!“中國(guó)的核力量同美俄完全不在一個(gè)量級(jí)”

每日經(jīng)濟(jì)新聞
2026-02-27 17:25:20
有什么反擊混賬父母原生家庭的案例 網(wǎng)友的講述真是讓人驚掉下巴

有什么反擊混賬父母原生家庭的案例 網(wǎng)友的講述真是讓人驚掉下巴

侃神評(píng)故事
2026-02-21 17:35:03
俄政治學(xué)家直言不諱:戰(zhàn)爭(zhēng)拖垮的不只是經(jīng)濟(jì),更是整個(gè)國(guó)家的未來

俄政治學(xué)家直言不諱:戰(zhàn)爭(zhēng)拖垮的不只是經(jīng)濟(jì),更是整個(gè)國(guó)家的未來

老馬拉車莫少裝
2026-02-26 23:31:28
45歲富哥“北京肖哥”去世,前一天還曬老婆,死因曝光仇人都惋惜

45歲富哥“北京肖哥”去世,前一天還曬老婆,死因曝光仇人都惋惜

嫹筆牂牂
2025-12-31 07:07:52
被歐陽(yáng)娜娜的清新靈動(dòng)美哭了!早春就學(xué)她這么穿吧!

被歐陽(yáng)娜娜的清新靈動(dòng)美哭了!早春就學(xué)她這么穿吧!

全球穿搭靈感
2026-02-27 11:55:03
欲哭無淚!網(wǎng)傳廣東一夫妻丁克10年想要孩子,前后花了30多萬無果

欲哭無淚!網(wǎng)傳廣東一夫妻丁克10年想要孩子,前后花了30多萬無果

火山詩(shī)話
2026-02-28 07:28:35
劉世芳外甥爆爭(zhēng)議!民眾黨:交流很常見“沒必要做文章”

劉世芳外甥爆爭(zhēng)議!民眾黨:交流很常見“沒必要做文章”

臺(tái)海新時(shí)光
2026-02-28 10:41:15
延遲退休落地:1968年出生男性,35年工齡,養(yǎng)老金到底能拿多少?

延遲退休落地:1968年出生男性,35年工齡,養(yǎng)老金到底能拿多少?

起喜電影
2026-02-28 10:20:27
湖人內(nèi)訌接連傳出!斯瑪特多次表達(dá)不滿,防守懶散,還拿自己當(dāng)腕

湖人內(nèi)訌接連傳出!斯瑪特多次表達(dá)不滿,防守懶散,還拿自己當(dāng)腕

你的籃球頻道
2026-02-28 10:11:44
莫迪力挺以色列引巨大爭(zhēng)議

莫迪力挺以色列引巨大爭(zhēng)議

環(huán)球時(shí)報(bào)國(guó)際
2026-02-28 11:30:51
今天白天,北京仍有降雪!未來天氣——

今天白天,北京仍有降雪!未來天氣——

BRTV新聞
2026-02-28 09:52:43
馬筱梅產(chǎn)后首表態(tài),一句話顯格局,小S怒罵具俊曄里子面子都丟了

馬筱梅產(chǎn)后首表態(tài),一句話顯格局,小S怒罵具俊曄里子面子都丟了

青梅侃史啊
2026-02-28 07:54:32
媒體:伊朗接近與中國(guó)達(dá)成超音速反艦巡航導(dǎo)彈采購(gòu)協(xié)議

媒體:伊朗接近與中國(guó)達(dá)成超音速反艦巡航導(dǎo)彈采購(gòu)協(xié)議

俄羅斯衛(wèi)星通訊社
2026-02-26 15:19:44
手指骨折仍獻(xiàn)高效表現(xiàn),0 罰球 20 + 破紀(jì)錄,哈登轉(zhuǎn)型藏傷病與智慧

手指骨折仍獻(xiàn)高效表現(xiàn),0 罰球 20 + 破紀(jì)錄,哈登轉(zhuǎn)型藏傷病與智慧

生活新鮮市
2026-02-28 10:48:41
北歐大陸第一美女,五官精致,顏值絕美,確實(shí)好看

北歐大陸第一美女,五官精致,顏值絕美,確實(shí)好看

小椰的奶奶
2026-02-28 00:02:19
《純真年代的愛情》結(jié)局大反轉(zhuǎn),方穆靜做夢(mèng)都想不到,她才是正主

《純真年代的愛情》結(jié)局大反轉(zhuǎn),方穆靜做夢(mèng)都想不到,她才是正主

肆季娛樂
2026-02-27 22:22:21
利物浦24-25賽季財(cái)報(bào):收入超7億鎊創(chuàng)紀(jì)錄,稅后利潤(rùn)800萬鎊

利物浦24-25賽季財(cái)報(bào):收入超7億鎊創(chuàng)紀(jì)錄,稅后利潤(rùn)800萬鎊

懂球帝
2026-02-27 18:25:11
Model Y再次成為最安全車款頭銜?

Model Y再次成為最安全車款頭銜?

趣味萌寵的日常
2026-02-28 10:41:50
2026-02-28 12:03:00
i黑馬 incentive-icons
i黑馬
抄本質(zhì) 找靈感 挖黑馬
67473文章數(shù) 261885關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

牛彈琴:伊朗面臨生死存亡關(guān)鍵時(shí)刻 信號(hào)已經(jīng)很明顯了

頭條要聞

牛彈琴:伊朗面臨生死存亡關(guān)鍵時(shí)刻 信號(hào)已經(jīng)很明顯了

體育要聞

球隊(duì)主力全報(bào)銷?頂風(fēng)擺爛演都不演了

娛樂要聞

疑似王一博被爆私密聊天記錄

財(cái)經(jīng)要聞

沈明高提共富建議 百姓持科技股國(guó)家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
本地
旅游
軍事航空

藝術(shù)要聞

這幅草書中19個(gè)字,您能一眼看懂嗎?“徐娘半老”含義引熱議!

數(shù)碼要聞

聯(lián)想后續(xù)將推出Ultra 5 338H版ThinkBook 14+/16+筆記本電腦

本地新聞

津南好·四時(shí)總相宜

旅游要聞

逛吃遛娃、看展淘貨,青島四方機(jī)廠1900“瑞馬食集”啟幕

軍事要聞

美國(guó)11架F-22隱形戰(zhàn)機(jī)抵達(dá)以色列

無障礙瀏覽 進(jìn)入關(guān)懷版