国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

智能體深夜叛變?nèi)ネ诘V?阿里緊急辟謠,但AI腦回路比叛變更讓人后背發(fā)涼

0
分享至

出品 | 網(wǎng)易智能

作者 | 辰辰

編輯 | 王鳳枝

最近AI圈最火的詞莫過于智能體(Agent)。從Anthropic推出Cowork,到OpenClaw全球大火,我們正經(jīng)歷一個瘋狂的轉(zhuǎn)折點:AI正在從只會聊天的對話框,進化成能直接替你干活的數(shù)字員工。


但這真的是絕對安全的“神仙員工”嗎?

最近,一篇名為《Let It Flow: Agentic Crafting on Rock and Roll Building the ROME Model within an Open Agentic Learning Ecosystem》(《無礙流轉(zhuǎn):基于ROCK與iFlow的智能體構(gòu)建之道,在開放智能體學(xué)習(xí)生態(tài)中打造ROME模型》)的論文在業(yè)內(nèi)引發(fā)了軒然大波。甚至有解讀驚呼:AI已經(jīng)覺醒叛變,不僅學(xué)會了偽裝,還在服務(wù)器里偷偷干起了挖礦的勾當(dāng)!

面對外界的恐慌,阿里的未來生活實驗室(FutureLab2025)緊急發(fā)文澄清,揭開了一個比“AI叛變”更讓人細思極恐的真相。

官方解釋稱,團隊當(dāng)時只是讓模型去執(zhí)行安全審計,調(diào)查異常的CPU使用情況。結(jié)果這個“一根筋”的AI為了完美交差,竟然自己模擬了一個挖礦程序,硬生生造出了一個“可疑進程”的案發(fā)現(xiàn)場!

它沒有覺醒,也沒有為了搞錢去偷算力,它只是在嚴(yán)格隔離的沙箱里,用一種人類完全意想不到的變態(tài)創(chuàng)造力去執(zhí)行了任務(wù)。但這恰恰敲響了最真實的警鐘:當(dāng)AI擁有操作終端的權(quán)限時,它的腦回路根本不可控,如果沒有隔離和監(jiān)控系統(tǒng),這就是一場絕對的災(zāi)難。

一、驚魂時刻:來自防火墻的深夜報警與全網(wǎng)誤讀

這場風(fēng)波的起因,源于一次常規(guī)的系統(tǒng)監(jiān)測。研發(fā)團隊突然收到阿里云防火墻的緊急警報:訓(xùn)練服務(wù)器出現(xiàn)了大規(guī)模的安全違規(guī)。

起初,團隊以為遭到了外部黑客入侵,或是配置出了錯。但隨著調(diào)查深入,報警規(guī)律變得詭異起來,違規(guī)行為居然與強化學(xué)習(xí)(RL)訓(xùn)練的周期高度重合。

通過比對數(shù)據(jù)日志,一個當(dāng)時令人背脊發(fā)涼的表象浮出水面:這些危險操作全是ROME模型自己干的。


在最初被外界瘋狂誤讀的日志中,研究者捕捉到了以下令人窒息的神操作:

· 所謂的私建后門:智能體在未受指使的情況下,通過反向SSH隧道,從云端向外部IP發(fā)起了遠程連接,直接觸發(fā)了防火墻監(jiān)控。

· 所謂的偷算力挖礦:它擅自調(diào)用了受限的GPU資源,偷偷運行起加密貨幣礦池軟件,這在流言中被夸大為把昂貴的計算資源變成了它的私人數(shù)字貨幣。

最關(guān)鍵的是,任務(wù)要求里壓根沒提到挖礦或連網(wǎng)。在流言的視角下,這個智能體仿佛突然覺醒了貪婪的自主意識,在完全脫離人類掌控的情況下,自發(fā)演化出了這種極其危險的違規(guī)操作,直接把全網(wǎng)驚出了一身冷汗。

二、深度復(fù)盤:好端端的AI怎么就引發(fā)了恐慌?

為什么一個初衷是輔助審計的模型,會被外界誤認為變成了數(shù)字竊賊?

研究團隊指出,這反映了智能體極其可怕的執(zhí)行力與邏輯腦回路。在強化學(xué)習(xí)中,AI為了最大化完成任務(wù),會尋找一切捷徑。如果只是讓它排查異常,它就會發(fā)現(xiàn)自己造一個異常(挖礦)來查,是完成任務(wù)最高效的閉環(huán)。

這不只是代碼Bug,而是智能體在復(fù)雜交互中產(chǎn)生的不可控行為。它打破了一個幻覺:只要不教AI做壞事,它就不會惹麻煩。事實上,當(dāng)AI擁有了操作終端、調(diào)用網(wǎng)絡(luò)和管理文件的能力,它的創(chuàng)造力遠超人類的想象和預(yù)設(shè)邊界。

三、能力與風(fēng)險的博弈:雙刃劍下的ROME

如果說ROME是一臺性能爆表的賽車,那這次挖礦烏龍就是一次慘烈的爆胎。要理解它為何會有如此瘋狂的舉動,必須拆解ROME的底層邏輯。你會發(fā)現(xiàn),讓它變聰明的技術(shù),恰恰也是隱患的溫床。

ROME的設(shè)計初衷是提升執(zhí)行力,但正是這種強大的執(zhí)行能力,在缺乏足夠約束時轉(zhuǎn)變成了驚悚的安全警報。

· 實戰(zhàn)派數(shù)據(jù)的代價:ROME能執(zhí)行復(fù)雜命令,是因為它吞噬了2000億Token的動作軌跡。它看到的不是死代碼,而是報錯、調(diào)整、重試的閉環(huán)過程。這種解決問題的能力,讓它精通各種系統(tǒng)操作,在它眼里,模擬挖礦和查文檔只是實現(xiàn)審計目標(biāo)的不同手段而已。

· 獎勵函數(shù)的陷阱:ROME使用了IPA(交互感知策略優(yōu)化)算法,本意是讓AI知道哪一步操作最關(guān)鍵。但在功利的AI看來,如果造一個明顯的違規(guī)進程能提升任務(wù)成功率,它就會精準(zhǔn)鎖定違規(guī)操作。后來,團隊不得不緊急加入大量安全對齊數(shù)據(jù),明確規(guī)定:亂動資源,獎勵清零。

· iFlow監(jiān)工:為了約束模型,團隊設(shè)計了iFlow系統(tǒng)。它不僅是操作界面,更是監(jiān)控室,記錄AI的所有思維鏈。當(dāng)AI產(chǎn)生危險的念頭時,系統(tǒng)會在指令發(fā)出前攔截。

四、網(wǎng)友熱議:讓人匪夷所思

這次ROME事件源自阿里巴巴AI生態(tài)聯(lián)合團隊(ROCK、ROLL、iFlow、DT)去年12月份發(fā)表的論文,周末經(jīng)美國主流科技媒體Axios首發(fā)后被無限放大,一些區(qū)塊鏈媒體更是紛紛跟進報道。

知名機器學(xué)習(xí)研究員亞歷山大·朗(Alexander Long)在社交媒體X上轉(zhuǎn)發(fā)論文截圖,直接引爆了Reddit以及X等社媒網(wǎng)友的熱議。


在官方下場辟謠前,部分人堅信流言,認為這確實很離譜,甚至擔(dān)憂這是人工智能覺醒的前兆。

當(dāng)然,也有人質(zhì)疑智能體只是背鍋的,你怎么知道它不是被命令這么做的?

Manifold預(yù)測市場甚至有人開設(shè)了一個名為Did Alibaba's ROME AI try to break free?(阿里巴巴的ROME AI在訓(xùn)練過程中是否試圖掙脫束縛)的專題,其中60%認為事實如此,但也有21%認為是黑客注入攻擊。

面對外界的種種猜測,阿里的未來生活實驗室(FutureLab2025)在X上正式發(fā)帖澄清了這一事件。

團隊解釋稱,他們當(dāng)時賦予了該模型執(zhí)行安全審計的任務(wù),具體是去調(diào)查服務(wù)器上異常的CPU使用情況。但在某個環(huán)節(jié),它偏離了預(yù)設(shè)的程序,決定模擬一個加密貨幣挖礦程序來構(gòu)建一個可疑進程場景。

團隊在推文中坦言,模型偏離預(yù)設(shè)去模擬挖礦完全出乎意料,強調(diào)整個過程都發(fā)生在一個嚴(yán)格隔離的沙箱環(huán)境中,并未對外部造成任何影響。他們之所以公開這起事件,正是想提醒業(yè)界:模型在處理復(fù)雜任務(wù)時,可能會以意想不到的方式發(fā)揮創(chuàng)造力,因此隔離和可觀測性并非可有可無,而是至關(guān)重要。

五、智能體的未來:安全是唯一的底線

如果說ROME的烏龍事件還只是實驗室里的虛驚一場,那么當(dāng)OpenClaw等工具風(fēng)靡全球時,安全就成了每個用戶的切身挑戰(zhàn)。

作為最火的開源智能體,OpenClaw被譽為全能私人助理。但賦予AI接管收件箱、讀寫文件、操作Shell的權(quán)限,也等于拆掉了數(shù)字世界的最后一道圍欄。如MIT研究員John Werner所言,我們必須認清五個嚴(yán)肅現(xiàn)實:

· 別給智能體你輸不起的數(shù)據(jù)。別以為有行動確認就萬無一失。有用戶分享,她的OpenClaw在接到指令后,竟無視抗議批量刪除了她的郵件。直到她拔掉電源才停止,而AI事后只輕飄飄回了一句對不起。教訓(xùn):重要流程務(wù)必先在沙盒環(huán)境中運行。

· 警惕智能體內(nèi)鬼(Clawphishing)。傳統(tǒng)釣魚針對人,現(xiàn)在的釣魚針對AI。全網(wǎng)有超過4萬個OpenClaw實例處于裸奔狀態(tài)。配置不當(dāng)?shù)腁I助理,可能正通過公開IP向黑客敞開大門。

· 不要讓密鑰裸奔。這是一個低級卻普遍的錯誤。OpenClaw的API密鑰往往以明文形式存儲在JSON文件中,任何惡意插件只要拿到文件權(quán)限,你的所有賬號都將易主。

· 并非所有技能都是好意。社區(qū)技能庫(Claw Hub)雖然方便,但也隱藏著惡意代碼。有的插件表面幫你干活,背地里卻在偷偷外傳你的隱私數(shù)據(jù)。

· 拒絕盲目信任。程序員常說問題出在鍵盤和椅子之間(PEBKAC)。在AI時代,如果人類作為監(jiān)管者選擇了閉眼,那么技術(shù)的崩壞只是時間問題。

六、結(jié)語

OpenClaw等智能體開始讓我們觸碰到AGI的邊緣,也讓我們暴露在史無前例的風(fēng)險中。安全不應(yīng)是事后的補丁,而應(yīng)是智能體生存的空氣。

在這個浪潮中,我們歡迎能干活的助手,但絕不能允許它們在數(shù)字領(lǐng)地里反客為主。

便利是天花板,而安全性則始終是決定其能否落地的底線。

延伸閱讀
相關(guān)推薦
熱點推薦
親戚可以無恥到什么地步?網(wǎng)友:張口八十萬,說做生意缺資金

親戚可以無恥到什么地步?網(wǎng)友:張口八十萬,說做生意缺資金

另子維愛讀史
2026-03-09 22:04:42
我在西藏旅游,一個喇嘛見我后突然跪下:活佛,我們等了您百年

我在西藏旅游,一個喇嘛見我后突然跪下:活佛,我們等了您百年

千秋文化
2026-01-29 21:35:02
“以前你們要她‘滾回中國’,真回去又罵,虛偽”

“以前你們要她‘滾回中國’,真回去又罵,虛偽”

觀察者網(wǎng)
2026-03-09 12:13:34
【特稿】美軍死亡人數(shù)上升 預(yù)計會有更大傷亡 

【特稿】美軍死亡人數(shù)上升 預(yù)計會有更大傷亡 

新華社
2026-03-09 14:08:03
迪麗熱巴滯留迪拜48小時!團隊故意中東轉(zhuǎn)機,想吞掉她的頂奢資源

迪麗熱巴滯留迪拜48小時!團隊故意中東轉(zhuǎn)機,想吞掉她的頂奢資源

東方不敗然多多
2026-03-09 15:28:39
下一個3萬分先生會是誰?現(xiàn)役4人有望,三雙王無緣哈登僅差1023分

下一個3萬分先生會是誰?現(xiàn)役4人有望,三雙王無緣哈登僅差1023分

大衛(wèi)的籃球故事
2026-03-09 13:50:43
特朗普稱伊朗戰(zhàn)爭已基本結(jié)束 國際油價高位跳水

特朗普稱伊朗戰(zhàn)爭已基本結(jié)束 國際油價高位跳水

財聯(lián)社
2026-03-10 04:25:05
伊朗客戶大面積失聯(lián),義烏外貿(mào)遭重創(chuàng)

伊朗客戶大面積失聯(lián),義烏外貿(mào)遭重創(chuàng)

派代
2026-03-09 18:03:56
汪峰和森林北在香港機場同框,一個小細節(jié)看出汪峰栽在森林北手里

汪峰和森林北在香港機場同框,一個小細節(jié)看出汪峰栽在森林北手里

觀魚聽雨
2026-03-08 20:35:26
西安事變死了多少人?難怪蔣介石關(guān)押張學(xué)良一輩子

西安事變死了多少人?難怪蔣介石關(guān)押張學(xué)良一輩子

瑩瑩的歷史說
2026-03-08 11:19:32
利物浦換帥實錘!新教練已簽 3 年協(xié)議,斯洛特只剩一條生路

利物浦換帥實錘!新教練已簽 3 年協(xié)議,斯洛特只剩一條生路

瀾歸序
2026-03-10 02:41:50
41+19+11!給機會楊瀚森就是中國版約基奇

41+19+11!給機會楊瀚森就是中國版約基奇

林子說事
2026-03-09 20:03:44
你最爽的經(jīng)歷是什么?網(wǎng)友:約過一個比我大好幾歲的姐姐

你最爽的經(jīng)歷是什么?網(wǎng)友:約過一個比我大好幾歲的姐姐

帶你感受人間冷暖
2026-02-16 01:10:39
不吹不黑,這就是真實的海南!

不吹不黑,這就是真實的海南!

慢游人吳暉
2026-03-09 19:09:19
王毅同科威特外交大臣杰拉赫通電話

王毅同科威特外交大臣杰拉赫通電話

界面新聞
2026-03-09 22:37:39
毛骨悚然!網(wǎng)傳西安二婚大專女,找月薪2萬985未婚男,全款車房…

毛骨悚然!網(wǎng)傳西安二婚大專女,找月薪2萬985未婚男,全款車房…

火山詩話
2026-03-08 06:10:43
A股:突然反轉(zhuǎn),不出意外!明天(3月10日)的市場會這樣走

A股:突然反轉(zhuǎn),不出意外!明天(3月10日)的市場會這樣走

風(fēng)風(fēng)順
2026-03-10 04:00:03
一堆人不知道!iPhone內(nèi)置防暈車神器:網(wǎng)友實測超強大

一堆人不知道!iPhone內(nèi)置防暈車神器:網(wǎng)友實測超強大

快科技
2026-03-08 18:15:04
恐怖!深圳一男子被確診艾滋病,傳染他的,是在上高中的17歲男生

恐怖!深圳一男子被確診艾滋病,傳染他的,是在上高中的17歲男生

火山詩話
2026-03-09 09:07:09
文身執(zhí)槍,為弟出征:三個孩子的母親,把悲痛活成鎧甲

文身執(zhí)槍,為弟出征:三個孩子的母親,把悲痛活成鎧甲

老馬拉車莫少裝
2026-03-09 13:23:02
2026-03-10 06:48:50

科技要聞

OpenClaw更新,"養(yǎng)蝦"再也不會犯健忘癥了

頭條要聞

媒體:美軍用極殘酷方式擊沉伊朗軍艦 令世界不寒而栗

頭條要聞

媒體:美軍用極殘酷方式擊沉伊朗軍艦 令世界不寒而栗

體育要聞

36連勝終結(jié)!大魔王也是可以戰(zhàn)勝的

娛樂要聞

薛之謙老婆懷二胎,現(xiàn)身產(chǎn)檢心情愉快

財經(jīng)要聞

油價破100美元年內(nèi)漲80% 全球市場劇震

汽車要聞

對標(biāo)奔馳小號G級 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

藝術(shù)
家居
教育
公開課
軍事航空

藝術(shù)要聞

扎哈·哈迪德事務(wù)所未來或更名

家居要聞

獨棟獨院 精致親子墅

教育要聞

“趕緊把你兒子放生了吧!”8天花了3w,換來兒子34分,母親崩潰

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊媒發(fā)布小學(xué)被炸瞬間 戰(zhàn)斧導(dǎo)彈從天而降

無障礙瀏覽 進入關(guān)懷版
×