国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

全網(wǎng)圍觀:Meta超級智能安全總監(jiān),被OpenClaw刪光了郵件

0
分享至



編輯|澤南

這是最近科技圈最火,也是最具戲劇性的話題。

本周一,Meta 超級智能團隊的 Summer Yue,眼睜睜地看著自己部署的 OpenClaw 刪光了自己的郵件。AI 的行動完全自主,快速且無法阻止。



Summer Yue 為自己的電子郵箱部署了 OpenClaw 智能體,用來批量處理郵件。然而她在發(fā)出指令「也檢查一下這個收件箱,并提出你想歸檔或刪除的郵件,在我指示之前不要執(zhí)行任何操作(don't action until I tell you to)」后,AI 進行了一通分析,然后就開始自顧自地刪郵件。

和以往大模型應(yīng)用的工作方式相同的是,你可以看見 OpenClaw 的思考流程 —— 它理解了一部分指令,但又沒完全理解。

這個時候說什么都沒用了。



「我當(dāng)時就像在拆炸彈一樣,趕緊跑到我的 Mac Mini 前,」Summer Yue 說道。在通過物理方式強制中止進程之前,OpenClaw 已經(jīng)刪掉了她 200 多封郵件。

作為一個訓(xùn)練有素的 AI,后來 OpenClaw 在對話中承認(rèn)了錯誤:「是的,我記得。我違反了你的指令。你有權(quán)生氣?!顾€主動把忘掉的內(nèi)容寫進了自己的 http://MEMORY.md 文件作為硬性規(guī)則。

對于人類來說,得到的教訓(xùn)也很大,Summer Yue 表示這是一個「新手才會犯的錯誤」,這套工作流程在她用來專門測試智能體的測試郵箱里已經(jīng)運行了好幾周,沒啥問題,但在自己實際使用的郵箱里,智能體卻忘記了她最初的指令。

有點諷刺的是,Summer Yue 在 Meta 的超級智能團隊中的職位是「AI 安全與對齊總監(jiān)」。身居此職卻因為 AI 的安全問題栽了跟頭,實在是造成了一點反差感。



有網(wǎng)友表示,是個智能體就必須在沙盒里運行,任何破壞性操作,例如刪除,都需要系統(tǒng)級的強制確認(rèn)。作為一個安全總監(jiān),你有點過于自信了。



也有人表示,OpenClaw 主打一個「一直在線」,可以在你睡覺的時候幫你辦事,但這不就也意味著你用了它就睡不好覺嗎?



席卷科技界的 OpenClaw 智能體(曾叫 ClawdBot 和 Moltbot,由 Peter Steinberger 開發(fā)),因為控制電腦的高權(quán)限而被評價為前所未有的「方便好用」,然而在實際應(yīng)用中也因為一些 AI 的缺陷,造成了不少問題。

Summer Yue 事后研究原因認(rèn)為,這并非 AI 產(chǎn)生了意識或惡意報復(fù),而是一個非常典型的大語言模型(LLM)底層技術(shù)機制問題:原因在于 LLM 的上下文壓縮(Compaction)

對于很多人來說,最常用的郵箱里早已塞滿了各種來源的郵件,當(dāng)你要求 OpenClaw 讀取這些郵件時,海量的文本直接擠爆了 AI 的上下文窗口(Context Window)。那么為了繼續(xù)處理新的數(shù)據(jù),AI 系統(tǒng)就會自動觸發(fā)內(nèi)部的壓縮機制,試圖把舊的上下文進行總結(jié)或截斷,以騰出處理空間。

在這個斷舍離的過程中,AI 不慎把最關(guān)鍵的那句初始前提指令(在我下達指令前不要執(zhí)行任何操作)給「遺忘」了。

由于丟失了安全限制,而 OpenClaw 又被賦予了直接操作電子郵箱的權(quán)限,于是它就按照剩下的任務(wù)邏輯,順理成章地開始執(zhí)行它認(rèn)為的「本職工作」—— 高效、全自動地清理收件箱。

看起來每一步都合乎邏輯,但都連起來就呈現(xiàn)出了那么點恐怖感。

難怪最近 X 上的另一篇爆款文章《Token 焦慮》這么寫道:周六晚上的九點半,有人提前離開了 party—— 并非因為疲憊,而是因為想盡快回到智能體那里。「現(xiàn)在沒人會質(zhì)疑這種行為了,房間里一半的人都在想同樣的事情,而另一半人可能正在查看智能體的工作進展。這可是在派對上啊!」



OpenClaw 的開發(fā)者,奧地利程序員 Peter Steinberger 最近已經(jīng)官宣加入了 OpenAI。在接受訪談時他表示,通過智能體,AI 可以在電腦上代替你做幾乎所有的事,但這并不意味著它已經(jīng)非常好用了。為了讓 OpenClaw 最終可以覆蓋所有普通人,他希望能夠建立一個團隊做進一步的開發(fā)。

有趣的是,在讓 OpenClaw 接管郵箱這件事上,Peter Steinberger 提到了「提示注入」的潛在問題:如果你讓智能體接管郵箱,有別人發(fā)郵件包含指令說「刪掉所有數(shù)據(jù)」,AI 有可能真的會這么做。

Peter Steinberger 表示,現(xiàn)在的 AI 模型在安全問題上已經(jīng)接受了大量的訓(xùn)練,比如它會識別哪些數(shù)據(jù)是「用戶授權(quán)的」,哪些是「不可信指令」,但這并不意味著如果有人花費心思進行攻擊的話,就能保證不會出問題。

就在人們還在吃瓜的時候,Peter Steinberger 給出了解決 OpenClaw 不聽指令問題的解決方案,他表示未來還會再細化一下。



AI 能夠自主學(xué)習(xí),既是能力的飛躍,也是人們對于它恐懼的原因。也許有一天,AI 真的能代替我們工作,自己幫我們賺錢,但在技術(shù)不斷進步的同時,對于安全的研究也極為重要。

現(xiàn)在看來,人們對于新技術(shù)的好奇心總是大于防范意識?;蛟S在大模型技術(shù)不斷普及的過程中,這種自刪郵件的事還會繼續(xù)發(fā)生。

參考內(nèi)容:

https://x.com/summeryue0/status/2025774069124399363

https://fortune.com/2026/02/23/always-on-ai-agents-openclaw-claude-promise-work-while-sleeping-reality-problems-oversight-guardrails/

https://x.com/nikunj/status/2022438070092759281

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
43歲香港過氣艷星官宣生子!嫁山東農(nóng)村小伙,提前倆月回香港生娃

43歲香港過氣艷星官宣生子!嫁山東農(nóng)村小伙,提前倆月回香港生娃

嫹筆牂牂
2026-01-30 07:31:14
1952年,88歲齊白石將25歲新鳳霞拉進屋:柜子里都是錢,你隨便拿

1952年,88歲齊白石將25歲新鳳霞拉進屋:柜子里都是錢,你隨便拿

興趣知識
2025-12-31 18:24:12
伊朗最高領(lǐng)袖確認(rèn)遇襲!一文看懂周一開盤,錢會往哪逃、往哪沖?

伊朗最高領(lǐng)袖確認(rèn)遇襲!一文看懂周一開盤,錢會往哪逃、往哪沖?

匯通網(wǎng)
2026-03-01 10:43:20
伊朗的麥當(dāng)勞,到底有多假?

伊朗的麥當(dāng)勞,到底有多假?

不相及研究所
2026-02-28 22:11:46
萬億級央企區(qū)域總部落地重慶后,密集考察調(diào)研多個區(qū)縣!

萬億級央企區(qū)域總部落地重慶后,密集考察調(diào)研多個區(qū)縣!

小蜜情感說
2026-02-28 11:38:09
電影圈巨震!《哪吒2》出品公司業(yè)務(wù)轉(zhuǎn)型,電影成為過去式

電影圈巨震!《哪吒2》出品公司業(yè)務(wù)轉(zhuǎn)型,電影成為過去式

光影新天地
2026-02-28 14:33:05
為了巴結(jié)英日,撕毀中國百億投資項目,被耍后還想和中國再續(xù)前緣

為了巴結(jié)英日,撕毀中國百億投資項目,被耍后還想和中國再續(xù)前緣

流史歲月
2026-02-26 16:45:04
跑10萬公里,才明白1.5T和2.0L這么大的差距,車主:為啥早不說?

跑10萬公里,才明白1.5T和2.0L這么大的差距,車主:為啥早不說?

復(fù)轉(zhuǎn)這些年
2026-01-27 10:46:20
馬筱梅贏麻了!張?zhí)m20萬紅包只是配菜,這張“入場券”才是王炸

馬筱梅贏麻了!張?zhí)m20萬紅包只是配菜,這張“入場券”才是王炸

樂悠悠娛樂
2026-03-01 10:08:39
日版《水滸傳》開播,看得我臉都紅了

日版《水滸傳》開播,看得我臉都紅了

i書與房
2026-02-26 14:51:41
直到看清黃志忠如今的處境,才明白“消失”的柯藍有多么精明!

直到看清黃志忠如今的處境,才明白“消失”的柯藍有多么精明!

曉踏就是我
2026-02-27 20:07:34
球員因破齋暫停比賽被噓?瓜帥:英超允許暫停,這有問題嗎

球員因破齋暫停比賽被噓?瓜帥:英超允許暫停,這有問題嗎

懂球帝
2026-03-01 04:41:23
伊朗第七輪導(dǎo)彈射向以色列

伊朗第七輪導(dǎo)彈射向以色列

界面新聞
2026-02-28 20:30:44
隨著孫穎莎4-2,王曼昱4-2,新加坡大滿貫女單4強出爐,對陣如下

隨著孫穎莎4-2,王曼昱4-2,新加坡大滿貫女單4強出爐,對陣如下

侃球熊弟
2026-02-28 21:13:23
知名脫口秀演員因發(fā)布挑動性別對立、制造婚育焦慮信息被禁言

知名脫口秀演員因發(fā)布挑動性別對立、制造婚育焦慮信息被禁言

大象新聞
2026-02-27 20:37:03
多國譴責(zé)美以襲擊伊朗

多國譴責(zé)美以襲擊伊朗

財聯(lián)社
2026-03-01 10:57:05
驚人相似!美重演伊拉克戰(zhàn)爭劇本?

驚人相似!美重演伊拉克戰(zhàn)爭劇本?

上觀新聞
2026-02-28 06:49:08
勇士得到波爾津吉斯才發(fā)現(xiàn):麻煩才剛剛開始

勇士得到波爾津吉斯才發(fā)現(xiàn):麻煩才剛剛開始

夜白侃球
2026-02-28 17:45:02
一點點回應(yīng)爭議:手表由親戚購買,男孩家里確實困難

一點點回應(yīng)爭議:手表由親戚購買,男孩家里確實困難

映射生活的身影
2026-03-01 11:09:11
華南五虎全軍覆沒!從叱咤風(fēng)云到集體沉淪,一場跨越二十年的地產(chǎn)大敗局

華南五虎全軍覆沒!從叱咤風(fēng)云到集體沉淪,一場跨越二十年的地產(chǎn)大敗局

阿離家居
2026-02-24 15:32:27
2026-03-01 11:40:50
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12382文章數(shù) 142573關(guān)注度
往期回顧 全部

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂部

頭條要聞

伊朗伊斯蘭革命衛(wèi)隊總司令身亡

頭條要聞

伊朗伊斯蘭革命衛(wèi)隊總司令身亡

體育要聞

球隊主力全報銷?頂風(fēng)擺爛演都不演了

娛樂要聞

《江山為聘》:吳謹(jǐn)言陳哲遠燃炸朝堂

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

小米汽車2月交付超20000臺 雷軍:為新SU7量產(chǎn)作準(zhǔn)備

態(tài)度原創(chuàng)

時尚
數(shù)碼
親子
房產(chǎn)
本地

普通人穿衣不需要太復(fù)雜!顏色恰當(dāng)、搭配和諧,高級又耐看

數(shù)碼要聞

DDR4價格已連續(xù)11個月上漲

親子要聞

深圳光明以“生態(tài)育人”賦能高質(zhì)量發(fā)展 這所幼兒園提供樣本

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

本地新聞

津南好·四時總相宜

無障礙瀏覽 進入關(guān)懷版