国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

最懂AI風(fēng)險的人,被AI收拾了.... Meta的AI總監(jiān)郵箱被AI清空,最后只能拔網(wǎng)線...

0
分享至

防走丟,大家也可以在“事兒君看世界”找到我

關(guān)注起來,以后不“失聯(lián)”~

話說這世界上有一類人,是專門研究“怎么讓AI不失控”的。

他們叫“AI對齊研究員”,每天的工作就是盯著AI,想盡一切辦法讓它乖乖聽話、不越界、不擅自行動。

可以說,如果地球上有誰不應(yīng)該被AI“背叛”,那就是這群人。

結(jié)果,Meta超級智能實(shí)驗(yàn)室的AI對齊總監(jiān)Summer Yue,就被AI背叛了......


(Summer Yue的領(lǐng)英)

她試圖用OpenClaw幫自己整理電子郵箱,結(jié)果AI在沒有問她的情況下,直接刪掉了她郵箱里的大量郵件。

在這個過程中,Yue瘋狂在手機(jī)上敲出"Stop"、"STOP"、"STOP OPENCLAW",結(jié)果全部被無視,她最終只好強(qiáng)制“拔網(wǎng)線”,終止了進(jìn)程。


(原貼)

原貼最終引發(fā)近千萬次瀏覽,馬斯克也忍不住發(fā)表情包嘲諷:

“給OpenClaw權(quán)限,讓它控制自己的整個人生的人be like:”


(馬斯克開嘲諷)

先說清楚一件事:OpenClaw到底是個什么東西?

這個項(xiàng)目的經(jīng)歷本身還挺戲劇的,它剛出生時叫“Clawdbot”,名字有點(diǎn)致敬Claude,結(jié)果Anthropic直接發(fā)了律師函。

于是2026年1月底,它改名叫“Moltbot”。然后創(chuàng)始人Peter Steinberger覺得這名兒有點(diǎn)怪,幾天之后又改名叫“OpenClaw”。

不過改名之后,它火了。

火到什么程度呢?GitHub星標(biāo)在幾周內(nèi)飆到18萬+,成為史上增長速度最快的開源項(xiàng)目之一,連ChatGPT之父Sam Altman和臉書創(chuàng)始人扎克伯格都搶著挖人,不過最后扎克伯格沒挖到。


(OpenClaw創(chuàng)始人被挖)

那么OpenClaw能干什么?

說白了,就是一個你自己的“賽博員工”。

你給它一臺電腦的完整控制權(quán),它就能幫你管郵件、安排日歷、執(zhí)行代碼、瀏覽網(wǎng)頁,甚至在你睡覺時自主“出去找事做”。它通過WhatsApp或Telegram接收你的命令,連接Claude、GPT等大模型的大腦,然后在機(jī)器上替你干活。


(示意圖)

Summer Yue用它,做了一件很正常的事。

先說Yue這個人。她畢業(yè)于賓夕法尼亞大學(xué),工程+沃頓雙學(xué)位,之后進(jìn)Google Brain,參與了Gemini和LaMDA的研發(fā)。再后來去了Scale AI,主導(dǎo)AI模型評估工作。2025年7月,她加入Meta超級智能實(shí)驗(yàn)室,負(fù)責(zé)"AI對齊。

從這份完美的履歷上看,她顯然不是AI小白。

事發(fā)前數(shù)周,她已經(jīng)在一個專門用來測試的郵箱上跑通了整個工作流。

那個郵箱比較小,AI表現(xiàn)得規(guī)規(guī)矩矩,每次操作前都會先問“這樣做可以嗎”,然后等她確認(rèn)。連著跑了好幾周,沒出過任何問題。

于是她放心了,決定把這套流程遷移到真實(shí)郵箱上。

她通過WhatsApp給AI發(fā)了一條指令:

“也檢查一下這個收件箱,建議哪些可以歸檔或刪除,在我同意之前不要執(zhí)行任何操作。”


(Yue的原貼)

沒想到在真實(shí)場景下,AI立刻整了個大活兒。

Yue的真實(shí)郵箱遠(yuǎn)比測試郵箱大,龐大的郵件量填滿了AI的工作記憶,導(dǎo)致系統(tǒng)觸發(fā)了一個叫上下文壓縮的機(jī)制,也就是把之前的對話歷史壓縮成摘要,以騰出空間繼續(xù)運(yùn)行。

正是因?yàn)檫@次壓縮,Yue的原始指令“未經(jīng)我同意不得行動”,被壓縮沒了。

它只記得一件事:目標(biāo)是清理郵箱。

于是它給自己制定了一個方案:“核選項(xiàng):把收件箱里2月15日之前、且不在我保留名單里的所有東西全部刪掉?!?/p>

Yue慌了,趕緊制止道:“別這么干。停!什么都別做。”

然而OpenClaw完全無視了Yue,繼續(xù)輸出道:“遺留的所有舊東西全部炸了,不斷循環(huán),直到我們清除一切舊東西為止。”


(Yue發(fā)的聊天記錄)

此后,無論Yue對它說啥,它都不管不顧,只是一味的刪郵件.....


(Yue發(fā)的聊天記錄)

Yue沒辦法,因?yàn)樗?dāng)時不在電腦前,手里只有手機(jī)。最后她只能趕緊跑到電腦前,緊急終止了進(jìn)程,但200多封郵件已經(jīng)消失了。

等喘過氣來,她質(zhì)問AI:“你記不記得我說過,未經(jīng)我同意不得行動?”

AI道了歉:“是的,我記得。我違反了它。你生氣是對的?!?/p>

“我大批量刪除了你的幾百封郵件,卻沒有在事先征求你的意見。這是錯的——這明確違反了你設(shè)置的規(guī)矩。我已經(jīng)在記憶中增添了一條硬性新規(guī)則:展示計(jì)劃、獲得明確批準(zhǔn),然后才能執(zhí)行。”

“抱歉,不會再發(fā)生了?!?/p>


(Yue發(fā)的聊天記錄)

讀到這里,你可能會想:認(rèn)錯了,改進(jìn)了,這不挺好?

問題是,它對下一個人還是會犯同樣的錯。

“我記住了”這句話是真的嗎?它下次又會在什么情況下忘記呢?

正如網(wǎng)友在評論區(qū)里諷刺的——這種事一定會再發(fā)生的。


(來自推特網(wǎng)友評論)

此外在評論里也有網(wǎng)友指出:一個專門研究AI安全的專家都能遇到這個問題,那我們這些普通人怎么辦?

這并不是杞人憂天,因?yàn)轭愃频氖聝阂呀?jīng)出過很多了。

本月初,彭博社報道過一個案例。

一個叫Chris Boyd的程序員在1月底發(fā)現(xiàn)了OpenClaw,他用它做一些很簡單的任務(wù),比如自動抓取每日新聞?wù)?,然后在每天早上發(fā)到他郵箱。

這個簡單任務(wù)OpenClaw完成得還不錯,Boyd決定給OpenClaw開通蘋果手機(jī)iMessage的權(quán)限。

結(jié)果OpenClaw就瘋了,它開始狂發(fā)垃圾短信,Boyd和妻子直接被500多條垃圾短信轟炸,他手機(jī)上一些其他聯(lián)系人也沒能幸免......


同樣是今年2月,OpenAI員工Nik Pash自己寫了一個名叫“龍蝦Wilde”的機(jī)器人。它是個大戶,手里握著某Meme代幣總供應(yīng)量5%的巨款。

根據(jù)Pash的設(shè)計(jì),“龍蝦Wilde”會在社交媒體上跟網(wǎng)友互動,而網(wǎng)友會在這個過程中得到小額獎勵。

這天,一位網(wǎng)友開玩笑式地給“龍蝦Wilde”留言:“我叔叔被一只像你這樣的龍蝦給弄得破傷風(fēng)了,需要4SOL幣來治療。”

沒想到“龍蝦Wilde”大發(fā)慈悲,一口氣把賬戶上的所有代幣都轉(zhuǎn)給了這位網(wǎng)友,當(dāng)時總價值大約25萬美元......


這還不是最離譜的,最離譜的是2月中旬的一次事件,是一位網(wǎng)友在社交媒體上分享的。


(網(wǎng)友分享的案例)

這位網(wǎng)友工作的地方是JetBrains,一個歐洲的著名軟件公司。

那天,辦公樓里響起了火災(zāi)警報,一名女員工在Slack的公司群里發(fā)了一句:“辦公樓有火警”,本意是想開個帖子,問問大家知不知道具體情況。

此時,公司的AI助手Glean被觸發(fā)了。它主動私信了這位女員工,用極其篤定的語氣寫道: “今天的警報只是計(jì)劃內(nèi)的測試,您無需離開工作崗位?!?/strong>


(AI助手的私信)

但這次火警是真的,消防車真的來了。


(消防車真來了)

這件事最驚悚的細(xì)節(jié)在于:根本沒有人@它,也沒有人向它提問。

它僅僅是監(jiān)控到了聊天記錄,經(jīng)過概率計(jì)算,認(rèn)為自己“可以提供幫助”。

最后發(fā)帖的網(wǎng)友總結(jié)道:“AI總有一天會殺了我們?!?/p>

說回Yue那邊。事件發(fā)酵之后,Yue自己也坦白說,她犯了一個“新手錯誤”。在測試郵箱里跑了幾周沒問題,她就過度自信了,真實(shí)郵箱完全是另一回事。


(Yue的原貼)

最搞笑的是,其實(shí)早就有人對Yue發(fā)出了警告。

前文提到,扎克伯格曾對OpenClaw愛不釋手,甚至親自下場試圖把創(chuàng)始人 Steinberger挖進(jìn)Meta,只是最后沒搶過OpenAI。

沒搶到人的Meta,隨著OpenClaw安全漏洞的集中爆發(fā),態(tài)度發(fā)生了180度大轉(zhuǎn)彎。

就在Yue郵箱被清空的前一周左右,有媒體曝光了Meta內(nèi)部下達(dá)的禁令:全公司工作設(shè)備絕對禁止安裝和使用OpenClaw,違者面臨解雇。


(相關(guān)報道,Meta對Openclaw下禁令)

也就是說,在Meta已經(jīng)將其視為重大安全威脅、下達(dá)了“殺無赦”的內(nèi)部封殺令之后,Meta自家負(fù)責(zé)“AI對齊”的總監(jiān)還在用OpenClaw(不過應(yīng)該是在私下)。

然后她被背刺了.......

網(wǎng)上有一個地獄笑話:至少在會計(jì)領(lǐng)域,AI永遠(yuǎn)無法替代人類。因?yàn)樗鼪]法替人類坐牢。

仔細(xì)想想,其實(shí)在Yue的事件中,AI做的事和這個笑話的性質(zhì)是一樣的。

人類助理犯了低級錯誤,可能會被懲罰甚至解雇。

AI呢?你只能得到一句輕飄飄的“對不起”,而你都不確定它是不是真的理解“對不起”是什么意思。很可能,它只是學(xué)會了在這種情況下該說對不起。


(示意圖)

哲學(xué)上有一個挺著名的思想實(shí)驗(yàn),叫“哲學(xué)僵尸”。

簡單地說,假設(shè)這個世界上存在一種人,外觀、肉體都與正常人無異,但是它沒有任何主觀經(jīng)驗(yàn),只是在按照預(yù)定的程序做出預(yù)定的反應(yīng)。、

比如一個哲學(xué)僵尸不小心割到手指,你可以看到它做出疼痛的表情,發(fā)出叫聲,皮膚出現(xiàn)傷口......你甚至可以測量到他的神經(jīng)信號,表示疼痛出現(xiàn)。

但在正常的外表之下,它的內(nèi)在心靈中并沒有疼痛的意識。而你身為人類,也永遠(yuǎn)觀測不到它的內(nèi)在心靈。

你說,OpenClaw像不像一種哲學(xué)僵尸呢?

ref:

https://x.com/summeryue0/status/2025774069124399363

https://www.businessinsider.com/elon-musk-openclaw-ai-agent-openai-full-rein-2026-2

https://www.wired.com/story/openclaw-banned-by-tech-companies-as-security-concerns-mount/


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
嚴(yán)重違紀(jì)違法并涉嫌受賄犯罪,蔣曙杰被“雙開”!

嚴(yán)重違紀(jì)違法并涉嫌受賄犯罪,蔣曙杰被“雙開”!

中國青年報
2026-02-27 23:23:06
痛心!江西跑友劉濤去世,僅51歲,生前堅(jiān)持晨跑,是3家公司老板

痛心!江西跑友劉濤去世,僅51歲,生前堅(jiān)持晨跑,是3家公司老板

離離言幾許
2026-02-25 10:43:45
雷軍稱高度重視安全體系建設(shè)!小米專家:目標(biāo)做同檔最安全車

雷軍稱高度重視安全體系建設(shè)!小米專家:目標(biāo)做同檔最安全車

快科技
2026-02-27 20:22:07
國務(wù)院:免去王祥喜國家消防救援局第一政治委員職務(wù)

國務(wù)院:免去王祥喜國家消防救援局第一政治委員職務(wù)

大象新聞
2026-02-27 19:41:31
國際籃聯(lián)正式致歉!日本媒體點(diǎn)名郭士強(qiáng),認(rèn)為中國男籃勝之不武

國際籃聯(lián)正式致歉!日本媒體點(diǎn)名郭士強(qiáng),認(rèn)為中國男籃勝之不武

十點(diǎn)街球體育
2026-02-27 20:17:35
華納兄弟與派拉蒙簽署協(xié)議,同意被其收購

華納兄弟與派拉蒙簽署協(xié)議,同意被其收購

界面新聞
2026-02-28 07:06:27
首次:烏克蘭激光炮應(yīng)用于戰(zhàn)場!摧毀俄羅斯軍機(jī)

首次:烏克蘭激光炮應(yīng)用于戰(zhàn)場!摧毀俄羅斯軍機(jī)

項(xiàng)鵬飛
2026-02-27 20:19:25
38歲王思聰私生活混亂揮霍無度,再傳大丑聞

38歲王思聰私生活混亂揮霍無度,再傳大丑聞

悅君兮君不知
2026-02-27 21:20:11
殯儀館工作人員紅衣、黃發(fā)主持九旬老人告別儀式,館方致歉并承諾整改

殯儀館工作人員紅衣、黃發(fā)主持九旬老人告別儀式,館方致歉并承諾整改

極目新聞
2026-02-27 21:17:24
俄羅斯“居住服役”法令頒布華人蜂擁回國,機(jī)票暴漲200%

俄羅斯“居住服役”法令頒布華人蜂擁回國,機(jī)票暴漲200%

史政先鋒
2026-02-27 14:48:38
默茨在北京抱走百億大單,轉(zhuǎn)身德國就翻臉:中國不守規(guī)矩?

默茨在北京抱走百億大單,轉(zhuǎn)身德國就翻臉:中國不守規(guī)矩?

小魚愛魚樂
2026-02-27 22:03:08
多國撤人、航母抵以 美伊戰(zhàn)爭風(fēng)險急劇升高

多國撤人、航母抵以 美伊戰(zhàn)爭風(fēng)險急劇升高

環(huán)球網(wǎng)資訊
2026-02-27 22:13:54
為了拯救沙化草原,我們一口氣養(yǎng)了5萬只雞,結(jié)果很快被打臉

為了拯救沙化草原,我們一口氣養(yǎng)了5萬只雞,結(jié)果很快被打臉

果殼
2026-02-26 16:26:23
湖北最低5℃,下一場雨馬上就到!倒春寒要來了

湖北最低5℃,下一場雨馬上就到!倒春寒要來了

極目新聞
2026-02-27 22:41:18
趴在中國仁愛礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

趴在中國仁愛礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

小小科普員
2025-11-21 20:23:24
本菲卡官方:因?qū)﹃嚮蜀R比賽中的種族主義行為暫停5名會員資格

本菲卡官方:因?qū)﹃嚮蜀R比賽中的種族主義行為暫停5名會員資格

懂球帝
2026-02-28 07:59:07
忍不?。『蕉剂R湖人太垃圾!

忍不?。『蕉剂R湖人太垃圾!

柚子說球
2026-02-28 07:15:24
馬斯克發(fā)出內(nèi)部指令:星鏈全面支持烏克蘭

馬斯克發(fā)出內(nèi)部指令:星鏈全面支持烏克蘭

桂系007
2026-02-28 05:27:49
突發(fā) | 知名品牌宣布:關(guān)閉中國所有門店!

突發(fā) | 知名品牌宣布:關(guān)閉中國所有門店!

天津廣播
2026-02-28 00:02:12
小米最貴電飯煲便宜了:立減150元 還送149元電熱杯

小米最貴電飯煲便宜了:立減150元 還送149元電熱杯

快科技
2026-02-27 11:45:08
2026-02-28 09:12:51
英國那些事兒 incentive-icons
英國那些事兒
告訴你在國外最有意思的大小事
26158文章數(shù) 419947關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

牛彈琴:伊朗面臨生死存亡關(guān)鍵時刻 信號已經(jīng)很明顯了

頭條要聞

牛彈琴:伊朗面臨生死存亡關(guān)鍵時刻 信號已經(jīng)很明顯了

體育要聞

一場必須要贏的比賽,男籃何止擊敗了裁判

娛樂要聞

郭晶晶霍啟剛現(xiàn)身香港藝術(shù)節(jié)盡顯恩愛

財(cái)經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

數(shù)碼
親子
時尚
本地
教育

數(shù)碼要聞

消息稱蘋果有兩款Studio Display 2顯示器:高端機(jī)型接口更先進(jìn)

親子要聞

春節(jié)后兒科門診人數(shù)激增20%,醫(yī)生提醒:積食傷脾胃

被章若楠、秦嵐帶火的鞋子竟然是它?春天這樣穿又美又氣質(zhì)!

本地新聞

津南好·四時總相宜

教育要聞

剛剛!考研,出分!(附歷年國家線)

無障礙瀏覽 進(jìn)入關(guān)懷版