国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenClaw走紅背后:當(dāng)AI助手擁有你的郵箱和硬盤訪問權(quán)

0
分享至


(來源:麻省理工科技評論)

AI 智能體在使用過程中存在諸多風(fēng)險。

例如,即便僅局限在聊天窗口內(nèi),大語言模型也會出現(xiàn)錯誤,表現(xiàn)出不當(dāng)行為。一旦它們配備網(wǎng)頁瀏覽器、電子郵箱等可與外界交互的工具,這些錯誤帶來的后果會嚴(yán)重得多。

這或許能解釋,為何首款實現(xiàn)突破的大語言模型個人助手并非出自頭部 AI 實驗室,而是由獨立軟件工程師彼得?斯坦伯格(Peter Steinberger)研發(fā)。2025 年 11 月,斯坦伯格將這款名為 OpenClaw 的工具上傳至 GitHub 平臺,今年 1 月末,該項目迅速走紅。

OpenClaw 依托現(xiàn)有大語言模型,讓用戶打造定制化的個人助手。對部分用戶而言,這意味著要提交海量個人數(shù)據(jù),包括所有的郵件記錄與硬盤內(nèi)容,這一情況讓安全專家深感擔(dān)憂。OpenClaw 帶來的安全風(fēng)險范圍極廣,過去幾周涌現(xiàn)的相關(guān)安全分析博客文章,普通人可能需要近一周時間才能全部讀完。中國政府已公開發(fā)布警告,提示 OpenClaw 存在安全漏洞

針對這些擔(dān)憂,斯坦伯格在 X 平臺發(fā)文稱,非技術(shù)人員不應(yīng)使用該軟件。他并未回應(yīng)本文的置評請求。但市場對 OpenClaw 提供的功能需求明確,且這類需求并非只存在于能自主完成軟件安全檢測的人群中。所有希望涉足個人助手領(lǐng)域的 AI 企業(yè),都需研發(fā)保障用戶數(shù)據(jù)安全的系統(tǒng)。企業(yè)需要借鑒智能體安全前沿研究的相關(guān)技術(shù)方案。

OpenClaw 本質(zhì)上是為大語言模型配備的機械外骨骼。用戶可任選一款大語言模型作為核心驅(qū)動,這款模型會獲得更強的記憶能力,還能自主設(shè)定并定期重復(fù)執(zhí)行任務(wù)。與頭部 AI 企業(yè)推出的智能體產(chǎn)品不同,OpenClaw 智能體支持全天候運行,用戶可通過 WhatsApp 或其他即時通訊軟件與其交互。這意味著它能成為超強能力的個人助手,每天早晨用定制待辦事項提醒用戶,在用戶工作時規(guī)劃假期,空閑時開發(fā)新應(yīng)用。

但這種強大能力也伴隨相應(yīng)風(fēng)險。用戶若想讓 AI 個人助手管理收件箱,就需要授予其郵箱訪問權(quán)限,其中包含所有敏感信息;用戶若想讓助手代為購物,就需要提供信用卡信息;用戶若想讓助手在電腦上完成編寫代碼等任務(wù),就需要授予其本地文件訪問權(quán)限。

這類權(quán)限會引發(fā)多種問題。第一種是 AI 助手自身出現(xiàn)操作失誤,曾有用戶的 Google Antigravity 編程智能體清空了其整個硬盤。第二種是黑客通過常規(guī)黑客工具入侵智能體,竊取敏感數(shù)據(jù)或運行惡意代碼。OpenClaw 走紅的幾周內(nèi),安全研究人員已發(fā)現(xiàn)大量此類漏洞,缺乏安全意識的用戶會因此面臨風(fēng)險。

這兩類風(fēng)險都有應(yīng)對方法。部分用戶選擇在獨立電腦或云端運行 OpenClaw 智能體,避免硬盤數(shù)據(jù)被清空,其他漏洞可通過成熟的安全技術(shù)修復(fù)。

但本文采訪的專家,重點關(guān)注一種更隱蔽的安全風(fēng)險,即提示詞注入。提示詞注入本質(zhì)是對大語言模型的劫持。攻擊者只需在大語言模型可能瀏覽的網(wǎng)頁發(fā)布惡意文本或圖片,或?qū)⑦@類內(nèi)容發(fā)送至模型讀取的郵箱,就能操控模型按照自己的指令行動。

若這款大語言模型擁有用戶隱私信息的訪問權(quán)限,后果會十分嚴(yán)重。多倫多大學(xué)電氣與計算機工程教授尼古拉斯?帕佩諾(Nicolas Papernot)表示,使用 OpenClaw 這類工具,就像把錢包交給街上的陌生人。頭部 AI 企業(yè)能否放心推出個人助手產(chǎn)品,關(guān)鍵在于其抵御此類攻擊的防護(hù)能力。

需要明確的是,提示詞注入目前尚未引發(fā)重大安全事故,至少沒有公開的相關(guān)報道。但如今互聯(lián)網(wǎng)上已有數(shù)十萬 OpenClaw 智能體運行,提示詞注入會成為網(wǎng)絡(luò)罪犯更青睞的攻擊手段。帕佩諾表示,這類工具會促使惡意攻擊者將目標(biāo)轉(zhuǎn)向更廣泛的人群。

提示詞注入這一概念,由知名大語言模型博主西蒙?威利森(Simon Willison)在 2022 年提出,僅比 ChatGPT 發(fā)布早數(shù)月。早在當(dāng)時就可預(yù)見,大語言模型普及后,會帶來全新的安全漏洞。大語言模型無法區(qū)分用戶指令與執(zhí)行指令所需的數(shù)據(jù),郵件、網(wǎng)頁搜索結(jié)果等內(nèi)容,在模型看來都只是文本。

因此攻擊者若在郵件中嵌入幾句話,被大語言模型誤認(rèn)為用戶指令,就能操控模型執(zhí)行任何操作。

提示詞注入是棘手的難題,短期內(nèi)難以徹底解決。加州大學(xué)伯克利分校計算機科學(xué)教授 Dawn Song 表示,目前業(yè)內(nèi)尚未找到一勞永逸的防御方案。但眾多學(xué)術(shù)團(tuán)隊正在研究該問題,已提出多種策略,未來有望實現(xiàn) AI Agent 的安全應(yīng)用。

從技術(shù)角度來說,當(dāng)前使用 OpenClaw 可避免提示詞注入風(fēng)險,只需斷開其網(wǎng)絡(luò)連接。但禁止 OpenClaw 讀取郵件、管理日程、開展網(wǎng)絡(luò)調(diào)研,會喪失 AI Agent 的核心使用價值。防御提示詞注入的關(guān)鍵,是在阻止模型被劫持的同時,保留其正常工作的能力。

第一種策略是訓(xùn)練大語言模型,使其忽略提示詞注入。大語言模型研發(fā)的核心環(huán)節(jié)為后期訓(xùn)練,研發(fā)人員會讓具備文本生成能力的模型,通過合理應(yīng)答獲得正向反饋,應(yīng)答失誤則接受負(fù)向反饋,逐步成為實用的助手。

這類正向與負(fù)向反饋是象征性的,大語言模型會像動物一樣從中學(xué)習(xí)。通過這一過程,可訓(xùn)練模型拒絕執(zhí)行特定的提示詞注入指令。

但這一過程需要把握平衡。若過度訓(xùn)練模型拒絕注入指令,模型也會拒絕用戶的合理請求。大語言模型的行為本身存在隨機性,即便經(jīng)過高效訓(xùn)練,能抵御提示詞注入,偶爾仍會出現(xiàn)失誤。

第二種方法是在提示詞注入攻擊到達(dá)大語言模型前進(jìn)行攔截。通常會使用專用的檢測模型,判斷傳輸至目標(biāo)模型的數(shù)據(jù)是否包含注入內(nèi)容。但近期研究顯示,即便性能最優(yōu)的檢測模型,也無法識別部分類型的提示詞注入攻擊。

第三種策略更為復(fù)雜。該方案并非通過檢測輸入內(nèi)容是否存在注入來管控數(shù)據(jù),而是制定規(guī)則約束模型的輸出行為,避免模型執(zhí)行有害操作。

這類防御方式的部分規(guī)則十分簡單。例如限定模型僅能向預(yù)先審核的郵箱地址發(fā)送郵件,就能避免用戶信用卡信息被泄露給攻擊者。但這類規(guī)則會限制模型完成諸多實用任務(wù),比如代為調(diào)研并聯(lián)系潛在的職業(yè)人脈。

杜克大學(xué)電氣與計算機工程教授 Neil Gong 表示,難點在于如何精準(zhǔn)制定這類規(guī)則,這需要在實用性與安全性之間做出平衡。

從更廣泛的層面來看,整個智能體領(lǐng)域都在權(quán)衡這一平衡。智能體需要達(dá)到何種安全標(biāo)準(zhǔn),才能兼顧實用性與安全性,專家對此觀點不一。Song 創(chuàng)辦的 Virtue AI 公司研發(fā)智能體安全平臺,她認(rèn)為當(dāng)前已能安全部署人工智能個人助手。但 Gong 表示,行業(yè)尚未達(dá)到這一水平。

即便人工智能智能體尚未能完全抵御提示詞注入,仍有多種方法降低風(fēng)險。部分技術(shù)方案也可應(yīng)用于 OpenClaw。上周在舊金山舉辦的首屆 ClawCon 活動上,斯坦伯格宣布已聘請安全人員參與該工具的研發(fā)。目前 OpenClaw 仍存在安全漏洞,但這并未打消眾多熱衷用戶的使用熱情。

喬治?皮克特(George Pickett)是 OpenClaw GitHub 倉庫的志愿維護(hù)者,也是該工具的愛好者。他采取了多項安全措施保障使用安全,在云端運行工具,避免硬盤被誤刪,同時設(shè)置防護(hù)機制,防止他人接入自己的智能助手。

但他并未采取專門措施防范提示詞注入。他知曉這一風(fēng)險,卻未看到相關(guān)攻擊事件的報道。皮克特表示,或許這種想法很不明智,但自己不太可能成為首個被攻擊的目標(biāo)。

https://www.technologyreview.com/2026/02/11/1132768/is-a-secure-ai-assistant-possible/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
德國總理參觀宇樹科技,王興興回應(yīng):深感榮幸,此次活動是建立與德國更多企業(yè)合作的窗口

德國總理參觀宇樹科技,王興興回應(yīng):深感榮幸,此次活動是建立與德國更多企業(yè)合作的窗口

極目新聞
2026-02-26 15:25:26
年僅23歲!香港女警英年早逝,入職僅半年令人扼腕!

年僅23歲!香港女警英年早逝,入職僅半年令人扼腕!

朗威談星座
2026-02-26 04:54:45
男子網(wǎng)戀被騙9.5萬余元!松江警方破獲一起婚戀詐騙案

男子網(wǎng)戀被騙9.5萬余元!松江警方破獲一起婚戀詐騙案

上觀新聞
2026-02-24 12:19:12
日本2025年新生兒數(shù)量再創(chuàng)新低

日本2025年新生兒數(shù)量再創(chuàng)新低

上觀新聞
2026-02-26 16:34:30
女子5.5克黃金戒指換新只剩下2克,丈夫:損失三四千元,實在氣不過,店方:5G黃金是一口價的金飾工藝,不是克數(shù)

女子5.5克黃金戒指換新只剩下2克,丈夫:損失三四千元,實在氣不過,店方:5G黃金是一口價的金飾工藝,不是克數(shù)

大風(fēng)新聞
2026-02-26 15:52:03
3-2險爆冷!1號種子驚險過關(guān),陳熠蒯曼輸?shù)貌辉瑳]莎頭還真不行

3-2險爆冷!1號種子驚險過關(guān),陳熠蒯曼輸?shù)貌辉?,沒莎頭還真不行

體育就你秀
2026-02-26 15:21:28
減持字節(jié)暴賺!估值從200億美元到5500億美元,9年贏麻了

減持字節(jié)暴賺!估值從200億美元到5500億美元,9年贏麻了

財視傳播
2026-02-26 10:17:08
男子在順風(fēng)車上排便后“失聯(lián)”,車主無奈報警!平臺回應(yīng):賠償車主519元,涉事乘客已被封號

男子在順風(fēng)車上排便后“失聯(lián)”,車主無奈報警!平臺回應(yīng):賠償車主519元,涉事乘客已被封號

揚子晚報
2026-02-25 22:20:40
俄粉的好機會來了?中國總領(lǐng)館:在俄長期居留男性須至少服役1年

俄粉的好機會來了?中國總領(lǐng)館:在俄長期居留男性須至少服役1年

瑜說還休
2026-02-26 12:52:45
美軍閃電撤離,伊朗或變天,特朗普開始擔(dān)心:中方抄了美軍后路

美軍閃電撤離,伊朗或變天,特朗普開始擔(dān)心:中方抄了美軍后路

策略述
2026-02-26 13:37:08
金與正,“轉(zhuǎn)正”了

金與正,“轉(zhuǎn)正”了

中國新聞周刊
2026-02-26 17:01:40
杉杉集團(tuán)破產(chǎn),事實證明:美女主持人只會排節(jié)目,對管理無能為力

杉杉集團(tuán)破產(chǎn),事實證明:美女主持人只會排節(jié)目,對管理無能為力

天天熱點見聞
2026-02-26 08:06:55
“我老公家要絕后了,我娘家也要絕后了”,一廣西網(wǎng)友發(fā)帖引共鳴

“我老公家要絕后了,我娘家也要絕后了”,一廣西網(wǎng)友發(fā)帖引共鳴

火山詩話
2026-02-26 09:41:57
河南一蜜雪冰城店被曝用垃圾車運冰塊送后廚,店長疑刪監(jiān)控后稱:你是同行嗎?這么有正義感

河南一蜜雪冰城店被曝用垃圾車運冰塊送后廚,店長疑刪監(jiān)控后稱:你是同行嗎?這么有正義感

爆角追蹤
2026-02-26 08:12:43
巴拿馬賭輸了?撕毀長和租約后,中國占21.4%貨運量或成致命一擊

巴拿馬賭輸了?撕毀長和租約后,中國占21.4%貨運量或成致命一擊

凡知
2026-02-26 05:30:28
難以置信!整個A股被格力電器的公告嚇壞了,暫時停止補漲行情…

難以置信!整個A股被格力電器的公告嚇壞了,暫時停止補漲行情…

火山詩話
2026-02-26 15:33:19
真心喂了狗!八旬獨居老人認(rèn)快遞員為干兒子,95萬養(yǎng)老錢被盜一空

真心喂了狗!八旬獨居老人認(rèn)快遞員為干兒子,95萬養(yǎng)老錢被盜一空

派大星紀(jì)錄片
2026-02-26 14:12:57
老菜販悄悄告訴我的買菜口訣:圓的洋蔥、裂的香菇、彎的黃瓜,真不是瞎講究!

老菜販悄悄告訴我的買菜口訣:圓的洋蔥、裂的香菇、彎的黃瓜,真不是瞎講究!

三農(nóng)老歷
2026-02-26 04:49:54
平頂山打人事件仍在發(fā)酵!網(wǎng)傳劉某飛,名下竟有多達(dá)4家企業(yè)關(guān)聯(lián)

平頂山打人事件仍在發(fā)酵!網(wǎng)傳劉某飛,名下竟有多達(dá)4家企業(yè)關(guān)聯(lián)

火山詩話
2026-02-26 07:38:12
上海商場內(nèi),緊急停運!扶梯突發(fā)故障,踏板異常凸起堆疊...親歷者:幸虧出事前兩秒走下來...楊浦區(qū)回應(yīng)

上海商場內(nèi),緊急停運!扶梯突發(fā)故障,踏板異常凸起堆疊...親歷者:幸虧出事前兩秒走下來...楊浦區(qū)回應(yīng)

揚子晚報
2026-02-26 10:38:44
2026-02-26 19:24:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16325文章數(shù) 514658關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

金與正"轉(zhuǎn)正"了 戴著黑白色發(fā)箍坐在候補委員的第一位

頭條要聞

金與正"轉(zhuǎn)正"了 戴著黑白色發(fā)箍坐在候補委員的第一位

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

人民幣離岸價升破6.83 什么原因?

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

親子
游戲
教育
房產(chǎn)
軍事航空

親子要聞

寶藍(lán)幫助鄰居阿姨照顧寶寶,阿姨送寶藍(lán)玩具感謝寶藍(lán)的照顧~

Xbox用戶遭短信轟炸 官方道歉稱Xbox APP過于熱情

教育要聞

南京公辦、民辦中小學(xué)2026最新收費標(biāo)準(zhǔn)!4所民辦改革試點自主制定收費標(biāo)準(zhǔn)!

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標(biāo)桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

軍事要聞

美政府給新伊核協(xié)議設(shè)限內(nèi)容遭披露

無障礙瀏覽 進(jìn)入關(guān)懷版