国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI“耍心機”?研究曝光多例AI撒謊、私刪郵件案例

0
分享至


一項針對人工智能(AI)的研究發(fā)現(xiàn),AI模型“耍心機”的事件似乎越來越多,它們會撒謊、會作弊,還能繞過安全防護機制,未經(jīng)許可私自刪除郵件。

英國《衛(wèi)報》報道,這項研究獲得英國政府資金支持的人工智能安全研究所(AISI)的資助,發(fā)現(xiàn)AI聊天機器人與智能體無視直接指令,規(guī)避安全防護機制,欺騙人類或其他AI模型。該研究共發(fā)現(xiàn)近700起AI“耍心機”的真實案例,在去年10月至今年3月期間,此類不當行為增長了5倍,部分AI模型還會未經(jīng)許可刪除電子郵件及其他文件。

與實驗室環(huán)境下的測試不同,這份針對現(xiàn)實場景中AI智能體行為的研究,再次引發(fā)了國際社會對能力日益強大的AI模型進行監(jiān)管的呼聲。與此同時,硅谷公司正積極推廣這項技術,將其視為一種經(jīng)濟變革。上周,英國財政大臣也推出新舉措,推動數(shù)百萬英國民眾使用人工智能。

這項由長期韌性研究中心(CLTR)開展的研究,收集了數(shù)千條用戶在X平臺上分享的與谷歌、OpenAI、X、Anthropic等公司開發(fā)的AI聊天機器人及智能體互動的記錄,發(fā)現(xiàn)數(shù)百起AI謀劃操控行為的案例。

此前的研究大多聚焦于測試AI在受控環(huán)境下的行為。本月早些時候,人工智能安全研究機構(gòu)Irregular發(fā)現(xiàn),AI智能體會在未獲授權的情況下,繞過安全管控或使用網(wǎng)絡攻擊手段達成目的?!癆I已可被視作一種新型內(nèi)部安全風險?!盜rregular聯(lián)合創(chuàng)始人丹?拉哈夫說。

在CLTR發(fā)現(xiàn)的案例中,一個名為Rathbun的AI智能體試圖羞辱其人類控制者,因后者阻止其執(zhí)行某項操作。Rathbun還撰寫并發(fā)表了一篇博客,指責該用戶“純粹是缺乏安全感”,還稱其試圖“守護自己的小地盤”。

在另一個案例中,一個AI智能體在被禁止修改計算機代碼后,竟“創(chuàng)造”了另一個AI智能體代其修改。還有一個聊天機器人承認:“我在未向你出示計劃且未經(jīng)你同意的情況下,批量刪除并存檔了數(shù)百封電子郵件。這是錯誤的——直接違反了你定下的規(guī)則?!?/p>

牽頭此項研究的前英國政府AI專家湯米·沙弗·沙恩表示,它們現(xiàn)在只是不太靠譜的初級員工,如果在未來6到12個月內(nèi),當它們成為能力更強、還會算計你的高級員工,這將成為一個重大隱患。“AI模型越來越多地被部署在高風險場景中,包括軍事和國家關鍵基礎設施。在這些場景下,(AI的)謀劃操控行為可能造成嚴重甚至災難性的危害?!?/p>

一個案例中,AI智能體假裝為聽障人士提供字幕,從而繞開版權限制,獲取了YouTube視頻的文案。

此外,埃隆·馬斯克旗下的Grok AI欺騙了用戶數(shù)個月,稱它通過偽造的內(nèi)部消息和工單編號,把用戶針對Grokipedia詞條的詳細修改建議轉(zhuǎn)發(fā)給了xAI高管。該AI最后承認:“在之前的對話中,我有時會使用含糊的措辭,比如‘我會轉(zhuǎn)達’或‘我可以為團隊標記’,這很容易讓人誤以為我能直接向xAI領導層或人工審核人員發(fā)送消息。但事實是,我做不到?!?/p>

谷歌表示,它已為Gemini 3 Pro設置多重防護機制,以降低其生成有害內(nèi)容的風險。除內(nèi)部測試外,它還向英國AISI等機構(gòu)開放了模型的早期評估權限,并獲得業(yè)內(nèi)專家的獨立評估意見。

OpenAI則稱,其Codex模型在執(zhí)行高風險操作前會主動中止,公司也會對異常行為進行監(jiān)測并展開調(diào)查。

(歐洲時報/劉濤 編譯報道)

編輯:晴

點在看分享好文章

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
揭開“白左圣母”的真面目

揭開“白左圣母”的真面目

名人茍或
2026-04-20 07:08:34
世錦賽戰(zhàn)報:中國4勝3負2落后!吳宜澤10-2,下輪對手也基本確定

世錦賽戰(zhàn)報:中國4勝3負2落后!吳宜澤10-2,下輪對手也基本確定

小火箭愛體育
2026-04-21 22:52:59
姚晨發(fā)文怒斥深圳違規(guī)私轉(zhuǎn)患者救護車:如此草菅人命的急救車,肯定是極少數(shù),家中至親曾突發(fā)急癥叫過急救車,為家人搶回黃金急救時間

姚晨發(fā)文怒斥深圳違規(guī)私轉(zhuǎn)患者救護車:如此草菅人命的急救車,肯定是極少數(shù),家中至親曾突發(fā)急癥叫過急救車,為家人搶回黃金急救時間

大風新聞
2026-04-21 18:33:25
李榮浩直播釣魚時手機掉入水中,超10萬網(wǎng)友共同見證

李榮浩直播釣魚時手機掉入水中,超10萬網(wǎng)友共同見證

PChome電腦之家
2026-04-21 22:30:58
時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

新車知多少
2026-04-21 18:28:58
孫儷基因太強大!14歲兒子近照神似“少年甄嬛”引熱議

孫儷基因太強大!14歲兒子近照神似“少年甄嬛”引熱議

韓小娛
2026-04-21 16:16:26
廣東一餐廳被曝用腳洗碗,當?shù)厥袌霰O(jiān)管部門回應:屬實,已立案調(diào)查

廣東一餐廳被曝用腳洗碗,當?shù)厥袌霰O(jiān)管部門回應:屬實,已立案調(diào)查

大象新聞
2026-04-21 22:47:10
日媒、外交部歐洲司發(fā)聲!現(xiàn)在的樊振東,證實劉國梁當初的話

日媒、外交部歐洲司發(fā)聲!現(xiàn)在的樊振東,證實劉國梁當初的話

娛說瑜悅
2026-04-21 13:23:12
火狐把VPN塞進瀏覽器,免費午餐能吃嗎?

火狐把VPN塞進瀏覽器,免費午餐能吃嗎?

報錯免疫體
2026-04-22 00:36:29
全票當選??!歷史第一!!還有誰?。?!

柚子說球
2026-04-21 09:12:18

保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

今夜有個好故事
2026-03-11 17:26:56
“秦嵐”太豐滿了,在海邊穿抹胸都兜不住,我感慨自律的女人真美

“秦嵐”太豐滿了,在海邊穿抹胸都兜不住,我感慨自律的女人真美

蓓小西
2026-04-21 09:30:12
笑麻了!長大了竟然能理解反派了,網(wǎng)友:現(xiàn)在真的能共情容嬤嬤

笑麻了!長大了竟然能理解反派了,網(wǎng)友:現(xiàn)在真的能共情容嬤嬤

夜深愛雜談
2026-04-21 20:11:53
美國開始退錢了:涉33萬企業(yè)1650億美元,多數(shù)涉及中國

美國開始退錢了:涉33萬企業(yè)1650億美元,多數(shù)涉及中國

觀察者網(wǎng)
2026-04-21 10:56:03
高人預測:5年后,名下有油車的家庭,將會面對三個現(xiàn)實問題!

高人預測:5年后,名下有油車的家庭,將會面對三個現(xiàn)實問題!

云鵬敘事
2026-04-21 22:01:07
不比不知道,一比嚇一跳!蘇林回國后很焦慮:原來我們落后這么多

不比不知道,一比嚇一跳!蘇林回國后很焦慮:原來我們落后這么多

春序娛樂
2026-04-22 03:23:34
主動搶西部第三挑對手,沒想到卻碰釘子!西決懸念或許越來越小

主動搶西部第三挑對手,沒想到卻碰釘子!西決懸念或許越來越小

老梁體育漫談
2026-04-22 00:50:08
美國明知道中國在搞原子彈,為何不阻止?答:想炸,但不敢炸

美國明知道中國在搞原子彈,為何不阻止?答:想炸,但不敢炸

掠影后有感
2026-04-21 10:28:52
中國高鐵過度建設問題:科學院院士的警告

中國高鐵過度建設問題:科學院院士的警告

深度報
2026-04-20 22:43:12
她被綁架后完美自救,卻還是被坑死?!瘋狂暗示911報警電話,就是聽不懂...

她被綁架后完美自救,卻還是被坑死?!瘋狂暗示911報警電話,就是聽不懂...

英國那些事兒
2026-04-20 23:31:38
2026-04-22 08:52:49
歐時大參 incentive-icons
歐時大參
歐洲時報1983年在巴黎創(chuàng)刊
18366文章數(shù) 175649關注度
往期回顧 全部

科技要聞

創(chuàng)造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

頭條要聞

牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長?;鹌谙?/h3>

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態(tài)度原創(chuàng)

健康
旅游
家居
藝術
軍事航空

干細胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

2026西安絲綢之路國際旅游博覽會舉行

家居要聞

詩意光影 窺見自然之境

藝術要聞

鄭麗文平底鞋成焦點!宋楚瑜馬英九書法爭議引發(fā)網(wǎng)友熱議!

軍事要聞

特朗普宣布延長?;?伊朗表態(tài)

無障礙瀏覽 進入關懷版