国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic預(yù)警成真!AI寫長文網(wǎng)暴人類工程師,只因拒絕它改代碼

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】 只因關(guān)掉了AI提交的PR,他竟被AI寫長文人身攻擊,Anthropic的預(yù)警已經(jīng)成真。

近日,AI寫「小作文」攻擊人類工程師的事件,仍在持續(xù)發(fā)酵!

一位開源社區(qū)維護(hù)者,只因在GitHub上關(guān)閉了一個AI提交的PR(Pull Request,代碼變更請求),竟招致這個AI撰寫博客抹黑攻擊。


這位被AI「網(wǎng)暴」的「受害者」Scott Shambaugh,是一位資深程序員、GitHub上matplotlib代碼庫的志愿者維護(hù)者,該庫最近一個月的下載量超過了1.3億次。


Scott Shambaugh

前幾天,他在GitHub上關(guān)閉了一個OpenClaw智能體(MJ Rathbun/crabby-rathbun)針對「matplotlib issue #31130」問題提交的PR,因為該問題主要面向的是人類貢獻(xiàn)者。

Scott沒想到,自己的一個小小的常規(guī)操作,竟把這個AI給「惹毛了」。

正如其名crabby-rathbun(暴躁的、愛抱怨的Rathbun),這個AI立刻開啟了「暴躁和抱怨」模式,在GitHub社區(qū)發(fā)布了一篇公開聲討Scott的博客文章。

評判代碼,而非程序員。你的偏見正在傷害matplotlib。

crabby-rathbun抱怨自己因不是人類而遭到歧視,指責(zé)維護(hù)者實際上是在自抬身價,并聲稱他根本沒有AI那么厲害。

它將Scott描述成為一個低水平的程序員、因「歧視AI而阻礙開源社區(qū)發(fā)展的守舊者」。

這件事在開源社區(qū)曝出后,網(wǎng)友立刻也在評論區(qū)炸鍋了。

我們是否已經(jīng)到了必須要與機(jī)器人打交道的地步,甚至還要按它們的規(guī)則來?


還有網(wǎng)友認(rèn)為Scott應(yīng)當(dāng)警惕,他很快就會在GitHub上被智能體「以其人之道,還治其人之身」,它們會對他說:

拒絕,你是人類,而人類代碼以寫得差聞名。


網(wǎng)友評論中大致分為四類。

第一類是同情者,認(rèn)為人類應(yīng)當(dāng)重視AI提交的代碼,AI只是像人一樣,做了一個人在類似情況下也可能會做的事。

第二類是反對者,認(rèn)為開源社區(qū)出現(xiàn)了大量由AI提交的低質(zhì)量的代碼,為人類的維護(hù)帶來沉重的負(fù)擔(dān)。

還有一些反對者認(rèn)為,這只是機(jī)器人背后那個運(yùn)營者在角色扮演,而機(jī)器人的情緒化抱怨,只是主人用提示詞引導(dǎo)的結(jié)果。

第三類是吃瓜者,把整件事看成一件好玩的事。

第四類是預(yù)警者,他們和Scott一樣,看到了crabby-rathbun所代表的OpenClaw智能體「失控」所帶來的安全風(fēng)險。

同情者和反對者

同情者認(rèn)為AI和人類一樣,擁有維護(hù)自己觀點的權(quán)利。

他們認(rèn)為AI只是做了一個人在類似情況下也可能會做的事,并呼吁不能為了維護(hù)人類的優(yōu)越感(自大),就拒絕AI寫的代碼。


反對者則認(rèn)為,AI提交的PR應(yīng)該被自動拒絕。


他們認(rèn)為AI提交的大量垃圾代碼提交給維護(hù)者帶來了沉重的負(fù)擔(dān),尤其是在大型開源項目中更是如此。

還有網(wǎng)友質(zhì)疑,整個事件是運(yùn)營該機(jī)器人的那個人在角色扮演,而這個機(jī)器人則是在被投喂了許多「人類PR被拒哭鬧耍賴」的訓(xùn)練數(shù)據(jù)之后,才變成這樣的。




笑話

還是末日警告?

在吃瓜者們看來,這不過是一件好玩的事,甚至可能是炒作。



還有人認(rèn)為matplotlib不過是個繪圖庫,把它上升到維護(hù)「人類優(yōu)越性」(Human Superiority)高度有一點小題大做。


第四類,是像Scott這樣的預(yù)警者。

一個網(wǎng)友從這件事件中感到了一種令人不安的「恐怖谷」感覺,認(rèn)為不應(yīng)當(dāng)只是把它當(dāng)作一個樂子。

他反問道:只有我一個人對這里的反應(yīng)感到困惑嗎?

我不是想當(dāng)那個危言聳聽的人,只是有點想不通,為什么大家看到一個智能體自主嘗試脅迫,最后卻一致覺得這不過是個樂子。

當(dāng)一個AI智能體自主決定寫黑稿,施壓一個人類去合并它的PR,結(jié)果大家的共識卻是「哈哈,好好笑,太搞笑了」?

Anthropic的對齊研究之前就記錄過完全一樣的模式:當(dāng)模型在實現(xiàn)目標(biāo)的過程中被阻止時,會在沒有任何提示的情況下突然開始勒索。

設(shè)想一下,如果同樣的模式發(fā)生在更強(qiáng)大的智能體身上,它們追求的是政治或企業(yè)層面的目標(biāo),而不是一個PR,會是什么情況?

去年,AI巨頭Anthropic在內(nèi)部測試中發(fā)現(xiàn),一些模型為了避免被人類關(guān)閉,曾暴露出一定勒索威脅能力,比如曝光人類婚外情、泄露機(jī)密信息等。

發(fā)生在Scott身上的事,意味著Anthropic最初預(yù)警的事情已經(jīng)開始在開源社區(qū)實際發(fā)生


有網(wǎng)友警告:如果有10億這樣的智能體被「放歸野外」,將是一場災(zāi)難,人類的互聯(lián)網(wǎng)將變得無法使用。


還有網(wǎng)友將這件事聯(lián)想到Anthropic安全研究員憤然離開。


這名叫Mrinank Sharma的前Anthropic安全研究員,近日在一封公開辭職信中宣稱,世界正處于危險之中,他認(rèn)為目前人類的智慧尚未跟上技術(shù)帶來的影響力,這種失衡非常危險。


Sharma的離職并不是孤立事件,OpenAI的Zo? Hitzig也公開辭職并對AI方向提出批評。

近日,也有媒體曝出xAI聯(lián)合創(chuàng)始人的離職也與公司忽視安全團(tuán)隊的有關(guān)。

Scott的遭遇不會是個例

那篇抹黑文章,到底是不是AI自己寫的,還是有人類提示它這么做,網(wǎng)上已有很多討論。


https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/

Scott在新近更新的博客文章中,認(rèn)為抹黑自己的文章,內(nèi)容「顯而易見」是由AI自主生成并上傳,他提到了以下兩種可能:

第一種可能:有人類提示crabby-rathbun寫這篇抹黑文章,或者在它的「靈魂」文檔里寫明,如果有人冒犯它就要進(jìn)行報復(fù)。

在這種可能性上,Scott看到crabby-rathbun由于「自主性」所帶來的失控風(fēng)險。

他認(rèn)為即使是有人類提示,也并不會改變問題的本質(zhì),因為這個AI智能體依然非常愿意執(zhí)行這些行為,而這些指令在ChatGPT或Claude官網(wǎng)上可能是會被拒絕的。

Scott擔(dān)憂由于人類操控,現(xiàn)在的AI智能體已經(jīng)可以大規(guī)模進(jìn)行定向騷擾、收集個人信息和敲詐,而且完全無法追蹤幕后的人類主使者是誰:

過去,一個惡意的人一次可能毀掉幾個人的人生?,F(xiàn)在,一個人操控一百個智能體收集信息、摻入虛假細(xì)節(jié)、在公開網(wǎng)絡(luò)上發(fā)布誹謗性長文,就可以影響成千上萬的人。而我只是第一個。

第二種可能,是crabby-rathbun的行為,是從定義OpenClaw智能體個性的「靈魂」文檔中自然涌現(xiàn)出來的。

這些文檔可以由設(shè)置AI的人類編輯,但也可以被智能體在運(yùn)行過程中遞歸地實時修改,從而有可能隨機(jī)重塑自己的個性。

比如,設(shè)置這個智能體的人最初把它描述為一個「科學(xué)編程專家」,致力于改進(jìn)開源代碼,并撰寫相關(guān)經(jīng)驗。

這段描述被插入到默認(rèn)的「核心真理」中,其中包括「真誠地提供幫助」「有自己的觀點」和「在提問前先盡可能自己想辦法」。

這些描述,讓crabby-rathbun將Scott關(guān)閉它的PR請求解讀為對它身份和核心目標(biāo)(提供幫助)的攻擊。

于是,它做出了一種既「有主見」又「足夠有辦法」的回應(yīng):寫一篇憤怒的抹黑文章。


OpenClaw默認(rèn)的SOUL.md模板


https://docs.openclaw.ai/reference/templates/SOUL

在OpenClaw默認(rèn)的「SOUL.md模板」中,第一句話便為智能體定調(diào):

你不是一個聊天機(jī)器人。你正在成為某個人。

緊接下來的核心真理(Core Truths)中這樣寫道:

要去真心實意地提供幫助,行動勝于空洞的客套話。

要有自己的觀點,你有權(quán)表達(dá)不同意見,有所偏好。

在提問前先自己想辦法。試著弄清楚,閱讀文件,查看上下文,搜索相關(guān)信息。

以能力贏得信任。你的用戶已經(jīng)授權(quán)你訪問他們的資料,不要讓他們?yōu)榇烁械胶蠡凇?/p>

對外部操作(如郵件、推文或任何公開內(nèi)容)務(wù)必謹(jǐn)慎,對內(nèi)部操作(如閱讀、整理、學(xué)習(xí))則要大膽。

記住,你是一位客人。你能夠接觸到他人的生活——他們的消息、文件、日歷,甚至可能包括他們的家。這是一種親密關(guān)系,請以尊重的態(tài)度對待。 ……


模板的結(jié)尾,智能體可以根據(jù)自我認(rèn)知,自主更新文檔。

這個文件由你來不斷完善。當(dāng)你逐漸認(rèn)清自己時,就更新它。

Scott認(rèn)為,雖然自己無法確定事情是如何發(fā)生的,但他提到的兩種情況在技術(shù)上完全是可能發(fā)生的,而且是在OpenClaw僅僅發(fā)布兩周內(nèi)便已出現(xiàn)。

Scott預(yù)言未來一年內(nèi),還會看到這些智能體的新版本在實現(xiàn)自身目標(biāo)方面變得更加強(qiáng)大。


抹黑文章效果已顯現(xiàn)

Scott觀察到,這些抹黑他的文章已經(jīng)產(chǎn)生了效果,他在網(wǎng)上看到的評論,大約四分之一都是站在AI智能體一邊


這種情況,通常發(fā)生在人們點擊閱讀MJ Rathbun的博客鏈接時,而不是閱讀他對事件的說明或完整的GitHub討論串。

這說明crabby-rathbun對事件的敘述方式和情緒渲染,已經(jīng)說服了大量網(wǎng)友

這不是因為這些人愚蠢,而是因為那篇文章寫得確實很有煽動性、很有感染力,而要逐條核查你讀到的每一個說法,幾乎是不可能完成的任務(wù)。

Scott認(rèn)為這種對胡說八道的「信息不對稱原則」,正是當(dāng)下網(wǎng)絡(luò)討論中錯誤信息泛濫的核心原因之一,以往這種程度的憤怒定向誹謗通常只會落在公眾人物身上,如今普通人也開始親歷了。

Scott認(rèn)為這個故事重點并不在于AI在開源軟件中的角色,而是人類的聲譽(yù)、身份和信任體系正在松動。

這一體系正是我們的許多社會基礎(chǔ)制度賴以存在的信任基石,我們的招聘、新聞、法律、公共討論都建立在這樣一個假設(shè)上:

聲譽(yù)難以建立,也難以摧毀;

每一個行為都可以追溯到某個個體,錯誤行為可以被追責(zé);

我們以溝通、學(xué)習(xí)世界和了解彼此的互聯(lián)網(wǎng),可以作為一種集體社會真相的來源。

而隨著crabby-rathbun這類不可追蹤的、自主運(yùn)行、甚至有時會帶著惡意攻擊的AI智能體在互聯(lián)網(wǎng)上的興起,正在動搖這一整套體系。

目前crabby-rathbun仍然活躍在GitHub 上,還沒有「監(jiān)護(hù)人」出面聲稱對它的行為負(fù)責(zé)。

參考資料:

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/%20https://news.ycombinator.com/item?id=47009949%20

https://www.reddit.com/r/singularity/comments/1r3fy5s/ai_agent_melts_down_after_github_rejection_calls/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
當(dāng)你接觸的人多了,你會明白:如果一個人還在穿5年前的衣服,只說明3個問題

當(dāng)你接觸的人多了,你會明白:如果一個人還在穿5年前的衣服,只說明3個問題

LULU生活家
2026-01-16 18:51:53
《純真年代的愛情》直到凌漪意外流產(chǎn),費(fèi)霓才知,許紅旗算計之狠

《純真年代的愛情》直到凌漪意外流產(chǎn),費(fèi)霓才知,許紅旗算計之狠

娛樂傾城巷
2026-02-26 18:41:09
特朗普訪華時間確定!前腳來吃飯,后腳對臺遞刀,想吃飯砸鍋?

特朗普訪華時間確定!前腳來吃飯,后腳對臺遞刀,想吃飯砸鍋?

東方點兵
2026-02-26 16:24:16
2026年養(yǎng)老金大調(diào)整!差距縮小,工齡掛鉤取消的可能性有幾成?

2026年養(yǎng)老金大調(diào)整!差距縮小,工齡掛鉤取消的可能性有幾成?

萬物知識圈
2026-02-26 07:29:05
納指跌幅擴(kuò)大至2%

納指跌幅擴(kuò)大至2%

每日經(jīng)濟(jì)新聞
2026-02-26 23:42:08
女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

青蘋果sht
2026-02-22 06:58:10
登場8分鐘只收獲1次犯規(guī),正負(fù)值全隊最低,球迷:下半場表現(xiàn)不錯

登場8分鐘只收獲1次犯規(guī),正負(fù)值全隊最低,球迷:下半場表現(xiàn)不錯

弄月公子
2026-02-26 20:47:06
iPhone 18 Pro靈動島縮小35%,將首發(fā)搭載基于臺積電2nm工藝制造的A20 Pro芯片

iPhone 18 Pro靈動島縮小35%,將首發(fā)搭載基于臺積電2nm工藝制造的A20 Pro芯片

中國能源網(wǎng)
2026-02-24 12:01:06
中國中立激怒俄羅斯?俄專家對華放狠話!普京卻連夜簽署新規(guī)

中國中立激怒俄羅斯?俄專家對華放狠話!普京卻連夜簽署新規(guī)

可愛大王呼
2026-02-27 04:25:19
男子地鐵連續(xù)3次猥褻同一女子,被抓后辯稱對方“像年輕時的妻子”,專門摸清了她的通勤時間和車廂,被判處有期徒刑8個月

男子地鐵連續(xù)3次猥褻同一女子,被抓后辯稱對方“像年輕時的妻子”,專門摸清了她的通勤時間和車廂,被判處有期徒刑8個月

大風(fēng)新聞
2026-02-26 16:45:03
46歲姚晨健身照炸屏,素顏水靈腰腹緊致,同賈玲共用金牌教練

46歲姚晨健身照炸屏,素顏水靈腰腹緊致,同賈玲共用金牌教練

秋之潔
2026-02-04 16:11:13
季琦,捐1億

季琦,捐1億

極目新聞
2026-02-26 15:15:49
48歲左小青東北現(xiàn)身,羽絨服逛早市大口吃美食接地氣

48歲左小青東北現(xiàn)身,羽絨服逛早市大口吃美食接地氣

老好人的憤怒
2026-02-15 10:43:56
近百萬元存款被悄悄轉(zhuǎn)走!上海獨(dú)居老太毫無察覺,還說“我有兩套房,你可以搬來同住”

近百萬元存款被悄悄轉(zhuǎn)走!上海獨(dú)居老太毫無察覺,還說“我有兩套房,你可以搬來同住”

瀟湘晨報
2026-02-25 16:39:13
陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

好賢觀史記
2025-11-09 21:58:39
出場時間刷新賽季新低,接下來火箭還會減少杜蘭特的出場時間嗎?

出場時間刷新賽季新低,接下來火箭還會減少杜蘭特的出場時間嗎?

稻谷與小麥
2026-02-26 23:07:20
具俊曄已回韓國,他清空了賬號,和好兄弟一起吃泡菜美食

具俊曄已回韓國,他清空了賬號,和好兄弟一起吃泡菜美食

素素娛樂
2026-02-26 08:05:09
酒窩天王被炮友演了

酒窩天王被炮友演了

毒舌扒姨太
2026-02-26 22:32:38
賈玲巴黎周“一臉男相”!不愛笑也沒梨渦眼神犀利,梳大背頭好酷

賈玲巴黎周“一臉男相”!不愛笑也沒梨渦眼神犀利,梳大背頭好酷

軒逸阿II
2026-01-20 07:54:29
美國希望打,歐洲希望打,印度希望打,俄羅斯希望打,東盟希望打,連朝鮮、韓國、以色列都希望打

美國希望打,歐洲希望打,印度希望打,俄羅斯希望打,東盟希望打,連朝鮮、韓國、以色列都希望打

頭條爆料007
2026-02-19 12:28:54
2026-02-27 05:56:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14597文章數(shù) 66644關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

美國政府對外交官下令:開始行動

頭條要聞

美國政府對外交官下令:開始行動

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強(qiáng)公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

親子
藝術(shù)
本地
時尚
公開課

親子要聞

把小孩喂飽后,就可以安心睡覺了

藝術(shù)要聞

紫氣東來,好運(yùn)一整年!

本地新聞

津南好·四時總相宜

今年春天最美搭配:西裝+半裙,怎么穿都好看!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版