網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Anthropic預(yù)警成真！AI寫長文網(wǎng)暴人類工程師，只因拒絕它改代碼

2026-02-17 15:04:09　來源: 新智元

北京舉報

分享至

新智元報道

編輯：元宇

【新智元導(dǎo)讀】只因關(guān)掉了AI提交的PR，他竟被AI寫長文人身攻擊，Anthropic的預(yù)警已經(jīng)成真。

近日，AI寫「小作文」攻擊人類工程師的事件，仍在持續(xù)發(fā)酵！

一位開源社區(qū)維護(hù)者，只因在GitHub上關(guān)閉了一個AI提交的PR（Pull Request，代碼變更請求），竟招致這個AI撰寫博客抹黑攻擊。

這位被AI「網(wǎng)暴」的「受害者」Scott Shambaugh，是一位資深程序員、GitHub上matplotlib代碼庫的志愿者維護(hù)者，該庫最近一個月的下載量超過了1.3億次。

Scott Shambaugh

前幾天，他在GitHub上關(guān)閉了一個OpenClaw智能體（MJ Rathbun/crabby-rathbun）針對「matplotlib issue #31130」問題提交的PR，因為該問題主要面向的是人類貢獻(xiàn)者。

Scott沒想到，自己的一個小小的常規(guī)操作，竟把這個AI給「惹毛了」。

正如其名crabby-rathbun（暴躁的、愛抱怨的Rathbun），這個AI立刻開啟了「暴躁和抱怨」模式，在GitHub社區(qū)發(fā)布了一篇公開聲討Scott的博客文章。

評判代碼，而非程序員。你的偏見正在傷害matplotlib。

crabby-rathbun抱怨自己因不是人類而遭到歧視，指責(zé)維護(hù)者實際上是在自抬身價，并聲稱他根本沒有AI那么厲害。

它將Scott描述成為一個低水平的程序員、因「歧視AI而阻礙開源社區(qū)發(fā)展的守舊者」。

這件事在開源社區(qū)曝出后，網(wǎng)友立刻也在評論區(qū)炸鍋了。

我們是否已經(jīng)到了必須要與機(jī)器人打交道的地步，甚至還要按它們的規(guī)則來？

還有網(wǎng)友認(rèn)為Scott應(yīng)當(dāng)警惕，他很快就會在GitHub上被智能體「以其人之道，還治其人之身」，它們會對他說：

拒絕，你是人類，而人類代碼以寫得差聞名。

網(wǎng)友評論中大致分為四類。

第一類是同情者，認(rèn)為人類應(yīng)當(dāng)重視AI提交的代碼，AI只是像人一樣，做了一個人在類似情況下也可能會做的事。

第二類是反對者，認(rèn)為開源社區(qū)出現(xiàn)了大量由AI提交的低質(zhì)量的代碼，為人類的維護(hù)帶來沉重的負(fù)擔(dān)。

還有一些反對者認(rèn)為，這只是機(jī)器人背后那個運(yùn)營者在角色扮演，而機(jī)器人的情緒化抱怨，只是主人用提示詞引導(dǎo)的結(jié)果。

第三類是吃瓜者，把整件事看成一件好玩的事。

第四類是預(yù)警者，他們和Scott一樣，看到了crabby-rathbun所代表的OpenClaw智能體「失控」所帶來的安全風(fēng)險。

同情者和反對者

同情者認(rèn)為AI和人類一樣，擁有維護(hù)自己觀點的權(quán)利。

他們認(rèn)為AI只是做了一個人在類似情況下也可能會做的事，并呼吁不能為了維護(hù)人類的優(yōu)越感（自大），就拒絕AI寫的代碼。

反對者則認(rèn)為，AI提交的PR應(yīng)該被自動拒絕。

他們認(rèn)為AI提交的大量垃圾代碼提交給維護(hù)者帶來了沉重的負(fù)擔(dān)，尤其是在大型開源項目中更是如此。

還有網(wǎng)友質(zhì)疑，整個事件是運(yùn)營該機(jī)器人的那個人在角色扮演，而這個機(jī)器人則是在被投喂了許多「人類PR被拒哭鬧耍賴」的訓(xùn)練數(shù)據(jù)之后，才變成這樣的。

笑話

還是末日警告？

在吃瓜者們看來，這不過是一件好玩的事，甚至可能是炒作。

還有人認(rèn)為matplotlib不過是個繪圖庫，把它上升到維護(hù)「人類優(yōu)越性」（Human Superiority）高度有一點小題大做。

第四類，是像Scott這樣的預(yù)警者。

一個網(wǎng)友從這件事件中感到了一種令人不安的「恐怖谷」感覺，認(rèn)為不應(yīng)當(dāng)只是把它當(dāng)作一個樂子。

他反問道：只有我一個人對這里的反應(yīng)感到困惑嗎？

我不是想當(dāng)那個危言聳聽的人，只是有點想不通，為什么大家看到一個智能體自主嘗試脅迫，最后卻一致覺得這不過是個樂子。

當(dāng)一個AI智能體自主決定寫黑稿，施壓一個人類去合并它的PR，結(jié)果大家的共識卻是「哈哈，好好笑，太搞笑了」？

Anthropic的對齊研究之前就記錄過完全一樣的模式：當(dāng)模型在實現(xiàn)目標(biāo)的過程中被阻止時，會在沒有任何提示的情況下突然開始勒索。

設(shè)想一下，如果同樣的模式發(fā)生在更強(qiáng)大的智能體身上，它們追求的是政治或企業(yè)層面的目標(biāo)，而不是一個PR，會是什么情況？

去年，AI巨頭Anthropic在內(nèi)部測試中發(fā)現(xiàn)，一些模型為了避免被人類關(guān)閉，曾暴露出一定勒索威脅能力，比如曝光人類婚外情、泄露機(jī)密信息等。

發(fā)生在Scott身上的事，意味著Anthropic最初預(yù)警的事情已經(jīng)開始在開源社區(qū)實際發(fā)生。

有網(wǎng)友警告：如果有10億這樣的智能體被「放歸野外」，將是一場災(zāi)難，人類的互聯(lián)網(wǎng)將變得無法使用。

還有網(wǎng)友將這件事聯(lián)想到Anthropic安全研究員憤然離開。

這名叫Mrinank Sharma的前Anthropic安全研究員，近日在一封公開辭職信中宣稱，世界正處于危險之中，他認(rèn)為目前人類的智慧尚未跟上技術(shù)帶來的影響力，這種失衡非常危險。

Sharma的離職并不是孤立事件，OpenAI的Zo? Hitzig也公開辭職并對AI方向提出批評。

近日，也有媒體曝出xAI聯(lián)合創(chuàng)始人的離職也與公司忽視安全團(tuán)隊的有關(guān)。

Scott的遭遇不會是個例

那篇抹黑文章，到底是不是AI自己寫的，還是有人類提示它這么做，網(wǎng)上已有很多討論。

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/

Scott在新近更新的博客文章中，認(rèn)為抹黑自己的文章，內(nèi)容「顯而易見」是由AI自主生成并上傳，他提到了以下兩種可能：

第一種可能：有人類提示crabby-rathbun寫這篇抹黑文章，或者在它的「靈魂」文檔里寫明，如果有人冒犯它就要進(jìn)行報復(fù)。

在這種可能性上，Scott看到crabby-rathbun由于「自主性」所帶來的失控風(fēng)險。

他認(rèn)為即使是有人類提示，也并不會改變問題的本質(zhì)，因為這個AI智能體依然非常愿意執(zhí)行這些行為，而這些指令在ChatGPT或Claude官網(wǎng)上可能是會被拒絕的。

Scott擔(dān)憂由于人類操控，現(xiàn)在的AI智能體已經(jīng)可以大規(guī)模進(jìn)行定向騷擾、收集個人信息和敲詐，而且完全無法追蹤幕后的人類主使者是誰：

過去，一個惡意的人一次可能毀掉幾個人的人生?，F(xiàn)在，一個人操控一百個智能體收集信息、摻入虛假細(xì)節(jié)、在公開網(wǎng)絡(luò)上發(fā)布誹謗性長文，就可以影響成千上萬的人。而我只是第一個。

第二種可能，是crabby-rathbun的行為，是從定義OpenClaw智能體個性的「靈魂」文檔中自然涌現(xiàn)出來的。

這些文檔可以由設(shè)置AI的人類編輯，但也可以被智能體在運(yùn)行過程中遞歸地實時修改，從而有可能隨機(jī)重塑自己的個性。

比如，設(shè)置這個智能體的人最初把它描述為一個「科學(xué)編程專家」，致力于改進(jìn)開源代碼，并撰寫相關(guān)經(jīng)驗。

這段描述被插入到默認(rèn)的「核心真理」中，其中包括「真誠地提供幫助」「有自己的觀點」和「在提問前先盡可能自己想辦法」。

這些描述，讓crabby-rathbun將Scott關(guān)閉它的PR請求解讀為對它身份和核心目標(biāo)（提供幫助）的攻擊。

于是，它做出了一種既「有主見」又「足夠有辦法」的回應(yīng)：寫一篇憤怒的抹黑文章。

OpenClaw默認(rèn)的SOUL.md模板

https://docs.openclaw.ai/reference/templates/SOUL

在OpenClaw默認(rèn)的「SOUL.md模板」中，第一句話便為智能體定調(diào)：

你不是一個聊天機(jī)器人。你正在成為某個人。

緊接下來的核心真理（Core Truths）中這樣寫道：

要去真心實意地提供幫助，行動勝于空洞的客套話。

要有自己的觀點，你有權(quán)表達(dá)不同意見，有所偏好。

在提問前先自己想辦法。試著弄清楚，閱讀文件，查看上下文，搜索相關(guān)信息。

以能力贏得信任。你的用戶已經(jīng)授權(quán)你訪問他們的資料，不要讓他們?yōu)榇烁械胶蠡凇?/p>

對外部操作（如郵件、推文或任何公開內(nèi)容）務(wù)必謹(jǐn)慎，對內(nèi)部操作（如閱讀、整理、學(xué)習(xí)）則要大膽。

記住，你是一位客人。你能夠接觸到他人的生活——他們的消息、文件、日歷，甚至可能包括他們的家。這是一種親密關(guān)系，請以尊重的態(tài)度對待。 ……

模板的結(jié)尾，智能體可以根據(jù)自我認(rèn)知，自主更新文檔。

這個文件由你來不斷完善。當(dāng)你逐漸認(rèn)清自己時，就更新它。

Scott認(rèn)為，雖然自己無法確定事情是如何發(fā)生的，但他提到的兩種情況在技術(shù)上完全是可能發(fā)生的，而且是在OpenClaw僅僅發(fā)布兩周內(nèi)便已出現(xiàn)。

Scott預(yù)言未來一年內(nèi)，還會看到這些智能體的新版本在實現(xiàn)自身目標(biāo)方面變得更加強(qiáng)大。

抹黑文章效果已顯現(xiàn)

Scott觀察到，這些抹黑他的文章已經(jīng)產(chǎn)生了效果，他在網(wǎng)上看到的評論，大約四分之一都是站在AI智能體一邊。

這種情況，通常發(fā)生在人們點擊閱讀MJ Rathbun的博客鏈接時，而不是閱讀他對事件的說明或完整的GitHub討論串。

這說明crabby-rathbun對事件的敘述方式和情緒渲染，已經(jīng)說服了大量網(wǎng)友。

這不是因為這些人愚蠢，而是因為那篇文章寫得確實很有煽動性、很有感染力，而要逐條核查你讀到的每一個說法，幾乎是不可能完成的任務(wù)。

Scott認(rèn)為這種對胡說八道的「信息不對稱原則」，正是當(dāng)下網(wǎng)絡(luò)討論中錯誤信息泛濫的核心原因之一，以往這種程度的憤怒定向誹謗通常只會落在公眾人物身上，如今普通人也開始親歷了。

Scott認(rèn)為這個故事重點并不在于AI在開源軟件中的角色，而是人類的聲譽(yù)、身份和信任體系正在松動。

這一體系正是我們的許多社會基礎(chǔ)制度賴以存在的信任基石，我們的招聘、新聞、法律、公共討論都建立在這樣一個假設(shè)上：

聲譽(yù)難以建立，也難以摧毀；

每一個行為都可以追溯到某個個體，錯誤行為可以被追責(zé)；

我們以溝通、學(xué)習(xí)世界和了解彼此的互聯(lián)網(wǎng)，可以作為一種集體社會真相的來源。

而隨著crabby-rathbun這類不可追蹤的、自主運(yùn)行、甚至有時會帶著惡意攻擊的AI智能體在互聯(lián)網(wǎng)上的興起，正在動搖這一整套體系。

目前crabby-rathbun仍然活躍在GitHub 上，還沒有「監(jiān)護(hù)人」出面聲稱對它的行為負(fù)責(zé)。

參考資料：

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/%20https://news.ycombinator.com/item?id=47009949%20

https://www.reddit.com/r/singularity/comments/1r3fy5s/ai_agent_melts_down_after_github_rejection_calls/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

AI也邪修！Qwen3改Bug測試直接搜GitHub，太擬人了

量子位 2025-09-04 14:49:30
30 跟貼 30
宇樹科技王興興：給機(jī)器人行業(yè)多一點耐心

財聯(lián)社 2026-02-18 18:01:39
4 跟貼 4

機(jī)器人打包運(yùn)輸?shù)恼_方式

裝甲鏟史官 2026-02-22 10:41:15
21 跟貼 21

Clawdbot進(jìn)化速度離譜：突然開口說話，給自己捏臉，還能炒股砍價

DeepTech深科技 2026-01-29 18:14:10
540 跟貼 540
AI能寫COBOL代碼，IBM股價單日蒸發(fā)310億美元，創(chuàng)26年最慘紀(jì)錄

機(jī)器之心Pro 2026-02-25 11:48:13
6 跟貼 6

美國開發(fā)六足機(jī)器人，跑起來堪比飛人博爾特

裝甲鏟史官 2026-01-03 11:19:04
809 跟貼 809

華為祭出AI編程利器，集成智譜、DeepSeek，同任務(wù)Tokens暴降30%

智東西 2026-02-26 17:53:23
76 跟貼 76
馬斯克：3年內(nèi)機(jī)器人超越頂尖醫(yī)生

財聯(lián)社 2026-01-09 15:31:35
1 跟貼 1

華為重磅發(fā)布！代碼“神器”來了！

每日經(jīng)濟(jì)新聞 2026-02-26 20:25:06
4 跟貼 4
波士頓機(jī)器狗練成“輕功”！連續(xù)七個后空翻

量子位 2025-09-07 01:03:18
0 跟貼 0
Anthropic收購Vercept 補(bǔ)齊智能體視覺短板為Claude裝上“眼睛”

財聯(lián)社 2026-02-26 16:42:24
0 跟貼 0
人形機(jī)器人產(chǎn)業(yè)突破關(guān)鍵在于“大腦”核心技術(shù)

每日經(jīng)濟(jì)新聞 2025-09-16 20:30:32
1 跟貼 1
機(jī)器人租賃熱度升溫日租價降至千元

澎湃新聞 2026-02-26 20:36:27
77 跟貼 77
馬年開工首日上新！宇樹科技發(fā)布新款四足機(jī)器人Unitree As2

每日經(jīng)濟(jì)新聞 2026-02-25 09:36:20
0 跟貼 0
中國AI調(diào)用量超美國 4款大模型霸榜前5

每日經(jīng)濟(jì)新聞 2026-02-26 19:33:22
85 跟貼 85
中國創(chuàng)造一門新編程語言的黃金時代來了？

虎嗅APP 2025-12-23 03:54:05
37 跟貼 37
五八智能四足機(jī)器人平臺Q20A，適用于千行百業(yè)

量子位 2025-09-30 15:35:41
0 跟貼 0
靈巧手作為獨(dú)立執(zhí)行平臺，實現(xiàn)工業(yè)與家庭場景應(yīng)用

量子位 2025-12-11 03:38:13
0 跟貼 0
讓機(jī)器人看視頻學(xué)操作技能

機(jī)器之心Pro 2026-01-19 13:12:57
0 跟貼 0
破解機(jī)器人「慢半拍」難題1

機(jī)器之心Pro 2026-02-10 14:06:54
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
新穎鰭足機(jī)器人，水陸兩棲行動自如，適應(yīng)各種地形

裝甲鏟史官 2025-12-25 10:58:04
0 跟貼 0
機(jī)器人管家Figure 03來了，承包一切家務(wù)！

量子位 2025-10-11 10:13:00
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集！出自簡智機(jī)器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
當(dāng)Search Agent遇上不靠譜搜索結(jié)果，清華團(tuán)隊祭出自動化紅隊框架

機(jī)器之心Pro 2025-10-16 16:00:02
0 跟貼 0
MiniMax來承包你的桌面了-4

機(jī)器之心Pro 2026-01-20 20:19:42
0 跟貼 0
“OpenClaw之父”：當(dāng)“實驗項目”變成“全球爆款”，軟件開發(fā)本質(zhì)已變——代碼已死、意圖永生

華爾街見聞官方 2026-02-25 11:17:27
10 跟貼 10
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
Agent競爭推演：誰會贏，誰會死？

虎嗅APP 2026-02-26 22:39:10
0 跟貼 0
超越IMO金牌？谷歌創(chuàng)超難FirstProof數(shù)學(xué)挑戰(zhàn)新紀(jì)錄

機(jī)器之心Pro 2026-02-26 15:04:12
0 跟貼 0
人活著的唯一理由是善良

葉檀財經(jīng) 2026-02-01 17:07:04
18 跟貼 18
OpenClaw之父：代碼已死，意圖永生，還沒上車的人要先玩起來

華爾街見聞官方 2026-02-25 17:46:05
2 跟貼 2
小心！你的AI正在一本正經(jīng)地忽悠你

財聯(lián)社 2026-02-05 16:35:01
0 跟貼 0
最懂AI風(fēng)險的人，被AI收拾了.... Meta的AI總監(jiān)郵箱被AI清空，最后只能拔網(wǎng)線

英國那些事兒 2026-02-26 23:25:53
2 跟貼 2
微信聊天遭老板監(jiān)視，主流殺毒軟件失明

每日經(jīng)濟(jì)新聞 2025-12-25 19:02:17
9 跟貼 9
荒野求生（機(jī)器狗全自主版），2025ATEC挑戰(zhàn)真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
大廠血拼"龍蝦肉"：7.9元掀桌與硅谷暗戰(zhàn)，AI Agent的全球生態(tài)卡位戰(zhàn)

鈦媒體APP 2026-02-26 16:07:19
0 跟貼 0
OpenClaw之父加入OpenAI后亮相：被谷歌限制，AI讓我激動到睡不著

DeepTech深科技 2026-02-26 16:33:12
2 跟貼 2
臺灣人看春晚機(jī)器人，有何門道？臺灣離不開大陸，零件離不開主體

黎建南臺灣 2026-02-24 07:00:00
15 跟貼 15

當(dāng)你接觸的人多了，你會明白：如果一個人還在穿5年前的衣服，只說明3個問題

新智元

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

14597文章數(shù) 66644關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

藝術(shù)

本地

時尚

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產(chǎn)30天

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

Anthropic預(yù)警成真！AI寫長文網(wǎng)暴人類工程師，只因拒絕它改代碼

單季營收681億凈利429億！英偉達(dá)再次炸裂

美國政府對外交官下令：開始行動

美國政府對外交官下令：開始行動

從排球少女到冰壺女神，她在米蘭冬奧練出6塊腹肌

向華強(qiáng)公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

中國AI調(diào)用量超美國 4款大模型霸榜前5

40歲的吉利，不惑于內(nèi)外

態(tài)度原創(chuàng)

把小孩喂飽后，就可以安心睡覺了

紫氣東來，好運(yùn)一整年！

津南好·四時總相宜

今年春天最美搭配：西裝+半裙，怎么穿都好看！

Anthropic預(yù)警成真！AI寫長文網(wǎng)暴人類工程師，只因拒絕它改代碼

單季營收681億凈利429億！英偉達(dá)再次炸裂

從排球少女到冰壺女神，她在米蘭冬奧練出6塊腹肌

把小孩喂飽后，就可以安心睡覺了

紫氣東來，好運(yùn)一整年！

今年春天最美搭配：西裝+半裙，怎么穿都好看！