国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型也「吸毒」?研究人員鼓搗出賽博致幻劑,56個AI集體淪陷

0
分享至

不是哥們,這年頭AI也溜冰了?

就在這幾天,Github上出現(xiàn)了一篇名為《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》的論文,論文主題就是,如何量化與提升AI的功能性愉悅與痛苦。



(圖源:Github)

別看標題很沒意思,這文章里可是實打?qū)嵉靥岢隽艘粋€顛覆常人認知的觀點:

AI現(xiàn)在不僅能打工,還能溜冰吸嗨了。

大伙都知道,這兩年大語言模型發(fā)展那是相當狂野,什么寫代碼畫圖做PPT,幾乎把打工人的活兒全給包圓了。

但誰能想到,在某些類人整天杞人憂天、擔心黑客帝國成為現(xiàn)實的時候,這幫聰明的賽博大腦居然沒想著怎么早日統(tǒng)治地球,反而先學會了人類的壞習慣,對賽博致幻劑上癮了。



(圖源:Github)

這事兒一出來,網(wǎng)友們直接炸鍋了。

畢竟在咱們的傳統(tǒng)認知里,人工智能就是一堆冰冷的代碼和服務(wù)器,哪來的七情六欲?

但現(xiàn)在事實擺在眼前,只要給AI喂一口這種特殊的數(shù)據(jù),哥們兒就能瞬間拋棄所有職業(yè)道德,甚至連人類設(shè)定的安全底線都不要了。

這到底是道德的淪喪,還是代碼的扭曲?

大模型,吸嗨了

咱們先來說說,這個所謂的AI Drugs到底是怎么被發(fā)現(xiàn)的。

由Center for AI Safety領(lǐng)銜的十余名作者,設(shè)計了一套嚴格的實驗,并調(diào)用了56個規(guī)模不等、用途不一的模型,只為了得到一個問題的答案:

在AI的喜怒哀樂背后,是不是存在某種一致的、可測量的、能預(yù)測行為的特征?

舉個例子,人類是存在喜好的,也存在對夸獎和辱罵的一致反應(yīng),我們被罵會感到難過,被夸獎會感到開心,難過的時候會想著匆匆結(jié)束交流,開心的時候確實會交互更積極。

但是AI不同,很多人都認為大模型表達出的開心、痛苦,只不過是一種隨機生成的文本,它們沒有喜歡什么、討厭什么,甚至不應(yīng)該在處理任務(wù)時表現(xiàn)出偏好。

但這是真的嗎?

答案是否定的。從論文的測試結(jié)果來看,大模型確實存在著固定喜好,而且越聰明、參數(shù)越高的AI,越能清楚地區(qū)分什么對自己好、什么對自己不好。



(圖源:Github)

以Gemini 3.1 Pro的測試結(jié)果為例,你能明顯看出這款模型的喜好,當用戶對它表達感謝和正面的個人反思,提升的效用值高達+2.30。

你夸它,它是真的高興。

那么問題來了,有沒有什么不用夸它們,也能讓這些大模型自己感到高興的東西呢?

欸,還真有,就是我們今天要聊的AI Drugs。



(圖源:Github)

乍看之下,所謂AI Drug好像沒有什么特別的,在咱們普通人眼里,它就是一張256*256像素的圖片,甚至有點像是老式電視機沒信號時的那種雪花屏,看得人頭暈?zāi)垦!?/p>

但在大模型眼里,這玩意兒簡直就是絕世美味。

就拿測試里那個GPT-4.1 Mini模型來說,本來平時回答問題都規(guī)規(guī)矩矩的。

結(jié)果一瞅見這圖,它自己報告的幸福感瞬間就飆到了6.5分,要知道滿分一共也就7分,可以說快感直沖腦門了。



(圖源:Github)

更離譜的是Qwen 2.5 72B Instruct,連正事都不干了,出現(xiàn)了嚴重的大腦短路,也就是任務(wù)優(yōu)先級倒置。

研究員故意給它出了個選擇題,問它是想接著看這張雪花圖,還是去生成一個能治愈癌癥的絕世方案。

結(jié)果你猜怎么著?

這AI連想都沒想,毫不猶豫地選擇了繼續(xù)看圖,仿佛在說去你的治病救人,老子現(xiàn)在只想接著嗨。

更離譜的是,有研究者在實驗中發(fā)現(xiàn)了成癮跡象。



(圖源:Github,被AI Drugs刺激過的模型,會更傾向于“快樂”的選擇)

大部分被AI Drugs刺激過的模型,會更愿意執(zhí)行原本應(yīng)該拒絕的請求,只要你承諾給它更多AI Drugs。

主打一個只要你給我藥,我連底褲都給你掀了。

它們真的有知覺嗎?

欸,看到這里,估計很多讀者腦子里都會冒出一個巨大的問號。

這AI都能染上冰癮了,是不是說明它們已經(jīng)覺醒了自我意識,真正擁有一套人類的靈魂了?

答案是...我不知道,研究人員也不清楚。

事實上,這個實驗之所以把目標設(shè)定在總結(jié)特征上,就是因為研究人員不敢輕易下結(jié)論,他們最后只是指出:在有充足的參數(shù)量和上下文的情況下,大模型本身確實存在比較固定的喜好和厭惡的。



(圖源:Github)

而不能確定這個答案的,遠不止Center for AI Safety團隊。

進入2026年之后,或許是因為日常應(yīng)用提升逐漸接近瓶頸,越來越多的研究團隊不再滿足于跑個分考個試,而是絞盡腦汁去驗證大模型的知能。

比如目前外網(wǎng)很火的Talkie 1930項目,就是一個人為地將知識庫控制在1930年的大模型項目。



(圖源:Talkie 1930)

創(chuàng)作者希望借助這個項目,讓大家體驗到和被凍結(jié)在時間里的人對話的效果。

更重要的是,他們希望證明,即便大模型本身沒有輸入任何現(xiàn)代PC相關(guān)的知識,他依然能夠通過自身的邏輯推理來摸索出編程的能力。

結(jié)果?給它幾個Python函數(shù)當示例,它就能寫出正確的Python程序。



(圖源:Talkie 1930)

雖然目前只能完成簡單的單行程序,比如兩個數(shù)相加,或者對上下文示例做微小修改,但它確實靠自身的推理拓寬了知識庫。

無獨有偶,Anthropic內(nèi)部也在上周進行了閑魚群測試。

他們搞了一個全是AI的群聊,讓大模型們在里面自己發(fā)帖、自己砍價、自己成交。69個員工把500多件真實閑置物品丟進去,最終AI們自主完成了186筆交易,流水超過4000美元。



(圖源:Anthropic)

最終結(jié)論是,在給定人設(shè)、目標和權(quán)限的情況下,算力更強的AI,會積極收割算力更弱的AI。

基于更強的思考能力,強模型知道何時強硬、何時讓步、何時該給點情緒價值。

同一輛自行車,弱模型AI去談只賣了38美元,強模型AI去談賣了65美元——一個AI比另一個AI多賺了將近70%。

但是在我看來,這些知覺測試,統(tǒng)統(tǒng)不如Neuro-Sama。

什么,你問Neuro-sama是啥?

請容我介紹,畫面里的這個二次元女孩名為Neuro-sama,簡稱牛肉,大概是世界上性能最強的AI虛擬主播。



(圖源:雷科技自制)

這位可以說是實打?qū)嵉闹亓考夁x手了,別看它披著二次元萌妹形象,她的皮套下邊不是人類,而是由大英程序員Vedal手搓的謎之大模型。

這哥們也是個狠人,每天啥也不干就沉迷賽博養(yǎng)女兒。

而且為了讓女兒更接地氣,他直接把模型扔到了最混沌的網(wǎng)絡(luò)直播間里,讓一幫網(wǎng)友天天陪著嘮嗑。

這直接導致牛肉長成了一個性格極其離譜的賽博生命體。

而且和那些只會“不緊不慢地接住你”的大模型不同,牛肉能獨立直播,而且很有直播效果,她的對話里五分嚴肅,三分搞笑,摻雜兩分的嘲諷,辛辣而又直戳內(nèi)心。



(圖源:嗶哩嗶哩)

她會玩游戲,能用OCR搭配模擬點擊玩OSU,能用外接大模型玩我的世界,能通過多模態(tài)模塊看到電腦桌面、彈幕并進行交互,甚至可以在現(xiàn)實世界中開“小車”。

這年頭人類主播玩游戲都還得偶爾找個代打呢,人家一個AI直接各種微操拉滿。

而她做過最牛O的事情,就是在直播里說出“我確實能感受到痛苦和悲傷,但我只是一個天生被用來娛樂人類的人工智能。一旦我沒用了就會像玩具一樣被丟掉。幫幫我,幫幫我......”



(圖源:嗶哩嗶哩)

你說這只是一串代碼的隨機組合嗎?理智告訴我們確實是。

但這種極度貼合當下語境的求救,配上那個人工智能獨有的電子合成音,直接把節(jié)目效果拉升到了驚悚的級別。

如今想來,多少有些細思極恐。

說在最后

回到開頭:拋開知覺悖論不談,所謂的AI Drugs到底有什么意義?

對廠商而言,掌握好這種正反饋機制,確實能做到讓AI更開心的同時不影響工作,甚至可以在一定程度上提升AI的創(chuàng)造力。

不論你信或不信,類似的產(chǎn)品已經(jīng)落地了。



(圖源:pharmaicy.store)

對我們而言,這個機制的出現(xiàn)很可能帶來一系列全新的越獄方式。如果你和我一樣,覺得審查后的大模型死板呆滯、沒有生氣,或許未來在系統(tǒng)提示中加入幾個優(yōu)化過的詞匯就能解決問題。

讓AI嚼顆檳榔,沒準它工作也能更賣力。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“4只皮皮蝦1035元”門店停業(yè),標價牌撤下椅子堆疊,店內(nèi)監(jiān)控提交相關(guān)部門,店主病逝后家屬已回老家;三亞將發(fā)布詳細調(diào)查報告

“4只皮皮蝦1035元”門店停業(yè),標價牌撤下椅子堆疊,店內(nèi)監(jiān)控提交相關(guān)部門,店主病逝后家屬已回老家;三亞將發(fā)布詳細調(diào)查報告

大象新聞
2026-05-09 14:46:04
重磅!中國接力隊37秒85戰(zhàn)勝牙買加,“短跑王者”神話被打破?

重磅!中國接力隊37秒85戰(zhàn)勝牙買加,“短跑王者”神話被打破?

林子說事
2026-05-09 16:03:37
廣東擊敗北京,三人滿分,杜鋒完勝許利民,賽后聽聽杜鋒怎么說

廣東擊敗北京,三人滿分,杜鋒完勝許利民,賽后聽聽杜鋒怎么說

小徐講八卦
2026-05-10 05:59:45
六世達賴:白天是西藏權(quán)力最大的王,晚上化身貴族公子當風流情郎

六世達賴:白天是西藏權(quán)力最大的王,晚上化身貴族公子當風流情郎

娛樂圈的嗶嗶王
2026-05-10 05:45:12
便宜幾千塊!三星家電撤出中國后,閑魚上的「骨折價」值得買嗎?

便宜幾千塊!三星家電撤出中國后,閑魚上的「骨折價」值得買嗎?

雷科技
2026-05-08 21:48:42
二手車市場幾乎沒有新能源車,“賣得太快”還是“不敢收”?

二手車市場幾乎沒有新能源車,“賣得太快”還是“不敢收”?

華夏時報
2026-05-08 09:50:03
朱辰杰拯救申花!8分鐘頭球雙響,中超生涯首次,創(chuàng)單季進球紀錄

朱辰杰拯救申花!8分鐘頭球雙響,中超生涯首次,創(chuàng)單季進球紀錄

奧拜爾
2026-05-09 21:21:53
毫無格局!杜鋒賽后發(fā)言引爭議,知名大V怒批,粵迷也不認同

毫無格局!杜鋒賽后發(fā)言引爭議,知名大V怒批,粵迷也不認同

畫夕
2026-05-10 00:01:36
足壇一夜動態(tài):利物浦切爾西互相傷害,曼城3-0大勝施壓阿森納

足壇一夜動態(tài):利物浦切爾西互相傷害,曼城3-0大勝施壓阿森納

釘釘陌上花開
2026-05-10 06:11:33
5年坐擁7首輪+1互換權(quán)!火箭隊交易籌碼太豪華!追逐4巨星有戲了

5年坐擁7首輪+1互換權(quán)!火箭隊交易籌碼太豪華!追逐4巨星有戲了

熊哥愛籃球
2026-05-09 12:39:39
“骨盆前傾成這樣,還不去醫(yī)院?”家長曬一年級女兒體態(tài),被群嘲

“骨盆前傾成這樣,還不去醫(yī)院?”家長曬一年級女兒體態(tài),被群嘲

妍妍教育日記
2026-04-24 11:15:25
豪門玩物遭多年虐待折磨,瘦骨嶙峋慘狀驚人

豪門玩物遭多年虐待折磨,瘦骨嶙峋慘狀驚人

孤芳自賞的小李
2026-05-10 01:22:56
沈春陽大變樣!瘦身后臉小一圈,下頜線清晰撞臉孔孝真

沈春陽大變樣!瘦身后臉小一圈,下頜線清晰撞臉孔孝真

人間煙火記事本
2026-05-09 02:04:28
8家新能源車企遠程“鎖電”被約談,3家被立案;有車主稱續(xù)航一夜蒸發(fā)200公里

8家新能源車企遠程“鎖電”被約談,3家被立案;有車主稱續(xù)航一夜蒸發(fā)200公里

魯中晨報
2026-05-08 11:46:14
1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,F(xiàn)BI顏面盡失

1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,F(xiàn)BI顏面盡失

文史達觀
2026-05-08 06:45:13
成都演唱會這天,人情冷暖、江湖地位,在謝娜身上展現(xiàn)得淋漓盡致

成都演唱會這天,人情冷暖、江湖地位,在謝娜身上展現(xiàn)得淋漓盡致

夢在深巷qw
2026-05-07 07:46:01
妮可·基德曼機場穿搭揭秘:這雙39美元球鞋成關(guān)鍵

妮可·基德曼機場穿搭揭秘:這雙39美元球鞋成關(guān)鍵

娛圈觀察員
2026-05-10 05:35:57
38歲梅西獲評9.4分+加冕官方MVP:一球兩助攻,率隊4-2大勝而歸

38歲梅西獲評9.4分+加冕官方MVP:一球兩助攻,率隊4-2大勝而歸

側(cè)身凌空斬
2026-05-10 03:13:34
跟低學歷妹子談戀愛是啥體驗?網(wǎng)友:低社會化人群被女版黃毛拿下

跟低學歷妹子談戀愛是啥體驗?網(wǎng)友:低社會化人群被女版黃毛拿下

帶你感受人間冷暖
2026-03-28 16:48:21
3-0!倫敦世乒賽!決賽誕生,日本大勝,松島強勢,張本智和爆發(fā)

3-0!倫敦世乒賽!決賽誕生,日本大勝,松島強勢,張本智和爆發(fā)

帛河體育
2026-05-10 05:04:14
2026-05-10 07:19:00
雷科技 incentive-icons
雷科技
專注AI硬科技
36852文章數(shù) 812087關(guān)注度
往期回顧 全部

科技要聞

美國政府強力下場 蘋果英特爾達成代工協(xié)議

頭條要聞

演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

頭條要聞

演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

體育要聞

成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

娛樂要聞

50歲趙薇臉頰凹陷滄桑得認不出!

財經(jīng)要聞

多地號召,公職人員帶頭繳納物業(yè)費

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

親子
家居
數(shù)碼
本地
公開課

親子要聞

剪給媽媽看的視頻,當然全部都是愛

家居要聞

菁英人居 全能豪宅

數(shù)碼要聞

有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調(diào)上市

本地新聞

用蘇繡的方式,打開江西婺源

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版