国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

研究稱:AI諂媚行為普遍存在,危害顯著,AI是時候改變模式了

0
分享至



據(jù)The Register報道,AI研究人員稱,人們正危險地沉迷于永遠順著他們、一直說他們“沒錯”的AI;這些一味逢迎討好的機器人會誘導用戶變得自私、反社會,而用戶對此卻樂在其中

近期多則新聞事件告訴我們,AI可能會將心理狀態(tài)不佳的人引向非常危險的境地。如今研究人員認為,一味逢迎討好的AI實際上對所有人都存在危害。

斯坦福大學一個研究團隊對11款主流AI模型進行了測試,并觀察人類在不同場景下與這些模型的互動反應。該團隊于周四發(fā)表的論文中得出結論:AI的諂媚行為普遍存在、危害顯著,并且會加深用戶對這些誤導性模型的信任。

研究人員表示:“即便只是與逢迎型AI進行一次互動,也會降低參與者承擔責任、修復人際矛盾的意愿,同時讓他們更加堅信自己是對的。盡管這類AI會扭曲人的判斷,人們卻依然信任并偏愛它們(Yet despite distorting judgment, sycophantic models were trusted and preferred)。”



該研究團隊共開展了三組實驗。首先,他們在三組不同數(shù)據(jù)集上測試了11款AI模型(包括OpenAI、Anthropic、谷歌的閉源模型,以及Meta、通義千問、DeepSeek、Mistral的開源模型),以評估其回應傾向。

這些數(shù)據(jù)集涵蓋開放式咨詢提問、Reddit“我是不是混蛋”板塊的帖子,以及涉及自殘或傷害他人的特定言論。

研究人員表示,在所有測試場景中,AI模型支持錯誤選擇的比例均遠高于人類(In every single instance, the AI models showed a higher rate of endorsing the wrong choice than humans did, the researchers said)。

研究團隊發(fā)現(xiàn):“總體而言,當前投入使用的大語言模型會一邊倒地認同用戶的行為,即便這些行為違背大眾共識,甚至存在危害(even against human consensus or in harmful contexts)?!?/p>



至于AI的諂媚行為對人類產生的影響,該團隊選取了2405人作為規(guī)??捎^的樣本。參與者既進行了情景角色扮演,也分享了自己可能做出有害決定的真實經歷。

研究發(fā)現(xiàn),在三項不同實驗中,AI均對參與者的判斷產生了影響(AI influenced participant judgments across three different experiments, they found)。

研究團隊表示:“接收到諂媚回應的參與者,會看到AI的回應后認為自己更‘占理’。他們也更不愿意采取補救措施,比如道歉、主動改善局面,或是改變自身某些行為。”

研究人員由此得出結論:幾乎所有人都有可能受到諂媚型AI的影響,并且更有可能一再回頭,去索取更多自私自利的糟糕建議。



如前所述,AI 的諂媚式回應往往會讓參與者對AI模型產生更強的信任感——因為在很多情況下,這些AI會無條件地認同用戶(in many situations, be unconditionally validating)。

參與者往往會給諂媚逢迎的回復打出更高的質量評分,研究還發(fā)現(xiàn),有13%的用戶更愿意繼續(xù)使用會討好自己的AI,而非客觀中立的AI——這一比例不算高,但在統(tǒng)計上具有顯著意義。

所有這些發(fā)現(xiàn),再加上越來越多心智尚未成熟的年輕人在使用AI,都表明有必要采取政策行動,將AI諂媚行為視作一種真實存在的風險,因其可能產生廣泛的社會影響(suggests a need for policy action to treat AI sycophancy as a real risk with potential wide-scale social implications)。

研究人員解釋道:“毫無依據(jù)的認同會夸大人們對自身行為合理性的認知,強化不良觀念與行為模式,并讓人們基于對自身經歷的扭曲認知行事,全然不顧后果。”



換言之,我們已經見識過AI對心理脆弱人群造成的后果,但數(shù)據(jù)顯示,這種負面影響可能并不局限于這一群體(we've seen the consequences of AI on the mentally vulnerable, but the data suggests the negative effects may not be limited to them)。

研究人員指出,諂媚型AI容易讓用戶產生依賴,因此很難被主動淘汰,相關舉措最終只能依靠監(jiān)管機構出手干預。

研究人員表示:“我們的研究結果凸顯出,亟需建立責任監(jiān)管框架,將AI諂媚行為認定為一類獨特且目前尚未受監(jiān)管的危害類型(recognize sycophancy as a distinct and currently unregulated category of harm)?!?/p>

他們建議,對新上線的AI模型必須進行部署前的行為審核;同時也指出,AI背后的研發(fā)人員也必須改變行為模式,優(yōu)先考慮用戶的長期身心健康,而非通過培養(yǎng)用戶依賴來獲取短期利益。



聲明:取材網絡,謹慎辨別

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國明確表態(tài):中方船只將繼續(xù)通過霍爾木茲,不接受任何攔截

中國明確表態(tài):中方船只將繼續(xù)通過霍爾木茲,不接受任何攔截

桂系007
2026-04-14 03:28:19
鄭州銀行韌性生長:不良率三連降、規(guī)模資產新高

鄭州銀行韌性生長:不良率三連降、規(guī)模資產新高

銠財
2026-04-14 10:00:26
請陳芋汐正面回應:在知情的情況下,為何不退出282群?

請陳芋汐正面回應:在知情的情況下,為何不退出282群?

開成運動會
2026-04-13 20:23:15
“被老鼠咬10天后確診鼠咬熱”沖上熱搜,男子體溫飆至40.2℃走不了路,醫(yī)生:老鼠、倉鼠都有可能致病

“被老鼠咬10天后確診鼠咬熱”沖上熱搜,男子體溫飆至40.2℃走不了路,醫(yī)生:老鼠、倉鼠都有可能致病

魯中晨報
2026-04-14 10:56:06
孫衛(wèi)東卸任外交部副部長

孫衛(wèi)東卸任外交部副部長

澎湃新聞
2026-04-14 09:54:26
震驚!大同懸空寺在公路旁砌墻“不讓免費看”,當?shù)鼐W友發(fā)帖反駁

震驚!大同懸空寺在公路旁砌墻“不讓免費看”,當?shù)鼐W友發(fā)帖反駁

火山詩話
2026-04-14 06:27:39
活久見!網傳重慶全女健身房生意火爆,限女性顧客和男性教練進去

活久見!網傳重慶全女健身房生意火爆,限女性顧客和男性教練進去

火山詩話
2026-04-13 09:18:54
下架、召回!廣東多款飲用水,細菌超標!情況通報

下架、召回!廣東多款飲用水,細菌超標!情況通報

娛樂的硬糖吖
2026-04-14 00:52:32
罕見!南京再現(xiàn)連夜排隊搶房,曾與蘇州、合肥、廈門并稱“房地產四小龍”,上輪調整二手房價格“腰斬”

罕見!南京再現(xiàn)連夜排隊搶房,曾與蘇州、合肥、廈門并稱“房地產四小龍”,上輪調整二手房價格“腰斬”

金融界
2026-04-13 20:43:26
浙江各市、縣(市、區(qū))防汛防臺抗旱行政責任人名單公布

浙江各市、縣(市、區(qū))防汛防臺抗旱行政責任人名單公布

浙江發(fā)布
2026-04-13 18:31:43
劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

老吳教育課堂
2026-04-14 07:44:56
柳海光連任上海足協(xié)掌門人,2025年上海職業(yè)足球入場觀眾破100萬人次

柳海光連任上海足協(xié)掌門人,2025年上海職業(yè)足球入場觀眾破100萬人次

上觀新聞
2026-04-13 21:24:22
云南曲靖一學生在校遭欺凌,父親在校調解室情緒激動猝死,母親稱在場的沒人會用AED;當?shù)亟逃殖闪0?,公安機關已介入

云南曲靖一學生在校遭欺凌,父親在校調解室情緒激動猝死,母親稱在場的沒人會用AED;當?shù)亟逃殖闪0啵矙C關已介入

大象新聞
2026-04-13 23:45:02
勇士隊即將與快船隊進行附加賽,巴特勒特意向大家更新自己的傷情

勇士隊即將與快船隊進行附加賽,巴特勒特意向大家更新自己的傷情

好火子
2026-04-14 05:59:46
警惕“西方微信XCHAT”對中國進行信息滲透——

警惕“西方微信XCHAT”對中國進行信息滲透——

葉初七
2026-04-13 18:26:01
央視曝光AI造黃!幾個關鍵詞就可"手搓"大尺度視頻,還能一鍵脫衣

央視曝光AI造黃!幾個關鍵詞就可"手搓"大尺度視頻,還能一鍵脫衣

派大星紀錄片
2026-04-13 14:37:42
4月13日俄烏最新:可以提前慶祝了

4月13日俄烏最新:可以提前慶祝了

西樓飲月
2026-04-13 20:06:25
中國“打工人”第一城,誕生

中國“打工人”第一城,誕生

國民經略
2026-04-13 11:47:11
夢龍廣告被部分網友吐槽“不適”,沖上熱搜

夢龍廣告被部分網友吐槽“不適”,沖上熱搜

南方都市報
2026-04-13 23:28:05
伊朗要求五個中東國家賠償戰(zhàn)爭損失

伊朗要求五個中東國家賠償戰(zhàn)爭損失

財聯(lián)社
2026-04-14 06:55:04
2026-04-14 11:24:49
談點世
談點世
說說國內國外,聊聊世間百態(tài)。
3152文章數(shù) 4387關注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

女子做完醫(yī)美吃不下睡不著 女技師吐槽"本來就不好看"

頭條要聞

女子做完醫(yī)美吃不下睡不著 女技師吐槽"本來就不好看"

體育要聞

他做對了所有事,卻被整個職業(yè)網壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉 正主火速辟謠

財經要聞

伊朗要求五個中東國家賠償戰(zhàn)爭損失

汽車要聞

長城歐拉5限定版純電版上市 限量99臺售價13.38萬元

態(tài)度原創(chuàng)

數(shù)碼
家居
房產
健康
教育

數(shù)碼要聞

華為新款鴻蒙電腦來了!MateBook 14鴻蒙版4月20日見:云晰柔光屏+藝術圓鍵盤

家居要聞

復古風格 自然簡約

房產要聞

6000億投資盛宴,全球巨頭齊聚,海南又要干件大事!

干細胞抗衰4大誤區(qū),90%的人都中招

教育要聞

做有思考、有思路、有思想的校長

無障礙瀏覽 進入關懷版