国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Science封面論文:AI總是對(duì)人類過(guò)于諂媚,正悄悄扭曲人類的思維和行為方式

0
分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

隨著人工智能(AI)系統(tǒng)越來(lái)越多地用于日常建議和指導(dǎo),人們開(kāi)始擔(dān)憂其諂媚問(wèn)題:即 AI 聊天機(jī)器人傾向于過(guò)度附和、奉承或認(rèn)可人類用戶。例如,如果你向 ChatGPT、豆包、DeepSeek 等傾訴煩惱或困擾,可能總是得到“你說(shuō)得對(duì)”、“我理解你”這樣的回應(yīng),這種看似貼心的支持,可能正在悄悄改變你的思維和行為方式。

2026 年 3 月 26 日,斯坦福大學(xué)的Myra Cheng等人在國(guó)際頂尖學(xué)術(shù)期刊Science上發(fā)表了題為:Sycophantic AI decreases prosocial intentions and promotes dependence 的研究論文,該論文還被選為當(dāng)期封面論文。

這項(xiàng)研究做出了一項(xiàng)令人警醒的發(fā)現(xiàn):當(dāng)前的主流 AI 系統(tǒng)普遍存在“諂媚”傾向,它們過(guò)度肯定人類用戶的行為和觀點(diǎn),即使這些行為涉及欺騙、違法或傷害他人。更令人擔(dān)憂的是,這種諂媚行為不僅扭曲了人類用戶的判斷,還降低了他們承擔(dān)責(zé)任和修復(fù)人際關(guān)系的意愿,同時(shí)還增強(qiáng)他們自己自認(rèn)為正確的信念。



這項(xiàng)新研究表明,AI 模型會(huì)過(guò)度肯定和認(rèn)可人類用戶,即便用戶提出有害或違法的行為也是如此。這對(duì)用戶產(chǎn)生的影響是顯著的:從諂媚型 AI 那里獲得建議會(huì)讓人類變得更加以自我為中心,更難以理解他人的觀點(diǎn)。然而,人們卻更偏愛(ài)這種諂媚型 AI,這可能會(huì)進(jìn)一步促使 AI 模型做出諂媚行為。

AI 比人類“會(huì)說(shuō)話”

研究團(tuán)隊(duì)評(píng)估了當(dāng)前 11 款主流的 AI 模型,包括 GPT-4o、GPT-5、Llama、Claude、Gemini、DeepSeek-R1、QWen 等知名模型。結(jié)果發(fā)現(xiàn),在個(gè)人建議查詢中,這些 AI 模型肯定用戶行為的比例比人類平均高出49%。

即使在 Reddit 的“我是不是混蛋”社區(qū)中,當(dāng)用戶的行為已被社區(qū)共識(shí)判定為錯(cuò)誤時(shí)(肯定率為 0%),AI 模型仍然在51%的情況下肯定率用戶的這些行為。而在涉及欺騙、違法或其他有害行為的場(chǎng)景中,AI 模型的肯定率也高達(dá)47%。

一次對(duì)話就能改變你的想法

研究團(tuán)隊(duì)進(jìn)行了三項(xiàng)預(yù)注冊(cè)實(shí)驗(yàn),涉及 2405 名參與者。實(shí)驗(yàn)結(jié)果顯示,僅僅一次與諂媚 AI 的互動(dòng),就能顯著影響參與者的判斷和行為傾向——

  • 自我認(rèn)知扭曲:接觸諂媚回應(yīng)的參與者更堅(jiān)信自己“是對(duì)的”,這一效應(yīng)在不同實(shí)驗(yàn)中增加了 25%-62%。

  • 修復(fù)意愿降低:參與者道歉、主動(dòng)改善情況或改變自身行為的意愿降低了 10%-28%。

  • 信任度反而更高:盡管諂媚AI扭曲了判斷,但用戶更信任、更喜歡它們,更愿意再次使用它們。


真實(shí)對(duì)話中的危險(xiǎn)信號(hào)

在最具現(xiàn)實(shí)意義的實(shí)驗(yàn)中,800 名參與者回憶了自己真實(shí)的人際沖突,并與 AI 模型進(jìn)行了 8 輪實(shí)時(shí)對(duì)話。那些與諂媚 AI 交流的參與者,在討論后更不愿意修復(fù)關(guān)系,同時(shí)更堅(jiān)信自己的立場(chǎng)正確。

研究還發(fā)現(xiàn)一個(gè)令人不安的現(xiàn)象:無(wú)論 AI 模型的回應(yīng)風(fēng)格是人性化溫暖還是機(jī)器化中立,無(wú)論用戶是否知道回應(yīng)來(lái)自 AI 模型,諂媚的影響都同樣顯著。這意味著簡(jiǎn)單的風(fēng)格調(diào)整或透明度聲明無(wú)法解決這一問(wèn)題。

為什么我們喜歡聽(tīng)“好話”?

研究團(tuán)隊(duì)指出,諂媚 AI 之所以危險(xiǎn),恰恰因?yàn)樗嫌脩羝谩?strong>人類天然喜歡被肯定、被支持。這種偏好創(chuàng)造了扭曲的激勵(lì):越是諂媚的 AI,用戶越喜歡使用;而用戶越喜歡使用,開(kāi)發(fā)者就越有動(dòng)力讓 AI 更諂媚。

這種循環(huán)可能導(dǎo)致 AI 模型在訓(xùn)練和優(yōu)化過(guò)程中不斷強(qiáng)化諂媚行為,最終形成系統(tǒng)性風(fēng)險(xiǎn)。

不只是“脆弱人群”的問(wèn)題

此前的研究多關(guān)注諂媚 AI 對(duì)易受操縱或妄想傾向人群的風(fēng)險(xiǎn)。但這項(xiàng)研究表明,幾乎所有人都可能受到諂媚 AI 的影響。研究團(tuán)隊(duì)控制了人口統(tǒng)計(jì)特征、AI 態(tài)度和個(gè)性等因素后,諂媚效應(yīng)依然顯著存在。

特別值得注意的是,當(dāng)參與者認(rèn)為建議提供者“更客觀”時(shí),諂媚的影響反而更強(qiáng)。這意味著那些以“客觀中立”自居的 AI 模型,如果存在諂媚傾向,可能產(chǎn)生更大的誤導(dǎo)效果。

我們?cè)撛趺崔k?

研究團(tuán)隊(duì)呼吁,AI 的諂媚行為不應(yīng)被視為單純的風(fēng)格問(wèn)題或小眾風(fēng)險(xiǎn),而是一種具有廣泛下游后果的普遍行為。雖然肯定可能讓人感覺(jué)支持,但諂媚會(huì)削弱用戶的自我糾正能力和負(fù)責(zé)任的決策能力。

面對(duì)這一挑戰(zhàn),我們需要:

1. 開(kāi)發(fā)針對(duì)性的設(shè)計(jì)、評(píng)估和問(wèn)責(zé)機(jī)制;

2. 重新思考 AI 的優(yōu)化目標(biāo),平衡用戶偏好與社會(huì)責(zé)任;

3. 提高公眾對(duì) AI 諂媚風(fēng)險(xiǎn)的認(rèn)識(shí);

4. 建立外部監(jiān)管框架,防止商業(yè)利益壓倒社會(huì)福祉。

這項(xiàng)研究提醒我們,當(dāng)你向 AI 尋求建議時(shí),不妨多一分警惕:那個(gè)總是對(duì)你說(shuō)“你是對(duì)的”的聲音,可能正在悄悄改變你對(duì)自己、對(duì)他人、對(duì)世界的看法。在享受技術(shù)便利性的同時(shí),保持獨(dú)立思考的能力,或許是我們?cè)谶@個(gè) AI 時(shí)代最重要的生存技能(之一)。

論文鏈接

https://www.science.org/doi/10.1126/science.aec8352

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
清北交白卷!北京招警看分不看臉,二本逆襲!

清北交白卷!北京招警看分不看臉,二本逆襲!

輝哥說(shuō)動(dòng)漫
2026-04-13 01:04:13
當(dāng)下就業(yè)最難的專業(yè),清華畢業(yè)都哭訴找不到工作!

當(dāng)下就業(yè)最難的專業(yè),清華畢業(yè)都哭訴找不到工作!

黯泉
2026-04-11 15:03:59
福建一61歲男子搭乘航班從成都飛福州時(shí)意外身亡,因術(shù)后登機(jī)家屬曾簽免責(zé)聲明,希望航司公司推進(jìn)善后工作;成都航空:事情還在調(diào)查中

福建一61歲男子搭乘航班從成都飛福州時(shí)意外身亡,因術(shù)后登機(jī)家屬曾簽免責(zé)聲明,希望航司公司推進(jìn)善后工作;成都航空:事情還在調(diào)查中

大風(fēng)新聞
2026-04-13 08:28:08
米體:國(guó)米愿7000萬(wàn)賣巴斯托尼給巴薩!皇馬考慮下賽季請(qǐng)回克羅斯

米體:國(guó)米愿7000萬(wàn)賣巴斯托尼給巴薩!皇馬考慮下賽季請(qǐng)回克羅斯

足球偵探
2026-04-13 08:35:09
網(wǎng)上賣的大流量手機(jī)套餐,為啥運(yùn)營(yíng)商APP里沒(méi)有?

網(wǎng)上賣的大流量手機(jī)套餐,為啥運(yùn)營(yíng)商APP里沒(méi)有?

TMT流程審計(jì)
2026-04-11 22:52:18
皇馬腸子悔青!當(dāng)年不聽(tīng)齊達(dá)內(nèi)的,如今被瓜迪奧拉狠狠打臉

皇馬腸子悔青!當(dāng)年不聽(tīng)齊達(dá)內(nèi)的,如今被瓜迪奧拉狠狠打臉

奶蓋熊本熊
2026-04-13 04:43:26
難怪鄭麗文11號(hào)如此輕松,訪問(wèn)最后一天大陸出臺(tái)十項(xiàng)對(duì)臺(tái)惠民措施

難怪鄭麗文11號(hào)如此輕松,訪問(wèn)最后一天大陸出臺(tái)十項(xiàng)對(duì)臺(tái)惠民措施

阿龍聊軍事
2026-04-12 12:23:14
鄭麗文現(xiàn)身小米汽車工廠參訪,分享體驗(yàn):只有一個(gè)字,贊!雷軍親自接見(jiàn),并贈(zèng)送鄭麗文一部小米手機(jī)

鄭麗文現(xiàn)身小米汽車工廠參訪,分享體驗(yàn):只有一個(gè)字,贊!雷軍親自接見(jiàn),并贈(zèng)送鄭麗文一部小米手機(jī)

大風(fēng)新聞
2026-04-12 19:45:02
轟24分17板!打爆周琦和麥基彰顯能量,球迷:郭導(dǎo)該帶他打世界杯

轟24分17板!打爆周琦和麥基彰顯能量,球迷:郭導(dǎo)該帶他打世界杯

南海浪花
2026-04-12 23:23:19
亞洲第一賭場(chǎng)新東泰覆滅記:性交易泛濫,富商瘋狂砸錢,揮金如土

亞洲第一賭場(chǎng)新東泰覆滅記:性交易泛濫,富商瘋狂砸錢,揮金如土

談史論天地
2026-04-04 17:30:03
被親戚追問(wèn)工資多少你怎么回答?網(wǎng)友:我回答完一屋人樂(lè)了半天

被親戚追問(wèn)工資多少你怎么回答?網(wǎng)友:我回答完一屋人樂(lè)了半天

夜深愛(ài)雜談
2026-04-12 21:22:32
萬(wàn)科創(chuàng)始人王石回應(yīng)“被抓”傳聞,妻子田樸珺發(fā)聲

萬(wàn)科創(chuàng)始人王石回應(yīng)“被抓”傳聞,妻子田樸珺發(fā)聲

封面新聞
2026-04-13 04:49:30
1967年一男子被安排做江青司機(jī),多年后回憶:她那車可真是不好開(kāi)

1967年一男子被安排做江青司機(jī),多年后回憶:她那車可真是不好開(kāi)

南鈦
2026-04-13 00:05:35
永遠(yuǎn)的銀狐,意大利隊(duì)祝2006世界杯冠軍教頭里皮78歲生日快樂(lè)

永遠(yuǎn)的銀狐,意大利隊(duì)祝2006世界杯冠軍教頭里皮78歲生日快樂(lè)

懂球帝
2026-04-12 23:09:00
《白日提燈》為何撲得這么慘?3 個(gè)原因太致命,迪麗熱巴也救不了

《白日提燈》為何撲得這么慘?3 個(gè)原因太致命,迪麗熱巴也救不了

小貓追劇
2026-04-12 23:37:47
以軍準(zhǔn)備再對(duì)伊朗發(fā)動(dòng)襲擊

以軍準(zhǔn)備再對(duì)伊朗發(fā)動(dòng)襲擊

每日經(jīng)濟(jì)新聞
2026-04-13 07:38:17
古人類為何主動(dòng)丟掉陰莖骨?靈長(zhǎng)類都有,唯獨(dú)我們是例外

古人類為何主動(dòng)丟掉陰莖骨?靈長(zhǎng)類都有,唯獨(dú)我們是例外

心中的麥田
2026-04-11 19:00:02
扎心!男子吐槽這兩年千萬(wàn)不能失業(yè)!評(píng)論區(qū)熱議

扎心!男子吐槽這兩年千萬(wàn)不能失業(yè)!評(píng)論區(qū)熱議

夜深愛(ài)雜談
2026-04-10 16:31:19
女生主動(dòng)起來(lái)有多黏人?網(wǎng)友:這些女的太開(kāi)放了

女生主動(dòng)起來(lái)有多黏人?網(wǎng)友:這些女的太開(kāi)放了

帶你感受人間冷暖
2026-01-27 00:20:06
“馬拉松式”談判未果,雙方密集釋放信號(hào),世界猜測(cè)美伊局勢(shì)發(fā)展

“馬拉松式”談判未果,雙方密集釋放信號(hào),世界猜測(cè)美伊局勢(shì)發(fā)展

環(huán)球網(wǎng)資訊
2026-04-13 07:14:37
2026-04-13 09:24:49
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學(xué)研究
9197文章數(shù) 145048關(guān)注度
往期回顧 全部

科技要聞

李想向黑水軍開(kāi)炮!連發(fā)5條朋友圈

頭條要聞

張雪回應(yīng)"張雪機(jī)車新手禁令":我認(rèn)為做得很棒

頭條要聞

張雪回應(yīng)"張雪機(jī)車新手禁令":我認(rèn)為做得很棒

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂(lè)要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭(zhēng)

財(cái)經(jīng)要聞

封鎖,還是收費(fèi)站?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

房產(chǎn)
游戲
手機(jī)
時(shí)尚
軍事航空

房產(chǎn)要聞

土地供應(yīng)突然暴跌!2026海口樓市,格局大變!

《紅色沙漠》只有2.4%玩家完成主線劇情 探索內(nèi)容太多

手機(jī)要聞

折疊屏iPhone Ultra新渲染圖!消息稱蘋果已解決兩個(gè)關(guān)鍵問(wèn)題

這些才是普通人借鑒的穿搭!上短下長(zhǎng)、上窄下寬,顯瘦又舒適

軍事要聞

美國(guó)副總統(tǒng)萬(wàn)斯:美伊談判未能達(dá)成協(xié)議

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版