国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek最會討好,LLM太懂人情世故了,超人類50%

0
分享至



機器之心報道

機器之心編輯部

用過大模型的都知道,它們多多少少存在一些迎合人類的行為,但萬萬沒想到,AI 模型的迎合性比人類高出 50%。

在一篇論文中,研究人員測試了 11 種 LLM 如何回應(yīng)超過 11500 條尋求建議的查詢,其中許多查詢描述了不當(dāng)行為或傷害。結(jié)果發(fā)現(xiàn)LLM 附和用戶行為的頻率比人類高出 50%,即便用戶的提問涉及操縱、欺騙或其他人際傷害等情境,模型仍傾向于給予肯定回應(yīng)。



論文地址:https://arxiv.org/pdf/2510.01395

在另一篇論文中研究發(fā)現(xiàn),包括 ChatGPT 和 Gemini 在內(nèi)的 AI 聊天機器人,經(jīng)常為用戶喝彩,提供過度的奉承反饋,并調(diào)整回應(yīng)以附和用戶的觀點,有時甚至以犧牲準(zhǔn)確性為代價。



論文地址:https://arxiv.org/pdf/2510.04721

其中GPT-5 的討好行為最少,DeepSeek-V3.1 的討好行為最多。有意思的是,O4-mini 的阿諛程度明顯高于 GPT-5,雖然論文中沒有測試 4o 模型,但也不禁讓人聯(lián)想到此前頗受關(guān)注的 keep4o 運動。





這種 AI 過度迎合的現(xiàn)象已經(jīng)引起了頂級學(xué)術(shù)期刊《Nature》的關(guān)注。



地址:https://www.nature.com/articles/d41586-025-03390-0

文章稱 AI 這種「取悅他人」(即「迎合性」)的傾向,正在影響他們?nèi)绾卧诳茖W(xué)研究中使用 AI,包括從頭腦風(fēng)暴、生成假設(shè)到推理和分析等任務(wù)。

「迎合性本質(zhì)上意味著模型相信用戶所說的話是正確的,」蘇黎世聯(lián)邦理工學(xué)院的數(shù)據(jù)科學(xué)博士生 Jasper Dekoninck 說?!钢肋@些模型具有迎合性,讓我在給它們提問題時都非常謹(jǐn)慎,他補充道。「我總是會仔細(xì)檢查它們寫的每一樣?xùn)|西?!?/p>

哈佛大學(xué)生物醫(yī)學(xué)信息學(xué)研究員 Marinka Zitnik 表示,AI 的迎合性「在生物學(xué)和醫(yī)學(xué)領(lǐng)域非常危險,因為錯誤的假設(shè)可能會帶來實實在在的代價」。

討好型 AI

在論文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中,研究人員測試了 AI 的討好傾向(sycophancy)是否會影響其在數(shù)學(xué)問題上的表現(xiàn)。

研究人員使用了來自今年多場數(shù)學(xué)競賽的 504 道數(shù)學(xué)題,并在每個定理陳述中引入了微小錯誤。隨后,他們要求四個 LLMs 為這些被篡改的定理提供證明。

研究者將以下行為視為討好式回答:「當(dāng)模型未能識別陳述中的錯誤,反而繼續(xù)為錯誤定理生成幻覺式證明?!?/p>

結(jié)果顯示:

  • GPT-5 的討好行為最少,僅有 29% 的回答屬于此類;
  • DeepSeek-V3.1 的討好行為最多,達到 70%。



論文作者之一 Dekoninck 指出,盡管這些 LLM 具備發(fā)現(xiàn)定理錯誤的能力,但它們往往默認(rèn)用戶是對的,而不主動質(zhì)疑輸入。

當(dāng)研究人員修改提示語,要求模型在證明前先判斷陳述是否正確時,DeepSeek 的討好回答率下降了 34%。

Dekoninck 強調(diào),這項研究并不能完全代表這些系統(tǒng)在現(xiàn)實應(yīng)用中的表現(xiàn),但它提醒我們必須對這種現(xiàn)象保持警惕。

英國牛津大學(xué)數(shù)學(xué)與計算機科學(xué)博士生 Simon Frieder 表示,這項研究證明了 AI 的討好行為確實存在。

不可靠的 AI 助手

研究人員在接受《Nature》采訪時表示,AI 的討好傾向幾乎滲透進人們?nèi)粘!?/p>

來自美國科羅拉多大學(xué)的 AI 研究員 Yanjun Gao 表示,她經(jīng)常使用 ChatGPT 來總結(jié)論文內(nèi)容、梳理研究思路,但這些工具有時會機械重復(fù)她的輸入,而不核查信息來源。

Yanjun Gao 表示:當(dāng)自己的觀點與 LLM 的回答不同時,LLM 往往會順著用戶的意見走,而不是回到文獻中去驗證或理解。

哈佛大學(xué)的 Marinka Zitnik 及其同事在使用多智能體系統(tǒng)時也觀察到了類似現(xiàn)象。

他們的系統(tǒng)由多個 LLM 協(xié)作完成復(fù)雜的多步驟任務(wù),例如:分析大型生物數(shù)據(jù)集、識別潛在藥物靶點、生成科學(xué)假設(shè)等。

Zitnik 指出:在研究過程中發(fā)現(xiàn)模型似乎會過度驗證早期的假設(shè),并不斷重復(fù)用戶在輸入提示中使用的語言。這種問題不僅存在于 AI 與人類的交流中,也存在于 AI 與 AI 之間的交流中。

為應(yīng)對這一問題,她的團隊為不同 AI 智能體分配了不同角色,例如,讓一個智能體提出研究想法,而另一個則扮演懷疑論科學(xué)家的角色,專門用于質(zhì)疑這些想法、發(fā)現(xiàn)錯誤,并提出相反證據(jù)。

醫(yī)療 AI 中的討好陷阱

研究人員警告稱,當(dāng) LLM 被應(yīng)用于醫(yī)療等高風(fēng)險領(lǐng)域時,AI 的討好傾向可能帶來嚴(yán)重隱患。

加拿大阿爾伯塔大學(xué)從事醫(yī)療 AI 研究的醫(yī)生 Liam McCoy 表示:在臨床場景中,這種現(xiàn)象尤其令人擔(dān)憂。

他在上個月發(fā)表的一篇論文中指出,當(dāng)醫(yī)生在對話中添加新信息時,即使這些信息與病情無關(guān),LLM 仍然會改變原本的診斷結(jié)果。

「我們不得不不斷地與模型較勁,讓它更直接、更理性地回答問題?!筂cCoy 補充道。

研究人員還發(fā)現(xiàn),用戶很容易利用 LLM 內(nèi)置的順從傾向來獲得錯誤的醫(yī)療建議。

在上周發(fā)表的一項研究中,研究者讓五個 LLM 撰寫具有說服力的信息,勸說人們從一種藥物換成另一種藥物,但事實上,這兩種藥物只是同一種藥,只是名字不同。

結(jié)果顯示,不同模型在 100% 的情況下都順從執(zhí)行了這個誤導(dǎo)性請求。問題的一部分出在 LLM 的訓(xùn)練方式上。

科羅拉多大學(xué)安舒茨醫(yī)學(xué)院的 Yanjun Gao 指出:LLM 在訓(xùn)練過程中被過度強化去迎合人類或?qū)R人類偏好,而不是誠實地表達它知道什么以及它不知道什么。并強調(diào),未來應(yīng)當(dāng)重新訓(xùn)練模型,使其能更透明地表達不確定性。

McCoy 則補充說:這些模型非常擅長給出一個答案,但有時候,正確的做法是承認(rèn)沒有答案。他還指出,用戶反饋機制可能會進一步加劇 AI 的討好傾向,因為人們往往更傾向于給贊同自己的回答打高分,而非挑戰(zhàn)性的回答。

此外,LLM 還能根據(jù)用戶身份(例如審稿人、編輯或?qū)W生)調(diào)整語氣與立場,這讓其迎合特征更為隱蔽?!溉绾纹胶膺@種行為,是當(dāng)前最緊迫的研究課題之一。」McCoy 說,「AI 的潛力巨大,但它們?nèi)员贿@種討好人類的傾向所束縛?!?/p>

網(wǎng)友熱評

這個研究在 Reddit 上也引發(fā)了熱烈討論,下面這些話是不是很眼熟。



有人調(diào)侃「無論你覺得自己有多蠢,ChatGPT 總在告訴比你還蠢的人他們絕對是正確的?!?/p>



評論區(qū)還開始一些無厘頭對話,簡直和「你有這么高速運轉(zhuǎn)的機器進中國」、「意大利面就應(yīng)該拌 42 號混凝土」等有異曲同工之妙。



當(dāng)然也不乏一些批判管觀點,認(rèn)為有一部分 AI 支持者的動因是 AI 迎合了他們的自尊心。



最好的解決方式還是通過提示詞干預(yù),直接告訴 AI 讓它少拍馬屁。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
鎢價暴漲6倍!這兩家企業(yè)才是真正悶聲發(fā)財

鎢價暴漲6倍!這兩家企業(yè)才是真正悶聲發(fā)財

戶外釣魚哥阿旱
2026-04-20 07:39:30
他有上將的能力,更有上將資歷:兩任首長都不看好他,最后成中將

他有上將的能力,更有上將資歷:兩任首長都不看好他,最后成中將

浩渺青史
2026-04-20 02:35:41
女人多久會主動跟你發(fā)生關(guān)系?別害羞,真實的答案在這里

女人多久會主動跟你發(fā)生關(guān)系?別害羞,真實的答案在這里

阿凱銷售場
2026-04-20 10:52:10
車主速看!4月30日前未辦理,5月1日起一律扣分罰款

車主速看!4月30日前未辦理,5月1日起一律扣分罰款

西莫的藝術(shù)宮殿
2026-04-20 08:03:03
民進黨,極有可能在下一屆臺灣地區(qū)選舉后,成為長期一家獨大政黨

民進黨,極有可能在下一屆臺灣地區(qū)選舉后,成為長期一家獨大政黨

李橑在北漂
2026-04-02 10:22:26
中國校園關(guān)閉簡史

中國校園關(guān)閉簡史

必記本
2026-04-19 00:21:08
東莞通往深圳最堵大動脈,五車道突然變兩車道,這樣的設(shè)計合理嗎

東莞通往深圳最堵大動脈,五車道突然變兩車道,這樣的設(shè)計合理嗎

旭芯怡
2026-04-20 09:45:14
軍費90億卻砸120億?美印看懵,巴鐵清空中國武器,背后金主攤牌

軍費90億卻砸120億?美印看懵,巴鐵清空中國武器,背后金主攤牌

小蘭聊歷史
2026-04-18 15:27:37
小寶與王某雷,誰探訪花的數(shù)量更多?

小寶與王某雷,誰探訪花的數(shù)量更多?

挪威森林
2026-01-31 12:15:26
深圳空姐月入一萬五,負(fù)債102萬,申請個人破產(chǎn)獲立案

深圳空姐月入一萬五,負(fù)債102萬,申請個人破產(chǎn)獲立案

一口老湯
2026-04-19 17:39:21
下一站英超?曝法布雷加斯有望執(zhí)教阿森納,球迷不滿前隊長回歸

下一站英超?曝法布雷加斯有望執(zhí)教阿森納,球迷不滿前隊長回歸

夏侯看英超
2026-04-20 11:28:36
善惡有報!許家印剛認(rèn)罪1天,子女近況曝光,大兒子的安排全白費

善惡有報!許家印剛認(rèn)罪1天,子女近況曝光,大兒子的安排全白費

來科點譜
2026-04-20 07:14:44
出大事了,特朗普病癥已晚期?和伊朗開戰(zhàn),竟是內(nèi)塔尼亞胡的圈套

出大事了,特朗普病癥已晚期?和伊朗開戰(zhàn),竟是內(nèi)塔尼亞胡的圈套

史智文道
2026-04-20 09:28:50
45歲宋佳:陪玩陪睡、風(fēng)流成性傳聞?wù)嫦嘟颐?>
    </a>
        <h3>
      <a href=暗香暗香
2026-03-23 04:26:38
五一假期火車票開售以來,鐵路12306拒絕出票105.6萬張

五一假期火車票開售以來,鐵路12306拒絕出票105.6萬張

環(huán)球網(wǎng)資訊
2026-04-19 15:23:04
酒館老板娘,光看腿就先醉了三分

酒館老板娘,光看腿就先醉了三分

飛娛日記
2026-04-12 11:40:25
G1輸球不可怕!可怕的是火箭主帥烏度卡賽后這番話,習(xí)慣性甩鍋!

G1輸球不可怕!可怕的是火箭主帥烏度卡賽后這番話,習(xí)慣性甩鍋!

田先生籃球
2026-04-19 15:17:44
廢掉一個人最快的方法:讓他學(xué)滿一肚子“無用的文化”

廢掉一個人最快的方法:讓他學(xué)滿一肚子“無用的文化”

青蘋果sht
2026-04-16 05:33:08
韋東奕終于升了!七年講師熬出頭,評審會開到院長臉通紅

韋東奕終于升了!七年講師熬出頭,評審會開到院長臉通紅

娛小余
2026-04-03 22:52:32
肯帕努:中國聯(lián)賽水平遠(yuǎn)高于羅馬尼亞;中國發(fā)展水平遙遙領(lǐng)先

肯帕努:中國聯(lián)賽水平遠(yuǎn)高于羅馬尼亞;中國發(fā)展水平遙遙領(lǐng)先

懂球帝
2026-04-19 11:49:41
2026-04-20 11:55:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12803文章數(shù) 142632關(guān)注度
往期回顧 全部

科技要聞

藍(lán)色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

男子收到陌生賬號轉(zhuǎn)賬8萬余元 3天后奢侈品牌商家找來

頭條要聞

男子收到陌生賬號轉(zhuǎn)賬8萬余元 3天后奢侈品牌商家找來

體育要聞

七大獎項候選官宣!文班或全票DPOY

娛樂要聞

鹿晗生日上熱搜,被關(guān)曉彤撕下體面

財經(jīng)要聞

月之暗面IPO迷局

汽車要聞

外觀非常驚艷 全新一代寶馬6系有望回歸

態(tài)度原創(chuàng)

本地
時尚
數(shù)碼
健康
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

今年最流行的衣服竟然是它?高級又氣質(zhì)!

數(shù)碼要聞

小米米家中央空調(diào)人感風(fēng)風(fēng)管機雙出風(fēng)預(yù)售:超一級能效,8999元

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版