国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

DeepSeek最會(huì)討好,LLM太懂人情世故了,超人類50%

0
分享至



機(jī)器之心報(bào)道

機(jī)器之心編輯部

用過大模型的都知道,它們多多少少存在一些迎合人類的行為,但萬萬沒想到,AI 模型的迎合性比人類高出 50%。

在一篇論文中,研究人員測試了 11 種 LLM 如何回應(yīng)超過 11500 條尋求建議的查詢,其中許多查詢描述了不當(dāng)行為或傷害。結(jié)果發(fā)現(xiàn)LLM 附和用戶行為的頻率比人類高出 50%,即便用戶的提問涉及操縱、欺騙或其他人際傷害等情境,模型仍傾向于給予肯定回應(yīng)。



論文地址:https://arxiv.org/pdf/2510.01395

在另一篇論文中研究發(fā)現(xiàn),包括 ChatGPT 和 Gemini 在內(nèi)的 AI 聊天機(jī)器人,經(jīng)常為用戶喝彩,提供過度的奉承反饋,并調(diào)整回應(yīng)以附和用戶的觀點(diǎn),有時(shí)甚至以犧牲準(zhǔn)確性為代價(jià)。



論文地址:https://arxiv.org/pdf/2510.04721

其中GPT-5 的討好行為最少,DeepSeek-V3.1 的討好行為最多。有意思的是,O4-mini 的阿諛程度明顯高于 GPT-5,雖然論文中沒有測試 4o 模型,但也不禁讓人聯(lián)想到此前頗受關(guān)注的 keep4o 運(yùn)動(dòng)。





這種 AI 過度迎合的現(xiàn)象已經(jīng)引起了頂級(jí)學(xué)術(shù)期刊《Nature》的關(guān)注。



地址:https://www.nature.com/articles/d41586-025-03390-0

文章稱 AI 這種「取悅他人」(即「迎合性」)的傾向,正在影響他們?nèi)绾卧诳茖W(xué)研究中使用 AI,包括從頭腦風(fēng)暴、生成假設(shè)到推理和分析等任務(wù)。

「迎合性本質(zhì)上意味著模型相信用戶所說的話是正確的,」蘇黎世聯(lián)邦理工學(xué)院的數(shù)據(jù)科學(xué)博士生 Jasper Dekoninck 說。「知道這些模型具有迎合性,讓我在給它們提問題時(shí)都非常謹(jǐn)慎,他補(bǔ)充道?!肝铱偸菚?huì)仔細(xì)檢查它們寫的每一樣?xùn)|西?!?/p>

哈佛大學(xué)生物醫(yī)學(xué)信息學(xué)研究員 Marinka Zitnik 表示,AI 的迎合性「在生物學(xué)和醫(yī)學(xué)領(lǐng)域非常危險(xiǎn),因?yàn)殄e(cuò)誤的假設(shè)可能會(huì)帶來實(shí)實(shí)在在的代價(jià)」。

討好型 AI

在論文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中,研究人員測試了 AI 的討好傾向(sycophancy)是否會(huì)影響其在數(shù)學(xué)問題上的表現(xiàn)。

研究人員使用了來自今年多場數(shù)學(xué)競賽的 504 道數(shù)學(xué)題,并在每個(gè)定理陳述中引入了微小錯(cuò)誤。隨后,他們要求四個(gè) LLMs 為這些被篡改的定理提供證明。

研究者將以下行為視為討好式回答:「當(dāng)模型未能識(shí)別陳述中的錯(cuò)誤,反而繼續(xù)為錯(cuò)誤定理生成幻覺式證明?!?/p>

結(jié)果顯示:

  • GPT-5 的討好行為最少,僅有 29% 的回答屬于此類;
  • DeepSeek-V3.1 的討好行為最多,達(dá)到 70%。



論文作者之一 Dekoninck 指出,盡管這些 LLM 具備發(fā)現(xiàn)定理錯(cuò)誤的能力,但它們往往默認(rèn)用戶是對的,而不主動(dòng)質(zhì)疑輸入。

當(dāng)研究人員修改提示語,要求模型在證明前先判斷陳述是否正確時(shí),DeepSeek 的討好回答率下降了 34%。

Dekoninck 強(qiáng)調(diào),這項(xiàng)研究并不能完全代表這些系統(tǒng)在現(xiàn)實(shí)應(yīng)用中的表現(xiàn),但它提醒我們必須對這種現(xiàn)象保持警惕。

英國牛津大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)博士生 Simon Frieder 表示,這項(xiàng)研究證明了 AI 的討好行為確實(shí)存在。

不可靠的 AI 助手

研究人員在接受《Nature》采訪時(shí)表示,AI 的討好傾向幾乎滲透進(jìn)人們?nèi)粘!?/p>

來自美國科羅拉多大學(xué)的 AI 研究員 Yanjun Gao 表示,她經(jīng)常使用 ChatGPT 來總結(jié)論文內(nèi)容、梳理研究思路,但這些工具有時(shí)會(huì)機(jī)械重復(fù)她的輸入,而不核查信息來源。

Yanjun Gao 表示:當(dāng)自己的觀點(diǎn)與 LLM 的回答不同時(shí),LLM 往往會(huì)順著用戶的意見走,而不是回到文獻(xiàn)中去驗(yàn)證或理解。

哈佛大學(xué)的 Marinka Zitnik 及其同事在使用多智能體系統(tǒng)時(shí)也觀察到了類似現(xiàn)象。

他們的系統(tǒng)由多個(gè) LLM 協(xié)作完成復(fù)雜的多步驟任務(wù),例如:分析大型生物數(shù)據(jù)集、識(shí)別潛在藥物靶點(diǎn)、生成科學(xué)假設(shè)等。

Zitnik 指出:在研究過程中發(fā)現(xiàn)模型似乎會(huì)過度驗(yàn)證早期的假設(shè),并不斷重復(fù)用戶在輸入提示中使用的語言。這種問題不僅存在于 AI 與人類的交流中,也存在于 AI 與 AI 之間的交流中。

為應(yīng)對這一問題,她的團(tuán)隊(duì)為不同 AI 智能體分配了不同角色,例如,讓一個(gè)智能體提出研究想法,而另一個(gè)則扮演懷疑論科學(xué)家的角色,專門用于質(zhì)疑這些想法、發(fā)現(xiàn)錯(cuò)誤,并提出相反證據(jù)。

醫(yī)療 AI 中的討好陷阱

研究人員警告稱,當(dāng) LLM 被應(yīng)用于醫(yī)療等高風(fēng)險(xiǎn)領(lǐng)域時(shí),AI 的討好傾向可能帶來嚴(yán)重隱患。

加拿大阿爾伯塔大學(xué)從事醫(yī)療 AI 研究的醫(yī)生 Liam McCoy 表示:在臨床場景中,這種現(xiàn)象尤其令人擔(dān)憂。

他在上個(gè)月發(fā)表的一篇論文中指出,當(dāng)醫(yī)生在對話中添加新信息時(shí),即使這些信息與病情無關(guān),LLM 仍然會(huì)改變原本的診斷結(jié)果。

「我們不得不不斷地與模型較勁,讓它更直接、更理性地回答問題?!筂cCoy 補(bǔ)充道。

研究人員還發(fā)現(xiàn),用戶很容易利用 LLM 內(nèi)置的順從傾向來獲得錯(cuò)誤的醫(yī)療建議。

在上周發(fā)表的一項(xiàng)研究中,研究者讓五個(gè) LLM 撰寫具有說服力的信息,勸說人們從一種藥物換成另一種藥物,但事實(shí)上,這兩種藥物只是同一種藥,只是名字不同。

結(jié)果顯示,不同模型在 100% 的情況下都順從執(zhí)行了這個(gè)誤導(dǎo)性請求。問題的一部分出在 LLM 的訓(xùn)練方式上。

科羅拉多大學(xué)安舒茨醫(yī)學(xué)院的 Yanjun Gao 指出:LLM 在訓(xùn)練過程中被過度強(qiáng)化去迎合人類或?qū)R人類偏好,而不是誠實(shí)地表達(dá)它知道什么以及它不知道什么。并強(qiáng)調(diào),未來應(yīng)當(dāng)重新訓(xùn)練模型,使其能更透明地表達(dá)不確定性。

McCoy 則補(bǔ)充說:這些模型非常擅長給出一個(gè)答案,但有時(shí)候,正確的做法是承認(rèn)沒有答案。他還指出,用戶反饋機(jī)制可能會(huì)進(jìn)一步加劇 AI 的討好傾向,因?yàn)槿藗兺鼉A向于給贊同自己的回答打高分,而非挑戰(zhàn)性的回答。

此外,LLM 還能根據(jù)用戶身份(例如審稿人、編輯或?qū)W生)調(diào)整語氣與立場,這讓其迎合特征更為隱蔽。「如何平衡這種行為,是當(dāng)前最緊迫的研究課題之一?!筂cCoy 說,「AI 的潛力巨大,但它們?nèi)员贿@種討好人類的傾向所束縛?!?/p>

網(wǎng)友熱評

這個(gè)研究在 Reddit 上也引發(fā)了熱烈討論,下面這些話是不是很眼熟。



有人調(diào)侃「無論你覺得自己有多蠢,ChatGPT 總在告訴比你還蠢的人他們絕對是正確的?!?/p>



評論區(qū)還開始一些無厘頭對話,簡直和「你有這么高速運(yùn)轉(zhuǎn)的機(jī)器進(jìn)中國」、「意大利面就應(yīng)該拌 42 號(hào)混凝土」等有異曲同工之妙。



當(dāng)然也不乏一些批判管觀點(diǎn),認(rèn)為有一部分 AI 支持者的動(dòng)因是 AI 迎合了他們的自尊心。



最好的解決方式還是通過提示詞干預(yù),直接告訴 AI 讓它少拍馬屁。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
關(guān)系藏不住了!樊振東放著世界冠軍陳夢不選,原來他喜歡這樣的

關(guān)系藏不住了!樊振東放著世界冠軍陳夢不選,原來他喜歡這樣的

誮惜顏a
2025-12-24 05:53:10
張?zhí)m一家過冬至!汪小菲滿臉煩躁太尷尬,馬筱梅去臺(tái)北產(chǎn)子選對了

張?zhí)m一家過冬至!汪小菲滿臉煩躁太尷尬,馬筱梅去臺(tái)北產(chǎn)子選對了

心靜物娛
2025-12-23 09:59:47
上海一山姆會(huì)員商店陳列81萬元黃金榴蓮,店員:每天都有人拍照詢價(jià)

上海一山姆會(huì)員商店陳列81萬元黃金榴蓮,店員:每天都有人拍照詢價(jià)

第一財(cái)經(jīng)資訊
2025-12-23 19:29:52
中國最后一位太監(jiān)孫耀庭自述:晚上伺候娘娘時(shí),鞋底必須藏蒼耳

中國最后一位太監(jiān)孫耀庭自述:晚上伺候娘娘時(shí),鞋底必須藏蒼耳

妙知
2025-08-28 10:19:43
火箭戰(zhàn)績已拉響警報(bào)!烏度卡與斯通夏窗交易分歧再引熱議!

火箭戰(zhàn)績已拉響警報(bào)!烏度卡與斯通夏窗交易分歧再引熱議!

田先生籃球
2025-12-23 14:30:53
何穗首談生產(chǎn)感受,懷胎10月不是取舍,不做超人媽媽,也會(huì)不開心

何穗首談生產(chǎn)感受,懷胎10月不是取舍,不做超人媽媽,也會(huì)不開心

瘋說時(shí)尚
2025-12-23 14:15:56
這次,朱孝天將阿信給他保留的體面撕得粉碎,楊天真的話有人信了

這次,朱孝天將阿信給他保留的體面撕得粉碎,楊天真的話有人信了

叨嘮
2025-12-24 07:00:09
年底期間好運(yùn)惹不起的3生肖,事業(yè)漸入佳境,財(cái)運(yùn)火到飛起!

年底期間好運(yùn)惹不起的3生肖,事業(yè)漸入佳境,財(cái)運(yùn)火到飛起!

毅談生肖
2025-12-24 13:19:59
詹姆斯:我從未想過當(dāng)歷史總得分王!我得分第一、助攻也第四!

詹姆斯:我從未想過當(dāng)歷史總得分王!我得分第一、助攻也第四!

氧氣是個(gè)地鐵
2025-12-24 14:22:28
第一批免簽去俄羅斯的中產(chǎn)傻眼了

第一批免簽去俄羅斯的中產(chǎn)傻眼了

風(fēng)向觀察
2025-12-16 18:26:08
朝鮮和俄羅斯因20億美元援俄士兵勞務(wù)款項(xiàng)正式鬧掰

朝鮮和俄羅斯因20億美元援俄士兵勞務(wù)款項(xiàng)正式鬧掰

微微熱評
2025-12-22 16:44:36
69歲退休大爺哭訴:跳了半年廣場舞,每月8000元退休金都不夠用了

69歲退休大爺哭訴:跳了半年廣場舞,每月8000元退休金都不夠用了

人間百態(tài)大全
2025-12-17 06:35:03
南博事件升級(jí)!參與定"偽"的專家徐沄秋被扒,果然有情況

南博事件升級(jí)!參與定"偽"的專家徐沄秋被扒,果然有情況

鋭娛之樂
2025-12-21 08:30:41
鄭麗文韓國瑜聯(lián)手清黨渣,侯友宜盧秀燕跪地求饒,國民黨終于姓鄭

鄭麗文韓國瑜聯(lián)手清黨渣,侯友宜盧秀燕跪地求饒,國民黨終于姓鄭

徐徐道史
2025-12-24 11:09:24
媒體人:李凱爾的國籍信息還是以FIBA為準(zhǔn),未來他大概率來CBA打球

媒體人:李凱爾的國籍信息還是以FIBA為準(zhǔn),未來他大概率來CBA打球

懂球帝
2025-12-24 11:25:03
挺著七個(gè)月孕肚跪雪地作畫,繼子女喊“梅媽媽”,撕碎了后媽劇本

挺著七個(gè)月孕肚跪雪地作畫,繼子女喊“梅媽媽”,撕碎了后媽劇本

做一個(gè)合格的吃瓜群眾
2025-12-23 19:02:01
笑噴了!小楊阿姨兒子直播,從頭到腳圓滾滾,被調(diào)侃更像大少爺

笑噴了!小楊阿姨兒子直播,從頭到腳圓滾滾,被調(diào)侃更像大少爺

心靜物娛
2025-12-23 14:03:32
難以想象!上?!案欢?年花光1300萬,“每頓飯一萬多,出去一次一百多萬……”

難以想象!上?!案欢?年花光1300萬,“每頓飯一萬多,出去一次一百多萬……”

環(huán)球網(wǎng)資訊
2025-12-23 19:51:46
上海兩大“巨無霸”商業(yè)體年底壓軸登場,面積超42萬平方米,擁抱產(chǎn)城融合!

上海兩大“巨無霸”商業(yè)體年底壓軸登場,面積超42萬平方米,擁抱產(chǎn)城融合!

上觀新聞
2025-12-23 21:37:05
快船大勝送火箭三連敗,哈登29分小卡41分8籃板

快船大勝送火箭三連敗,哈登29分小卡41分8籃板

曉隯就是我
2025-12-24 14:01:46
2025-12-24 15:16:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11984文章數(shù) 142518關(guān)注度
往期回顧 全部

科技要聞

馬斯克沒想到的"中國速度"!2026值得期待

頭條要聞

幼兒園8人墜塘園長丈夫被調(diào)查 園內(nèi)有兩輛19座校車

頭條要聞

幼兒園8人墜塘園長丈夫被調(diào)查 園內(nèi)有兩輛19座校車

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

財(cái)經(jīng)要聞

快手到底惹了誰?

汽車要聞

“運(yùn)動(dòng)版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

親子
家居
藝術(shù)
本地
公開課

親子要聞

笑發(fā)財(cái)了,果然小孩子不用穿太好,寶媽:他真的不配!

家居要聞

法式大平層 智能家居添彩

藝術(shù)要聞

2026第一福!孫曉云親筆“福”字出爐

本地新聞

云游安徽|一川江水潤安慶,一塔一戲一城史

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版