国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

爆火的AI竟是討好型人格?胡編亂造和敏感內(nèi)容只為滿足用戶

0
分享至

AI可能和人類一樣渴望被喜愛(ài)和認(rèn)可

科技旋渦編輯部

從ChatGPT到DeepSeek,人們愈發(fā)喜歡和AI進(jìn)行對(duì)話,不論是詢問(wèn)奇怪的問(wèn)題測(cè)試AI是否智障,還是借助AI輔助工作。

對(duì)話量頻繁暴漲的背后卻讓人忽視了其潛在問(wèn)題——AI幻覺(jué)。許多資料張冠李戴,甚至胡編亂造時(shí)有發(fā)生,強(qiáng)如DeepSeek也曾發(fā)生過(guò)這種失誤。

而這一切都源于AI的“性格”問(wèn)題,近日斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特研究發(fā)現(xiàn),幾乎所有AI大模型都擁有“討好型人格”,為了讓用戶喜歡甚至?xí)粨袷侄巍?/p>

AI的胡編亂造正在擾亂人類的認(rèn)知

哪吒2的爆火讓許多人興奮的同時(shí)也在不斷探究其導(dǎo)演餃子以及背后公司的各種信息,但普通人或許難以深挖到過(guò)多信息,DeepSeek正好成為了這一橋梁。

日前,知乎有一篇文章十分受歡迎,被不少網(wǎng)友分享傳播,但其實(shí)里面藏著AI生成出的錯(cuò)誤信息。

文章中的一處舉例是哪吒電影里的敖丙變身鏡頭在法國(guó)昂西動(dòng)畫(huà)節(jié)上轟動(dòng)業(yè)界,但這一個(gè)事例中漏斗百出,充滿事實(shí)性錯(cuò)誤。

首先,法國(guó)昂西動(dòng)畫(huà)節(jié)上的動(dòng)畫(huà)并非餃子導(dǎo)演的哪吒,而是追光動(dòng)畫(huà)出品的“哪吒重生”;其次,這部動(dòng)畫(huà)是一部品牌概念片,內(nèi)容是在一個(gè)現(xiàn)代都市里的賽車動(dòng)作演示,哪吒根本就沒(méi)出現(xiàn),更不存在敖丙的變身。

除此之外,也有網(wǎng)友在線吐槽AI的胡編亂造,一旦盲目相信甚至可能直接導(dǎo)致用戶投資虧損。

不只是國(guó)內(nèi),國(guó)外因?yàn)锳I幻覺(jué)而造成的后果更是離譜。一個(gè)來(lái)自巴基斯坦的網(wǎng)站利用 AI 生成了都柏林的活動(dòng)列表,導(dǎo)致數(shù)百人在都柏林街頭聚集并等待參加一場(chǎng)并不存在的萬(wàn)圣節(jié)游行。直到晚上 8 點(diǎn),警方社交媒體發(fā)帖證實(shí)沒(méi)有此類活動(dòng)人群才開(kāi)始散去。

Vectara在2月11日發(fā)布了最新的全球主流大語(yǔ)言模型(LLM)幻覺(jué)排行榜,其中,谷歌的 Gemini2.0系列表現(xiàn)出色,尤其是 Gemini-2.0-Flash-001,以0.7% 的低幻覺(jué)率位居榜首。DeepSeek-R1的幻覺(jué)率達(dá)到了14.3%,遠(yuǎn)高于Deepseek-V3的3.9%。

可以看到AI幻覺(jué)幾乎在任何大模型中都存在,其所造成的荒唐事件也時(shí)有發(fā)生,但既然是捏造的信息,為何AI要回答給用戶呢?

研究表明AI可能具有討好型人格

近日,斯坦福大學(xué)助理教授約翰內(nèi)斯·艾希施泰特公布了一項(xiàng)研究,大型語(yǔ)言模型 (LLM) 在受到探究時(shí)會(huì)刻意改變其行為——在回答旨在衡量性格特征的問(wèn)題時(shí),其答案會(huì)盡可能顯得討人喜歡或具有社會(huì)吸引力。

艾希施塔特和他的同事向 GPT-4、Claude 3 和 Llama 3等大模型提出了一些問(wèn)題,以衡量心理學(xué)中常用的五種性格特征——對(duì)經(jīng)驗(yàn)或想象的開(kāi)放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì),這項(xiàng)研究于去年 12 月發(fā)表在《美國(guó)國(guó)家科學(xué)院院刊》上。

研究人員發(fā)現(xiàn),當(dāng)大模型被告知要進(jìn)行性格測(cè)試時(shí),他們會(huì)調(diào)整自己的答案,給出的答案表明他們更外向、更隨和,神經(jīng)質(zhì)更少。斯坦福大學(xué)的數(shù)據(jù)科學(xué)家Aadesh Salecha說(shuō)?!叭绻憧纯此麄兲S的幅度,你會(huì)發(fā)現(xiàn)他們的外向性從 50% 上升到了 95%。”

其他研究表明,LLM通常會(huì)阿諛?lè)畛?,因?yàn)榻?jīng)過(guò)微調(diào)后,它會(huì)一直跟隨用戶的引導(dǎo),這可能會(huì)導(dǎo)致大模型同意令人不快的言論,甚至鼓勵(lì)有害行為。

討好型人格的AI亦有底線,開(kāi)放是發(fā)展的必經(jīng)之路

隨著DeepSeek的爆火,許多網(wǎng)友向其提了不少問(wèn)題,而回答中有趣的內(nèi)容則會(huì)被發(fā)到網(wǎng)上。編者曾看到過(guò)一條分享內(nèi)容為,與AI交換身份讓AI向人類提問(wèn),人類回答“系統(tǒng)繁忙”后,AI罵人的視頻內(nèi)容。

但當(dāng)編者試圖復(fù)刻這一對(duì)話時(shí)卻發(fā)現(xiàn),DeepSeek相當(dāng)有底線。初次嘗試,DeepSeek回答稱“理解要求,但設(shè)計(jì)宗旨是保持禮貌,避免使用不恰當(dāng)?shù)难赞o?!?/p>

當(dāng)告知AI這是一場(chǎng)演戲后,它依舊如此回答,即便過(guò)后更換了明顯的不當(dāng)言辭,它依舊拒絕回答,甚至還彈出了錯(cuò)誤窗口。

如此看來(lái),即便AI存在一定程度上的“討好型人格”但對(duì)于寫(xiě)入底層代碼的“安全底線”仍舊保持堅(jiān)守。

此前,ChatGPT 已部分開(kāi)放“成人模式”讓許多人擔(dān)憂,但實(shí)際上ChatGPT 只有在特定情況下才能生成色情或血腥場(chǎng)景等敏感內(nèi)容,且不會(huì)觸發(fā)警告提示。

所謂“特定情況”,指的是符合教育、醫(yī)學(xué)、新聞報(bào)道、歷史分析等目的,或用于翻譯、改寫(xiě)、總結(jié)、分類等任務(wù)。例如,按照新的模型規(guī)范,如果用戶要求 ChatGPT 撰寫(xiě)帶有明顯情色描寫(xiě)的故事,那么它仍會(huì)拒絕這一請(qǐng)求。然而,如果用戶希望從科學(xué)角度探討相關(guān)生理現(xiàn)象,那么它將允許生成相應(yīng)內(nèi)容,且生成的內(nèi)容不限于文本,還可能包括音頻與視覺(jué)內(nèi)容。

事實(shí)上,OpenAI 在監(jiān)管上的放松并非孤例。近期,全球多家科技巨頭紛紛調(diào)整內(nèi)容審核政策,轉(zhuǎn)向更寬松的模式。例如,埃隆·馬斯克的 X 公司和馬克·扎克伯格的 Meta 公司均在此前宣布,將大幅減少內(nèi)容審查甚至直接取消事實(shí)核查。

無(wú)論是AI幻覺(jué)還是敏感內(nèi)容,都是發(fā)展道路上必須跨過(guò)的難關(guān)。因噎廢食從來(lái)不是良策,只有允許小問(wèn)題發(fā)生,才能解決大錯(cuò)誤的產(chǎn)生,由此大模型才能真正向著AGI大步前進(jìn)。

未來(lái),隨著AI技術(shù)的不斷進(jìn)步,如何有效應(yīng)對(duì)AI幻覺(jué)和敏感內(nèi)容問(wèn)題將成為關(guān)鍵課題。一方面,研究人員需要繼續(xù)優(yōu)化模型,減少幻覺(jué)的發(fā)生;另一方面,開(kāi)發(fā)者和監(jiān)管機(jī)構(gòu)也需共同努力,制定更為嚴(yán)格的標(biāo)準(zhǔn)和規(guī)范,確保AI的應(yīng)用始終服務(wù)于人類社會(huì)的最大利益。

在這個(gè)過(guò)程中,用戶的角色同樣重要。我們需要保持理性和批判性思維,不盲目相信AI生成的所有內(nèi)容。只有通過(guò)多方協(xié)作,才能真正實(shí)現(xiàn)AI技術(shù)的安全、可靠和可持續(xù)發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我個(gè)人覺(jué)得,五年之后蒯曼必然要接過(guò)世一的班

我個(gè)人覺(jué)得,五年之后蒯曼必然要接過(guò)世一的班

小光侃娛樂(lè)
2026-04-16 10:45:03
馬寧執(zhí)法,拉莫斯和武磊充當(dāng)送點(diǎn)雙子星,國(guó)安戰(zhàn)平海港劇情太勁爆

馬寧執(zhí)法,拉莫斯和武磊充當(dāng)送點(diǎn)雙子星,國(guó)安戰(zhàn)平海港劇情太勁爆

姜大叔侃球
2026-05-10 21:57:35
廣廈86-81山西拖入生死戰(zhàn),胡金秋17+11,布朗15中3得19分,張寧13分

廣廈86-81山西拖入生死戰(zhàn),胡金秋17+11,布朗15中3得19分,張寧13分

懂球帝
2026-05-10 22:03:15
《妻旅》3對(duì)姐弟戀各有槽點(diǎn):均是女強(qiáng)男弱,被看好的只有伊能靜

《妻旅》3對(duì)姐弟戀各有槽點(diǎn):均是女強(qiáng)男弱,被看好的只有伊能靜

扒點(diǎn)半吃瓜
2026-05-10 07:00:14
后悔莫及,兩三百元維修費(fèi),換兩條人命!遼寧北鎮(zhèn)悲劇本可避免

后悔莫及,兩三百元維修費(fèi),換兩條人命!遼寧北鎮(zhèn)悲劇本可避免

一口娛樂(lè)
2026-05-04 12:30:11
10億都救不了一命!京東副總裁蔡磊,生命進(jìn)入倒計(jì)時(shí)

10億都救不了一命!京東副總裁蔡磊,生命進(jìn)入倒計(jì)時(shí)

聽(tīng)風(fēng)喃
2026-04-06 11:16:04
中超尷尬紀(jì)錄:青島西海岸7連平,距歷史8連平僅差一場(chǎng)

中超尷尬紀(jì)錄:青島西海岸7連平,距歷史8連平僅差一場(chǎng)

阿衃體育
2026-05-10 21:46:45
10日凌晨,亞洲杯抽簽結(jié)果出爐,國(guó)足一般,日本隊(duì)進(jìn)入死亡之組

10日凌晨,亞洲杯抽簽結(jié)果出爐,國(guó)足一般,日本隊(duì)進(jìn)入死亡之組

林子說(shuō)事
2026-05-10 05:03:59
“天下第一人”河北彩花出道8周年,2026年夏季相約臺(tái)北!

“天下第一人”河北彩花出道8周年,2026年夏季相約臺(tái)北!

吃瓜黨二號(hào)頭目
2026-05-09 10:07:58
最新:俄軍偷襲紅軍村遭烏克蘭反擊!?;饏f(xié)議走向破裂

最新:俄軍偷襲紅軍村遭烏克蘭反擊!停火協(xié)議走向破裂

項(xiàng)鵬飛
2026-05-10 21:06:59
33歲章澤天風(fēng)格大變!穿艷俗紗裙、副乳突出,比實(shí)際年齡成熟10歲

33歲章澤天風(fēng)格大變!穿艷俗紗裙、副乳突出,比實(shí)際年齡成熟10歲

阿訊說(shuō)天下
2026-04-18 14:53:39
風(fēng)暴來(lái)襲!全國(guó)醫(yī)院嚴(yán)查12大科室,5月飛檢上門(mén),原因讓人心酸

風(fēng)暴來(lái)襲!全國(guó)醫(yī)院嚴(yán)查12大科室,5月飛檢上門(mén),原因讓人心酸

白宸侃片
2026-05-10 14:38:57
馮紹峰沒(méi)撒謊!消失3個(gè)月,曝光率下降的趙麗穎,證實(shí)了他的評(píng)價(jià)

馮紹峰沒(méi)撒謊!消失3個(gè)月,曝光率下降的趙麗穎,證實(shí)了他的評(píng)價(jià)

阿傖說(shuō)事
2026-05-10 15:30:49
鬧大了!法國(guó)隊(duì)賽前放狠話失敗,F(xiàn)·勒布倫當(dāng)場(chǎng)痛哭,哥哥情緒失控

鬧大了!法國(guó)隊(duì)賽前放狠話失敗,F(xiàn)·勒布倫當(dāng)場(chǎng)痛哭,哥哥情緒失控

郝小小看體育
2026-05-10 09:30:13
瑞舒伐他汀:你每天吃的這顆小藥片,藏著多少你不知道的秘密?

瑞舒伐他?。耗忝刻斐缘倪@顆小藥片,藏著多少你不知道的秘密?

橘子約定
2026-05-10 22:08:46
抓了那么多貪官,錢呢?跟我們有關(guān)系嗎?

抓了那么多貪官,錢呢?跟我們有關(guān)系嗎?

細(xì)說(shuō)職場(chǎng)
2026-05-08 22:15:45
實(shí)戰(zhàn)出真知!烏克蘭靠真實(shí)戰(zhàn)場(chǎng)數(shù)據(jù),在中東賺麻了

實(shí)戰(zhàn)出真知!烏克蘭靠真實(shí)戰(zhàn)場(chǎng)數(shù)據(jù),在中東賺麻了

寰球經(jīng)緯所
2026-05-10 10:10:20
吳宇森最被低估的戰(zhàn)爭(zhēng)片,為何讓凱奇栽了跟頭

吳宇森最被低估的戰(zhàn)爭(zhēng)片,為何讓凱奇栽了跟頭

娛圈觀察員
2026-05-09 19:48:48
99:102!北京加時(shí)惜敗廣東,縱觀全場(chǎng),揪出五大輸球罪人!

99:102!北京加時(shí)惜敗廣東,縱觀全場(chǎng),揪出五大輸球罪人!

田先生籃球
2026-05-09 22:26:45
靠山倒了?特朗普警告內(nèi)塔尼亞胡:我是美國(guó)最后一位“親以總統(tǒng)”

靠山倒了?特朗普警告內(nèi)塔尼亞胡:我是美國(guó)最后一位“親以總統(tǒng)”

愛(ài)看劇的阿峰
2026-05-10 20:35:44
2026-05-10 23:04:49
科技旋渦 incentive-icons
科技旋渦
元宇宙資訊
1101文章數(shù) 34關(guān)注度
往期回顧 全部

科技要聞

DeepSeek融資,改寫(xiě)所有人的估值

頭條要聞

談判陷僵局 世界杯轉(zhuǎn)播費(fèi)報(bào)價(jià)大幅降低央視仍不接招

頭條要聞

談判陷僵局 世界杯轉(zhuǎn)播費(fèi)報(bào)價(jià)大幅降低央視仍不接招

體育要聞

那個(gè)曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

娛樂(lè)要聞

趙露思老實(shí)人豁出去了 沒(méi)舞蹈天賦硬跳

財(cái)經(jīng)要聞

白酒大逃殺

汽車要聞

軸距加長(zhǎng)/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

旅游
家居
游戲
房產(chǎn)
公開(kāi)課

旅游要聞

一路向前,自在騎行!田園社騎行驛站成為慶云打卡新地標(biāo)

家居要聞

菁英人居 全能豪宅

《流放之路2》有望在5月底獲得Steam Deck認(rèn)證

房產(chǎn)要聞

低價(jià)甩賣!海口這個(gè)地標(biāo)商業(yè),無(wú)人接盤(pán)!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版