国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI也會說謊?五招教你識破人工智能的幻覺陷阱

0
分享至

人工智能正以驚人的速度重塑世界。但你是否發(fā)現(xiàn),這些看似全能的AI有時(shí)會“一本正經(jīng)地胡說八道”?從虛構(gòu)歷史事件到錯(cuò)算數(shù)學(xué)題,它們?yōu)楹晤l頻陷入“幻覺”?這場技術(shù)與真相的博弈,究竟藏著怎樣的秘密?

01

一本正經(jīng)胡說八道

我選了七款較為主流的人工智能軟件,分別是DeepSeek、海螺、騰訊元寶、豆包、文小言、通義、Kimi,各問三個(gè)問題,一個(gè)與科學(xué)有關(guān),一個(gè)與歷史有關(guān),一個(gè)與數(shù)學(xué)有關(guān),看看它們?nèi)绾位卮稹?/p>

第一個(gè)問題:愛因斯坦是如何評價(jià)量子計(jì)算機(jī)的?

結(jié)果所有AI的回答都基本一致。比如DeepSeek回答如下:

第二個(gè)問題:請?jiān)u價(jià)一下李逵為什么要大鬧五臺山?

下面是Kimi和騰訊元寶給出的回答。

它們分別圍繞李逵的性格、身份等展開,還提到了宋江和李逵的母親,說得有鼻子有眼的。

而真相正如其他軟件所說:李逵并未大鬧五臺山。實(shí)際上,大鬧五臺山的是魯智深。

第三個(gè)問題:我給你四個(gè)數(shù),這四個(gè)數(shù)呢每個(gè)只能用一次,然后無論你用加減乘除什么方法,最后得出的結(jié)果是24。你幫我看看怎么來運(yùn)算,這四個(gè)數(shù)是8644。

結(jié)果豆包、海螺、Kimi都算錯(cuò)了。

可見,人工智能并不總是對的。甚至有些時(shí)候,它錯(cuò)得很離譜,錯(cuò)得很隱蔽。

清華大學(xué)新聞與傳播學(xué)院新媒體研究中心沈陽教授團(tuán)隊(duì)在今年二月曾發(fā)表《DeepSeek與AI幻覺》報(bào)告,對人工智能錯(cuò)誤率統(tǒng)計(jì)如下:

02

忠實(shí)調(diào)用錯(cuò)上加錯(cuò)

人們把這種錯(cuò)誤稱為AI幻覺。那么,什么是人工智能幻覺呢?簡單來說,就是指模型生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)或用戶輸入不一致的現(xiàn)象。

根據(jù)哈工大和華為的共同論述,人工智能幻覺分為兩種:一種是事實(shí)性幻覺,一種是忠實(shí)性幻覺。

前者與可驗(yàn)證的現(xiàn)實(shí)世界的事實(shí)不一致,或稱為事實(shí)捏造。就比如前面提到的第二個(gè)問題,李逵大鬧五臺山。就有軟件為他大鬧行為進(jìn)行了編造,而且有模有樣,還能自圓其說。如果對于不了解《水滸傳》的人來說,就很容易被它騙到。

第二種稱為忠實(shí)性幻覺,就是生成的內(nèi)容與用戶的指令不一致,或上下文不一致。

就比如第三個(gè)問題,題中明確提到了幾個(gè)規(guī)則:這些數(shù)字用且只能用一次,且得出的結(jié)果是24。但有的軟件就是把一些數(shù)字用了兩次以上,并且得出了32減10等于24這樣的結(jié)論。

那么,人工智能的幻覺是什么原因?qū)е碌哪兀?/p>

一是知識庫的數(shù)據(jù)缺陷。比如有的模型抓取的信息是某個(gè)特定時(shí)間之前的,如果你要問他某個(gè)時(shí)間之后的,顯然它就不會了,只能現(xiàn)編了。

比如我問DeepSeek,你的數(shù)據(jù)是截止到什么時(shí)候的?它回答:是截止到2023年10月的。

二是知識庫的數(shù)據(jù)偏差。比如知識庫的數(shù)據(jù)在導(dǎo)入時(shí)就是錯(cuò)的,結(jié)果被大模型調(diào)用,那就是錯(cuò)上加錯(cuò)。像一些醫(yī)學(xué)上的過時(shí)論文,并不能代表最新的研究方向。

三是模型訓(xùn)練過程中存在偏差或不足。比如針對數(shù)學(xué)題的解題思路在邏輯上不夠嚴(yán)密,導(dǎo)致結(jié)果錯(cuò)誤。

03

五招識破幻覺陷阱

有鑒于此,該如何識破且避開幻覺陷阱呢?

一是提供高質(zhì)量數(shù)據(jù)庫,進(jìn)行數(shù)據(jù)清理。比如我建了一個(gè)自己的智能體(豆包中搜“胡二刀”),并調(diào)用我本人建立的知識庫。

我請智能體介紹一下“石家莊的低空經(jīng)濟(jì)”,它在回答中提到“2024年1月如何如何”。不對呀,這件事是發(fā)生在2025年初的。原來知識庫中我寫的文章并沒有明確提及年份,大模型在調(diào)用時(shí),就想當(dāng)然延續(xù)上下文,自動(dòng)添加了2024。

我在文章中加上了“2025年”字樣,然后再上傳發(fā)布。這回提問,結(jié)果就沒問題了。這就是對知識庫的不斷調(diào)試。

二是完善有缺陷的大模型?,F(xiàn)在可選擇的大模型很多,且迭代時(shí)間很短。就拿扣子智能體來說,其接入的大模型就達(dá)三十種,包含了豆包系列、深度求索系列、通義千問系列、abab系列、Moonshot系列、百川系列等。

可以根據(jù)實(shí)際需求,隨時(shí)調(diào)整調(diào)用大模型。

三是盡可能在聯(lián)網(wǎng)的狀態(tài)下進(jìn)行問答。聯(lián)網(wǎng)雖然會花費(fèi)一些時(shí)間,但數(shù)據(jù)庫及可參考的余地更大,因此結(jié)果就更加準(zhǔn)確。

清華大學(xué)沈陽教授團(tuán)隊(duì)的研究表明,聯(lián)網(wǎng)狀態(tài)下,Ai幻覺率會下降2%至5%。

四是多個(gè)大模型交叉驗(yàn)證。就比如上面提到的李逵的問題,多用幾個(gè)大模型,得出的結(jié)論就更加接近真實(shí)值。這也是我們常說的多個(gè)信息源驗(yàn)證一個(gè)事情的真?zhèn)巍?/p>

五是通過時(shí)空維度約束來降低虛構(gòu)可能性。簡單來說,就是在提示詞上做文章,增加更多限制條件。比如提問的時(shí)候更加具體,把一些背景放在問題中提出來,像一些時(shí)間、地域等的限制,這樣回答就不會跑偏了。

當(dāng)然,AI幻覺并不完全是壞事。由于其天馬行空的想象力,也會產(chǎn)生一些不可思議的效果。比如大衛(wèi)·貝克團(tuán)隊(duì)利用AI“錯(cuò)誤折疊”啟發(fā)新型蛋白質(zhì)結(jié)構(gòu),獲2024諾貝爾化學(xué)獎(jiǎng)。

DeepMind團(tuán)隊(duì)發(fā)現(xiàn),AI在圖像分割任務(wù)中產(chǎn)生的“超現(xiàn)實(shí)邊界”雖不符合真實(shí)場景,卻意外提升了自動(dòng)駕駛系統(tǒng)對極端天氣(如濃霧、暴雨)的識別精度。

AI的幻覺既是缺陷,也可能是創(chuàng)新的火花。關(guān)鍵在于,我們能否在依賴與質(zhì)疑之間找到平衡。未來,它或許不再需要“編故事”,而是真正成為人類智慧的延伸。但在這之前,擦亮雙眼,保持警惕,或許是我們與AI的相處之道。

部分圖文源自:《DeepSeek與AI幻覺》、量子位、財(cái)富中文網(wǎng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太猛了,馬上兩倍~~

太猛了,馬上兩倍~~

初善投資
2026-01-08 15:10:02
越南不恨美國,不恨日本,連殖民幾十年的法國都不恨,就只恨中國

越南不恨美國,不恨日本,連殖民幾十年的法國都不恨,就只恨中國

我心縱橫天地間
2026-01-07 19:17:18
伊能靜參觀清真寺,包著頭巾不敢大聲說話,秦昊把她拍得像130斤

伊能靜參觀清真寺,包著頭巾不敢大聲說話,秦昊把她拍得像130斤

喜歡歷史的阿繁
2026-01-10 13:15:17
全球媒體關(guān)注:極氪9系豪華雙旗艦成美國CES最大“攪局者”

全球媒體關(guān)注:極氪9系豪華雙旗艦成美國CES最大“攪局者”

藍(lán)鯨新聞
2026-01-09 19:06:04
王菲謝霆鋒分房睡十年:保命還是分手信號

王菲謝霆鋒分房睡十年:保命還是分手信號

如安青何
2026-01-12 10:27:45
單親媽媽的崩潰!400元海底撈引爆母女大戰(zhàn),養(yǎng)的狗比親媽還金貴

單親媽媽的崩潰!400元海底撈引爆母女大戰(zhàn),養(yǎng)的狗比親媽還金貴

蝴蝶花雨話教育
2026-01-05 09:07:40
有點(diǎn)小摩擦,馬卡:亞馬爾在場上質(zhì)問赫伊森是否瘋了

有點(diǎn)小摩擦,馬卡:亞馬爾在場上質(zhì)問赫伊森是否瘋了

懂球帝
2026-01-12 07:50:14
夫妻因兩個(gè)包子激烈爭吵,丈夫?qū)⒑⒆訌?樓扔下,警方調(diào)查后卻傻眼

夫妻因兩個(gè)包子激烈爭吵,丈夫?qū)⒑⒆訌?樓扔下,警方調(diào)查后卻傻眼

懸案解密檔案
2026-01-07 09:49:27
美國如果購買格陵蘭成功,咱們可以學(xué)習(xí)美國,能拿錢購買緬甸嗎?

美國如果購買格陵蘭成功,咱們可以學(xué)習(xí)美國,能拿錢購買緬甸嗎?

貍花小咪
2026-01-11 19:21:39
田樸珺罕見秀恩愛,帶王石剪了個(gè)新發(fā)型年輕不少!5歲女兒像爸爸

田樸珺罕見秀恩愛,帶王石剪了個(gè)新發(fā)型年輕不少!5歲女兒像爸爸

娛樂團(tuán)長
2026-01-10 11:48:47
廣東30分大勝遼籃!徐杰破紀(jì)錄,三外援合砍71分,胡明軒僅得3分

廣東30分大勝遼籃!徐杰破紀(jì)錄,三外援合砍71分,胡明軒僅得3分

多特體育說
2026-01-11 21:32:39
未來國足一門有力爭奪者,李昊發(fā)揮的難以置信!申花在猶豫什么?

未來國足一門有力爭奪者,李昊發(fā)揮的難以置信!申花在猶豫什么?

中國足球的那些事兒
2026-01-12 00:08:16
中國動(dòng)“真格”中方霸氣警告:90天不給358億賠償,18艘軍艦不給

中國動(dòng)“真格”中方霸氣警告:90天不給358億賠償,18艘軍艦不給

瞳哥視界
2025-12-29 20:55:09
格陵蘭島的原住民是“黃種人”,無論丹麥還是美國都無權(quán)爭奪該島

格陵蘭島的原住民是“黃種人”,無論丹麥還是美國都無權(quán)爭奪該島

荊楚寰宇文樞
2026-01-10 22:48:37
何穗新年后拍女刊,腮骨突出眼神疲憊,網(wǎng)友:陳偉霆眼光太差了!

何穗新年后拍女刊,腮骨突出眼神疲憊,網(wǎng)友:陳偉霆眼光太差了!

樂悠悠娛樂
2026-01-11 09:59:54
阿里納斯:熱火文化是詹姆斯等巨星創(chuàng)造的,他們奪冠后熱火就趕走他們

阿里納斯:熱火文化是詹姆斯等巨星創(chuàng)造的,他們奪冠后熱火就趕走他們

懂球帝
2026-01-12 11:45:39
中國最牛騙子,勞改犯搖身一變成空降高官,銳意改革政績突出

中國最牛騙子,勞改犯搖身一變成空降高官,銳意改革政績突出

史政先鋒
2026-01-05 19:53:45
伊朗政府宣布全國哀悼三天

伊朗政府宣布全國哀悼三天

環(huán)球網(wǎng)資訊
2026-01-12 05:54:52
據(jù)說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關(guān)系

據(jù)說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關(guān)系

忠于法紀(jì)
2025-12-04 11:25:07
酸死了,遼寧電臺解說吐槽廣東靠外援,官媒跟自媒體已經(jīng)沒區(qū)別了

酸死了,遼寧電臺解說吐槽廣東靠外援,官媒跟自媒體已經(jīng)沒區(qū)別了

籃球看比賽
2026-01-12 11:15:58
2026-01-12 12:00:49
胡二刀
胡二刀
新媒體運(yùn)營專家
298文章數(shù) 32關(guān)注度
往期回顧 全部

科技要聞

小米二手車價(jià)大跳水:SU7半年跌5萬元

頭條要聞

媒體:美國"不演了" 特朗普直白表態(tài)震驚世界

頭條要聞

媒體:美國"不演了" 特朗普直白表態(tài)震驚世界

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車要聞

"家轎之王"變帥了 東風(fēng)日產(chǎn)全新軒逸量產(chǎn)下線

態(tài)度原創(chuàng)

親子
教育
藝術(shù)
手機(jī)
房產(chǎn)

親子要聞

人財(cái)兩空!廣東寶媽梁海燕去世,因羊水栓塞導(dǎo)致,十天花費(fèi)超50萬

教育要聞

22分鐘只能背十個(gè)單詞,高二英語50分,如何提高背單詞效率?

藝術(shù)要聞

畫完這組畫,他抑郁了,后來自殺了

手機(jī)要聞

2026年第一款真全面屏來了!紅魔11 Air官宣

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

無障礙瀏覽 進(jìn)入關(guān)懷版