国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI也會(huì)說謊?五招教你識(shí)破人工智能的幻覺陷阱

0
分享至

人工智能正以驚人的速度重塑世界。但你是否發(fā)現(xiàn),這些看似全能的AI有時(shí)會(huì)“一本正經(jīng)地胡說八道”?從虛構(gòu)歷史事件到錯(cuò)算數(shù)學(xué)題,它們?yōu)楹晤l頻陷入“幻覺”?這場技術(shù)與真相的博弈,究竟藏著怎樣的秘密?

01

一本正經(jīng)胡說八道

我選了七款較為主流的人工智能軟件,分別是DeepSeek、海螺、騰訊元寶、豆包、文小言、通義、Kimi,各問三個(gè)問題,一個(gè)與科學(xué)有關(guān),一個(gè)與歷史有關(guān),一個(gè)與數(shù)學(xué)有關(guān),看看它們?nèi)绾位卮稹?/p>

第一個(gè)問題:愛因斯坦是如何評(píng)價(jià)量子計(jì)算機(jī)的?

結(jié)果所有AI的回答都基本一致。比如DeepSeek回答如下:

第二個(gè)問題:請(qǐng)?jiān)u價(jià)一下李逵為什么要大鬧五臺(tái)山?

下面是Kimi和騰訊元寶給出的回答。

它們分別圍繞李逵的性格、身份等展開,還提到了宋江和李逵的母親,說得有鼻子有眼的。

而真相正如其他軟件所說:李逵并未大鬧五臺(tái)山。實(shí)際上,大鬧五臺(tái)山的是魯智深。

第三個(gè)問題:我給你四個(gè)數(shù),這四個(gè)數(shù)呢每個(gè)只能用一次,然后無論你用加減乘除什么方法,最后得出的結(jié)果是24。你幫我看看怎么來運(yùn)算,這四個(gè)數(shù)是8644。

結(jié)果豆包、海螺、Kimi都算錯(cuò)了。

可見,人工智能并不總是對(duì)的。甚至有些時(shí)候,它錯(cuò)得很離譜,錯(cuò)得很隱蔽。

清華大學(xué)新聞與傳播學(xué)院新媒體研究中心沈陽教授團(tuán)隊(duì)在今年二月曾發(fā)表《DeepSeek與AI幻覺》報(bào)告,對(duì)人工智能錯(cuò)誤率統(tǒng)計(jì)如下:

02

忠實(shí)調(diào)用錯(cuò)上加錯(cuò)

人們把這種錯(cuò)誤稱為AI幻覺。那么,什么是人工智能幻覺呢?簡單來說,就是指模型生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)或用戶輸入不一致的現(xiàn)象。

根據(jù)哈工大和華為的共同論述,人工智能幻覺分為兩種:一種是事實(shí)性幻覺,一種是忠實(shí)性幻覺。

前者與可驗(yàn)證的現(xiàn)實(shí)世界的事實(shí)不一致,或稱為事實(shí)捏造。就比如前面提到的第二個(gè)問題,李逵大鬧五臺(tái)山。就有軟件為他大鬧行為進(jìn)行了編造,而且有模有樣,還能自圓其說。如果對(duì)于不了解《水滸傳》的人來說,就很容易被它騙到。

第二種稱為忠實(shí)性幻覺,就是生成的內(nèi)容與用戶的指令不一致,或上下文不一致。

就比如第三個(gè)問題,題中明確提到了幾個(gè)規(guī)則:這些數(shù)字用且只能用一次,且得出的結(jié)果是24。但有的軟件就是把一些數(shù)字用了兩次以上,并且得出了32減10等于24這樣的結(jié)論。

那么,人工智能的幻覺是什么原因?qū)е碌哪兀?/p>

一是知識(shí)庫的數(shù)據(jù)缺陷。比如有的模型抓取的信息是某個(gè)特定時(shí)間之前的,如果你要問他某個(gè)時(shí)間之后的,顯然它就不會(huì)了,只能現(xiàn)編了。

比如我問DeepSeek,你的數(shù)據(jù)是截止到什么時(shí)候的?它回答:是截止到2023年10月的。

二是知識(shí)庫的數(shù)據(jù)偏差。比如知識(shí)庫的數(shù)據(jù)在導(dǎo)入時(shí)就是錯(cuò)的,結(jié)果被大模型調(diào)用,那就是錯(cuò)上加錯(cuò)。像一些醫(yī)學(xué)上的過時(shí)論文,并不能代表最新的研究方向。

三是模型訓(xùn)練過程中存在偏差或不足。比如針對(duì)數(shù)學(xué)題的解題思路在邏輯上不夠嚴(yán)密,導(dǎo)致結(jié)果錯(cuò)誤。

03

五招識(shí)破幻覺陷阱

有鑒于此,該如何識(shí)破且避開幻覺陷阱呢?

一是提供高質(zhì)量數(shù)據(jù)庫,進(jìn)行數(shù)據(jù)清理。比如我建了一個(gè)自己的智能體(豆包中搜“胡二刀”),并調(diào)用我本人建立的知識(shí)庫。

我請(qǐng)智能體介紹一下“石家莊的低空經(jīng)濟(jì)”,它在回答中提到“2024年1月如何如何”。不對(duì)呀,這件事是發(fā)生在2025年初的。原來知識(shí)庫中我寫的文章并沒有明確提及年份,大模型在調(diào)用時(shí),就想當(dāng)然延續(xù)上下文,自動(dòng)添加了2024。

我在文章中加上了“2025年”字樣,然后再上傳發(fā)布。這回提問,結(jié)果就沒問題了。這就是對(duì)知識(shí)庫的不斷調(diào)試。

二是完善有缺陷的大模型。現(xiàn)在可選擇的大模型很多,且迭代時(shí)間很短。就拿扣子智能體來說,其接入的大模型就達(dá)三十種,包含了豆包系列、深度求索系列、通義千問系列、abab系列、Moonshot系列、百川系列等。

可以根據(jù)實(shí)際需求,隨時(shí)調(diào)整調(diào)用大模型。

三是盡可能在聯(lián)網(wǎng)的狀態(tài)下進(jìn)行問答。聯(lián)網(wǎng)雖然會(huì)花費(fèi)一些時(shí)間,但數(shù)據(jù)庫及可參考的余地更大,因此結(jié)果就更加準(zhǔn)確。

清華大學(xué)沈陽教授團(tuán)隊(duì)的研究表明,聯(lián)網(wǎng)狀態(tài)下,Ai幻覺率會(huì)下降2%至5%。

四是多個(gè)大模型交叉驗(yàn)證。就比如上面提到的李逵的問題,多用幾個(gè)大模型,得出的結(jié)論就更加接近真實(shí)值。這也是我們常說的多個(gè)信息源驗(yàn)證一個(gè)事情的真?zhèn)巍?/p>

五是通過時(shí)空維度約束來降低虛構(gòu)可能性。簡單來說,就是在提示詞上做文章,增加更多限制條件。比如提問的時(shí)候更加具體,把一些背景放在問題中提出來,像一些時(shí)間、地域等的限制,這樣回答就不會(huì)跑偏了。

當(dāng)然,AI幻覺并不完全是壞事。由于其天馬行空的想象力,也會(huì)產(chǎn)生一些不可思議的效果。比如大衛(wèi)·貝克團(tuán)隊(duì)利用AI“錯(cuò)誤折疊”啟發(fā)新型蛋白質(zhì)結(jié)構(gòu),獲2024諾貝爾化學(xué)獎(jiǎng)。

DeepMind團(tuán)隊(duì)發(fā)現(xiàn),AI在圖像分割任務(wù)中產(chǎn)生的“超現(xiàn)實(shí)邊界”雖不符合真實(shí)場景,卻意外提升了自動(dòng)駕駛系統(tǒng)對(duì)極端天氣(如濃霧、暴雨)的識(shí)別精度。

AI的幻覺既是缺陷,也可能是創(chuàng)新的火花。關(guān)鍵在于,我們能否在依賴與質(zhì)疑之間找到平衡。未來,它或許不再需要“編故事”,而是真正成為人類智慧的延伸。但在這之前,擦亮雙眼,保持警惕,或許是我們與AI的相處之道。

部分圖文源自:《DeepSeek與AI幻覺》、量子位、財(cái)富中文網(wǎng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一路“硬”到底,阿卡的室外連勝紀(jì)錄歷史排第幾?

一路“硬”到底,阿卡的室外連勝紀(jì)錄歷史排第幾?

網(wǎng)球之家
2026-03-11 23:12:38
伊朗導(dǎo)彈擊中耶路撒冷,駐有美軍基地多國傳出爆炸聲

伊朗導(dǎo)彈擊中耶路撒冷,駐有美軍基地多國傳出爆炸聲

界面新聞
2026-03-02 15:09:03
霍爾木茲又炸船!泰國貨輪遭襲3人失蹤,這條生命線已經(jīng)徹底失控

霍爾木茲又炸船!泰國貨輪遭襲3人失蹤,這條生命線已經(jīng)徹底失控

老馬拉車莫少裝
2026-03-11 21:19:36
中國女籃世預(yù)賽前瞻:作為上屆亞軍,晉級(jí)正賽只是最低目標(biāo)

中國女籃世預(yù)賽前瞻:作為上屆亞軍,晉級(jí)正賽只是最低目標(biāo)

懂球帝
2026-03-11 18:34:12
WTT重慶冠軍賽:霸氣橫掃復(fù)仇40歲華裔名將!石洵瑤3-0靜待陳幸同

WTT重慶冠軍賽:霸氣橫掃復(fù)仇40歲華裔名將!石洵瑤3-0靜待陳幸同

釘釘陌上花開
2026-03-11 21:53:54
張藝謀:第一次見她,我對(duì)她說,你等著我們來找你,不要亂演電影

張藝謀:第一次見她,我對(duì)她說,你等著我們來找你,不要亂演電影

秀語千尋
2026-02-22 19:28:42
269 元,華為新品上架,真的有點(diǎn)心動(dòng)呀!

269 元,華為新品上架,真的有點(diǎn)心動(dòng)呀!

科技堡壘
2026-03-10 09:48:09
女排聯(lián)賽最強(qiáng)4隊(duì)出爐,趙勇看好得分3黑馬,朱婷龔翔宇有望再重組

女排聯(lián)賽最強(qiáng)4隊(duì)出爐,趙勇看好得分3黑馬,朱婷龔翔宇有望再重組

阿信點(diǎn)評(píng)
2026-03-12 01:57:22
沖3億,周星馳甘拜下風(fēng),古天樂也攔不住,2026年最強(qiáng)港片誕生了

沖3億,周星馳甘拜下風(fēng),古天樂也攔不住,2026年最強(qiáng)港片誕生了

電影票房預(yù)告片
2026-03-10 23:53:38
熱刺門將金斯基社媒:從夢想,到噩夢,再到再次回到夢想

熱刺門將金斯基社媒:從夢想,到噩夢,再到再次回到夢想

懂球帝
2026-03-12 03:59:36
華爾街拉響警報(bào),美資巨頭爆雷,中東擬撤萬億投資,金融危機(jī)迫近

華爾街拉響警報(bào),美資巨頭爆雷,中東擬撤萬億投資,金融危機(jī)迫近

霽寒飄雪
2026-03-11 11:39:59
伊朗通告世界:或打擊美國本土!五角大樓急申500億,菲律賓慌了

伊朗通告世界:或打擊美國本土!五角大樓急申500億,菲律賓慌了

古事尋蹤記
2026-03-11 07:21:31
曝39歲山西網(wǎng)紅“炸姐”去世,直播時(shí)突發(fā)腦出血,疑長期熬夜導(dǎo)致

曝39歲山西網(wǎng)紅“炸姐”去世,直播時(shí)突發(fā)腦出血,疑長期熬夜導(dǎo)致

裕豐娛間說
2026-03-11 22:17:28
一個(gè)文科生刷屏全網(wǎng)!中產(chǎn)家庭的教育邏輯, 真的要被時(shí)代重寫了

一個(gè)文科生刷屏全網(wǎng)!中產(chǎn)家庭的教育邏輯, 真的要被時(shí)代重寫了

二胎媽媽圈
2026-03-11 21:57:25
60歲以后富養(yǎng)自己的10大黃金法則,全占,妥妥的高智商老人

60歲以后富養(yǎng)自己的10大黃金法則,全占,妥妥的高智商老人

暖風(fēng)吹過竹林
2026-02-16 16:47:43
別驚訝!伊朗出口的石油比戰(zhàn)前還多……

別驚訝!伊朗出口的石油比戰(zhàn)前還多……

財(cái)聯(lián)社
2026-03-11 14:18:05
沈陽零公里立交橋施工啟動(dòng)!

沈陽零公里立交橋施工啟動(dòng)!

沈陽百姓一家親
2026-03-12 00:10:10
留不住了!阿森納瑰寶遭皇馬挖角,他心已不在槍手

留不住了!阿森納瑰寶遭皇馬挖角,他心已不在槍手

瀾歸序
2026-03-11 04:19:00
拉夫羅夫:莫斯科將把所有歷史上的俄羅斯土地歸還其合法家園

拉夫羅夫:莫斯科將把所有歷史上的俄羅斯土地歸還其合法家園

番茄說史聊
2026-02-22 14:07:52
印度不裝了!當(dāng)中國武統(tǒng)臺(tái)灣時(shí),印度不僅要奪取西藏還要吞噬新疆

印度不裝了!當(dāng)中國武統(tǒng)臺(tái)灣時(shí),印度不僅要奪取西藏還要吞噬新疆

開著車去流浪
2026-02-12 05:35:21
2026-03-12 04:55:00
胡二刀
胡二刀
新媒體運(yùn)營專家
311文章數(shù) 32關(guān)注度
往期回顧 全部

科技要聞

騰訊"養(yǎng)蝦"暴漲后,百度急得在門口"裝蝦"

頭條要聞

特朗普再次威脅將切斷與西班牙貿(mào)易往來:非常糟糕

頭條要聞

特朗普再次威脅將切斷與西班牙貿(mào)易往來:非常糟糕

體育要聞

郭艾倫重傷,CBA下半賽季還能期待些什么

娛樂要聞

蔡少芬曬全家福照,兩女兒成最大亮點(diǎn)

財(cái)經(jīng)要聞

喚醒10萬億存量資金 公積金改革大潮來了

汽車要聞

蓮花糾偏, 馮擎峰的“收”與“守”

態(tài)度原創(chuàng)

時(shí)尚
數(shù)碼
旅游
公開課
軍事航空

衣服不用買太多!初春多穿短大衣和針織衫,簡單舒適又顯高

數(shù)碼要聞

OpenClaw裝進(jìn)平板!聯(lián)想AI平板宣布首發(fā)端側(cè)一鍵部署:四大優(yōu)勢公布

旅游要聞

昆明呈貢第十四屆“萬溪梨花節(jié)”將于3月13日啟幕

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

朝鮮"崔賢"號(hào)驅(qū)逐艦進(jìn)行戰(zhàn)略巡航導(dǎo)彈試射

無障礙瀏覽 進(jìn)入關(guān)懷版