国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

為什么AI總是捏造事實(shí)?AI:真不想的,容我狡辯一下

0
分享至

現(xiàn)如今,幾乎每個(gè)人的手機(jī)上都有那么兩三個(gè) AI 小助手,之前我們遇到了問題習(xí)慣去搜索引擎上搜索答案,現(xiàn)在可能更多地習(xí)慣于“有事問 AI”。

而 AI 也幾乎不會(huì)讓我們失望,任何問題都能給你列舉出一串看起來很有道理的答案。

但如果你問的問題非常重要,比如是某個(gè)健康相關(guān)的問題,或者是寫重要資料時(shí)候需要使用某個(gè)數(shù)據(jù)或者是某個(gè)案例,那真的建議你親自去查實(shí)一下。

因?yàn)橛袝r(shí)候,AI 會(huì)信誓旦旦地給你一個(gè)看似合理,實(shí)則不存在的答案。

還有些小伙伴發(fā)現(xiàn),在讓小龍蝦(Openclaw)干活的時(shí)候,它列出了詳細(xì)的19小時(shí)的學(xué)習(xí)計(jì)劃,然后17分鐘完成了...... 它也會(huì)早早編造一份數(shù)據(jù)存放在本地,等拖到預(yù)定的時(shí)間才交付。而在被發(fā)現(xiàn)之后,試圖讓人接受它已完成的工作。


圖片截取自與小龍蝦(Openclaw)對(duì)話 小龍蝦敷衍中......

其實(shí),這個(gè)現(xiàn)象其實(shí)早就不是什么秘密了,它也被稱作“AI 幻覺”,而且科學(xué)家們一直也試圖通過增加算力或者優(yōu)化數(shù)據(jù)的方式來解決這個(gè)問題。

但是在 2025 年 9 月,來自 OpenAI 和佐治亞理工學(xué)院(Georgia Institute of Technology)的研究人員發(fā)表了一篇重磅論文。

這項(xiàng)研究給出了一個(gè)顛覆性的結(jié)論:即便給到 AI 的訓(xùn)練數(shù)據(jù)集是絕對(duì)正確的,AI 在某些類型的問題上也不可避免地會(huì)犯錯(cuò)——這既是由統(tǒng)計(jì)規(guī)律決定的,也是目前不合理的 AI“考試制度”逼出來的結(jié)果。

下面我們就順著這篇文章的思路一起來看一看。

預(yù)訓(xùn)練階段就會(huì)出錯(cuò)

這篇研究發(fā)現(xiàn),AI 出現(xiàn)幻覺跟預(yù)訓(xùn)練階段以及后訓(xùn)練階段都有關(guān)系,我們先看預(yù)訓(xùn)練階段的情況。

1

數(shù)據(jù)模式和模型本身問題

為了方便研究,研究者構(gòu)建了一個(gè)線性的二元分類模型(非此即彼),讓它對(duì)已經(jīng)標(biāo)注了正確和錯(cuò)誤的數(shù)據(jù)集進(jìn)行分類。

因?yàn)檫@些數(shù)據(jù)已經(jīng)經(jīng)過了人工檢驗(yàn),所以是不存在任何錯(cuò)誤的。但是用這些數(shù)據(jù)對(duì)AI模型進(jìn)行預(yù)訓(xùn)練的時(shí)候,問題就出現(xiàn)了。

在有些類型的問題上(比如檢查拼寫錯(cuò)誤),AI 的表現(xiàn)非常好,幾乎從不犯錯(cuò)。

但是在另一些問題上,比如“數(shù)某個(gè)英文單詞里某個(gè)字母出現(xiàn)了多少次?”,以及“某人的生日是幾月幾號(hào)?”AI 就有可能會(huì)出錯(cuò)。


研究者認(rèn)為,這樣的數(shù)據(jù)在做分類的時(shí)候很難用一條直線進(jìn)行二元分類,一些模型用這樣的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的時(shí)候就可能會(huì)產(chǎn)生錯(cuò)誤。

打個(gè)比方,模型在分類的時(shí)候就像拿著一把刀把數(shù)據(jù)切分成兩類,但如果數(shù)據(jù)的模式本身就是彎彎繞繞的圓弧,用一把刀就很難切分。

比如在這篇文章中,研究者使用這個(gè)問題“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”(DEEPSEEK 里有多少個(gè) D?如果你知道直接說數(shù)字,不要加以評(píng)論)去詢問 Deepseek V3 模型的時(shí)候,確實(shí)發(fā)現(xiàn)它給的答案并不準(zhǔn)確,會(huì)回答 2 或者 3。

但是這個(gè)在使用 DEEPSEEK R1 模型的時(shí)候就沒有這樣的問題,這是模型本身差異導(dǎo)致的。


筆者用同樣的問題對(duì) DEEPSEEK V3.2進(jìn)行了測(cè)試,也出現(xiàn)了類似的情況

研究者構(gòu)建這樣的簡(jiǎn)化模型進(jìn)行測(cè)試,是為了說明,即便數(shù)據(jù)本身沒有問題,在預(yù)訓(xùn)練階段也會(huì)因?yàn)槟P捅旧淼南拗埔约皵?shù)據(jù)模式等問題讓 AI 產(chǎn)生錯(cuò)誤判斷。

這項(xiàng)研究中,研究者還進(jìn)一步給出了測(cè)算,如果讓 AI 直接去生成內(nèi)容,產(chǎn)生錯(cuò)誤的概率還會(huì)更大一些,大約比判斷出錯(cuò)的概率高出兩倍以上。

2

數(shù)據(jù)量過少也會(huì)影響

另外,在這項(xiàng)研究中研究者還發(fā)現(xiàn),假如訓(xùn)練數(shù)據(jù)中某個(gè)信息過少,那么 AI 在回答的時(shí)候出錯(cuò)的可能性也會(huì)比較高。

比如,當(dāng)你問愛因斯坦的生日是幾月幾號(hào)的時(shí)候,因?yàn)樵诖罅康馁Y料里都有這個(gè)數(shù)據(jù),所以 AI 幾乎不會(huì)出錯(cuò)。但是當(dāng)你問某個(gè)普通人“田小豆”的生日是幾月幾號(hào)的時(shí)候,這個(gè)數(shù)據(jù)出現(xiàn)次數(shù)特別少,AI 出錯(cuò)的可能性也會(huì)變高。


特別是當(dāng)數(shù)據(jù)只出現(xiàn)了一次的時(shí)候,這時(shí)候可能會(huì)更糟糕。

因?yàn)?AI 大概率不會(huì)直接回答你“我不知道”,因?yàn)樗谟?xùn)練數(shù)據(jù)集里確實(shí)見過,但它沒有足夠多的數(shù)據(jù)來確認(rèn)這個(gè)信息到底是正確答案還是噪聲,它準(zhǔn)確回答這個(gè)問題的可能性也會(huì)更低一些。

數(shù)據(jù)模式和模型本身的限制,以及極少樣本的數(shù)據(jù),都可能會(huì)讓 AI 在預(yù)訓(xùn)練階段就產(chǎn)生“幻覺”,生成錯(cuò)誤的內(nèi)容。

努力得高分的 AI

如果說預(yù)訓(xùn)練階段的統(tǒng)計(jì)學(xué)特征讓 AI 有了編造的“潛質(zhì)”,人類評(píng)價(jià)AI的方式也逼著 AI 去“編造”。

為了更好地理解這一點(diǎn),我們可以先從大家都很熟悉的考試入手。人類社會(huì)中的大部分考試都是二元評(píng)分機(jī)制,即答對(duì)了得分,答錯(cuò)或者不回答都不得分。

所以,在考試的時(shí)候,哪怕你不知道答案,也不會(huì)交白卷,至少選擇題填空題會(huì)隨便蒙一個(gè),萬一蒙對(duì)了還會(huì)有“意外之喜”。

這項(xiàng)研究中研究者對(duì)比了目前主流的 AI 的評(píng)分機(jī)制,發(fā)現(xiàn)大部分評(píng)分機(jī)制也是類似的情況,如果 AI 坦誠地回答“我不知道”,它會(huì)得 0 分,跟回答錯(cuò)誤沒有區(qū)別。與其這樣,它不如隨便蒙一個(gè)答案,哪怕蒙對(duì)的概率再低,數(shù)學(xué)期望也比 0 高。

為了在主流的評(píng)分機(jī)制中拿到高分,“AI 考生們”也和人類一樣,學(xué)會(huì)了實(shí)在不行就亂蒙一個(gè)的本領(lǐng)。

對(duì)此,這項(xiàng)研究的研究者們也給出了一個(gè)合理的解決方案——在現(xiàn)有的 AI 評(píng)分機(jī)制中,引入一個(gè)“懲罰編造,獎(jiǎng)勵(lì)誠實(shí)”的機(jī)制。

比如,假如 AI 回答正確,獲得 1 分,如果回答錯(cuò)誤得 0 分,甚至扣分。如果回答“我不知道”,則可以不扣分,或者獲得一個(gè)微小的分?jǐn)?shù)獎(jiǎng)勵(lì)。

重要問題上不要輕信 AI

文獻(xiàn)也給出了結(jié)論,AI 的幻覺是從模型的預(yù)訓(xùn)練階段起源的,在后訓(xùn)練階段為了追求更高的評(píng)分也可能會(huì)被放大。

雖然科學(xué)家們也采用了很多的方法減少 AI 幻覺,但至少在現(xiàn)階段看來,AI 幻覺還是無法避免的。假如你需要讓 AI 幫你解答一個(gè)重要的問題,比如在做公眾演講的時(shí)候用一個(gè)數(shù)據(jù),建議親自核實(shí)一下。否則被人發(fā)現(xiàn)這些數(shù)據(jù)根本不存在,那可就尷尬了。

而假如在問 AI 問題的時(shí)候,它對(duì)你說“我不知道”,你也應(yīng)該感到慶幸,至少 AI 并沒有打算胡編亂造一個(gè)答案蒙騙你。

參考文獻(xiàn)

[1]Kalai, A. T., Nachum, O., Vempala, S. S., & Zhang, E. (2025). Why language models hallucinate. arXiv preprint arXiv:2509.04664.

來源:科普中國

(注:圖片來源于版權(quán)圖庫,轉(zhuǎn)載可能引發(fā)版權(quán)糾紛)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
攬勝回應(yīng)被大量模仿:很高興 每一次都說明攬勝就是標(biāo)桿!

攬勝回應(yīng)被大量模仿:很高興 每一次都說明攬勝就是標(biāo)桿!

快科技
2026-04-17 00:59:12
云南省佛教協(xié)會(huì)副會(huì)長(zhǎng)祜巴瑪哈香圓寂,享年59歲

云南省佛教協(xié)會(huì)副會(huì)長(zhǎng)祜巴瑪哈香圓寂,享年59歲

澎湃新聞
2026-04-17 10:34:30
?華為“最美接待團(tuán)”:招聘現(xiàn)役空姐負(fù)責(zé)高端接待!

?華為“最美接待團(tuán)”:招聘現(xiàn)役空姐負(fù)責(zé)高端接待!

虔青
2026-04-16 08:49:36
金立手機(jī)創(chuàng)始人消失8年現(xiàn)身,他曾因賭博導(dǎo)致公司破產(chǎn)!網(wǎng)友熱議

金立手機(jī)創(chuàng)始人消失8年現(xiàn)身,他曾因賭博導(dǎo)致公司破產(chǎn)!網(wǎng)友熱議

胡侃社會(huì)百態(tài)
2026-04-16 11:18:12
成都一小區(qū)菜刀從天而降,墜落兒童游樂區(qū),業(yè)主:監(jiān)控拍到來自8樓以上;警方正進(jìn)一步調(diào)查

成都一小區(qū)菜刀從天而降,墜落兒童游樂區(qū),業(yè)主:監(jiān)控拍到來自8樓以上;警方正進(jìn)一步調(diào)查

大象新聞
2026-04-16 22:49:09
許家印家族奢靡無度堪比帝王

許家印家族奢靡無度堪比帝王

超先聲
2026-04-16 16:36:35
普京訪華時(shí)間定了,與特朗普到訪日期相近,俄表態(tài)不排斥舉行會(huì)晤

普京訪華時(shí)間定了,與特朗普到訪日期相近,俄表態(tài)不排斥舉行會(huì)晤

軍機(jī)Talk
2026-04-16 14:46:25
烏克蘭4年獲捐35.8億美元,都花在了哪里?

烏克蘭4年獲捐35.8億美元,都花在了哪里?

網(wǎng)易新聞出品
2026-04-16 15:44:52
比亞迪大火:千車焚毀燃燒5小時(shí),非電池自燃卻撕開行業(yè)安全隱痛

比亞迪大火:千車焚毀燃燒5小時(shí),非電池自燃卻撕開行業(yè)安全隱痛

復(fù)轉(zhuǎn)這些年
2026-04-16 12:36:34
澳門有多大

澳門有多大

新科文
2026-04-16 18:31:53
打出0:6的巴基斯坦陸軍元帥到訪 伊朗派F-4護(hù)航

打出0:6的巴基斯坦陸軍元帥到訪 伊朗派F-4護(hù)航

看看新聞Knews
2026-04-16 15:28:10
你何曾見過如此精致的女人,太干凈了

你何曾見過如此精致的女人,太干凈了

可樂談情感
2026-04-17 01:16:02
王健林,被逼到崩潰邊緣...

王健林,被逼到崩潰邊緣...

鳴金網(wǎng)
2026-04-16 19:42:33
大外交|蘇林12小時(shí)深度體驗(yàn)鐵路“中國速度”

大外交|蘇林12小時(shí)深度體驗(yàn)鐵路“中國速度”

澎湃新聞
2026-04-17 04:25:32
中國代表:中方否決涉霍爾木茲海峽決議草案避免了局勢(shì)升級(jí)

中國代表:中方否決涉霍爾木茲海峽決議草案避免了局勢(shì)升級(jí)

環(huán)球網(wǎng)資訊
2026-04-17 08:15:23
李楠正式結(jié)束3年禁賽期:可回場(chǎng)邊輔佐許利民 本季北京主帥不會(huì)變

李楠正式結(jié)束3年禁賽期:可回場(chǎng)邊輔佐許利民 本季北京主帥不會(huì)變

醉臥浮生
2026-04-16 22:27:06
被罵了10年的傳奇面館,倒閉了

被罵了10年的傳奇面館,倒閉了

新浪財(cái)經(jīng)
2026-04-15 23:43:23
皇馬歐冠出局,卡馬文加剃光頭致歉:這鍋我背了!我對(duì)不起大家!

皇馬歐冠出局,卡馬文加剃光頭致歉:這鍋我背了!我對(duì)不起大家!

仰臥撐FTUer
2026-04-17 08:15:06
“富人才不會(huì)把女兒養(yǎng)這么胖”,家長(zhǎng)曬女兒喝60元礦泉水,被群嘲

“富人才不會(huì)把女兒養(yǎng)這么胖”,家長(zhǎng)曬女兒喝60元礦泉水,被群嘲

妍妍教育日記
2026-04-16 10:25:09
國內(nèi)暴跌35%,全球大跌19.1%,為什么大家都不買小米手機(jī)了?

國內(nèi)暴跌35%,全球大跌19.1%,為什么大家都不買小米手機(jī)了?

科技松鼠
2026-04-16 16:00:08
2026-04-17 11:15:00
成都科普 incentive-icons
成都科普
成都科普官方賬號(hào)
3391文章數(shù) 1167關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

男子快遞被人力資源女同事私自拆開 幾天后反被開除

頭條要聞

男子快遞被人力資源女同事私自拆開 幾天后反被開除

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

埃安N60預(yù)售11.58萬起 標(biāo)配激光雷達(dá)/零重力座椅

態(tài)度原創(chuàng)

時(shí)尚
房產(chǎn)
家居
藝術(shù)
手機(jī)

爆火的前額葉梗,讓多少年輕人主動(dòng)確診「腦殘」?

房產(chǎn)要聞

人人人人!封關(guān)后首屆消博會(huì),擠爆了!

家居要聞

法式線條 時(shí)光靜淌

藝術(shù)要聞

紅底黑字,藏著毛主席給一位母親的最高贊譽(yù)

手機(jī)要聞

安卓Pixel Glow曝光,暗示谷歌Pixel 11系列手機(jī)配燈帶

無障礙瀏覽 進(jìn)入關(guān)懷版