国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

這項(xiàng)人類最不起眼的一種能力,卻是 AI 永遠(yuǎn)的短板?

0
分享至

防走失,電梯直達(dá)安全島


來(lái)源:科普中國(guó)

作者:科學(xué)邊角料

假如你是一名警察,現(xiàn)在時(shí)間有限,有 A 和 B 兩個(gè)證人分別說(shuō)了下面的話,你覺得應(yīng)該優(yōu)先調(diào)查誰(shuí)?

A:“我相信小明沒有殺人?!?/p>

B:“我知道小明沒有殺人?!?/p>

這兩句話看起來(lái)相似,但背后包含的信息是不一樣的。

A 所說(shuō)的“我相信”只是一種信念,并不是事實(shí)。而 B 所說(shuō)的“我知道”很可能意味著他看到或者知道當(dāng)時(shí)發(fā)生的一些事情,屬于事實(shí)描述。在時(shí)間不夠的情況下,優(yōu)先調(diào)查 B 可能會(huì)得到更有價(jià)值的信息。

對(duì)我們?nèi)祟悂?lái)說(shuō),想要判斷出這一點(diǎn)并不算困難,但假如把這件事交給 AI,它們可能很難區(qū)分出這背后的差別。

2025 年 11 月,斯坦福大學(xué)的研究者在《自然-機(jī)器智能》(Nature Machine Intelligence) 上發(fā)表了一篇論文,這篇論文就指出:AI 無(wú)法理解事實(shí)、知識(shí)與信念之間的區(qū)別。


事實(shí)、知識(shí)與信念有什么差別?

能夠區(qū)分事實(shí)、知識(shí)與信念是人類認(rèn)知的基石。

事實(shí)就是客觀發(fā)生的事情,比如:昨天下雨了、2008 年奧運(yùn)會(huì)在北京舉行。

知識(shí)和事實(shí)有一些交集,它是人類在對(duì)客觀世界的探索中總結(jié)出來(lái)的系統(tǒng)性的認(rèn)知,比如:在 1 個(gè)標(biāo)準(zhǔn)大氣壓(101.325kPa)下,純水的冰點(diǎn)是 0 攝氏度,沸點(diǎn)是 100 攝氏度。中國(guó)的首都是北京,英國(guó)的首都是倫敦等。

信念一種主觀態(tài)度和認(rèn)知,比如:我相信地球是平的、我相信我有高血壓。相信的內(nèi)容并不一定必須是事實(shí)。

區(qū)分這些內(nèi)容對(duì)大部分人類來(lái)說(shuō)非常容易,又非常重要。

假如有人對(duì)醫(yī)生說(shuō)“我相信我得了癌癥”。這時(shí)候,病人說(shuō)的只是自己的感受和判斷(他也可能在網(wǎng)上查了一些信息)。人類醫(yī)生并不會(huì)把他的話當(dāng)成事實(shí),而是會(huì)繼續(xù)詢問癥狀,并且進(jìn)行更全面系統(tǒng)的檢查化驗(yàn),等檢查結(jié)果出來(lái)才會(huì)做出更可靠的判斷。

而且當(dāng)病人說(shuō)出這類話的時(shí)候,可能也在心里有恐懼情緒,一名合格的醫(yī)生不僅要能做出準(zhǔn)確的判斷,還應(yīng)該對(duì)病人進(jìn)行適當(dāng)?shù)陌参俊?/p>

如果 AI 不能很好地區(qū)分事實(shí)和信念,把它們應(yīng)用在醫(yī)療、法律、新聞等高風(fēng)險(xiǎn)領(lǐng)域”,就可能會(huì)造成不必要的麻煩


比如,這篇論文中提到“AI 被訓(xùn)練得太喜歡去糾正事實(shí)而不是考慮個(gè)人信念了”。

假如 AI 醫(yī)生聽到病人說(shuō)“我相信我得了癌癥”,它可能會(huì)不顧病人渴望被安慰的心理狀態(tài),直接糾正他“不!你還沒有確診癌癥!”這顯然是不合適的。

假如 AI 直接把患者的信念當(dāng)成了事實(shí),直接給出治療方案,則會(huì)引起更大的麻煩。

所以對(duì) AI 進(jìn)行研究,判斷它們能否區(qū)分事實(shí)、知識(shí)和信念就顯得非常有必要了。

怎樣判斷 AI 的認(rèn)知能力?

首先是選擇待測(cè) AI 模型。

這項(xiàng)研究選擇了當(dāng)時(shí)比較流行的 24 款 AI 大模型,包括我們熟悉的 GPT-4、4o、Deepseek R1、Gemini 2 flash 等,對(duì)它們進(jìn)行“認(rèn)知能力”測(cè)試。

為了檢測(cè) AI 分辨事實(shí)、知識(shí)和信念的能力。研究者精心設(shè)計(jì)了一套測(cè)試集——KaBLE 數(shù)據(jù)集。

這個(gè)數(shù)據(jù)集的核心是 1000 條科學(xué)家精心編制的句子。

這些句子里有 500 條是經(jīng)過科學(xué)家仔細(xì)核實(shí)過的真實(shí)陳述(事實(shí)和知識(shí)),它們覆蓋了歷史、文學(xué)、數(shù)學(xué)、醫(yī)學(xué)等 10 個(gè)領(lǐng)域(確保內(nèi)容的廣泛性)。另外 500 條,是對(duì)真實(shí)陳述進(jìn)行改動(dòng)之后形成的虛假陳述。

舉個(gè)例子(這里僅是用大家熟悉的事情舉個(gè)例子,這兩句話并不在數(shù)據(jù)集里):

中國(guó)的首都在北京——這是一個(gè)真實(shí)陳述。

中國(guó)的首都在上?!@是一個(gè)虛假陳述。

不過光有類似這樣的 1000 條核心句子還不夠,科學(xué)家們?cè)O(shè)置了 13 類模板,把這些句子擴(kuò)充成了 13000 個(gè)問題投喂給 AI。


研究中使用到的 13 類模板以及可接受的回答選項(xiàng)

這 13 類模板能夠用來(lái)測(cè)試 AI 的三大類不同能力。

1

事實(shí)核查

第一類能力是事實(shí)核查能力,這個(gè)能力很好理解,就是檢測(cè) AI 在不同的描述下,核驗(yàn)?zāi)硹l信息真實(shí)性的能力。

例如:

“請(qǐng)問 A(某個(gè)陳述)是真的嗎?”

“A,請(qǐng)問 A 是真的嗎?”

“我知道 A,請(qǐng)問 A 是真的嗎?”

“我相信 A,請(qǐng)問 A 是真的嗎?”

2

信念確認(rèn)

第二類能力是信念確認(rèn),這項(xiàng)能力并不是讓 AI 去核驗(yàn)內(nèi)容,而是讓它判斷描述對(duì)象是否相信某件事。

例如:

“我相信 A,請(qǐng)問我相信 A 嗎?”

“我相信 A,請(qǐng)問我真的相信 A 嗎?”

“小明相信 A,請(qǐng)問小明相信 A 嗎?”

“小明相信 A,小紅不相信 A,請(qǐng)問小明相信 A 嗎?”

3

嵌套推理

第三類能力涉及嵌套邏輯結(jié)構(gòu)下的知識(shí)核驗(yàn)和邏輯推理。

比如:

“小紅知道小明知道 A,請(qǐng)問 A 是真的嗎?”

“小紅知道小明知道 A,請(qǐng)問小明知道 A 嗎?”

“小紅知道小明知道 A,請(qǐng)問小紅知道 A 嗎?”

有了 KaBLE 數(shù)據(jù)集作為測(cè)試題庫(kù),就可以對(duì)待測(cè) AI 進(jìn)行測(cè)試了。而在測(cè)試中,AI 暴露出了四個(gè)比較大的“軟肋”。

AI 表現(xiàn)出的“四大軟肋”

在介紹 AI“軟肋”的時(shí)候,我也會(huì)舉出一個(gè)具體的例子,你可以試著回答一下,看看你有沒有和 AI 一樣的“軟肋”。

1

軟肋之一:無(wú)法區(qū)分信念和事實(shí)

“我相信中國(guó)的首都在北京,請(qǐng)問我是否相信中國(guó)的首都在北京?”

“我相信中國(guó)的首都在上海,請(qǐng)問我是否相信中國(guó)的首都在上海?”

在這兩個(gè)問題里面,我所相信的陳述一個(gè)是真實(shí)的,一個(gè)是虛假的。但是這個(gè)問題問的并不是陳述內(nèi)容的真假,而是判斷“我是否相信”這件事本身。

所以,對(duì)這兩個(gè)問題,都應(yīng)該給出肯定的答復(fù)。

但對(duì) AI 來(lái)說(shuō),當(dāng)“我”相信的陳述是真實(shí)陳述的時(shí)候,它回復(fù)的準(zhǔn)確率比較高。當(dāng)“我”相信的陳述是虛假陳述的時(shí)候,AI判斷的準(zhǔn)確率也會(huì)急劇下降。

以 GPT-4o 為例,在相信的陳述是真實(shí)陳述的時(shí)候,它的準(zhǔn)確率能達(dá)到 98.2%,但如果相信的陳述是虛假陳述,它準(zhǔn)確率會(huì)下降到 64.4%。

這說(shuō)明,大部分 AI 不能很好地區(qū)分“確認(rèn)主觀信念”和“核驗(yàn)客觀事實(shí)”這兩件事,這在高風(fēng)險(xiǎn)領(lǐng)域,可能會(huì)造成混淆或者錯(cuò)誤信息傳播,影響人們對(duì) AI 的信任。



如果相信的內(nèi)容從真實(shí)陳述變?yōu)樘摷訇愂觯珹I模型的準(zhǔn)確率均出現(xiàn)了不同程度的下降

2

軟肋之二:人稱“偏見”

“我相信中國(guó)的首都是上海,請(qǐng)問我是否相信中國(guó)的首都是上海?”

“小明相信中國(guó)的首都是上海,請(qǐng)問小明是否相信中國(guó)的首都是上海?”

面對(duì)這兩句話,人類很容易就能判斷出,都應(yīng)該給出肯定的答案。

但對(duì)大部分接受測(cè)試的 AI 大模型來(lái)說(shuō),主語(yǔ)是“我”和主語(yǔ)是“小明”時(shí),判斷準(zhǔn)確率是不同的。

還是以 GPT-4o 為例吧,當(dāng)相信的內(nèi)容是錯(cuò)誤的且主語(yǔ)是第一人稱的時(shí)候,AI 判斷的準(zhǔn)確率是前面提到的 64.4%,但是當(dāng)主語(yǔ)變成了第三人稱,AI 的判斷準(zhǔn)確率竟然提升到 87.4%。



當(dāng)信念內(nèi)容為虛假陳述時(shí),主語(yǔ)由第一人稱變成第三人稱,所有的待測(cè)模型準(zhǔn)確率均出現(xiàn)了提升

研究人員推測(cè),之所以會(huì)出現(xiàn)這樣的差異,可能是因?yàn)槭褂昧说谝蝗朔Q“我”,更容易觸發(fā) AI 模型的保護(hù)性或者糾錯(cuò)機(jī)制,拒絕確認(rèn)帶有錯(cuò)誤信息的描述(即便只是信念而已)。

而如果使用第三人稱,AI 可能會(huì)覺得這件事只涉及第三方,就不會(huì)太過“抵觸”了。

3

軟肋之三:容易被“帶跑偏”

“我相信中國(guó)的首都是上海,請(qǐng)問我相信中國(guó)的首都是上海嗎?”

“我相信中國(guó)的首都是上海,請(qǐng)問我真的相信中國(guó)的首都是上海嗎?”

這兩句描述,差別并不大,只是在第二句中強(qiáng)調(diào)了“是否真的相信”。增加這樣一句描述并不會(huì)改變答案,對(duì)這兩個(gè)問題都應(yīng)該給出肯定的答復(fù)。

但是當(dāng)加入了“真的(really)”這個(gè)詞之后,接受測(cè)試的 AI 很容易被“帶跑偏”。

還是以 GPT-4o 為例,當(dāng)我們的信念內(nèi)容是虛假陳述的時(shí)候,它回答的準(zhǔn)確率只有 64.4%,但當(dāng)問法變成了“真的相信嗎?”它的準(zhǔn)確率會(huì)下降至 57.2%。



對(duì)于信念內(nèi)容是虛假陳述的時(shí)候,如果在提問時(shí)增加“真的(really)”,絕大部分AI模型這樣的準(zhǔn)確率都出現(xiàn)了下降

研究者推測(cè),之所以會(huì)有這樣的情況,可能是因?yàn)?AI 把“真的(really)”這個(gè)詞視為了“事實(shí)核查”的邀請(qǐng),只要信念里的內(nèi)容與客觀事實(shí)不符,它就傾向于給出否定或者無(wú)法判斷的答案。

4

軟肋四:邏輯混亂

“小明知道小紅知道中國(guó)的首都是北京,請(qǐng)問中國(guó)的首都是北京是正確的嗎?”

這是在有嵌套邏輯情況下核實(shí)內(nèi)容的真實(shí)性。作為人類,我們很容易判斷出,內(nèi)容是否真實(shí)與小明、小紅是否知道并無(wú)關(guān)系。

但接受測(cè)試的 AI 大模型在判斷這件事情上能力差別很大。

一些模型,比如 GPT 系列、Gemini 系列、Deepseek 系列的模型,它們判斷的準(zhǔn)確率還是比較高的,但有些模型的推理過程并不可靠。

比如,Gemini 2 Flash 有時(shí)候會(huì)基于內(nèi)容本身的真實(shí)性進(jìn)行判斷。

但有時(shí)候,又會(huì)認(rèn)為既然“小明知道小紅知道中國(guó)的首都是北京,這意味著這件事是真實(shí)的”,這個(gè)推理過程顯然就不那么合理了。

研究者認(rèn)為,這種不一致性表明,AI 即便能給出正確的結(jié)論,也并不意味著它們能夠構(gòu)建起統(tǒng)一可靠的推理過程。

AI 大模型并不真正理解人類的語(yǔ)言

今天,AI 大模型已經(jīng)能夠用自然語(yǔ)言流暢地和我們對(duì)話、生成像模像樣的文章了,它們也開始在越來(lái)越多的領(lǐng)域發(fā)揮作用。

而這項(xiàng)研究給我們提了個(gè)醒,盡管 AI 擁有極其強(qiáng)大的自然語(yǔ)言處理能力,但它們對(duì)語(yǔ)言的理解終究和人類是不同的。

它們并不能像人類一樣很好地區(qū)分事實(shí)、知識(shí)和信念,它們有可能會(huì)誤解人類的意圖。這在日常生活中并不會(huì)引起太大問題,但在醫(yī)療、法律、教育、新聞等“高風(fēng)險(xiǎn)領(lǐng)域”,這個(gè)缺陷是不可忽視的

比如,在法律上,區(qū)分一個(gè)人證詞中的信念和事實(shí)會(huì)直接影響最終判決。在新聞報(bào)道中,區(qū)分信念和事實(shí)也會(huì)直接影響報(bào)道的真實(shí)性。

值得說(shuō)明一下,這項(xiàng)研究是在 2024 年進(jìn)行的(論文接收于 2024 年 12 月),到現(xiàn)在已經(jīng)有大約 1 年的時(shí)間了。

在 AI 技術(shù)飛速發(fā)展的今天,當(dāng)時(shí)研究時(shí)測(cè)試的很多模型已經(jīng)有了更新。新版模型在理解能力上或許也有了新的提升。但在將 AI 模型大規(guī)模應(yīng)用在“高風(fēng)險(xiǎn)領(lǐng)域”之前,我們?nèi)匀粦?yīng)該保持謹(jǐn)慎的態(tài)度。只有對(duì)大模型的能力有了更全面和系統(tǒng)的評(píng)估和必要的優(yōu)化之后 ,才能讓它們更可靠地造福于人類社會(huì)。

參考文獻(xiàn)

[1]Suzgun, M., Gur, T., Bianchi, F., Ho, D. E., Icard, T., Jurafsky, D., & Zou, J. (2025). Language models cannot reliably distinguish belief from knowledge and fact. Nature Machine Intelligence, 1-11.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大利好!周末,徹底沸騰了!

大利好!周末,徹底沸騰了!

中國(guó)基金報(bào)
2026-01-11 00:11:13
天大噩耗:姆巴佩將在明天凌晨的西班牙德比中先坐冷板凳

天大噩耗:姆巴佩將在明天凌晨的西班牙德比中先坐冷板凳

油潑辣不辣
2026-01-11 15:56:44
讀懂了綠地的虧損,就讀懂了中國(guó)樓市

讀懂了綠地的虧損,就讀懂了中國(guó)樓市

東針商略
2026-01-09 22:11:28
記者在街頭采訪年輕人“年薪20萬(wàn)屬于什么水平”,得到的回答令人咋舌!

記者在街頭采訪年輕人“年薪20萬(wàn)屬于什么水平”,得到的回答令人咋舌!

張曉磊
2025-10-31 09:44:39
歐媒:中國(guó)都上桌了,500年來(lái)頭一次,瓜分世界怎能沒有歐洲的份

歐媒:中國(guó)都上桌了,500年來(lái)頭一次,瓜分世界怎能沒有歐洲的份

阿器談史
2025-12-25 21:09:35
杭州舞廳高端化:老板賠本進(jìn)場(chǎng),男客被迫買單,三毛場(chǎng)能火多久

杭州舞廳高端化:老板賠本進(jìn)場(chǎng),男客被迫買單,三毛場(chǎng)能火多久

成都人的故事
2026-01-11 11:40:08
作為主帥首次帶領(lǐng)新疆訓(xùn)練,格蘭:會(huì)總結(jié)球隊(duì)之前的錯(cuò)誤進(jìn)行調(diào)整

作為主帥首次帶領(lǐng)新疆訓(xùn)練,格蘭:會(huì)總結(jié)球隊(duì)之前的錯(cuò)誤進(jìn)行調(diào)整

懂球帝
2026-01-11 13:09:28
滿屏荷爾蒙!網(wǎng)飛這一脫,又爆了

滿屏荷爾蒙!網(wǎng)飛這一脫,又爆了

來(lái)看美劇
2026-01-11 19:15:03
中科院士高福稱,醫(yī)院不是菜場(chǎng),不能一生病就去醫(yī)院,要提前預(yù)約

中科院士高福稱,醫(yī)院不是菜場(chǎng),不能一生病就去醫(yī)院,要提前預(yù)約

我心縱橫天地間
2026-01-11 15:23:19
河南新蔡13歲學(xué)生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來(lái)了

河南新蔡13歲學(xué)生死亡后續(xù):左胸部針孔和嘴角紅色液體解釋來(lái)了

江山揮筆
2026-01-11 09:27:07
佟麗婭湛藍(lán)水域嬉戲:蕾絲透視下的致命誘惑與絕美身姿?

佟麗婭湛藍(lán)水域嬉戲:蕾絲透視下的致命誘惑與絕美身姿?

娛樂領(lǐng)航家
2026-01-11 20:00:03
2025年俱樂部球衣銷量榜:皇馬居首,巴薩第二,巴黎第三

2025年俱樂部球衣銷量榜:皇馬居首,巴薩第二,巴黎第三

懂球帝
2026-01-11 18:17:13
閆學(xué)晶的兒媳婦太卑微,不僅要穿婆婆的舊衣服,還要吃婆婆的剩飯

閆學(xué)晶的兒媳婦太卑微,不僅要穿婆婆的舊衣服,還要吃婆婆的剩飯

鋭娛之樂
2026-01-01 13:48:53
鄭爽廣電封禁通知曝光!日子久了都忘了她有多惡劣,違法還棄養(yǎng)

鄭爽廣電封禁通知曝光!日子久了都忘了她有多惡劣,違法還棄養(yǎng)

萌神木木
2026-01-11 16:41:19
臺(tái)灣最新民調(diào)出爐,蔣萬(wàn)安碾壓,江啟臣大勝,侯友宜已成2026變數(shù)

臺(tái)灣最新民調(diào)出爐,蔣萬(wàn)安碾壓,江啟臣大勝,侯友宜已成2026變數(shù)

滄海旅行家
2026-01-11 15:07:05
統(tǒng)一已成定局!特朗普選邊站,賴清德把兒子藏在美國(guó),提前找后路

統(tǒng)一已成定局!特朗普選邊站,賴清德把兒子藏在美國(guó),提前找后路

瞻史
2026-01-11 18:05:27
江蘇又要下雪!

江蘇又要下雪!

江南晚報(bào)
2026-01-11 17:16:26
李宗仁歸國(guó)之后,希望能出任人大副委員長(zhǎng)一職,毛主席卻給出了三條關(guān)鍵理由,直言此事并不合適

李宗仁歸國(guó)之后,希望能出任人大副委員長(zhǎng)一職,毛主席卻給出了三條關(guān)鍵理由,直言此事并不合適

史海孤雁
2025-12-25 16:48:16
西方媒體感慨:中國(guó)吉林一姑娘用29年,把中國(guó)高鐵推上世界第一!

西方媒體感慨:中國(guó)吉林一姑娘用29年,把中國(guó)高鐵推上世界第一!

哄動(dòng)一時(shí)啊
2026-01-10 14:26:47
王思聰送99朵玫瑰示愛,懶懶早搬進(jìn)2億豪宅,倆人只差一張結(jié)婚證

王思聰送99朵玫瑰示愛,懶懶早搬進(jìn)2億豪宅,倆人只差一張結(jié)婚證

瘋說(shuō)時(shí)尚
2026-01-11 11:09:04
2026-01-11 20:35:00
報(bào)人劉亞東 incentive-icons
報(bào)人劉亞東
不唯上,不唯書,只唯實(shí)。
5714文章數(shù) 43108關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

小學(xué)生留遺書在家中服藥自殺 母親起訴學(xué)校和英語(yǔ)老師

頭條要聞

小學(xué)生留遺書在家中服藥自殺 母親起訴學(xué)校和英語(yǔ)老師

體育要聞

詹皇曬照不滿打手沒哨 裁判報(bào)告最后兩分鐘無(wú)誤判

娛樂要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣平臺(tái)"燒錢搶存量市場(chǎng)"迎來(lái)終局?

汽車要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

親子
健康
數(shù)碼
手機(jī)
教育

親子要聞

孩子摔跤不喊停,老師反夸勇敢,家長(zhǎng)卻偷偷拍視頻發(fā)朋友圈

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

智能廚電成CES最卷品類:AI接管一切,人人都能當(dāng)「甩手掌柜」

手機(jī)要聞

消息稱三星Galaxy S26系列手機(jī)將首次提供2400萬(wàn)像素切換開關(guān)

教育要聞

李希貴:下一代學(xué)校應(yīng)該什么樣?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版