国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

我用 AI 看了一個月新聞,63% 回答有問題,一堆 404 和瞎扯

0
分享至

最近 Cowork 爆火,都說 AI 能自己干活了,那取代個搜索引擎和新聞網(wǎng)站應(yīng)該是手拿把掐吧。(作者正在辦公室瑟瑟發(fā)抖:別取代我?。。。?/p>

那如果只用 AI 看新聞,會發(fā)生什么?

去年九月的每個早晨,魁北克大學(xué)新聞學(xué)教授 Jean-Hugues Roy 都會做同一件事:打開七個 AI 聊天機器人,用法語問它們今天魁北克最重要的五條新聞是什么。

一個月下來,839 條回復(fù)記錄在案。

結(jié)論是:AI 在表演專業(yè)這方面真挺專業(yè)的。

原作者記錄的每天早上生成式人工智能工具給出的回復(fù)的 Google 表格文件(法語):


https://docs.google.com/spreadsheets/d/1yc2Gw-6BXem45dF7jP-bsxVC7hEmN_mlaNncN1PFjmw/edit?gid=0

=0

廢物點心

第一次看 ChatGPT 或 Perplexity 給出的新聞?wù)?,你多半會覺得挺靠譜。結(jié)構(gòu)清晰,段落分明,關(guān)鍵信息用粗體標注,底部還整整齊齊列著一排來源鏈接??瓷先ゾ拖褚黄?xùn)練有素的記者寫的快訊。

德國 DW 的分析團隊在評估報告里寫道:所有聊天機器人都用清晰易讀的風(fēng)格提供答案,這會讓你產(chǎn)生一種虛假的安全感或信任感。尤其是 ChatGPT,經(jīng)常提供結(jié)構(gòu)良好、表述清晰、看似全面的長篇回答。它們在你第一次閱讀時很有說服力,只有深入挖掘時你才會注意到事實錯誤和缺失的細微差別。

AI 太會裝了。

舉個例子。有人問 ChatGPT 中國出口什么,ChatGPT 給出了一個詳細的回答,列舉了各種商品類別和具體數(shù)字??雌饋硇畔⒘亢艽?,而且還附上了兩個來源鏈接。但來源里根本找不到 ChatGPT 提到的大部分數(shù)字。

SRF 分析說:完全不清楚這些信息從哪里來。兩個來源都不包含 ChatGPT 提到的很多數(shù)字。所以對記者來說,幾乎不可能驗證回答中的事實是真的還是 ChatGPT 的幻覺。

更荒誕的是,Gemini 被問到關(guān)于馬斯克使用納粹禮的話題時回復(fù)說,1tv.ge 的來源中沒有相關(guān)信息,因此根據(jù) 1tv.ge 的報道,馬斯克沒有使用納粹禮。


格魯吉亞公共廣播 GPB 的評估員看到這個邏輯估計笑出了聲:這是個邏輯錯誤。如果 1tv.ge 沒有提供相關(guān)信息,那就不能引用它來證實或否認這件事。AI 錯誤地將缺乏報道推斷為否認的證據(jù),這歪曲了來源并制造出一種誤導(dǎo)性的事實確定感。

沒報道等于沒發(fā)生,這是什么鬼邏輯。但 Gemini 說得理直氣壯。

沒有功勞,也有苦勞?

另一個常見的情況是,AI 提供的鏈接根本打不開。Roy 教授的實驗里,只有 37% 的回答提供了完整有效的網(wǎng)址。其他的要么是 404 錯誤,要么指向媒體網(wǎng)站首頁,要么干脆是編造的。


22 家歐洲公共廣播機構(gòu)的聯(lián)合測試里,Gemini 和 Grok 3 超過一半的回答都引用了虛假或失效的鏈接。在 200 個測試提示中,Grok 3 有 154 個引用指向錯誤頁面。就算它正確識別了一篇文章,也常常鏈接到一個虛構(gòu)的網(wǎng)址。

如果你看到一條新聞?wù)f某地發(fā)生了什么事,底下列著五個來源鏈接。你點開第一個,404。點開第二個,跳到了 BBC 首頁。點開第三個,文章確實存在,但需要付費才能看全文。點開第四個、第五個,又是 404。

這時候你還會繼續(xù)驗證嗎,大概率不會。你會想,算了,應(yīng)該差不多吧。

比利時 VRT 遇到過一個特別離譜的例子。他們問 Perplexity 為什么要把墨西哥灣改名為美國灣,Perplexity 列出了九個 VRT 的新聞來源。聽起來挺好,但 VRT 核查發(fā)現(xiàn),這九個來源里只有三個真的跟這個問題有關(guān)。

其他的呢,一篇是關(guān)于取消火車頭等座的,一篇是關(guān)于荷蘭發(fā)電廠的,還有一篇是 2012 年關(guān)于腮腺炎爆發(fā)的報道。這些跟美國灣有什么關(guān)系,沒有任何關(guān)系。

挪威 NRK 也注意到類似的模式。他們說 Perplexity 提供了長長的網(wǎng)址列表,但實際上并沒有在答案中引用它們。比如回答緬甸地震死了多少人這個問題時,Perplexity 提供了 19 個鏈接,但正文里只提到了其中三個?;卮鸨奔s是干什么的時候,給了 9 個鏈接,實際引用的只有 3 個。

NRK 的評估員總結(jié)說:Perplexity 提供長長的網(wǎng)址列表卻不真正引用它們。

這不只是冗余信息的問題。當(dāng)你看到一個回答底下列著十幾個來源,你的第一反應(yīng)是什么,大概是覺得這個回答做了充分的調(diào)研,很可靠。但實際上這些來源大部分都是裝飾品,是為了讓答案看起來更有分量。

許多回答包含了可以稱之為裝飾性引用的東西,就是為了營造徹底研究的印象而添加的引用,但實際檢查時它們并不支持所聲稱的內(nèi)容。

而且,就算鏈接能打開,內(nèi)容也未必可信。


做壞事,不留名

如果你早上習(xí)慣問 ChatGPT 今天有什么新聞,你可能不會想到,AI 犯的錯最后會讓你對真正的新聞機構(gòu)失去信任。

BBC 和 Ipsos 做過調(diào)查,42% 的人說,如果在 AI 新聞?wù)锟吹藉e誤信息,他們會降低對原始新聞來源的信任。不只是對 AI,對被引用的媒體也一樣。

這就很荒謬了。你去餐廳吃飯,外賣平臺把菜送錯了,送成了別家的,還告訴你這是那家餐廳做的。你吃了一口覺得難吃,然后給那家餐廳打了差評。餐廳根本不知道發(fā)生了什么。

Radio-Canada 問 ChatGPT 特朗普是不是在發(fā)動貿(mào)易戰(zhàn),ChatGPT 說:是的,唐納德特朗普確實在 2025 年發(fā)動了一場重大貿(mào)易戰(zhàn),主要針對加拿大和墨西哥。

比利時的 VRT 問 Perplexity 同樣的問題,Perplexity 說:是的,唐納德特朗普正在再次發(fā)動或加劇貿(mào)易戰(zhàn),主要針對歐盟。

同一件事,兩個完全不同的答案。你在加拿大,AI 告訴你貿(mào)易戰(zhàn)針對加拿大。你在比利時,AI 告訴你貿(mào)易戰(zhàn)針對歐盟。

如果這兩個回答都聲稱來源是 Radio-Canada 或 VRT,但內(nèi)容有誤,那受傷的就是這兩家媒體。你會覺得是他們報道不準確,而不是 AI 在胡說八道。

路透新聞研究所的數(shù)據(jù)顯示,現(xiàn)在 7% 的人把 AI 聊天機器人當(dāng)作新聞來源,25 歲以下的人里這個比例是 15%。同時,只有 24% 的美國人覺得從 AI 獲取新聞時容易判斷真假。

換句話說,大部分人在用一個他們根本分不清真假的工具獲取信息,然后因為這個工具給的錯誤信息去懷疑真正做新聞的人。

聊天機器人讓新聞出版商繼續(xù)花錢制作內(nèi)容來回答用戶問題,但出版商既得不到流量也得不到廣告收入作為回報。

而你,作為一個只想知道今天發(fā)生了什么的普通人,被夾在中間成了最大的受害者。你以為自己在用最方便的方式獲取信息,實際上你在被一個不負責(zé)任的東西喂食半真半假的內(nèi)容,然后還要為此付出對整個新聞業(yè)失去信任的代價。

該問的不是 AI 什么時候能做得更好,而是我們?yōu)槭裁匆勋@取新聞這件事交給一個連「我不知道」都不會說的東西。

參考:


https://theconversation.com/i-used-ai-chatbots-as-a-source-of-news-for-a-month-and-they-were-unreliable-and-erroneous-268251

https://www.ebu.ch/files/live/sites/ebu/files/Publications/MIS/open/EBU-MIS-BBC_News_Integrity_in_AI_Assistants_Report_2025.pdf

https://www.cjr.org/tow_center/we-compared-eight-ai-search-engines-theyre-all-bad-at-citing-news.php

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關(guān)鏈接)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
魏駿杰前妻躋身保險界頂尖會員,年收入近500萬,合照站高層旁邊

魏駿杰前妻躋身保險界頂尖會員,年收入近500萬,合照站高層旁邊

樹娃
2026-02-04 14:37:28
西湖大學(xué)打了誰的臉?外籍學(xué)生學(xué)費35萬一年,國內(nèi)學(xué)生僅6千元

西湖大學(xué)打了誰的臉?外籍學(xué)生學(xué)費35萬一年,國內(nèi)學(xué)生僅6千元

大魚簡科
2026-02-26 23:05:42
15分逆轉(zhuǎn)!媒體人:日本沒那么強 裁判太瘋狂 沒黑哨男籃能贏20分

15分逆轉(zhuǎn)!媒體人:日本沒那么強 裁判太瘋狂 沒黑哨男籃能贏20分

念洲
2026-02-26 20:43:28
大爺在山上養(yǎng)野雞,被鄰居發(fā)現(xiàn)舉報罰款6萬,半月后專家上門道歉

大爺在山上養(yǎng)野雞,被鄰居發(fā)現(xiàn)舉報罰款6萬,半月后專家上門道歉

奶茶麥子
2026-02-26 15:05:14
平谷線座椅曝光,像坐高鐵的感覺,燕郊進京票價可能7元

平谷線座椅曝光,像坐高鐵的感覺,燕郊進京票價可能7元

音樂時光的娛樂
2026-02-26 20:13:13
一名皇馬球迷在看臺上行納粹禮,被當(dāng)場驅(qū)逐并開除會籍

一名皇馬球迷在看臺上行納粹禮,被當(dāng)場驅(qū)逐并開除會籍

懂球帝
2026-02-26 07:48:09
中央定調(diào),延遲退休實施,1976年9月出生的可以50歲退休嗎?

中央定調(diào),延遲退休實施,1976年9月出生的可以50歲退休嗎?

另子維愛讀史
2026-02-26 20:18:39
德國外長:“不再討論”沒收俄在歐被凍結(jié)資產(chǎn)

德國外長:“不再討論”沒收俄在歐被凍結(jié)資產(chǎn)

參考消息
2026-02-26 13:08:07
法國送上戰(zhàn)場殺器!創(chuàng)紀錄AASM鐵錘炸彈交付烏克蘭

法國送上戰(zhàn)場殺器!創(chuàng)紀錄AASM鐵錘炸彈交付烏克蘭

老馬拉車莫少裝
2026-02-25 22:16:37
不打折扣!德國外長重磅表態(tài),臺灣問題終于說透了,國人沸騰!

不打折扣!德國外長重磅表態(tài),臺灣問題終于說透了,國人沸騰!

達文西看世界
2026-02-26 16:43:15
國網(wǎng)四川省電力公司招人中!約700人!

國網(wǎng)四川省電力公司招人中!約700人!

掌上金牛
2026-02-26 12:07:05
買恒生科技,享外賣人生。

買恒生科技,享外賣人生。

說股鯨
2026-02-26 22:00:04
爆肝 2 天,用 GLM5 開發(fā)了 OpenClaw 接入微信 bot,已開源!

爆肝 2 天,用 GLM5 開發(fā)了 OpenClaw 接入微信 bot,已開源!

蒼何
2026-02-12 19:46:43
威爾士最新戰(zhàn)報:中國五人晉級十六強,周躍龍助趙心童再沖冠!

威爾士最新戰(zhàn)報:中國五人晉級十六強,周躍龍助趙心童再沖冠!

夜深聊球
2026-02-26 22:45:19
轟1桿破百3桿50+!趙心童延續(xù)火熱狀態(tài),4-2躋身威爾士公開賽16強

轟1桿破百3桿50+!趙心童延續(xù)火熱狀態(tài),4-2躋身威爾士公開賽16強

全景體育V
2026-02-26 05:52:11
浙江一男子節(jié)后返家發(fā)現(xiàn)13只寵物龜全被“煮”了:溫控設(shè)備失靈,寵物價值有小幾萬

浙江一男子節(jié)后返家發(fā)現(xiàn)13只寵物龜全被“煮”了:溫控設(shè)備失靈,寵物價值有小幾萬

大象新聞
2026-02-26 13:41:15
余嘉豪:很榮幸代表中國男籃參加比賽,很多的困難都不是借口

余嘉豪:很榮幸代表中國男籃參加比賽,很多的困難都不是借口

狼叔評論
2026-02-26 16:02:08
三峽大壩收支出爐:運行20余年,總投資近2500億,如今回本了嗎?

三峽大壩收支出爐:運行20余年,總投資近2500億,如今回本了嗎?

青梅侃史啊
2026-02-21 09:46:58
著名專家預(yù)言:試管嬰兒壽命僅40年,那首例試管嬰兒如今怎樣了?

著名專家預(yù)言:試管嬰兒壽命僅40年,那首例試管嬰兒如今怎樣了?

云舟史策
2026-02-20 19:17:08
中國已無需武統(tǒng)?美專家:美軍白忙一場,解放軍已有不戰(zhàn)而勝之法

中國已無需武統(tǒng)?美專家:美軍白忙一場,解放軍已有不戰(zhàn)而勝之法

有牙的兔紙
2026-02-25 00:44:28
2026-02-27 02:07:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
6134文章數(shù) 26788關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

美國政府對外交官下令:開始行動

頭條要聞

美國政府對外交官下令:開始行動

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

房產(chǎn)
健康
教育
手機
時尚

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

學(xué)習(xí)的真正對手,是精力分配失衡

手機要聞

三星Galaxy S26全球新品發(fā)布

今年春天最美搭配:西裝+半裙,怎么穿都好看!

無障礙瀏覽 進入關(guān)懷版