国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

讓AI算24點(diǎn),它堅(jiān)持說(shuō)25-12=24!大模型的回答為什么不能相信?

0
分享至

“孩子解不出‘24點(diǎn)’,讓AI大模型幫忙,結(jié)果大模型給出‘2.6×5=24’的結(jié)果!孩子讓大模型重新解題,沒(méi)想到結(jié)果依舊奇葩,變成了‘25-12=24’!”最近發(fā)生的一件小事,讓市民成女士對(duì)AI大模型的“解題思路”哭笑不得,“都說(shuō)大模型不可全信,這次我有了切身的體會(huì)!



某AI大模型做“24點(diǎn)”的結(jié)果

一段時(shí)間以來(lái),部分網(wǎng)民利用AI大模型造假的消息時(shí)有發(fā)生,相關(guān)行為被依法查處。但部分網(wǎng)民不清楚的是,大模型因?yàn)椤癆I幻覺(jué)”,本身就會(huì)給出錯(cuò)誤的答案。如果凡事都問(wèn)AI大模型,很可能被誤導(dǎo)。

大模型做錯(cuò)小學(xué)數(shù)學(xué)題

大模型真的解不了小學(xué)數(shù)學(xué)題?

記者將成女士女兒的題目交給多個(gè)通用大模型:“根據(jù)小學(xué)數(shù)學(xué)知識(shí),用5、5、5、12算‘24點(diǎn)’”,結(jié)果讓人頗意外——

大模型A的答案是(12-5÷5)×2=24。這個(gè)算式本身就不符合題目要求,而且算式的結(jié)果是22,完全不對(duì)。


大模型A上演了“一本正經(jīng)的胡說(shuō)八道”

大模型B的答案是(5+5)×12÷5=24。算式和答案都正確,但在提供解題思路時(shí),大模型說(shuō)算式“(5+5)÷5×12”不對(duì),可這兩個(gè)算式都正確。


大模型B在“思考”過(guò)程中,將正確的解答判斷為錯(cuò)誤

大模型C的答案是(12×(5 + 5))÷5=24?傮w正確,但根據(jù)書(shū)寫(xiě)規(guī)范,算式多了一個(gè)括號(hào),應(yīng)當(dāng)是12×(5 + 5)÷5。


大模型C的解答書(shū)寫(xiě)不規(guī)范

記者又換了幾道小學(xué)數(shù)學(xué)題,發(fā)現(xiàn)大模型解題時(shí),可謂“洋相百出”。例如,有一道題是“不改變1、2、3、4、5這幾個(gè)數(shù)字的次序,在它們間添加四則運(yùn)算符號(hào)以及括號(hào),使結(jié)果等于1,且運(yùn)算過(guò)程中不能出現(xiàn)小數(shù)、負(fù)數(shù)”。大模型給了兩個(gè)答案,分別是“(1×2×3+4) ÷5=1”和“(5+4) ÷3-(2-1)=1”。不難發(fā)現(xiàn),兩個(gè)解答都是錯(cuò)誤的,而且答案二還改變了數(shù)字順序,不符合題目要求。


大模型完全沒(méi)有發(fā)現(xiàn)它給出的答案是錯(cuò)誤的

接著,記者問(wèn)大模型,如果增加一個(gè)數(shù)字6,即在1、2、3、4、5、6中添加四則運(yùn)算符號(hào)以及括號(hào),使結(jié)果等于1,答案是什么?某大模型給出兩個(gè)答案,一是“(1+2+3+4)-(5+6)=1”,另一個(gè)是“1×(2+3+4)-(5+6)=1”,全都不正確。當(dāng)記者用對(duì)話體“嘲笑”大模型“5+6=9”時(shí),大模型竟然回復(fù)“這次5+6=9總算沒(méi)算錯(cuò)!看來(lái)我今天終于把腦子‘重啟’成功了”。


大模型一錯(cuò)再錯(cuò)

可見(jiàn),看似能理解“人”說(shuō)話、無(wú)所不知的AI大模型,其實(shí)有嚴(yán)重缺陷。

大模型并不完全理解“人”

為什么大模型不能完成小學(xué)數(shù)學(xué)題?

最主要的原因是AI幻覺(jué)。簡(jiǎn)單來(lái)說(shuō),就是大模型并非完全理解了“人”的提問(wèn),而是通過(guò)算法邏輯給出它認(rèn)為正確的答案;有些時(shí)候,部分大模型為了“討好”提問(wèn)者,還會(huì)虛構(gòu)信息或強(qiáng)詞奪理。

專(zhuān)業(yè)人士指出,數(shù)學(xué)計(jì)算與邏輯推理是AI幻覺(jué)的高發(fā)場(chǎng)景。在計(jì)算過(guò)程中,大模型還可能因?yàn)檫z漏數(shù)字,得出不僅錯(cuò)誤并違背常識(shí)的答案。

例如,有用戶向某大模型詢(xún)問(wèn)“雞兔同籠”問(wèn)題,題干是“籠中雞兔共30只,腳88只,求雞兔各有幾只”。大模型用方程解題,將算式“2X+4 (30-X)=88”展開(kāi)為“2X+120-X=88”,遺漏系數(shù) 4,得出“雞-32只、兔62只”的荒謬答案。

值得關(guān)注的是,數(shù)學(xué)題引發(fā)的AI幻覺(jué)或許只是給出錯(cuò)誤答案,而在信息服務(wù)上的AI幻覺(jué)很可能誤事并擾亂社會(huì)秩序

例如,外省市曾出現(xiàn)網(wǎng)民使用AI大模型生成“汽車(chē)尾號(hào)限行”“公共事業(yè)費(fèi)漲價(jià)”等假消息,AI大模型無(wú)法辨別真?zhèn)危瑢⑦@些假消息抓取,成為其數(shù)據(jù)庫(kù)的一部分。這就導(dǎo)致其他網(wǎng)民在查詢(xún)相關(guān)信息時(shí),AI大模型以訛傳訛,傳播假消息。

AI幻覺(jué)風(fēng)險(xiǎn)在專(zhuān)業(yè)領(lǐng)域也有破壞性。在北京市通州區(qū)人民法院審結(jié)的一起商事糾紛中,原告代理人直接將AI生成的司法案例作為訴訟依據(jù)。相關(guān)案例看似與案件高度契合,但經(jīng)法官核實(shí),案號(hào)對(duì)應(yīng)的真實(shí)案件與AI描述完全不符,最終該代理意見(jiàn)被駁回,代理人也因用虛假信息擾亂司法秩序受到批評(píng)。

此外,不少專(zhuān)業(yè)人士在了解行業(yè)發(fā)展趨勢(shì)時(shí),會(huì)發(fā)現(xiàn)AI大模型能提供大量的行業(yè)發(fā)展數(shù)據(jù)、調(diào)研報(bào)告,并宣稱(chēng)它們出自官方或權(quán)威機(jī)構(gòu)。但進(jìn)一步核查會(huì)發(fā)現(xiàn),這些數(shù)據(jù)、報(bào)告都是AI幻覺(jué)的結(jié)果——AI大模型為了迎合提問(wèn)者而杜撰。如果相信這些數(shù)據(jù)、報(bào)告,很可能誤導(dǎo)后期決策。

警惕AI幻覺(jué),這些方法有效

客觀地說(shuō),AI大模型確實(shí)為人們提供了搜索信息、掌握知識(shí)的新途徑。但是,現(xiàn)有的技術(shù)發(fā)展還沒(méi)有辦法完全避免AI幻覺(jué)。那么,怎樣避免被AI幻覺(jué)誤導(dǎo)呢?有幾個(gè)行之有效的好辦法。

首先,追問(wèn)AI大模型,要求大模型提供引用信息的出處。對(duì)于AI給出的關(guān)鍵結(jié)論,如政策條款、數(shù)據(jù)報(bào)告、案例細(xì)節(jié)等,明確要求其標(biāo)注信息來(lái)源,包括具體文件名稱(chēng)、發(fā)布機(jī)構(gòu)、發(fā)布時(shí)間及官方鏈接。如果AI大模型用“信息來(lái)源于公開(kāi)網(wǎng)絡(luò)”“綜合整理多方資料”等模糊表述回應(yīng),或回避具體出處,基本可以判定信息存疑。

例如,在咨詢(xún)某項(xiàng)政策時(shí),可以追問(wèn)AI大模型“政策出處”“官方報(bào)道在哪里”“文件編號(hào)或發(fā)布日期”等,查看追問(wèn)答案,篩除不可靠信息。

其次,求證信息時(shí),不能“問(wèn)AI要答案”,而是“找官方要真相”。

“官方”包括各種政府機(jī)構(gòu)的官方公眾號(hào)、權(quán)威媒體的公眾號(hào)等,而非信息分發(fā)平臺(tái)、短視頻平臺(tái)上的“自媒體號(hào)”。比如,如果關(guān)心時(shí)事政策,可以查詢(xún)政府機(jī)構(gòu)或主流媒體的公眾號(hào)。

核查一些“二手信息”或“舊聞”時(shí),可以使用官方公眾號(hào)的“搜索功能”。大部分公眾號(hào)都有“搜索”功能,通常在公眾號(hào)主頁(yè)右上角或帶有“放大鏡”圖標(biāo),輸入信息的關(guān)鍵詞,就能從公眾號(hào)已有信息中匹配對(duì)應(yīng)內(nèi)容。


可以通過(guò)權(quán)威機(jī)構(gòu)公眾號(hào)的“搜索”功能核查信息

其三,交叉核對(duì)不同的官方信源,排除單一信息偏差。如果涉及重要決策,建議交叉核對(duì)兩三個(gè)權(quán)威信源,確保信息無(wú)偏差。比如,想核實(shí)“研究生報(bào)考某導(dǎo)師的研究方向”,除了查看高校官方公眾號(hào)、網(wǎng)頁(yè)發(fā)布的導(dǎo)師介紹外,也可以查詢(xún)教育類(lèi)官方媒體公眾號(hào),核對(duì)信息,避免被AI編造的“導(dǎo)師虛假言論”誤導(dǎo)。

其四,使用AI大模型檢索官方信息發(fā)布渠道。在不確定具體官方平臺(tái)時(shí),可以讓AI提供與需求相關(guān)的官方渠道清單

比如,想知道“如何查詢(xún)個(gè)人個(gè)稅繳納記錄”的答案,可以讓AI大模型列出“國(guó)家稅務(wù)總局官網(wǎng)”“當(dāng)?shù)囟悇?wù)局官方公眾號(hào)”“個(gè)稅 APP”等正規(guī)渠道,再自行登錄查詢(xún)。如果AI大模型推薦的渠道包含非官方平臺(tái),如商業(yè)資訊網(wǎng)站、個(gè)人運(yùn)營(yíng)的“稅務(wù)咨詢(xún)號(hào)”,要提高警惕,不可輕信。

最后,如果發(fā)現(xiàn)某條信息官方暫無(wú)報(bào)道,那么,比詢(xún)問(wèn)AI大模型“有沒(méi)有”更穩(wěn)妥的方式是“等待權(quán)威發(fā)布”。因?yàn)樵贏I大模型的“知識(shí)庫(kù)”或者說(shuō)數(shù)據(jù)庫(kù)中,既有官方信息,也有小道消息,不少信息來(lái)自自媒體的“自說(shuō)自話”甚至“胡編亂造”。當(dāng)網(wǎng)民有需求時(shí),AI大模型會(huì)將這些消息提供給提問(wèn)者,或者自動(dòng)捏造不實(shí)信息。所以,等待權(quán)威報(bào)道遠(yuǎn)好于問(wèn)AI“要答案”。

總之,可以把AI作為工具檢索信息,但不要全盤(pán)相信它給出的結(jié)果。

微信編輯:何夕

還原事實(shí),洞悉真相。

歡迎關(guān)注,留言舉報(bào)!

除了辟謠,這里還關(guān)注網(wǎng)絡(luò)熱點(diǎn),及時(shí)回應(yīng)網(wǎng)友關(guān)切,追蹤事件進(jìn)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
見(jiàn)完中國(guó)特使不到24小時(shí),馬杜羅被美國(guó)強(qiáng)擄,拉美局勢(shì)即將右轉(zhuǎn)?

見(jiàn)完中國(guó)特使不到24小時(shí),馬杜羅被美國(guó)強(qiáng)擄,拉美局勢(shì)即將右轉(zhuǎn)?

邱震海
2026-01-04 17:26:40
50歲老護(hù)士詳解護(hù)士繁重工作流程 稱(chēng)張水華但凡有背景早就調(diào)崗了

50歲老護(hù)士詳解護(hù)士繁重工作流程 稱(chēng)張水華但凡有背景早就調(diào)崗了

削桐作琴
2026-01-04 18:13:13
騰訊回應(yīng)元寶AI辱罵用戶:模型異常輸出,不存在人工回復(fù)

騰訊回應(yīng)元寶AI辱罵用戶:模型異常輸出,不存在人工回復(fù)

IT之家
2026-01-04 16:52:59
現(xiàn)場(chǎng)畫(huà)面曝光!美媒公布美軍打擊委內(nèi)瑞拉蒂烏納堡基地后景象

現(xiàn)場(chǎng)畫(huà)面曝光!美媒公布美軍打擊委內(nèi)瑞拉蒂烏納堡基地后景象

環(huán)球網(wǎng)資訊
2026-01-04 14:02:30
湖南女生游黃山失聯(lián),百米懸崖下發(fā)現(xiàn)遺體,景區(qū)被判擔(dān)責(zé)15%,家屬上訴:護(hù)欄存缺陷

湖南女生游黃山失聯(lián),百米懸崖下發(fā)現(xiàn)遺體,景區(qū)被判擔(dān)責(zé)15%,家屬上訴:護(hù)欄存缺陷

瀟湘晨報(bào)
2026-01-05 07:14:13
中國(guó)民眾呼聲高漲:既然美國(guó)能活捉馬杜羅,大陸為何不抓賴(lài)清德?

中國(guó)民眾呼聲高漲:既然美國(guó)能活捉馬杜羅,大陸為何不抓賴(lài)清德?

博覽歷史
2026-01-04 18:50:59
越拆越亂!雷軍拆車(chē)直播兩小時(shí)急關(guān)評(píng)論,1200公里續(xù)航成謎

越拆越亂!雷軍拆車(chē)直播兩小時(shí)急關(guān)評(píng)論,1200公里續(xù)航成謎

老特有話說(shuō)
2026-01-04 19:57:29
A股開(kāi)盤(pán):三大指數(shù)集體高開(kāi),人腦工程、有色金屬、油氣設(shè)服等概念走強(qiáng)

A股開(kāi)盤(pán):三大指數(shù)集體高開(kāi),人腦工程、有色金屬、油氣設(shè)服等概念走強(qiáng)

界面新聞
2026-01-05 09:28:20
田樸珺刪光王石合影,王石:每晚最難熬是等她回家,不知道回不回

田樸珺刪光王石合影,王石:每晚最難熬是等她回家,不知道回不回

眉眼動(dòng)人
2026-01-04 11:41:23
特朗普,下一個(gè)目標(biāo)已經(jīng)確定 | 地球知識(shí)局

特朗普,下一個(gè)目標(biāo)已經(jīng)確定 | 地球知識(shí)局

地球知識(shí)局
2026-01-04 15:27:25
轉(zhuǎn)載:委內(nèi)瑞拉是個(gè)什么樣的國(guó)家?

轉(zhuǎn)載:委內(nèi)瑞拉是個(gè)什么樣的國(guó)家?

觀雨大神經(jīng)
2026-01-04 20:35:36
后續(xù)!柬埔寨流浪女網(wǎng)紅父親發(fā)聲,曝女兒不堪一面,鄰居透露更多

后續(xù)!柬埔寨流浪女網(wǎng)紅父親發(fā)聲,曝女兒不堪一面,鄰居透露更多

阿纂看事
2026-01-04 21:49:32
正式確定!中國(guó)男籃教練重返CBA,成為新疆隊(duì)主帥,沖擊前四

正式確定!中國(guó)男籃教練重返CBA,成為新疆隊(duì)主帥,沖擊前四

體壇瞎白話
2026-01-05 07:44:43
張靈甫身亡,蔣介石當(dāng)眾將湯恩伯打得滿頭血,死后蔣仍冷言相待

張靈甫身亡,蔣介石當(dāng)眾將湯恩伯打得滿頭血,死后蔣仍冷言相待

浩渺青史
2026-01-04 00:58:05
馬杜羅被捕現(xiàn)場(chǎng)細(xì)節(jié)流出:古巴硬漢貼身安保,戰(zhàn)至最后盡忠職守

馬杜羅被捕現(xiàn)場(chǎng)細(xì)節(jié)流出:古巴硬漢貼身安保,戰(zhàn)至最后盡忠職守

裝甲鏟史官
2026-01-04 15:14:32
紫牛頭條| 曾因10元一個(gè)打包袋上熱搜,煙臺(tái)老蓬萊酒樓疑再爆宰客事件

紫牛頭條| 曾因10元一個(gè)打包袋上熱搜,煙臺(tái)老蓬萊酒樓疑再爆宰客事件

揚(yáng)子晚報(bào)
2026-01-04 22:15:44
委內(nèi)瑞拉曾多次將美國(guó)石油公司“國(guó)有化”,無(wú)視國(guó)際仲裁補(bǔ)償,終演變?yōu)檐娛聸_突

委內(nèi)瑞拉曾多次將美國(guó)石油公司“國(guó)有化”,無(wú)視國(guó)際仲裁補(bǔ)償,終演變?yōu)檐娛聸_突

回旋鏢
2026-01-04 19:21:13
國(guó)博佛像最新回應(yīng)!文物疑似被以1200多萬(wàn)拍賣(mài),崔老賬號(hào)已被處理

國(guó)博佛像最新回應(yīng)!文物疑似被以1200多萬(wàn)拍賣(mài),崔老賬號(hào)已被處理

李健政觀察
2026-01-04 17:14:23
馬斯克的“星鏈”衛(wèi)星第一時(shí)間為委內(nèi)瑞拉人民提供免費(fèi)互聯(lián)網(wǎng)

馬斯克的“星鏈”衛(wèi)星第一時(shí)間為委內(nèi)瑞拉人民提供免費(fèi)互聯(lián)網(wǎng)

一種觀點(diǎn)
2026-01-04 19:08:21
“立即放人”,中方發(fā)出最強(qiáng)音,特朗普:不會(huì)因馬杜羅與華鬧矛盾

“立即放人”,中方發(fā)出最強(qiáng)音,特朗普:不會(huì)因馬杜羅與華鬧矛盾

別人都叫我阿螫
2026-01-04 17:06:32
2026-01-05 09:51:01
網(wǎng)絡(luò)辟謠 incentive-icons
網(wǎng)絡(luò)辟謠
上海市網(wǎng)信辦、解放日?qǐng)?bào)出品
4844文章數(shù) 37116關(guān)注度
往期回顧 全部

科技要聞

雷軍新年首播:確認(rèn)汽車(chē)業(yè)務(wù)降速

頭條要聞

牛彈琴:美國(guó)露出獠牙 現(xiàn)在有三個(gè)國(guó)家感到最危險(xiǎn)

頭條要聞

牛彈琴:美國(guó)露出獠牙 現(xiàn)在有三個(gè)國(guó)家感到最危險(xiǎn)

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂(lè)要聞

《小城大事》上星央八 熱血筑夢(mèng)正當(dāng)時(shí)

財(cái)經(jīng)要聞

李迅雷:擴(kuò)內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車(chē)要聞

最高續(xù)航310km 嵐圖泰山8或?qū)⑸习肽臧l(fā)布

態(tài)度原創(chuàng)

游戲
親子
家居
公開(kāi)課
軍事航空

《星空》100GB大型MOD 將其變成星球大戰(zhàn)RPG

親子要聞

向太慈母多敗兒?原生家庭會(huì)帶來(lái)多大傷害?

家居要聞

黑白碰撞 個(gè)性多元冷冽風(fēng)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

馬杜羅預(yù)計(jì)5日在紐約"首次出庭"

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版