国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI時(shí)代,蝴蝶和海嘯之間只隔一個(gè)錯(cuò)誤

0
分享至



如果一篇論文錯(cuò)信了“AI幻覺”,會(huì)造成多米諾骨牌效應(yīng),引發(fā)一連串的數(shù)據(jù)錯(cuò)誤復(fù)發(fā),怎么破?用魔法打敗魔法,還是要靠AI工具。

開頭講兩個(gè)故事。

第一個(gè)故事,關(guān)于普遍性。

現(xiàn)在的學(xué)生和老師,都在普遍地使用AI。前幾天去親戚家串門,他正在教育他閨女不要用AI寫作文了,一定要自己寫。結(jié)果她閨女特別委屈地方告訴他:這是老師讓的,老師說(shuō)寫完之后,要傳給AI,讓AI給出修改意見。

前段時(shí)間,我去參加了一個(gè)大學(xué)教授和我們這些民間自媒體從業(yè)者的論壇,我特意問了關(guān)于使用AI的問題,答案是老師們也在普遍用AI做課件。

第二個(gè)故事,關(guān)于準(zhǔn)確性。

前段時(shí)間,良渚的自來(lái)水事件,鬧得沸沸揚(yáng)揚(yáng),但是突然有個(gè)信息沖了出來(lái),說(shuō)農(nóng)夫山泉在良渚有工廠,一時(shí)間快速發(fā)酵,幸虧事件查的及時(shí),發(fā)這個(gè)微博的博主很快刪除了信息,并且道了歉,說(shuō)是AI上查到的信息,搞錯(cuò)了。一句搞錯(cuò),差點(diǎn)給企業(yè)釀成大禍。

很顯然,AI在過去的兩年中,已經(jīng)證明了自己能夠給出比傳統(tǒng)搜索更優(yōu)質(zhì)答案的能力,人們也更愿意毫無(wú)底線地相信AI的答案,這種相信,在教授、媒體、教師、學(xué)術(shù)界、科學(xué)界、行政公務(wù)中都普遍存在,但是我們有沒有想過一個(gè)問題,如果AI在這些嚴(yán)肅學(xué)科領(lǐng)域,犯了良渚農(nóng)夫山泉那個(gè)錯(cuò),帶來(lái)的后果會(huì)是什么?

我覺得就是蝴蝶效應(yīng)。

一個(gè)媒體報(bào)道,或者一篇論文,用錯(cuò)一個(gè)數(shù)據(jù)之后,會(huì)引發(fā)一連串的數(shù)據(jù)錯(cuò)誤復(fù)發(fā),最終徹底讓AI陷入一種認(rèn)知錯(cuò)誤,誤導(dǎo)后面所有的人,這是一個(gè)多米諾的關(guān)系。

百度文心,最近弄了一個(gè)“放心寫”功能,大大提高了媒體和教育行業(yè)的AI使用確定性,我實(shí)話實(shí)說(shuō),之前為了確保數(shù)據(jù)不出錯(cuò),我還是會(huì)對(duì)比幾個(gè)AI一起交叉驗(yàn)證,然后再配合權(quán)威媒體的報(bào)道,確保自己不出錯(cuò),現(xiàn)在有了這個(gè)功能,直接把寫好的文章,傳給文心,有什么問題直接就會(huì)給我標(biāo)注出來(lái),我在線就可以修改,二次再審。

這等于給每個(gè)寫作者,加了一道風(fēng)控,有沒有數(shù)據(jù)錯(cuò)誤,有沒有政策解讀錯(cuò)誤,有沒有論點(diǎn)論據(jù)錯(cuò)誤,我在內(nèi)部開玩笑,我們行業(yè)的校對(duì)可以徹底下崗了,的確,我們公司的校對(duì)下崗很久了。

為什么學(xué)術(shù)界、媒體界是AI最應(yīng)該關(guān)注的對(duì)象?因?yàn)锳I的很多數(shù)據(jù)來(lái)源要取自這里,如果這里出錯(cuò),會(huì)交叉污染數(shù)據(jù),所以百度文心現(xiàn)在用“放心寫”,堵住這個(gè)交叉污染的可能性,是抵制AI幻覺的一個(gè)非常有效的手段。

我也試用了一下,拿“最近汽車行業(yè)監(jiān)管政策解讀”這個(gè)問題生成了一篇文章,具體細(xì)節(jié)和最終成果我就不展開說(shuō)了,只說(shuō)結(jié)論:質(zhì)量很可用,以對(duì)話助手的方式,達(dá)到了我以前用某些大模型的智能體的水平。



這個(gè)檢驗(yàn)過程有意思,提示未通過部分,我專門查了一下,為什么AI判定「歐盟《新電池法》要求2027年動(dòng)力電池回收利用率達(dá)到95%」不通過?原來(lái)法案是針對(duì)不同材料的,確實(shí)不能一概而論,很嚴(yán)謹(jǐn)。



再次重寫后通過,下載分享也很絲滑。

還有一點(diǎn)要提示,記住要把左下角的“事實(shí)校對(duì)”打開。

近期還看到一條訊息,LMArena大模型競(jìng)技場(chǎng)新發(fā)布了最新排名,文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名中國(guó)第一,特別是在創(chuàng)意寫作等方面表現(xiàn)突出。

值得點(diǎn)贊,不管從模型上還是應(yīng)用上,文心在中文寫作方面都很強(qiáng)勁,目前在文心APP最新版本可以體驗(yàn)最新的模型能力了。我了解到,放心寫中文寫作準(zhǔn)確率已經(jīng)超過了99%,幻覺率大大降低。

總之,我覺得未來(lái)如果要確保AI不產(chǎn)生過多幻覺,“放心寫”還真是一條可行之路。

首先,數(shù)據(jù)庫(kù)如何建立?

既然是一個(gè)幫助用戶避免AI幻覺的寫作工具,那就是要有一個(gè)屬于自己的細(xì)分?jǐn)?shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)不是開放式的,“放心寫”采用的數(shù)據(jù)庫(kù)都是權(quán)威可信機(jī)構(gòu)媒體和政府官網(wǎng),并沒有從海量的互聯(lián)網(wǎng)數(shù)據(jù)中去辨別,幻覺往往是因?yàn)殄e(cuò)誤信息權(quán)重大于正確信息之后,產(chǎn)生的結(jié)果。而且這種干擾,目前來(lái)看,是完全可實(shí)行的。

所以,用來(lái)二次辨別的工具,數(shù)據(jù)庫(kù)一定不是開放式全網(wǎng)數(shù)據(jù)。

其次,在小細(xì)分領(lǐng)域循環(huán)。

現(xiàn)在,文心“放心寫”對(duì)于公文、教育課件、行業(yè)報(bào)告、會(huì)議紀(jì)要等領(lǐng)域,已經(jīng)有強(qiáng)大的復(fù)盤能力,但是這種能力有個(gè)特性,就是服務(wù)辦公室工作比較多,并不是偏向娛樂和個(gè)人化需求,基本都是嚴(yán)肅話題,在這種特定場(chǎng)景中,數(shù)據(jù)就更容易保持干凈,這種干凈就可以傳染給外面的大數(shù)據(jù)庫(kù)。

第三,能夠幫助新手快速上手工作。

其實(shí),對(duì)于很多辦公室新人,甚至新教師來(lái)說(shuō),如何規(guī)范自己的行文,規(guī)范自己的課件,是一件非常頭疼的事,因?yàn)檫@些東西,往往都有固定的格式,其實(shí)不需要太多個(gè)性化的東西,但是這個(gè)格式需要經(jīng)驗(yàn),文心“放心寫”除了可以檢測(cè)錯(cuò)誤之外,也可以幫你根據(jù)你提供的參考文檔調(diào)整格式。

在過去的一年時(shí)間里,AI在很多公司,有了一個(gè)新名字,背鍋俠。

以前,公司里的人們辦公過程中出了錯(cuò),會(huì)把鍋甩給供應(yīng)商,說(shuō)是供應(yīng)商的錯(cuò),但是現(xiàn)在大家發(fā)現(xiàn),AI也可以承接這種錯(cuò)誤,這從側(cè)面也說(shuō)明了一個(gè)問題,AI幻覺的確普遍性存在,是一個(gè)現(xiàn)實(shí)問題。

無(wú)數(shù)的專家在擔(dān)憂,我們社會(huì)未來(lái)的信息安全問題,人類在未來(lái),到底還能不能真的分辨出哪些信息是真實(shí)的,哪些是AI杜撰出來(lái)的,今年良品鋪?zhàn)拥幕ㄉ?,被AI做出了一張花生長(zhǎng)在樹上的圖,成了鬧劇,事實(shí)上,這種事情,以后這會(huì)越來(lái)越多。

百度這次做“放心寫”,算是從反方向做了一次嘗試,AI不僅僅可以是數(shù)據(jù)信息的提供者,也可以是數(shù)據(jù)信息的糾正者,幻覺可能是AI創(chuàng)造出來(lái)的,也可以是AI糾正的。

時(shí)間來(lái)到了2026年,AI的競(jìng)爭(zhēng)很顯然會(huì)陷入一種白熱化,功能上的差異越來(lái)越小,那么下半場(chǎng)大家比什么?如果一個(gè)問題,所有AI給出的答案都大差不差,那么用誰(shuí)都一樣。那么如果一個(gè)問題,有一個(gè)AI能夠給出不一樣的答案,并且能夠做到錯(cuò)誤率很低,或者不出錯(cuò),這就是勝算。

確保自己和物理世界的強(qiáng)關(guān)聯(lián),不出現(xiàn)幻覺,對(duì)自己的交付負(fù)責(zé),這就是我心中AI后面的取勝法寶。

AI,在2026年,不能變成人們犯錯(cuò)的背鍋俠,而應(yīng)該是糾錯(cuò)俠。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
雕和鷹誰(shuí)更厲害?看完才知道,根本不是一個(gè)量級(jí)!

雕和鷹誰(shuí)更厲害?看完才知道,根本不是一個(gè)量級(jí)!

心中的麥田
2026-03-07 19:20:54
你們聽過最禽獸的事情是什么?網(wǎng)友的分享還是很有道理的!

你們聽過最禽獸的事情是什么?網(wǎng)友的分享還是很有道理的!

墻頭草
2026-03-06 08:09:57
44歲凱特王妃生理特征曝光!根本無(wú)法治愈,這次出鏡很“尷尬”

44歲凱特王妃生理特征曝光!根本無(wú)法治愈,這次出鏡很“尷尬”

夜深愛雜談
2026-03-07 18:54:52
不敢喝了!4大頭部椰子水全造假,100%純椰水全是水+糖 +科技狠活

不敢喝了!4大頭部椰子水全造假,100%純椰水全是水+糖 +科技狠活

川渝視覺
2026-03-04 20:09:52
性壓抑已經(jīng)變態(tài)至此了?

性壓抑已經(jīng)變態(tài)至此了?

黯泉
2026-03-07 11:28:43
遼寧鐵人球迷意難平!不僅因?yàn)?-3慘敗泰山,更是因?yàn)橐韵挛妩c(diǎn)!

遼寧鐵人球迷意難平!不僅因?yàn)?-3慘敗泰山,更是因?yàn)橐韵挛妩c(diǎn)!

田先生籃球
2026-03-07 20:40:14
伊朗的導(dǎo)彈先清空,還是美國(guó)中東盟國(guó)的防空導(dǎo)彈庫(kù)存先見底?

伊朗的導(dǎo)彈先清空,還是美國(guó)中東盟國(guó)的防空導(dǎo)彈庫(kù)存先見底?

合贊歷史
2026-03-07 12:24:43
小姑子兒子百天宴開58桌,我提前把老公13張信用卡全部掛失

小姑子兒子百天宴開58桌,我提前把老公13張信用卡全部掛失

藝鑒在線
2026-03-08 07:00:05
下午17點(diǎn),中國(guó)女足vs朝鮮!賽前傳來(lái)2個(gè)好消息,感謝亞足聯(lián)助攻

下午17點(diǎn),中國(guó)女足vs朝鮮!賽前傳來(lái)2個(gè)好消息,感謝亞足聯(lián)助攻

侃球熊弟
2026-03-08 01:25:03
陳永貴副手郭鳳蓮的現(xiàn)狀:兒子都是億萬(wàn)富翁,大兒子掏3000萬(wàn)修廟

陳永貴副手郭鳳蓮的現(xiàn)狀:兒子都是億萬(wàn)富翁,大兒子掏3000萬(wàn)修廟

兵鑒史
2026-03-07 02:19:39
伊朗總統(tǒng)向鄰國(guó)致歉:不再攻擊鄰國(guó)

伊朗總統(tǒng)向鄰國(guó)致歉:不再攻擊鄰國(guó)

每日經(jīng)濟(jì)新聞
2026-03-07 16:12:23
33歲人妻球場(chǎng)換裝驚艷四座,這豐滿胸圍是真實(shí)存在的嗎?

33歲人妻球場(chǎng)換裝驚艷四座,這豐滿胸圍是真實(shí)存在的嗎?

娛樂領(lǐng)航家
2026-03-06 20:00:03
又一男星組團(tuán)選妃?他恐成下一個(gè)棄子……

又一男星組團(tuán)選妃?他恐成下一個(gè)棄子……

毒舌八卦
2026-03-07 23:23:32
讓人淚目!李金羽賽后口誤稱“魯能”,使山東老球迷集體破防

讓人淚目!李金羽賽后口誤稱“魯能”,使山東老球迷集體破防

獅王亂彈
2026-03-08 07:25:19
中俄要求美國(guó)立即?;?!美防長(zhǎng)傲慢回應(yīng)!并向太平洋發(fā)射洲際導(dǎo)彈

中俄要求美國(guó)立即停火!美防長(zhǎng)傲慢回應(yīng)!并向太平洋發(fā)射洲際導(dǎo)彈

好賢觀史記
2026-03-06 19:32:59
沒想到,2026兩會(huì)最火的提案不是醫(yī)療和就業(yè),而是靳東的這一建議

沒想到,2026兩會(huì)最火的提案不是醫(yī)療和就業(yè),而是靳東的這一建議

天天熱點(diǎn)見聞
2026-03-07 10:11:29
央視怒批,目不識(shí)丁、洋相百出,難怪兩會(huì)上馮遠(yuǎn)征建議演員多學(xué)習(xí)

央視怒批,目不識(shí)丁、洋相百出,難怪兩會(huì)上馮遠(yuǎn)征建議演員多學(xué)習(xí)

淚滿過眼
2026-03-06 02:07:23
揭秘亞洲最窮國(guó):當(dāng)?shù)嘏泽@人開放,游客秒變土豪,無(wú)不想去定居

揭秘亞洲最窮國(guó):當(dāng)?shù)嘏泽@人開放,游客秒變土豪,無(wú)不想去定居

明天后天大后天
2026-02-07 11:10:14
中國(guó)50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

中國(guó)50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

深度報(bào)
2026-02-27 21:36:50
伊朗網(wǎng)紅吐槽中國(guó)網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭(zhēng)的殘酷

伊朗網(wǎng)紅吐槽中國(guó)網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭(zhēng)的殘酷

新游戲大妹子
2026-03-05 12:59:52
2026-03-08 11:16:49
長(zhǎng)三角momo incentive-icons
長(zhǎng)三角momo
專注大公司組織問題和職場(chǎng)文化分析。
88文章數(shù) 38關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

媒體:伊朗問題要注意普京的動(dòng)向 其在向美以喊話

頭條要聞

媒體:伊朗問題要注意普京的動(dòng)向 其在向美以喊話

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財(cái)經(jīng)要聞

油價(jià)要失控?

汽車要聞

華為乾崑全新激光雷達(dá)落地 鴻蒙智行同步技術(shù)升級(jí)

態(tài)度原創(chuàng)

本地
教育
健康
親子
公開課

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

教育要聞

成長(zhǎng)路上的心靈迷霧:青春期女生常見心理

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

親子要聞

12歲孩子腸癌晚期,腫瘤年輕化不是開玩笑!

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版