国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

頂會論文造假:50多篇ICLR論文怎么騙過同行評審的

0
分享至

當一篇論文的參考文獻有一半查無出處,它憑什么能通過兩輪評審?ICLR 2026的丑聞給出了一個令人不安的答案。

從法庭到頂會:同一種幻覺,同一種漏洞


法律界早就踩過這個坑。2023年的Mata v. Avianca案里,律師用ChatGPT寫訴狀,結(jié)果引用了六個根本不存在的判例。法官沒接受"我不懂AI"的借口,直接開出了制裁罰單。

這不是個案。研究顯示,即便是加了檢索增強(檢索增強生成,即讓模型先查資料再回答)的法律寫作工具,面對復雜查詢時也會捏造近三分之一的引用。而且這些不是實驗室原型,是正經(jīng)在售的商業(yè)產(chǎn)品。

學者James把這類錯誤分成兩檔:

「誤植型」——曲解或錯引真實來源;「憑空捏造型」——直接發(fā)明案例、法條、引文。ICLR 2026的論文們兩樣都占了:有的把前人工作的基線性能寫錯,有的干脆引用不存在的數(shù)據(jù)集和"前人研究",搜索引擎根本抓不到。

核心問題被一句點破:大語言模型的優(yōu)化目標是"下一個詞最像人話",不是"這句話為真"。指望下一代模型自動解決這個問題,屬于一廂情愿。

評審機制是怎么被攻破的

一個小型機器學習會議的程序主席講過一件事:一篇"明顯是AI寫的、打磨得很漂亮"的論文,差點騙過兩個超負荷工作的審稿人。最后是個志愿者發(fā)現(xiàn),一半?yún)⒖嘉墨I根本解析不出來。ICLR 2026只是把這套劇本放大了。

技術(shù)層面,幻覺有幾條滲透路徑:

第一,"請總結(jié)X方向的相關(guān)工作"——這種提示詞會讓模型在不確定時依然輸出看似合理的綜述,夾帶私貨。

第二,虛構(gòu)的會議名、數(shù)據(jù)集名、基準測試名,聽起來像真的。

第三,根本沒跑過的消融實驗,被寫成"我們嘗試了A/B/C三種設(shè)置"。

審稿人面對 polished 的文本,加上自身時間壓力,驗證動力天然不足。而生成式工具的輸出又恰好擅長"看起來對"。

責任該由誰扛?

法律學者Shamov的觀點值得注意:個人追責不夠,因為"經(jīng)過認證"的工具本身就被證明不可靠。他主張責任分散到三層——工具開發(fā)商、機構(gòu)/平臺、實際使用者。

學術(shù)出版完全對得上這個框架:

? 廠商做寫作和文獻工具

? 會議方定政策和評審流程

? 作者和審稿人選擇并驗證輸出

目前三層都在失靈。工具沒內(nèi)置事實核查,會議沒針對AI寫作調(diào)整審稿標準,作者和審稿人則普遍缺乏驗證紀律。

清單:AI輔助研究的五條底線

既然幻覺是模型結(jié)構(gòu)的內(nèi)稟特性, workaround 必須從流程入手。參考法律和安全關(guān)鍵領(lǐng)域的做法,可以列出這幾條:

1. 參考文獻必須逐條核驗

不是抽查,是全部。用學術(shù)搜索引擎、期刊官網(wǎng)、作者個人頁交叉確認。ICLR 2026的造假論文里,"查無此文"的引用占了相當比例——這本是審稿環(huán)節(jié)就能攔截的。

2. 數(shù)據(jù)集和基準測試要驗證可獲取性

論文聲稱用了某個數(shù)據(jù)集?去官方倉庫下載試試。聲稱在某個基準上跑了分數(shù)?找 leaderboard 核對。很多幻覺數(shù)據(jù)集的名字起得很像真的,但域名、機構(gòu)、年份對不上。

3. 消融實驗保留執(zhí)行痕跡

代碼版本、隨機種子、運行日志。不是說作者都會造假,而是這些痕跡讓"聲稱跑過"變成"可以復現(xiàn)"。

4. 工具輸出標記與隔離

哪些段落是AI生成的初稿,哪些是經(jīng)人工改寫的事實陳述,應(yīng)當有明確區(qū)分。這不是為了懲罰使用AI,而是為了在出問題時快速定位。

5. 審稿流程增加對抗性檢查

現(xiàn)在的審稿是"找亮點",需要補一道"找硬傷"的工序??梢噪S機抽取引用、數(shù)據(jù)集、實驗配置進行強制核驗,也可以引入專門的"紅隊"審稿人。

一個行業(yè)級的問題

ICLR 2026不是孤立事件。法律、安全、軟件工程都出現(xiàn)了同樣的模式:流暢的AI輸出被當作事實,治理規(guī)則跟不上技術(shù)擴散速度。

區(qū)別在于,法律界已經(jīng)用判例和制裁建立了底線。學術(shù)界的反應(yīng)還在"建議"和"倡導"層面。當一篇頂會論文的引用有50%是假的,它損害的不只是那屆會議的聲譽——而是整個同行評審制度的可信度。

如果明年的投稿系統(tǒng)不強制要求參考文獻哈希校驗,不接入數(shù)據(jù)集注冊表,我們是在等下一個ICLR 2027嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
北京男籃官宣解約貝利!29場僅1場20+離開不意外 新外援已就位

北京男籃官宣解約貝利!29場僅1場20+離開不意外 新外援已就位

醉臥浮生
2026-04-23 15:58:51
王大陸因涉黑討債被判6個月,牽扯逃兵役傷人案,女友也一同獲刑

王大陸因涉黑討債被判6個月,牽扯逃兵役傷人案,女友也一同獲刑

橙星文娛
2026-04-23 14:16:49
“我被炸死是活該?”鄭麗文一句話讓民進黨代表破防

“我被炸死是活該?”鄭麗文一句話讓民進黨代表破防

花語輕吟
2026-04-24 07:28:23
紅綠燈倒計時取消!全國推行新規(guī),以后過路口記住這1句話

紅綠燈倒計時取消!全國推行新規(guī),以后過路口記住這1句話

阿振觀點
2026-04-22 06:00:49
《八千里路云和月》大結(jié)局:五對情侶5種悲劇,丁玉嬌尋夫八年,孟萬福犧牲太凄慘

《八千里路云和月》大結(jié)局:五對情侶5種悲劇,丁玉嬌尋夫八年,孟萬福犧牲太凄慘

TVB的四小花
2026-04-24 07:51:53
廣東官宣為新外援完成注冊 上賽季得分王因傷離隊

廣東官宣為新外援完成注冊 上賽季得分王因傷離隊

蘭亭墨未干
2026-04-24 10:17:06
在沒文班亞馬的平行時空,霍姆格倫全票當選DPOY,還順手拿下MVP

在沒文班亞馬的平行時空,霍姆格倫全票當選DPOY,還順手拿下MVP

兵哥籃球故事
2026-04-23 13:37:48
吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進店小心翼翼的怕說錯話

吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進店小心翼翼的怕說錯話

另子維愛讀史
2026-02-27 20:31:34
婆婆說年夜飯沒我位置,我痛快答應(yīng)并取消了28888的包桌

婆婆說年夜飯沒我位置,我痛快答應(yīng)并取消了28888的包桌

曉艾故事匯
2026-04-13 14:12:40
中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

健康之光
2026-03-23 20:10:05
中國工資重回3000時代,月薪3000元成常態(tài)

中國工資重回3000時代,月薪3000元成常態(tài)

念得小柔
2026-04-22 16:42:12
張雪遺憾落敗僅4天,人民日報發(fā)文,沒有夸贊,卻讓張雪口碑暴漲

張雪遺憾落敗僅4天,人民日報發(fā)文,沒有夸贊,卻讓張雪口碑暴漲

老吳教育課堂
2026-04-23 18:58:07
突發(fā)!伊朗亂了!

突發(fā)!伊朗亂了!

財經(jīng)要參
2026-04-24 09:00:07
注意!中老年男性有性生活和沒性生活,差別居然這么大?

注意!中老年男性有性生活和沒性生活,差別居然這么大?

皓皓情感說
2026-04-22 08:20:32
為什么說"飛機最安全",是一個精心設(shè)計的統(tǒng)計學陷阱?

為什么說"飛機最安全",是一個精心設(shè)計的統(tǒng)計學陷阱?

半解智士
2026-04-22 14:35:15
她幫美國造出原子彈,37年后見到周總理,第一句話讓人瞬間淚崩

她幫美國造出原子彈,37年后見到周總理,第一句話讓人瞬間淚崩

老范談史
2026-04-20 20:30:16
吃相越來越難看,終于引起公憤了!

吃相越來越難看,終于引起公憤了!

胖胖說他不胖
2026-04-23 09:00:33
107天黯然下課!6年長約作廢,切爾西再坐實“教練墳?zāi)埂保?>
    </a>
        <h3>
      <a href=田先生籃球
2026-04-23 09:38:13
開拓者老板摳門?肖華:一個花40億收購球隊的人被這么說完全沒道理

開拓者老板摳門?肖華:一個花40億收購球隊的人被這么說完全沒道理

懂球帝
2026-04-23 21:35:22
特朗普:估計普京不會出席G20峰會,如果他來了會非常有幫助;稱“俄羅斯被趕出G8時普京非常生氣,如果他們沒有被趕出去,情況會好得多”

特朗普:估計普京不會出席G20峰會,如果他來了會非常有幫助;稱“俄羅斯被趕出G8時普京非常生氣,如果他們沒有被趕出去,情況會好得多”

魯中晨報
2026-04-24 10:16:03
2026-04-24 10:55:05
薛定諤的BUG
薛定諤的BUG
有態(tài)度網(wǎng)友ytd
1709文章數(shù) 37關(guān)注度
往期回顧 全部

頭條要聞

受AI沖擊"霸總"回家種地:比拍戲難 今年基本回不了本

頭條要聞

受AI沖擊"霸總"回家種地:比拍戲難 今年基本回不了本

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養(yǎng)

財經(jīng)要聞

19家企業(yè)要"鋁代銅",格力偏不

科技要聞

凌晨突發(fā)!GPT-5.5正式上線:跑分更猛

汽車要聞

全景iDrive 續(xù)航近800km 新款寶馬7系/i7亮相

態(tài)度原創(chuàng)

教育
時尚
數(shù)碼
手機
房產(chǎn)

教育要聞

相似無刻度直尺作圖,一個視頻學會!

今年最好看的3個顏色,太適合夏天了!

數(shù)碼要聞

曝英特爾下代Z970芯片組將承接當前B860大部分市場定位

手機要聞

蘋果更新推出Invites 1.8,支持iMessage直接分享邀請函

房產(chǎn)要聞

三亞安居房,突然官宣!

無障礙瀏覽 進入關(guān)懷版