国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】用AI檢測AI幻覺,用魔法打敗魔法!剛剛,NeurIPS已收錄論文被曝出數(shù)百條AI幻覺引用,至少53篇論文中招。為了對抗AI幻覺、造假所帶來的學(xué)術(shù)「污染」,首先拿起AI武器的,也應(yīng)當是AI頂會。

數(shù)百項虛假引用,53篇頂會論文被抓包!

剛剛,NeurIPS頂會暴雷,全球AI圈的「奧斯卡」盛會,被一家華人00后的AI初創(chuàng)公司「打假」了。

這家名為GPTZero的公司在掃描了NeurIPS 2025年所接收的4841篇論文后,發(fā)現(xiàn)了數(shù)百條由AI「編造」出來的引用,至少53篇論文「證據(jù)確鑿」。

GPTZero CEO Edward Tian將其稱作一個重要的節(jié)點時刻:

這是首次有記錄顯示,幻覺引用進入了頂級機器學(xué)習(xí)會議的官方文獻。


GPTZero聯(lián)合創(chuàng)始人兼CEO Edward Tian(左)與聯(lián)合創(chuàng)始人兼CTO Alex Cui(右)。

當「John Smith」這種占位符名字(類似中國的張三、李四),堂而皇之地出現(xiàn)在頂會參考文獻中,這意味著學(xué)術(shù)研究的基石已經(jīng)被AI幻覺「侵蝕」了。

更離譜的是,在GPTZero展示的例子中,圖靈獎得主Yann LeCun的名字,以「Samuel LeCun Jackson」的虛構(gòu)引用形式,出現(xiàn)在了另一篇有關(guān)深度學(xué)習(xí)的論文中。


學(xué)術(shù)引用的嚴謹性對于科研的意義不言而喻。

當謊言被引用了一千次,它在數(shù)據(jù)集中就變成了真理。

如果不加干預(yù),未來的研究者在引用這些「經(jīng)典」時,就像是在虛無縹緲的云端建造空中樓閣。

以前科學(xué)家們的研究是站在了巨人的肩膀上,今后很可能是站在AI的幻覺之上了。

53篇論文驚現(xiàn)AI幻覺引用

頂會濾鏡破碎

在AI學(xué)術(shù)圈,NeurIPS長期以來被視為一座「圣殿」。

在這里發(fā)表論文,幾乎等同于拿到了進入Google DeepMind或OpenAI等頂級實驗室的入場券。

然而,這層看上去高大上的「神圣濾鏡」,卻被GPTZero擊碎了。

他們對NeurIPS 2025已正式發(fā)表的4841篇論文進行了一次「地毯式掃描」,結(jié)果猶如一記重磅炸彈:

至少53篇論文,被檢測出包含數(shù)百條由大模型憑空捏造的引用。

最令人震驚的是,這些連鏈接都可能指向404的低級錯誤,竟悉數(shù)「騙」過了每篇論文至少三名專家的同行評審防線。


NeurIPS 2025現(xiàn)場


頂會的尊嚴,在AI幻覺面前,顯得不堪一擊。


https://gptzero.me/news/neurips/

如上圖,在GPTZero的官方博客中,公布了53篇NeurIPS論文中發(fā)表的100條虛構(gòu)引用列表。

在上圖所顯示的這篇論文中,GPTZero檢測到存在一篇標題相同的文章,作者顯然是偽造的。


在上面這篇關(guān)于深度學(xué)習(xí)技術(shù)的論文中,顯示無作者或標題匹配,說明該文章不存在于出版物中,其URL和DOI均為偽造。

GPTZero曾嘗試通過多種名稱來描述AI生成的幻覺引用。

「幻覺引用」(hallucinated citations)太長,「虛假引用」(fake citations)則帶有過強的道德評判色彩。


Alex Adams

最終,GPTZero機器學(xué)習(xí)主管Alex Adams提出了「氛圍引用」(vibe citing)一詞,用來描述大模型將真實來源進行推導(dǎo)或拼湊,從而生成看似逼真卻是虛假信息的傾向。

「氛圍引用」與「氛圍寫作」(vibe writing)或「氛圍編碼」(vibe coding)類似,其生成的引用乍看之下似乎準確無誤,但經(jīng)不起仔細推敲。


利用AI撰寫研究論文迅速流行,體現(xiàn)了「氛圍引用」(vibe-citing)的快速增長

從上圖中可以看出,2025年4月和9月的峰值分別對應(yīng)NeurIPS和ICLR 2025的論文提交截止日期。

AI幻覺的進化

Edward Tian認為,NeurIPS的情況更令人擔憂,因為問題出現(xiàn)在已經(jīng)被正式接收并發(fā)表的論文中

根據(jù)傳統(tǒng)的學(xué)術(shù)規(guī)范,即便只有一條偽造引用,也足以構(gòu)成拒稿理由。

NeurIPS 2025主賽道論文的接收率為24.52%,這意味著這些存在幻覺引用的論文擊敗了約15000篇競爭對手。

這些「AI幻覺」造成的引用問題,通過了同行評審,并被收錄進最終的會議論文集。

因此,Edward Tian認為這次問題,相比以往是一次明顯的升級,也是首次有記錄顯示幻覺引用進入了頂級機器學(xué)習(xí)會議的官方文獻。

在GPTZero曝光的部分案例中,我們看到了AI幻覺的驚人進化。

最初級錯誤

最初級錯誤,是論文參考文獻中出現(xiàn)了「John Smith」和「Jane Doe」這樣的占位姓名,甚至還有引用鏈接直接指向404空頁面。

而且,這種初級錯誤竟然逃過了世界頂級專家的法眼。

「半真半假」的隱蔽偽造

這是一種更危險、更深度,也更隱蔽的一種偽造。

AI可能會把多篇真實論文的內(nèi)容拼接或改寫,生成看起來十分可信的標題和作者列表。

它還會把一篇題為「深度學(xué)習(xí)的優(yōu)化」的論文,改寫成「深度學(xué)習(xí)中的優(yōu)化策略」。

乍看上去作者和關(guān)鍵詞都對,格式也是BibTeX的標準格式。

審稿人在快速瀏覽時,大腦會自動補全這些信息,覺得這篇文獻很眼熟,于是就通過了。

GPTZero之所以能發(fā)現(xiàn)「AI幻覺」,是因為它的結(jié)果是基于事實的對照。

據(jù)Alex Cui介紹,GPTZero的幻覺檢測工具會讀取論文全文,通過搜索開放網(wǎng)絡(luò)和學(xué)術(shù)數(shù)據(jù)庫,逐條核實引用的作者、標題、發(fā)表渠道和鏈接。

如果一條引用在現(xiàn)實世界找不到對應(yīng),或者只與真實論文部分匹配,系統(tǒng)就會拉響警報。

失守的防線

「投稿海嘯」與審稿過載困境

如此低級的錯誤,為什么會繞過層層把關(guān)的審稿系統(tǒng)?

答案很現(xiàn)實:由于內(nèi)卷,學(xué)術(shù)界的「算力」已經(jīng)跟不上了

ICLR、NeurIPS、ICML和AAAI這些全球AI頂會,每年吸引數(shù)千篇投稿和大量參與者。

由于AI、論文工廠以及發(fā)表壓力所引發(fā)的「投稿海嘯」,已使所有這些會議的審稿流程不堪重負,瀕臨崩潰。

比如,2020年至2025年間,NeurIPS的投稿量從9467篇激增超過220%,達到21575篇,遠高于2024年的15671篇和2023年的12343篇。

即便會議組織者動員了成千上萬名志愿評審,但對于每篇論文及其參考文獻進行深入審查也變得越來越難。

這就為AI幻覺的出現(xiàn)留下了可乘之機。

對此,NeurIPS理事會的官方回應(yīng)顯然有些蒼白:

1.1%的論文因使用大模型而包含一個或多個錯誤引用,也并不意味著論文內(nèi)容本身一定無效。例如,作者可能只是向大模型提供了不完整的引用信息,并讓模型生成BibTeX(格式化參考文獻)。

但是,這種說法在學(xué)術(shù)態(tài)度上也無法站住腳。

如果一位作者連自己的參考文獻都懶得核實,直接甩給AI去生成,且不進行復(fù)查,我們又怎能相信他在復(fù)雜的實驗數(shù)據(jù)上保持了嚴謹?


就像Hacker News中一位網(wǎng)友說的那樣,看到這些被標注錯誤的論文,會讓自己停下來思考:這篇論文的其它部分有多少是借助了AI輔助完成的。


「如果這些是僅有的錯誤,我們并不擔憂,但無法確定這些就已經(jīng)是全部的錯誤。這些錯誤表明該論文在提交時未經(jīng)過徹底的幻覺檢查,作者在使用AI時也缺乏應(yīng)有的謹慎!

用魔法打敗魔法

NeurIPS「翻車」不止是「氛圍引用」那么簡單,它動搖的是科研誠信的基石。

科研就像一場接力賽。以AI研究為例,它高度依賴「可復(fù)現(xiàn)性」和「溯源」。

就像Edward Tian所說的:「AI研究結(jié)果向來難以復(fù)現(xiàn),因此引用至關(guān)重要!

真實準確的引用,能幫助研究者判斷某個結(jié)果是否可復(fù)現(xiàn),并讓他人追溯到具體、可驗證的來源進行測試。

因此,如果「氛圍引用」的現(xiàn)象不加以遏制,我們將面臨一種可怕的「近親繁殖」效應(yīng):

AI生成了包含幻覺的論文,這些論文被收錄進數(shù)據(jù)庫,下一代AI模型又拿這些數(shù)據(jù)進行訓(xùn)練。

最終,AI開始從自己的幻覺中學(xué)習(xí)知識,導(dǎo)致模型的崩塌。

GPTZero的曝光旨在警示行業(yè)漏洞:舊有的「評審體系」,已難以應(yīng)對投稿量激增和AI使用所帶來的問題。

如何捍衛(wèi)同行評審的尊嚴?

另一大頂會ICLR(國際表征學(xué)習(xí)大會)已經(jīng)覺醒并開始行動。

ICLR將于今年4月舉辦,吸取了NeurIPS的教訓(xùn)后,它迅速聯(lián)手GPTZero,已啟動了嚴格的「排雷」行動。

此前,在GPTZero針對ICLR的一項投稿調(diào)研中,已經(jīng)發(fā)現(xiàn)了50條成功躲過評審的虛假引用。

去年11月,ICLR還發(fā)布了關(guān)于大模型生成論文及評審的應(yīng)對策略。


https://blog.iclr.cc/2025/11/19/iclr-2026-response-to-llm-generated-papers-and-reviews/

ICLR發(fā)出的信號非常明確:不封殺AI,但必須透明。

幻覺引用被定性為違反「道德準則」(Code of Ethics),一旦發(fā)現(xiàn)大量使用AI未披露或存在虛假內(nèi)容,將直接拒稿/桌拒(Desk Reject)。

更狠的是,審稿人亂用AI,自己的投稿也將面臨被拒的連帶懲罰

此外,ICLR還提到為了避免誤判,會結(jié)合工具篩選和人工復(fù)核,試圖通過「人機共治」,筑起抵御虛假內(nèi)容的新防線。

在AI時代,同行評審機制正被迫進行一場自我進化。

用AI檢測AI幻覺,用魔法打敗魔法。

為了應(yīng)對AI幻覺或造假帶來的學(xué)術(shù)「污染」,首先拿起AI武器的,也應(yīng)當是這些AI頂會。

GPTZero背后的兩位年輕創(chuàng)始人

GPTZero之所以能在AI檢測領(lǐng)域迅速嶄露頭角,離不開它兩位年輕創(chuàng)始人的完美互補。

Edward Tian


Edward Tian

Edward Tian是GPTZero的CEO ,也是一位擁有華人背景的00后創(chuàng)業(yè)者。

就讀普林斯頓大學(xué)期間,他主修計算機科學(xué),并輔修新聞方向;在創(chuàng)立GPTZero之前,他曾在Microsoft AI從事過研究工作,也做過BBC調(diào)查報道相關(guān)實踐。

這些經(jīng)歷讓他更早意識到:當生成式AI大規(guī)模普及后,「內(nèi)容真實性」與「學(xué)術(shù)誠信」將面臨新的挑戰(zhàn)。

2022年底ChatGPT上線引爆關(guān)注之后,Edward Tian在寒假期間快速做出了GPTZero的產(chǎn)品原型,并將困惑度(perplexity)與突發(fā)性(burstiness)等統(tǒng)計特征作為檢測的重要指標。


他認為人類寫作在這兩項指標上通常表現(xiàn)出更強的隨機性和結(jié)構(gòu)波動,據(jù)此能夠推測出一段文字是人工撰寫還是AI生成的。

AlexCui


Alex Cui

Alex Cui是GPTZero的聯(lián)合創(chuàng)始人兼CTO。

他在多倫多大學(xué)完成計算機科學(xué)碩士學(xué)位。在加入GPTZero之前,曾在自動駕駛公司W(wǎng)aabi擔任研究科學(xué)家。

作為GPTZero的CTO,Alex負責推進包括為微軟和谷歌產(chǎn)品開發(fā)的插件,幫助用戶在任何文檔或網(wǎng)站上檢測AI生成的文本。

二人并非臨時組隊,而是高中時期的好友。GPTZero早期團隊組建時,Edward便邀請Alex加入并負責技術(shù)推進。

參考資料:

https://fortune.com/2026/01/21/neurips-ai-conferences-research-papers-hallucinations/


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
萬萬沒想到,丁克大半輩子的張鐸,如今在46歲迎來了人生高光時刻

萬萬沒想到,丁克大半輩子的張鐸,如今在46歲迎來了人生高光時刻

胡一舸南游y
2026-01-14 13:20:09
福建金店被搶后續(xù):已抓獲是夫妻,曾搜過熔金步驟,更多細節(jié)曝光

福建金店被搶后續(xù):已抓獲是夫妻,曾搜過熔金步驟,更多細節(jié)曝光

小李子體育
2026-01-24 12:20:11
秋季發(fā)布!蘋果iPhone Fold售價或?qū)?.5萬元

秋季發(fā)布!蘋果iPhone Fold售價或?qū)?.5萬元

泡泡網(wǎng)
2026-01-22 17:22:07
“一坐高鐵就犯困”,12306回應(yīng)車廂二氧化碳濃度超標

“一坐高鐵就犯困”,12306回應(yīng)車廂二氧化碳濃度超標

中國新聞周刊
2026-01-23 15:54:20
未婚先孕?曝范冰冰現(xiàn)身婦產(chǎn)醫(yī)院,小心翼翼穿著寬松,腹部疑似隆起

未婚先孕?曝范冰冰現(xiàn)身婦產(chǎn)醫(yī)院,小心翼翼穿著寬松,腹部疑似隆起

八卦王者
2026-01-23 15:47:04
一群外國人曾到中國避難,于2003年正式加入中國國籍,他們直言:我是中國人,我為此感到自豪

一群外國人曾到中國避難,于2003年正式加入中國國籍,他們直言:我是中國人,我為此感到自豪

寄史言志
2026-01-09 17:55:10
“和平委員會”名單公布,19國已簽署,讓中方意外的是普京和巴鐵

“和平委員會”名單公布,19國已簽署,讓中方意外的是普京和巴鐵

尋途
2026-01-23 05:34:38
胡春華同志出席座談會!

胡春華同志出席座談會!

社評
2026-01-23 09:57:12
自民黨議員高呼“萬歲”,石破茂面色嚴肅、保持沉默

自民黨議員高呼“萬歲”,石破茂面色嚴肅、保持沉默

觀察者網(wǎng)
2026-01-24 11:12:24
黃金大漲,白銀狂飆!特朗普警告:歐洲若拋售美資產(chǎn),將遭重大報復(fù)

黃金大漲,白銀狂飆!特朗普警告:歐洲若拋售美資產(chǎn),將遭重大報復(fù)

證券時報e公司
2026-01-24 07:58:32
賽力斯拿下車企第一,華為贏麻了!

賽力斯拿下車企第一,華為贏麻了!

互聯(lián)網(wǎng)品牌官
2026-01-21 18:36:41
1950年,師級首長在成都遭活剝?毛主席拍案而起:116萬土匪,一個不留!

1950年,師級首長在成都遭活剝?毛主席拍案而起:116萬土匪,一個不留!

寄史言志
2026-01-07 20:37:09
向太曝馬伊琍已再婚:當年文章過不了心理那關(guān)

向太曝馬伊琍已再婚:當年文章過不了心理那關(guān)

娛樂看阿敞
2025-12-12 15:50:00
重磅官宣!人民日報預(yù)熱+足協(xié)聘任,國足主帥坦言與日本差距懸殊

重磅官宣!人民日報預(yù)熱+足協(xié)聘任,國足主帥坦言與日本差距懸殊

十點街球體育
2026-01-23 22:15:01
沈佳潤用力過猛,為可口可樂拍春節(jié)廣告臉比老爸大,粉底厚像虎妞

沈佳潤用力過猛,為可口可樂拍春節(jié)廣告臉比老爸大,粉底厚像虎妞

鋒哥與八卦哥
2026-01-24 11:42:24
“女碩士患精神疾病走失十余年被找回”案:兩人涉嫌強奸罪被起訴

“女碩士患精神疾病走失十余年被找回”案:兩人涉嫌強奸罪被起訴

大風(fēng)新聞
2026-01-22 22:16:16
故事:左宗棠收復(fù)新疆后,慈禧單獨召見他:你比曾國藩強在哪?

故事:左宗棠收復(fù)新疆后,慈禧單獨召見他:你比曾國藩強在哪?

飯小妹說歷史
2026-01-20 09:12:31
越共中央選出新一屆政治局成員,共19人

越共中央選出新一屆政治局成員,共19人

觀察者網(wǎng)
2026-01-23 18:36:08
種種跡象表明,特朗普賭輸了,馬斯克回歸政壇,中國發(fā)布4號公告

種種跡象表明,特朗普賭輸了,馬斯克回歸政壇,中國發(fā)布4號公告

風(fēng)雨與陽光
2026-01-24 14:44:27
91年,林立果未婚妻張寧,看望林豆豆夫婦,合影中張寧漂亮又時髦

91年,林立果未婚妻張寧,看望林豆豆夫婦,合影中張寧漂亮又時髦

歷史偉人錄
2024-11-28 12:02:20
2026-01-24 15:20:50
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14398文章數(shù) 66527關(guān)注度
往期回顧 全部

科技要聞

特斯拉Cybercrab即將落地 每公里不到1塊錢

頭條要聞

專家:特朗普或在春天訪問中國 其被認為是"對華鴿派"

頭條要聞

專家:特朗普或在春天訪問中國 其被認為是"對華鴿派"

體育要聞

當家球星打替補,他們在故意擺爛?

娛樂要聞

李微漪更新:狼王格林去世,3字淚目

財經(jīng)要聞

“百年老字號”張小泉遭60億債務(wù)壓頂

汽車要聞

有增程和純電版可選 日產(chǎn)NX8或于3-4月間上市

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
藝術(shù)
教育
公開課

房產(chǎn)要聞

正式官宣!三亞又一所名校要來了!

數(shù)碼要聞

Mad Catz美加獅21按鍵鼠標M.M.O. 7+國行上市,到手999元

藝術(shù)要聞

色彩之巔!法國蓬皮杜中心館藏藝術(shù)大師特展”在北京民生現(xiàn)代美術(shù)館開幕

教育要聞

難住大學(xué)生,如何求正方形面積

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版