国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

45年數(shù)論猜想被GPT-5.2 Pro獨(dú)立完成證明,陶哲軒:沒犯任何錯(cuò)誤

0
分享至

AI證明數(shù)學(xué)猜想,這次來真的了。

OpenAI最新模型GPT-5.2 Pro剛剛獨(dú)立證明了一道埃爾德什猜想。

論證過程經(jīng)菲爾茲獎(jiǎng)得主陶哲軒驗(yàn)證成立,還被評價(jià)為“迄今為止最明確的第一類結(jié)果(AI主要貢獻(xiàn))”。


這道題是埃爾德什問題庫中的第281號,由傳奇數(shù)學(xué)家保羅·埃爾德什(Paul Erd?s)與羅納德·格雷厄姆(Ronald Graham)于1980年共同提出,涉及同余覆蓋系統(tǒng)與自然密度的深層關(guān)系。

45年來,這道題一直靜靜躺在問題庫里,等待解答。

直到2025年1月17日,一位名叫Neel Somani的研究者把這道題扔給了GPT-5.2 Pro。


證明只用到GPT 5.2 Pro

埃爾德什問題網(wǎng)站已收錄AI證明結(jié)果。

整個(gè)論證在無窮阿德爾整數(shù)環(huán)上展開,借助哈爾測度和點(diǎn)態(tài)遍歷定理,結(jié)合緊致性論證完成了從逐點(diǎn)收斂到一致收斂的躍遷。


按陶哲軒的話說,它是“Furstenberg對應(yīng)原理”的一個(gè)變體,這是遍歷理論與組合數(shù)學(xué)交叉領(lǐng)域的標(biāo)準(zhǔn)工具。

但GPT-5.2 Pro的用法又有些不同,它比通常的論證更依賴伯克霍夫定理。


然而真正讓陶哲軒印象深刻的不是證明方法本身,而是AI沒有犯錯(cuò)。

讓我更驚訝的是它避免了錯(cuò)誤,比如極限交換或量詞順序的失誤,這正是這道題最容易踩的坑。前幾代大語言模型幾乎肯定會在這些微妙之處栽跟頭。

為了驗(yàn)證這份證明,陶哲軒親自動手,把整套遍歷論論證翻譯成了組合學(xué)語言,用哈代-利特爾伍德極大不等式替代伯克霍夫定理,重新走了一遍全部推導(dǎo)。

結(jié)論:證明成立。

一個(gè)意外的發(fā)現(xiàn)

正當(dāng)大家討論GPT-5.2 Pro的證明時(shí),一位網(wǎng)名KoishiChan的用戶在評論區(qū)拋出了一個(gè)令人意外的發(fā)現(xiàn):

這道題其實(shí)有更簡單的解法,而且所需的兩個(gè)定理早在1936年和1966年就已經(jīng)存在了。

第一個(gè)是達(dá)文波特(Harold Davenport)與埃爾德什本人在1936年合作證明的密度收斂定理。

第二個(gè)是羅杰斯定理,首次發(fā)表于1966年的哈爾伯斯塔姆-羅斯專著《序列》第五章。把這兩個(gè)經(jīng)典結(jié)果拼在一起,第281號問題幾乎是直接推論。

這就奇怪了。埃爾德什自己就是1936年那篇論文的合著者,而他在1980年提出這道題時(shí),都沒有意識到答案近在眼前。


陶哲軒就此事專門寫郵件請教了法國數(shù)學(xué)家特南鮑姆(Tenenbaum)。

特南鮑姆確認(rèn)“只要滿足你提到的兩個(gè)經(jīng)典結(jié)果(達(dá)文波特-埃爾多斯定理和羅杰斯定理),問題就能立即得到解決”,但他也猜測“問題的表述可能在某個(gè)環(huán)節(jié)被改動過”。不過目前沒有人找到任何其他版本的表述,所以只能按原樣處理。

更有意思的是,2007年菲拉塞塔、福特、科尼亞金、波默朗斯和余等五位頂尖專家在解決另一道埃爾德什問題時(shí),同樣不知道羅杰斯定理的存在,直到特南鮑姆提醒他們才補(bǔ)上了引用。

陶哲軒感慨:“羅杰斯定理沒有得到它應(yīng)有的傳播。它只出現(xiàn)在哈爾伯斯塔姆-羅斯那本書里,沒有單獨(dú)發(fā)表,文獻(xiàn)引用寥寥無幾?;蛟S這場討論能讓更多研究篩法和同余覆蓋的人注意到這個(gè)結(jié)果?!?/p>

最終現(xiàn)在這道題有了兩份證明:一份來自GPT-5.2 Pro的遍歷論路徑,一份來自KoishiChan挖出的經(jīng)典文獻(xiàn)組合。

陶哲軒確認(rèn)兩者是“不同的證明”,雖然在概念上有些重疊。


如何評估AI數(shù)學(xué)的真實(shí)成功率

消息傳開后,各路AI模型紛紛被拉來交叉驗(yàn)證。

Gemini 3 Pro表示證明沒有問題。另一位研究者用GPT-5.2 Pro反復(fù)檢查論證細(xì)節(jié),AI認(rèn)為唯一需要補(bǔ)充嚴(yán)格性的地方在第二步,可以用法圖引理繞過遍歷論直接完成。

不過陶哲軒指出這里法圖引理的方向用反:我剛教完研究生測度論,這類錯(cuò)誤見得太多了。

隨后又確認(rèn)其實(shí)是對補(bǔ)集應(yīng)用法圖引理,方向沒問題,論證成立。

但陶哲軒同時(shí)發(fā)出了冷靜的提醒。他寫道:

評估AI工具真實(shí)成功率時(shí),最大的統(tǒng)計(jì)偏差來自強(qiáng)烈的報(bào)告偏差,負(fù)面結(jié)果幾乎不會被披露。 如果某人或某AI公司把工具用在開放問題上但沒有進(jìn)展,他們沒有動力報(bào)告這個(gè)負(fù)面結(jié)論;即使報(bào)告了,也不太可能像正面結(jié)果那樣在社交媒體上傳播開來。 盡管絕大多數(shù)集中在難度譜系的簡單一端,遠(yuǎn)不能說明中等難度的埃爾德什問題已經(jīng)進(jìn)入AI的射程范圍。

他推薦了Paata Ivanisvili和Mehmet Mars Seven發(fā)起的一個(gè)開源項(xiàng)目,系統(tǒng)記錄前沿大語言模型在埃爾德什問題上的正面和負(fù)面結(jié)果。


數(shù)據(jù)顯示,這些工具在埃爾德什問題上的真實(shí)成功率大約只有百分之一到二。

但考慮到問題庫里有超過600道未解難題,這個(gè)比例仍然意味著一批數(shù)量可觀且非平凡的AI貢獻(xiàn)。


參考鏈接:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
云南嬰兒被撞后續(xù):對方態(tài)度囂張,帶人圍堵威脅寶媽,法院介入

云南嬰兒被撞后續(xù):對方態(tài)度囂張,帶人圍堵威脅寶媽,法院介入

青橘罐頭
2026-03-04 07:32:58
一天報(bào)銷115輛坦克!塔利班舉白旗求饒,巴鐵:多虧了中國制造!

一天報(bào)銷115輛坦克!塔利班舉白旗求饒,巴鐵:多虧了中國制造!

來科點(diǎn)譜
2026-03-02 10:58:53
英超中資隊(duì)釀奇跡?絕平阿森納+絕殺利物浦!4輪搶7分 或逆襲保級

英超中資隊(duì)釀奇跡?絕平阿森納+絕殺利物浦!4輪搶7分 或逆襲保級

我愛英超
2026-03-04 06:33:00
記念哈梅內(nèi)伊

記念哈梅內(nèi)伊

山間聽雨
2026-03-04 09:32:12
網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

眼光很亮
2026-03-01 16:12:51
再遭致命一擊!美國,被伊朗炸懵了!

再遭致命一擊!美國,被伊朗炸懵了!

大嘴說天下
2026-03-03 17:29:37
北京樓市起飛上天了,北京樓市萬柳板塊房價(jià)從12.8萬變成11.7萬

北京樓市起飛上天了,北京樓市萬柳板塊房價(jià)從12.8萬變成11.7萬

有事問彭叔
2026-03-02 21:58:37
億萬國人破防!90歲院士平靜宣布,中國導(dǎo)彈從此沒有任何死角

億萬國人破防!90歲院士平靜宣布,中國導(dǎo)彈從此沒有任何死角

策略述
2026-03-03 18:16:39
全球唯一明朝狀元卷,字跡如機(jī)器印刷,無一處筆誤,看完無地自容

全球唯一明朝狀元卷,字跡如機(jī)器印刷,無一處筆誤,看完無地自容

收藏大視界
2026-03-03 17:33:09
黃金白銀斷崖跳水

黃金白銀斷崖跳水

每日經(jīng)濟(jì)新聞
2026-03-03 20:06:15
以襲擊伊最高領(lǐng)袖選舉會場,戰(zhàn)事向中東多國外溢,最新動態(tài)→

以襲擊伊最高領(lǐng)袖選舉會場,戰(zhàn)事向中東多國外溢,最新動態(tài)→

極目新聞
2026-03-04 08:06:30
深夜十點(diǎn)半!日本男籃正式上訴,郭士強(qiáng)或被追罰,國際籃聯(lián)玩雙標(biāo)

深夜十點(diǎn)半!日本男籃正式上訴,郭士強(qiáng)或被追罰,國際籃聯(lián)玩雙標(biāo)

多特體育說
2026-03-03 22:30:36
李雨桐再錘薛之謙!指控他濫殺無辜,恐怕要坐牢,張杰無辜受牽連

李雨桐再錘薛之謙!指控他濫殺無辜,恐怕要坐牢,張杰無辜受牽連

離離言幾許
2026-03-03 11:09:30
2025年GDP全球前十強(qiáng):美國領(lǐng)跑、印度跌至第6、俄羅斯升至第8

2025年GDP全球前十強(qiáng):美國領(lǐng)跑、印度跌至第6、俄羅斯升至第8

南生今世說
2026-03-03 17:34:54
中國為何還在觀望?一旦卷入沖突,恐怕沒誰能在貿(mào)易和經(jīng)濟(jì)上幫咱

中國為何還在觀望?一旦卷入沖突,恐怕沒誰能在貿(mào)易和經(jīng)濟(jì)上幫咱

風(fēng)眼軍情
2026-03-02 19:11:49
蘇聯(lián)“人猿雜交”實(shí)驗(yàn):5名女孩與11只猩猩參與,結(jié)局如何?

蘇聯(lián)“人猿雜交”實(shí)驗(yàn):5名女孩與11只猩猩參與,結(jié)局如何?

談史論天地
2026-02-28 13:35:18
美專家:當(dāng)美軍第1波導(dǎo)彈干掉中國航母或兩棲艦后,希望中國退讓

美專家:當(dāng)美軍第1波導(dǎo)彈干掉中國航母或兩棲艦后,希望中國退讓

阿芒娛樂說
2026-03-04 05:56:46
以色列人痛哭流涕,這場戰(zhàn)爭讓以色列第一次感受到亡國滅種的危機(jī)

以色列人痛哭流涕,這場戰(zhàn)爭讓以色列第一次感受到亡國滅種的危機(jī)

星星會墜落
2026-03-03 20:02:59
爭議?祖國遭空襲后,伊朗女足亞洲杯集體拒唱國歌!主帥面帶微笑

爭議?祖國遭空襲后,伊朗女足亞洲杯集體拒唱國歌!主帥面帶微笑

我愛英超
2026-03-03 11:43:31
父母若是有以下7種疾病,子女基本都會遺傳,不少人并不清楚!

父母若是有以下7種疾病,子女基本都會遺傳,不少人并不清楚!

健康之光
2026-03-03 17:35:03
2026-03-04 12:11:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5389文章數(shù) 64616關(guān)注度
往期回顧 全部

科技要聞

新MacBook Pro首發(fā)M5 Pro/Max芯片 17999起

頭條要聞

哈梅內(nèi)伊之子被指當(dāng)選為新任最高領(lǐng)袖 但未獲官方證實(shí)

頭條要聞

哈梅內(nèi)伊之子被指當(dāng)選為新任最高領(lǐng)袖 但未獲官方證實(shí)

體育要聞

“頭鐵”拼圖在NBA也有生存環(huán)境

娛樂要聞

迪麗熱巴轉(zhuǎn)機(jī)滯留迪拜 錯(cuò)過巴黎時(shí)裝周

財(cái)經(jīng)要聞

伊朗,正在打破特朗普的幻想

汽車要聞

比亞迪元PLUS遭導(dǎo)彈襲擊 車輛未起火/乘員均生還

態(tài)度原創(chuàng)

本地
家居
房產(chǎn)
公開課
軍事航空

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

家居要聞

極簡無界 靜居自安然

房產(chǎn)要聞

400組,30套!聚億·椰海錦程為何能在春節(jié)火出圈?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗為遭到美以空襲小學(xué)遇難者舉行葬禮

無障礙瀏覽 進(jìn)入關(guān)懷版