国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

陶哲軒驚呼“變天”,AI用6小時(shí)改寫數(shù)學(xué)史

0
分享至

一塊閃亮的數(shù)學(xué)獎(jiǎng)牌,剛剛被寫入代碼的智能體在6小時(shí)內(nèi)摘下,而人類為此思考了30年。

PART 01

AI六小時(shí)破解30年數(shù)學(xué)難題

2025年12月,人工智能領(lǐng)域迎來里程碑事件:Harmonic公司開發(fā)的AI系統(tǒng)“亞里士多德”僅用6小時(shí)便攻克了困擾數(shù)學(xué)界30年的埃爾德什問題#124簡化版。這一突破被學(xué)界稱為“數(shù)學(xué)智能體時(shí)代的開端”,而菲爾茲獎(jiǎng)得主陶哲軒則犀利指出:AI正在高效收割數(shù)學(xué)界的“低垂果實(shí)”,讓人類研究者得以聚焦更具挑戰(zhàn)性的核心問題。



埃爾德什問題#124自1995年提出以來,一直是組合數(shù)論領(lǐng)域的頑固堡壘。其核心命題探討:給定k個(gè)不小于2的自然數(shù)d?,若∑1/(d?-1) ≥ 1,是否所有足夠大的自然數(shù)n都能表示為特定0-1組合的和?這個(gè)看似簡潔的問題,卻讓數(shù)學(xué)家們?cè)谧畲蠊s數(shù)(gcd)約束和邊界案例驗(yàn)證中陷入長達(dá)三十年的僵局。

“亞里士多德”的突破性在于其完全獨(dú)立的證明能力。它采用創(chuàng)新的“vibe proving”方法論,融合強(qiáng)化學(xué)習(xí)與蒙特卡洛樹搜索,在無需人類干預(yù)的情況下遍歷上億種證明路徑,最終輸出100%可驗(yàn)證的定理。整個(gè)過程僅耗時(shí)6小時(shí),而通過Lean形式化驗(yàn)證系統(tǒng)的檢驗(yàn)只需1分鐘。



耐人尋味的是,當(dāng)通用AI巨頭ChatGPT和Gemini面對(duì)同一問題時(shí),卻集體“折戟”。陶哲軒分析指出:Gemini僅能給出排除數(shù)字1后gcd條件成為必要的基礎(chǔ)觀察;ChatGPT則表現(xiàn)出明顯的“路徑依賴”,大量引用已有網(wǎng)頁和論文,未能提出原創(chuàng)性觀點(diǎn)。

這種差異揭示了專業(yè)AI與通用AI的本質(zhì)分野——當(dāng)“亞里士多德”被設(shè)計(jì)為“邏輯工匠”,基于形式邏輯生成可驗(yàn)證代碼時(shí),ChatGPT類模型仍是“猜詞機(jī)器”,依賴統(tǒng)計(jì)概率生成文本。

PART 02

“人機(jī)協(xié)同”的科研革命

陶哲軒將數(shù)學(xué)未解問題的分布描述為“長尾特征”。大多數(shù)難題并非超高難度,而是因人類數(shù)學(xué)家資源有限而被擱置的“低垂果實(shí)”。AI的自動(dòng)化能力恰恰擅長處理這類問題。



在埃爾德什問題網(wǎng)站上,“未解”標(biāo)簽最近減少了近十個(gè),這并非因?yàn)槿祟愅蝗唤鉀Q了這些問題,而是AI通過文獻(xiàn)檢索發(fā)現(xiàn)它們?cè)缫驯还タ恕_@種現(xiàn)象揭示了AI作為“清道夫”的價(jià)值——它能清理最容易解決的問題,讓人類聚焦于真正具有挑戰(zhàn)性的核心難題。

HarmonicMath創(chuàng)始人Vlad Tenev提出的“Vibe證明時(shí)代”已經(jīng)到來。這一概念意味著AI不僅能輔助驗(yàn)證,還能獨(dú)立創(chuàng)造。在數(shù)學(xué)領(lǐng)域,這種變革尤為深刻,因?yàn)閿?shù)學(xué)的形式化特性使其非常適合AI參與。



微軟前AI副總裁Sebastien Bubeck激動(dòng)地分享道:“該解決方案100%由AI生成,總計(jì)耗時(shí)6小時(shí)?!边@一效率與人類數(shù)學(xué)家30年的掙扎形成鮮明對(duì)比,凸顯了AI在科研效率方面的革命性提升。

PART 03

AI當(dāng)前局限與信息學(xué)學(xué)生的不可替代性

盡管“亞里士多德”取得了突破,但它解決的是原問題的簡化版本。原版埃爾德什問題#124不允許使用數(shù)字1且需要滿足額外的最小公約數(shù)條件,這一更復(fù)雜的版本仍有待解決。

AI在數(shù)學(xué)推理中面臨的主要挑戰(zhàn)之一是“超長推理鏈”問題。高中數(shù)學(xué)證明可能只需10到40步,而像黎曼猜想這樣的難題,證明路徑可能長達(dá)百萬步。美國加州理工學(xué)院的謝爾蓋·古科夫指出,這類超長路徑極難處理,AI必須在指數(shù)級(jí)增長的可能路徑中找到正確解法。



DeepMind的AlphaProof和AlphaGeometry2在國際奧數(shù)競賽中表現(xiàn)出色,但專家們普遍認(rèn)為,它們?nèi)匀狈φ嬲臄?shù)學(xué)洞察力。競賽題有一定“套路”,而真正的數(shù)學(xué)研究更開放、復(fù)雜。初創(chuàng)公司Epoch AI的FrontierMath測試顯示,面對(duì)全新技術(shù)難題,LLM幾乎集體“交白卷”。

數(shù)學(xué)家董彬指出,AI在數(shù)學(xué)研究中的理想角色是“AI學(xué)徒”——用訓(xùn)練數(shù)學(xué)家的方式培養(yǎng)AI助手。但目前,AI更適用于“單點(diǎn)突破”,從局部解決某些具體問題,而非全面替代人類直覺和創(chuàng)造力。

PART 04

信息學(xué)學(xué)生的四維能力重構(gòu)

當(dāng)AI開始收割數(shù)學(xué)“低垂果實(shí)”,信息學(xué)學(xué)生亟需重構(gòu)能力模型,在以下四個(gè)維度建立新優(yōu)勢:

人機(jī)協(xié)同的架構(gòu)思維——“亞里士多德”的成功源于其專業(yè)定位——與通用大模型不同,它專為數(shù)學(xué)證明設(shè)計(jì),融合強(qiáng)化學(xué)習(xí)、蒙特卡洛樹搜索與Lean形式化語言。這種“領(lǐng)域?qū)S弥悄堋奔軜?gòu)思維值得信息學(xué)學(xué)生深入學(xué)習(xí)。正如DeepSeek-V3.2-Speciale模型展現(xiàn)的,通過融合定理證明能力,專業(yè)模型在IMO、ICPC等賽事中已超越多數(shù)人類選手。

形式化驗(yàn)證的必備技能——Lean證明系統(tǒng)的應(yīng)用標(biāo)志著數(shù)學(xué)驗(yàn)證進(jìn)入程序化時(shí)代。信息學(xué)學(xué)生需掌握形式化驗(yàn)證工具,將自然語言證明轉(zhuǎn)化為機(jī)器可驗(yàn)證代碼。這不僅是防范AI幻覺的有效手段,更是未來科研協(xié)作的基礎(chǔ)能力。埃爾德什#124的證明在GitHub公開后,全球研究者均可參與驗(yàn)證與拓展(github.com/plby/lean-proofs)。

直覺引導(dǎo)的算法設(shè)計(jì)——當(dāng)前AI在依賴性質(zhì)觀察與解題直覺的題目上仍存在明顯局限。如AlphaProof解決3個(gè)IMO問題耗時(shí)3天,而人類選手僅需4.5小時(shí)。信息學(xué)學(xué)生應(yīng)強(qiáng)化元認(rèn)知能力,在AI陷入局部最優(yōu)時(shí)提供方向性指導(dǎo),這正是人類思維不可替代的核心價(jià)值——正如PatternBoost AI系統(tǒng)開發(fā)者所言:“探索性思維是數(shù)學(xué)的核心”。

問題發(fā)現(xiàn)的戰(zhàn)略眼光——倫敦?cái)?shù)學(xué)科學(xué)研究所何楊輝指出:AI能幫助證明問題,卻無法幫助確定需要解決的關(guān)鍵問題。信息學(xué)學(xué)生需培養(yǎng)科學(xué)發(fā)現(xiàn)的前瞻力,在AI清理“低垂果實(shí)”后,精準(zhǔn)識(shí)別真正值得攻堅(jiān)的“數(shù)學(xué)高峰”。這種能力建立在對(duì)學(xué)科發(fā)展脈絡(luò)的深刻理解與跨領(lǐng)域知識(shí)融合基礎(chǔ)上。

PART 05

教育轉(zhuǎn)型:從工具使用者到智能體架構(gòu)師

面對(duì)AI的沖擊,信息學(xué)教育正在經(jīng)歷范式轉(zhuǎn)變。2025年CNCC論壇達(dá)成共識(shí):信息學(xué)奧賽應(yīng)繼續(xù)堅(jiān)持以計(jì)算思維培養(yǎng)為核心,同時(shí)更加重視學(xué)生發(fā)現(xiàn)問題和提出問題的能力。微軟前AI副總裁塞巴斯蒂安·布貝克激動(dòng)地分享AI攻克埃爾德什難題的消息時(shí),強(qiáng)調(diào)“解決方案100%由AI生成”。



但走進(jìn)普林斯頓高等研究院,數(shù)學(xué)家們已在全新實(shí)驗(yàn)室工作:人類提出大膽猜想,AI負(fù)責(zé)驗(yàn)證與反例生成;人類構(gòu)建理論框架,AI完成繁瑣計(jì)算;人類捕捉靈感火花,AI將其轉(zhuǎn)化為嚴(yán)謹(jǐn)證明。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
金·卡戴珊與漢密爾頓領(lǐng)銜,明星聚集哈德森跨年派對(duì)

金·卡戴珊與漢密爾頓領(lǐng)銜,明星聚集哈德森跨年派對(duì)

奇思妙想生活家
2026-04-02 04:13:07
主角團(tuán)滅的5部頂級(jí)神劇,幾乎只剩下劇名了

主角團(tuán)滅的5部頂級(jí)神劇,幾乎只剩下劇名了

小Q侃電影
2026-04-03 22:17:56
伊朗伊斯蘭革命衛(wèi)隊(duì)宣布對(duì)美國“亞伯拉罕?林肯”號(hào)航空母艦發(fā)動(dòng)導(dǎo)彈襲擊

伊朗伊斯蘭革命衛(wèi)隊(duì)宣布對(duì)美國“亞伯拉罕?林肯”號(hào)航空母艦發(fā)動(dòng)導(dǎo)彈襲擊

俄羅斯衛(wèi)星通訊社
2026-04-03 15:13:44
商務(wù)部回應(yīng) Meta收購Manus

商務(wù)部回應(yīng) Meta收購Manus

每日經(jīng)濟(jì)新聞
2026-04-02 15:34:28
特朗普又發(fā)飆了。

特朗普又發(fā)飆了。

果媽聊娛樂
2026-04-03 07:26:17
歷史老師跌入“無人區(qū)”:某高中20人教研組,近一半無學(xué)生可教

歷史老師跌入“無人區(qū)”:某高中20人教研組,近一半無學(xué)生可教

聽心堂
2026-03-31 15:52:04
娶個(gè)日本老婆有多爽?兄弟曬婚禮現(xiàn)場和為國獻(xiàn)身過程:評(píng)論區(qū)男同胞眼饞壞了

娶個(gè)日本老婆有多爽?兄弟曬婚禮現(xiàn)場和為國獻(xiàn)身過程:評(píng)論區(qū)男同胞眼饞壞了

不二表姐
2026-04-03 21:30:00
網(wǎng)友RTX 5070顯卡損壞:商家免費(fèi)給換了塊5070 Ti

網(wǎng)友RTX 5070顯卡損壞:商家免費(fèi)給換了塊5070 Ti

3DM游戲
2026-04-01 12:31:04
風(fēng)向徹底變了!西方媒體集體改口:中國,無需再向世界證明什么

風(fēng)向徹底變了!西方媒體集體改口:中國,無需再向世界證明什么

樂天閑聊
2026-03-26 03:40:35
玄學(xué)大師點(diǎn)破天機(jī):無名指比食指長者,晚年命運(yùn)早已注定

玄學(xué)大師點(diǎn)破天機(jī):無名指比食指長者,晚年命運(yùn)早已注定

近史博覽
2026-04-02 17:15:33
上海中山醫(yī)院心內(nèi)科爆棚?回應(yīng):服務(wù)患者普通號(hào)常年不限號(hào),近期換季再迎高峰

上海中山醫(yī)院心內(nèi)科爆棚?回應(yīng):服務(wù)患者普通號(hào)常年不限號(hào),近期換季再迎高峰

上觀新聞
2026-04-02 20:49:03
宋佳這張素顏照,我盯著看了好一會(huì)兒。

宋佳這張素顏照,我盯著看了好一會(huì)兒。

科學(xué)發(fā)掘
2026-04-01 11:19:09
當(dāng)下,已經(jīng)沒有人愿意好好上班了!

當(dāng)下,已經(jīng)沒有人愿意好好上班了!

黯泉
2026-01-21 22:52:39
3人被查,3人被“雙開”,中央紀(jì)委國家監(jiān)委通報(bào)

3人被查,3人被“雙開”,中央紀(jì)委國家監(jiān)委通報(bào)

中國網(wǎng)
2026-04-03 21:22:14
2女3狗拒付4000車費(fèi)后續(xù):全網(wǎng)出名,同事認(rèn)出小區(qū)曝光,警方介入

2女3狗拒付4000車費(fèi)后續(xù):全網(wǎng)出名,同事認(rèn)出小區(qū)曝光,警方介入

離離言幾許
2026-04-02 15:41:08
月銷不足百輛,蓮花新車價(jià)格下探至50萬元

月銷不足百輛,蓮花新車價(jià)格下探至50萬元

國際金融報(bào)
2026-04-02 21:43:00
快訊!美軍地面部隊(duì)遲遲不入場的原因終于找到了!

快訊!美軍地面部隊(duì)遲遲不入場的原因終于找到了!

達(dá)文西看世界
2026-04-03 19:59:09
他汀類藥物到底該吃多久?能不能停藥?告訴你實(shí)情!

他汀類藥物到底該吃多久?能不能停藥?告訴你實(shí)情!

華醫(yī)網(wǎng)
2026-04-02 05:40:44
王毅一句話直指美國:聯(lián)合國不能為非法戰(zhàn)爭背書!不準(zhǔn)發(fā)生第5次

王毅一句話直指美國:聯(lián)合國不能為非法戰(zhàn)爭背書!不準(zhǔn)發(fā)生第5次

知法而形
2026-04-02 17:12:41
嚴(yán)查稅金、取消永住資格:日本永住申請(qǐng)熱度依然攀升

嚴(yán)查稅金、取消永住資格:日本永住申請(qǐng)熱度依然攀升

東京在線
2026-04-03 21:24:52
2026-04-04 02:52:49
電腦報(bào)少年派 incentive-icons
電腦報(bào)少年派
最新鮮的互聯(lián)網(wǎng)產(chǎn)業(yè)資訊
3919文章數(shù) 1602關(guān)注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

特朗普非常生氣要大清洗 陸軍部長、FBI局長等或被調(diào)整

頭條要聞

特朗普非常生氣要大清洗 陸軍部長、FBI局長等或被調(diào)整

體育要聞

被NBA選中20年后,他重新回到籃球場

娛樂要聞

夏克立官宣再婚當(dāng)爸?否認(rèn)婚內(nèi)出軌

財(cái)經(jīng)要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠(yuǎn)房親戚長得很像嗎?

態(tài)度原創(chuàng)

健康
手機(jī)
藝術(shù)
房產(chǎn)
公開課

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

手機(jī)要聞

OPPO Find X9 Ultra:真機(jī)偷跑!Find X9s Pro:要做小屏影像機(jī)皇

藝術(shù)要聞

她的作品藏著絕世美女,看看你能認(rèn)出幾個(gè)!

房產(chǎn)要聞

小陽春全面啟動(dòng)!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版