国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

陶哲軒力推AlphaEvolve:解決67個不同數(shù)學(xué)問題,多個難題中超越人類最優(yōu)解

0
分享至

陶哲軒又來安利AlphaEvolve了。

在與DeepMind高級工程師Bogdan Georgiev等人合著的新論文中,陶哲軒稱其為數(shù)學(xué)發(fā)現(xiàn)的有力新工具


具體來說,他們用AlphaEvolve研究了67個數(shù)學(xué)問題,涵蓋組合數(shù)學(xué)、幾何、數(shù)學(xué)分析與數(shù)論等多個領(lǐng)域。


結(jié)果發(fā)現(xiàn),AlphaEvolve在可擴展性、魯棒性、可解釋性方面均優(yōu)于傳統(tǒng)工具。

更關(guān)鍵的是,AlphaEvolve已經(jīng)可以自主發(fā)現(xiàn)新穎的數(shù)學(xué)構(gòu)造,并在部分問題上超越人類已有的最優(yōu)結(jié)果。

AI自主發(fā)現(xiàn)新數(shù)學(xué)構(gòu)造

AlphaEvolve在67個問題的測試中,不僅復(fù)現(xiàn)了眾多已知最優(yōu)解,更在多個方面展現(xiàn)了其獨特的發(fā)現(xiàn)能力。

一個關(guān)鍵的成就是AlphaEvolve能夠自主發(fā)現(xiàn)人類未曾一窺的新數(shù)學(xué)構(gòu)造

例如在處理Nikodym集問題時,系統(tǒng)生成的初步構(gòu)造雖然尚未達到最優(yōu),但它為人類研究者提供了“一個極好的人類直覺跳板” 。


基于AI提供的結(jié)構(gòu),研究人員通過人工簡化和直覺推演,最終找到了一個更優(yōu)的構(gòu)造,改進了已知的上界,這一人機協(xié)作的成果將作為一篇獨立的數(shù)學(xué)論文發(fā)表。


同樣地,在算術(shù)Kakeya猜想中,AlphaEvolve也發(fā)揮了類似作用。


系統(tǒng)不僅將一個已知的下界從1.61226提升至1.668,其構(gòu)造的解(形態(tài)上類似于離散高斯分布)還啟發(fā)人類數(shù)學(xué)家建立了新的漸近關(guān)系,相關(guān)成果也即將發(fā)表。


這種啟發(fā)人類研究的能力,與AlphaEvolve輸出結(jié)果的可解釋性緊密相關(guān)。

系統(tǒng)在大多數(shù)情況下生成的是結(jié)構(gòu)清晰的程序代碼,而非難以理解的黑盒結(jié)果,這使得人類專家可以方便地分析、歸納其發(fā)現(xiàn)的模式,并提煉出通用的數(shù)學(xué)公式。

積木堆疊問題便是這一特性的絕佳體現(xiàn)。


在該問題中,系統(tǒng)最初生成了一個邏輯正確的遞歸程序來計算積木的放置。在隨后的演化中,系統(tǒng)內(nèi)部的LLM分析了這段代碼的邏輯,并自主將其重構(gòu)為一個更簡潔、高效的顯式程序。

這個最終程序清晰地揭示了最優(yōu)解與諧波數(shù)(harmonic numbers)之間的數(shù)學(xué)關(guān)系,這與人類已知的理論公式完全一致,展示了系統(tǒng)從復(fù)雜解法中提煉數(shù)學(xué)本質(zhì)的能力。


除了方案的清晰性,AlphaEvolve在不同類型的問題設(shè)置下也表現(xiàn)出了強大的魯棒性。

它能夠有效處理高維度參數(shù)空間、復(fù)雜的幾何約束以及基于蒙特卡洛模擬的近似評分函數(shù)。

比如這里有一個最小三角形密度問題。


研究人員最初設(shè)計了一個樸素的評分函數(shù),但系統(tǒng)很快利用了該問題空間的非凸性,通過“欺騙”評分函數(shù)獲得了超越理論最優(yōu)的不可能分數(shù)。


為了解決這個問題,研究人員設(shè)計了一個更魯棒的新評分函數(shù),該函數(shù)基于問題的利普希茨連續(xù)性(Lipschitz type bounds)構(gòu)造。

在切換到這個更復(fù)雜的連續(xù)評分函數(shù)后,AlphaEvolve不再受局部陷阱的迷惑,迅速收斂到了已知的、正確的理論最優(yōu)解。


并且AlphaEvolve具備了出色的泛化能力,來看IMO 2025的第6題。


研究人員只在輸入n為完全平方數(shù)時才對系統(tǒng)進行評分。這種“信息限制”反而迫使AlphaEvolve去尋找這些稀疏實例背后的共同結(jié)構(gòu)模式,而不是對每個n進行“過擬合”。


最終,系統(tǒng)成功發(fā)現(xiàn)并輸出了在所有完全平方數(shù)n上均達到最優(yōu)的通用構(gòu)造,展現(xiàn)出了歸納能力。


在實際應(yīng)用中,AlphaEvolve的效率極高,僅需少量高質(zhì)量提示即可驅(qū)動。論文指出,來自領(lǐng)域?qū)<业奶崾荆╡xpert guidance)往往能顯著提升最終構(gòu)造的質(zhì)量,表明系統(tǒng)對人類輸入具有高度的敏感性。

同時,該系統(tǒng)在架構(gòu)上支持并行化,允許研究人員在多個問題實例或同一問題的不同參數(shù)設(shè)置上同時運行探索,并能自動遷移成功的搜索策略,這在處理多參數(shù)的幾何類問題時尤其高效。

AlphaEvolve工作模式

AlphaEvolve并非一個單一流程的系統(tǒng),而是通過不同“工作模式”適應(yīng)不同類型的數(shù)學(xué)問題探索任務(wù)。

該系統(tǒng)主要在兩種不同的模式下運行——“搜索模式”(search mode)和“泛化模式”(generalizer mode)。

“搜索模式”是系統(tǒng)最常用的模式,其目標是高效地發(fā)現(xiàn)最優(yōu)的數(shù)學(xué)構(gòu)造,而不必關(guān)心構(gòu)造過程是否具有可解釋性或普適性。在這種模式下,AlphaEvolve演化的不是直接生成構(gòu)造的程序,而是演化用于搜索構(gòu)造的程序。

每一個被演化的程序本身就是一個“搜索啟發(fā)式算法”(search heuristic)。

評估器會給予這些啟發(fā)式算法一個固定的時間預(yù)算,算法的得分取決于它在此預(yù)算內(nèi)能找到的最佳構(gòu)造的質(zhì)量。

這種方式解決了LLM調(diào)用(緩慢且昂貴)與傳統(tǒng)局部搜索(快速且廉價)之間的速度差異——一次緩慢的LLM調(diào)用用于生成一個高效的搜索策略,該策略隨后可以觸發(fā)大規(guī)模的廉價計算,自主探索數(shù)百萬個候選構(gòu)造。

系統(tǒng)演化的是一系列“改進器”(improver)函數(shù),它們動態(tài)地適應(yīng)搜索進程,早期可能偏好進行廣泛探索的啟發(fā)式算法,而當接近最優(yōu)解時,則會演化出更精細的、針對特定問題進行優(yōu)化的算法。


“泛化模式”則更具挑戰(zhàn)性 。

其目標是讓AlphaEvolve編寫一個能夠解決任意給定參數(shù)n的問題的通用程序 。系統(tǒng)的評估方式是考察該程序在一系列不同n值上的綜合表現(xiàn)。

這種模式的期望是,通過讓系統(tǒng)觀察自己在小規(guī)模n上找到的最優(yōu)解,它能夠自主“發(fā)現(xiàn)模式”,并將其歸納推廣為一個適用于所有n的通用公式或算法 。


總之,AlphaEvolve展示了AI引導(dǎo)的演化搜索如何補充人類的直覺,為數(shù)學(xué)研究提供了一個強大的新范式。

論文地址:
https://arxiv.org/abs/2511.02864

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
裝逼撞到你擅長的領(lǐng)域是啥體驗?網(wǎng)友:我曾經(jīng)也干過這種事呀

裝逼撞到你擅長的領(lǐng)域是啥體驗?網(wǎng)友:我曾經(jīng)也干過這種事呀

夜深愛雜談
2025-12-21 17:57:28
又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買了個牌子殼!

又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買了個牌子殼!

青眼財經(jīng)
2025-11-18 23:16:47
定居美國13年回國撈金遭驅(qū)逐,52歲被笑話

定居美國13年回國撈金遭驅(qū)逐,52歲被笑話

白日追夢人
2025-12-24 04:30:11
宗慶后被曝有7子,看了宗馥莉為他立的墓碑,才知道她早就布局了

宗慶后被曝有7子,看了宗馥莉為他立的墓碑,才知道她早就布局了

麥大人
2025-07-18 12:05:16
紫牛頭條|下班遭車禍,接受公司賠償后他發(fā)現(xiàn)一份意外險保單被公司隱瞞

紫牛頭條|下班遭車禍,接受公司賠償后他發(fā)現(xiàn)一份意外險保單被公司隱瞞

揚子晚報
2025-12-23 09:06:09
南京博物院又揭大瓜,前文物局局長曾問:賣幾個兵馬俑行不行?

南京博物院又揭大瓜,前文物局局長曾問:賣幾個兵馬俑行不行?

攬星河的筆記
2025-12-22 18:12:17
突發(fā)!法拉利撞上護欄后迅速起火,知名游戲大佬被困車內(nèi)身亡,警方通報!他被譽為“《使命召喚》之父”,眾多同行與玩家哀悼

突發(fā)!法拉利撞上護欄后迅速起火,知名游戲大佬被困車內(nèi)身亡,警方通報!他被譽為“《使命召喚》之父”,眾多同行與玩家哀悼

每日經(jīng)濟新聞
2025-12-23 15:06:07
受中國004核航母刺激太大,法國掀桌子了,砸鍋賣鐵也要建新航母

受中國004核航母刺激太大,法國掀桌子了,砸鍋賣鐵也要建新航母

云舟史策
2025-12-24 07:22:16
CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

弄月公子
2025-12-23 23:10:43
錢多有什么用?42歲離婚無兒無女的尼格買提,走上了另外一條道路

錢多有什么用?42歲離婚無兒無女的尼格買提,走上了另外一條道路

古事尋蹤記
2025-12-20 07:13:47
南京博物院盜賣文物,捐贈后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國寶還有多少黑幕

南京博物院盜賣文物,捐贈后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國寶還有多少黑幕

爆角追蹤
2025-12-18 15:36:33
他用藥7年換來肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

他用藥7年換來肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

健身迷
2025-12-22 10:19:04
轉(zhuǎn)告父母:這6種病屬于老年病,過度治療反而傷身,安然接受

轉(zhuǎn)告父母:這6種病屬于老年病,過度治療反而傷身,安然接受

讀懂世界歷史
2025-12-23 20:31:37
卷走53億!又一大佬帶全家跑路,欠中國銀行20億,投資者血本無歸

卷走53億!又一大佬帶全家跑路,欠中國銀行20億,投資者血本無歸

以茶帶書
2025-12-09 23:33:58
向大陸交底、對內(nèi)攤牌,鄭麗文把最怕被說破的那層窗戶紙,捅穿了

向大陸交底、對內(nèi)攤牌,鄭麗文把最怕被說破的那層窗戶紙,捅穿了

科普100克克
2025-12-24 00:10:32
哈佛大學(xué)研究:活過90歲的人29項共同特征

哈佛大學(xué)研究:活過90歲的人29項共同特征

尚曦讀史
2025-12-06 08:27:08
廣東5連勝,杜鋒:在廣東打球是幸福的!

廣東5連勝,杜鋒:在廣東打球是幸福的!

帶你領(lǐng)略快樂真諦
2025-12-24 02:50:13
黃金狂飆,一種交易正在悄悄進行

黃金狂飆,一種交易正在悄悄進行

鳳凰網(wǎng)財經(jīng)
2025-12-23 09:08:05
美國外交開始大洗牌

美國外交開始大洗牌

陸棄
2025-12-23 08:25:03
肥腸再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會出現(xiàn)6大變化

肥腸再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會出現(xiàn)6大變化

看世界的人
2025-12-04 10:51:31
2025-12-24 08:47:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5276文章數(shù) 64597關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強黑產(chǎn)攻擊

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

體育要聞

楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

娛樂要聞

朱孝天回應(yīng)阿信感謝,自曝沒再收到邀約

財經(jīng)要聞

快手到底惹了誰?

汽車要聞

四款新車集中發(fā)布 星途正式走進3.0時代

態(tài)度原創(chuàng)

旅游
家居
時尚
教育
公開課

旅游要聞

這趟俄羅斯之行,感覺很割裂

家居要聞

通透明亮 大氣輕奢風

歲月不敗美人,50歲銀發(fā)的她們也太會穿了

教育要聞

揭秘!淮南師范學(xué)院數(shù)學(xué)專業(yè)代碼一鍵鎖定

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版