国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

菲爾茲獎得主Michael Freedman新作揭開數(shù)學(xué)真相

0
分享至

機器之心編輯部


當談及數(shù)學(xué)時,我們近乎本能地認為,數(shù)學(xué)是一個嚴謹、精確、不容置疑的完美邏輯體系,但在菲爾茲獎得主邁克爾?弗里德曼(Michael Freedman)眼中,人類真正創(chuàng)造和關(guān)心的數(shù)學(xué),本質(zhì)上是「柔軟且可塑」的。

Michael Freedman 是當代最具影響力的數(shù)學(xué)家之一,曾因解決四維龐加萊猜想獲得菲爾茲獎。這一成果被認為是拓撲學(xué)領(lǐng)域的里程碑。

此后,他并未停留在純數(shù)學(xué)領(lǐng)域,而是轉(zhuǎn)向應(yīng)用前沿,創(chuàng)立了 Microsoft StationQ,成為拓撲量子計算的重要推動者之一。

近年來,Michael Freedman又將研究興趣延伸至人工智能,嘗試用數(shù)學(xué)視角理解人類知識的結(jié)構(gòu)與生成機制。



想象一下,一個僅需要 600 個 token 寫就的命題,展開后長度竟能達到 10 的 104 次方,比古戈爾(googol)還要龐大的天文數(shù)字。這并非科幻,而是 Michael Freedman 及其團隊在分析現(xiàn)代數(shù)學(xué)庫 Mathlib 時發(fā)現(xiàn)的真實現(xiàn)象。

這種數(shù)學(xué)家們在幾十層抽象之上輕松將龐大的演繹鏈條凝練為簡潔的概念背后,揭示了一個被數(shù)學(xué)家們使用了 3000 年、卻很少被言明的秘密:數(shù)學(xué)的本質(zhì),不是證明,而是壓縮。

近日,Michael Freedman 在最新論文中直接喊出這一宣言:「壓縮,就是你所需要的全部」(Compression is all you need)。



  • 論文鏈接:https://arxiv.org/pdf/2603.20396

在最近的一次采訪中,Michael Freedman 對此論文進行了介紹,探討了人類數(shù)學(xué)直覺與機器邏輯之間的巨大鴻溝。

他認為,人類數(shù)學(xué)數(shù)千年的演進,本質(zhì)上是一部不斷創(chuàng)造「宏」、構(gòu)建抽象層級的壓縮史。從 3000 年前的位值表示法,到現(xiàn)代復(fù)雜的微分方程,人類文明實際上一直在進行「數(shù)據(jù)壓縮」實驗。

人類做數(shù)學(xué),從來不是在窮舉推理路徑,而是在一個幾乎無限的空間中,不斷尋找可以被壓縮的結(jié)構(gòu)。相較之下,AI 卻是一直在「窮舉」……

因此,在 AI 正處于關(guān)鍵發(fā)展階段的當下,理解這一機制,或許正是人類與 AI 在數(shù)學(xué)領(lǐng)域?qū)崿F(xiàn)真正協(xié)作的起點。

下面是此次 Michael Freedman 的采訪內(nèi)容,為了更好地閱讀,我們在不改變原意的基礎(chǔ)上進行了調(diào)整。

主持人:當我們談到數(shù)學(xué)時,通常會認為它是一個嚴密、完美的邏輯體系,但你的研究似乎在說,人類真正使用的數(shù)學(xué)并不是這樣。你能否從「壓縮」這個概念開始講起?

Michael Freedman:當然可以。在我們的論文中有個小玩笑:壓縮其實早在 3000 年前就被發(fā)明了,也許就是數(shù)學(xué)的第一個偉大定理 —— 位值記數(shù)法(Place notation)。

比如「10」可以用一個「1」放在特定位置表示,「100」也是類似。就是通過把「1」放在不同的位置,從而用極少的符號表示極大的數(shù)。這種表示方式讓整數(shù)的表達具備對數(shù)級增長,卻能在有限符號中表達指數(shù)級數(shù)量的數(shù)。

這就是一種極其強大的壓縮方式,它甚至和現(xiàn)代物理中的一些思想(比如自旋鏈狀態(tài))有關(guān)。但壓縮遠不止是數(shù)字表示,它貫穿整個數(shù)學(xué)體系。

主持人:能舉一個更具體的例子嗎?

Michael Freedman:我剛上大學(xué)時,第一次上微分方程課,教授在黑板上寫下一個一個巨大的 Ω,并說它是「向量叢截面的芽層」(sheaf of germs of sections of a vector bundle)。

那一刻,我甚至不知道什么是向量叢?后來我才意識到要理解這句話,你需要理解背后的多層概念:向量叢、截面、層、芽,以及它們之間的映射關(guān)系。如果再往下深思,還涉及自然數(shù)、整數(shù)、有理數(shù)、實數(shù)、向量空間、流形等基礎(chǔ)結(jié)構(gòu)。

也就是說,數(shù)學(xué)家在思考時,其實是站在十幾層抽象之上。這就是為什么微分方程「看起來不難」,因為大量信息已經(jīng)被壓縮了。

這就是「壓縮」的力量:大量信息被隱藏在高層概念中。

而如果你用 Lean 這樣的形式化語言表達,就必須把這些壓縮全部展開。所以可以說:壓縮是數(shù)學(xué)的核心,而且已經(jīng)存在了 3000 年。

在論文中,我們試圖把這種直覺變成可量化的東西。我們使用 Lean 的數(shù)學(xué)庫(mathlib,約 50 萬行代碼)作為「人類數(shù)學(xué)」的一個近似模型,對其結(jié)構(gòu)進行了統(tǒng)計分析:一個定理如何調(diào)用其他引理、定義如何復(fù)合并相互嵌套。我們可以看到一種分層結(jié)構(gòu)和壓縮結(jié)構(gòu),它使得 Mathlib 中的命題以高層級( Wrapped,包裝態(tài))編寫,但隨后可以展開為基礎(chǔ)的 Lean 術(shù)語(Unwrapped,解包態(tài))。

我們研究了兩者的關(guān)系,發(fā)現(xiàn)這種層次關(guān)系將相對簡單的數(shù)學(xué)命題變成了源自基礎(chǔ) Lean 術(shù)語的、極其巨大的樹狀結(jié)構(gòu)。

主持人:我記得這可以達到一個非?;闹嚨臄?shù)字:10 的 104 次方,對吧?那我想問,你做這些事因為你想強調(diào)這本質(zhì)上是數(shù)學(xué)的核心,對嗎?

Michael Freedman:是的,我們將這個庫中的內(nèi)容視為人類行為的一個良好樣本,雖然它在數(shù)學(xué)各領(lǐng)域的分布并不完美 —— 數(shù)論和代數(shù)幾何比分析或拓撲多得多。它不是人類數(shù)學(xué)思想的完美副本,但它與「從一組公理出發(fā)進行每一種可能的邏輯推演」截然不同,后者會導(dǎo)致「混沌數(shù)學(xué)」。

而無論如何進行形式化,發(fā)現(xiàn)結(jié)構(gòu)都會呈雙指數(shù)級增長。最終的結(jié)果就像你說的,我們在 Lean 庫中找到的最長的解包命題(Unwrapped statement),其大小為 10 的 104 次方),比 Googol(10 的 100 次方)還要大。而它對應(yīng)的包裝命題(Wrapped statement)只有 600 個 Token。

這展示了驚人的膨脹,但反過來也展示了通過使用概念所獲得的巨大壓縮。

我想說的是,數(shù)學(xué)家和他們的智能體實際上在同一條船上。但當你看到像 Googol 這樣的數(shù)字,即使我們的機器比我們快 100 萬倍,100 萬在 Googol 的尺度下也是微不足道的。

所以,真正的問題不是人類與機器將探索什么,而是在龐大的形式推理空間中,哪一部分是可以被壓縮成我們和智能體能夠理解的形式(我稱之為形式數(shù)學(xué))。

我相信人類數(shù)學(xué)(在此將我們的智能體也視為「人類」的一部分)正是如此。

主持人:在你們分析的這些方程中,是否發(fā)現(xiàn)存在某些方程或過程,不具備與其他事物相同的「公分母」?如果是這樣,如何決定什么是「最基礎(chǔ)」的?或如何知道自己「觸底」?

Michael Freedman:對于 Lean 來說,很容易知道什么時候觸底,因為庫的結(jié)構(gòu)就是這樣設(shè)計的。

基本上,有原始項,你可以用它們構(gòu)建更復(fù)雜的命題,所以這個「展開后長度」有時被稱為樹表示法。每個命題,你看它的子節(jié)點,即它是由什么構(gòu)建的,然后你看那些子節(jié)點的子節(jié)點,形成一棵越來越深的樹,直到它終止于原始的 Lean 項。之后統(tǒng)計所有這些節(jié)點的調(diào)用,每個節(jié)點根據(jù)其調(diào)用的先前節(jié)點的權(quán)重被賦予權(quán)重,從原始項權(quán)重為 1 開始。當把樹上頂層的權(quán)重加起來時,就得到了展開后命題的巨大數(shù)字。

而壓縮在于,人類設(shè)計并利用 Lean 表達了一種語言,可以用大約 600 個 token 寫下這個 Googol 量級的數(shù)字。

我們在論文中使用的方法則是從數(shù)學(xué)物理中汲取了靈感。在物理學(xué)中嘗試為自然的某部分建立一個模型以幫助進行數(shù)學(xué)分析時,這就是「玩具模型」(toy model),并非試圖捕捉全部真相,而是抓住核心結(jié)構(gòu),有意選擇一個現(xiàn)實的粗略投影,希望能夠?qū)ζ渥龀鐾暾姆治觯瑥亩笇?dǎo)對更復(fù)雜問題的直覺。比如電磁學(xué)、量子力學(xué)、BCS 超導(dǎo)理論等,都是這樣。

在論文中,我們使用「幺半群」(monoid)來建模數(shù)學(xué)。

幺半群類似于群,只是未必有逆元,最簡單的幺半群就是計數(shù)數(shù)字,即自然數(shù)。在幺半群一側(cè),可以放入「宏」(macros),即「新思想」,代表新的抽象,可以幫助我們更高效地表達信息。

比如「10 的冪次方」,就是一個能實現(xiàn)壓縮、高效表示整數(shù)的宏的例子。一旦在幺半群中有宏,就可以推導(dǎo)出層級屬性、衡量壓縮程度。

研究結(jié)果顯示,宏越多,實現(xiàn)的壓縮程度就越高;宏越少,壓縮就越少,表達能力越弱。

而在數(shù)學(xué)這一側(cè),在 Lean 庫中,我們不知道宏是什么,這有點像在問數(shù)學(xué)的使用手冊,我們對此獲得的洞察越多,「人類」(我們和智能體)在探索數(shù)學(xué)時就會越順利,想法是去學(xué)習(xí)已經(jīng)在數(shù)學(xué)中使用的機制:原則是什么?推論是如何組織的?

現(xiàn)在的主要挑戰(zhàn)是解決「逆問題」,即看看在數(shù)學(xué)側(cè)對應(yīng)的「宏」到底是什么。

主持人:在數(shù)學(xué)推理中,機器往往需要遍歷指數(shù)級的可能性,而人類卻能以更慢、近似多項式的(速率)方式直接切中要點。這種差異是否源于一種「數(shù)學(xué)品味」?我們是如何從海量可能性中篩選出真正有意義的路徑的,以及這種能力是否可以被建模和復(fù)制到機器中?

Michael Freedman:這是實驗科學(xué),正是我們試圖發(fā)現(xiàn)的。我們試圖在某種程度上循環(huán)分析數(shù)學(xué)的歷史,試圖理解是什么引導(dǎo)我們走向這些高度可壓縮的形式推理領(lǐng)域,也許澄清這個概念,舉一些宏的例子會更好,就能看到什么是可壓縮、什么是不可壓縮的。

主持人:有沒有更為直觀的例子?

Michael Freedman:比如有一個定理:任何整數(shù)都可以表示為四個平方數(shù)之和(拉格朗日定理)。

這意味著,如果你將「平方數(shù)」當作宏,那使用這種增長極快的宏,每個整數(shù)只需要四步就可以表示。

聽起來很瘋狂,但解釋是表達這些平方數(shù)本身需要很多比特,所以這并不違背信息論。它只是,說明如果有更稠密的宏集,就可以用更少的步驟表達更多內(nèi)容,即宏的「密度」決定表達效率,而「10 的冪次方」正好處于平衡點,在宏的簡潔性(不要太大)和表達能力(能夠大量擴展)之間找到了一個最佳平衡點。

我們在論文中有一個結(jié)論是:多項式增長的幺半群容易壓縮,而指數(shù)增長的幺半群難以壓縮。

而根據(jù)經(jīng)驗和數(shù)值研究,我們發(fā)現(xiàn)數(shù)學(xué)具有高度可壓縮性。如果它能被一個幺半群很好地表示,那么它必須是一個多項式增長的幺半群,才能展現(xiàn)出我們面前看到的這種壓縮。

因此可以推測:數(shù)學(xué)的結(jié)構(gòu)本質(zhì)上是多項式的。

主持人:論文中還提到,建議使用類似 PageRank 算法來識別數(shù)學(xué)中高中心性的節(jié)點和核心定義,即那些支撐整個結(jié)構(gòu)發(fā)揮最大作用的節(jié)點。那我們?nèi)绾卧谶@些龐大的證明網(wǎng)絡(luò)中識別、找到它們?如果能識別出,是否定義了一種數(shù)學(xué)家與 AI 協(xié)作的新模式?

Michael Freedman:這是個好問題。PageRank 基本上是一種尋找馬爾可夫鏈平衡的算法。

換句話說,它是尋找某個微分方程的吸引不動點,你有許多互相交流的節(jié)點,想通過觀察誰調(diào)用了誰來確定誰最重要。這是一種分配重要性的自然想法,但它需要對結(jié)構(gòu)和互連有全局性的了解 。

但論文中我們提出了更簡單的指標,因為數(shù)學(xué)依賴抽象,有一些比例我們分別稱為「還原壓縮」(Reductive compression)和「演繹壓縮」(Deductive compression)。

「還原壓縮」是「展開長度」與「壓縮長度」的比值,如果一個陳述處于極高的抽象水平,展開后會變得巨大,那么這個比值就會非常大。這不僅是自動智能體可以使用的局部指標,還可以用來判斷是在提升還是降低抽象層級。

「演繹壓縮」則是觀察證明長度與命題長度的比值,這個比例告訴我們有多少數(shù)學(xué)工作被壓縮進了那個命題中。比如費馬大定理,可以用一句話描述,但證明需要數(shù)百頁。這個比例證明了現(xiàn)象級的力量:該命題具有極高的「壓縮密度」。

AI 可以在探索證明路徑時追蹤這些指標,以此感知它正在穿越的「景觀」。

主持人:其實從整體來看,這篇論文在研究數(shù)學(xué)智能的本質(zhì)時提出了一個非常大膽的宣言,且似乎與 LLM 發(fā)展有關(guān),當初為什么選擇這個特定方向?想傳達的核心是什么?

Michael Freedman:我們論文標題「Compression is all you need」(「壓縮,就是你所需要的全部」)本身就是一個強觀點。大膽的措辭陳述觀點是好事,這樣人們可以反駁它,從而引發(fā)更好的討論。

而至于我個人為什么選擇這個研究方向?

從宏觀上來看,我認為我們正處于一個非常特殊的歷史節(jié)點。從文藝復(fù)興到科學(xué)革命、工業(yè)革命,再到高科技革命和現(xiàn)在的 AI,歷史似乎真的在奔向「奇點」時刻,世界即將發(fā)生巨變。你可以說「外星人已經(jīng)抵達了」,只是它們是我們制造出來的。而我,更想作為參與者而非觀察者進入這個時代。

更具體來說,我們正在學(xué)習(xí),尋找能夠引導(dǎo)發(fā)現(xiàn)「有趣數(shù)學(xué)」(即人類數(shù)學(xué))的簡單組織原則將是富有成效的。我們已經(jīng)看到,這種可壓縮性在數(shù)學(xué)中有著非常不同的形式。

論文中提到的可壓縮性是「局部」的:你將一組符號壓縮成新符號(如 10 的冪次方)。但像柯爾莫哥洛夫(Kolmogorov)這樣的人通過算法研究了更一般類型的可壓縮性,即「全局」壓縮。

所以,數(shù)學(xué)家使用局部壓縮,而全局壓縮是不可計算的。但可能存在某種中間地帶,通過仔細研究壓縮,我們和智能體也許能探索超越局部壓縮的新思維模式。這是一個模糊的想法,但我想呈現(xiàn)給大家。

所以,我認為我們和 AI 在某種意義上是「同一條船上的人」。它們也無法通過暴力計算探索全部空間,必須像我們一樣依賴「直覺」。而未來的關(guān)鍵是:我們?nèi)绾闻c AI 一起,發(fā)展新的數(shù)學(xué)直覺。

這篇論文,其實是在嘗試畫出一張「數(shù)學(xué)的地形圖」,幫助我們理解這個空間。

https://arxiv.org/abs/2603.20396

https://x.com/SAIRfoundation/status/2036916216913330552

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
19歲女孩挪用自家1700萬當“榜一大姐” 親爹帶女兒自首:坐牢才有可能追回錢款

19歲女孩挪用自家1700萬當“榜一大姐” 親爹帶女兒自首:坐牢才有可能追回錢款

封面新聞
2026-04-20 17:48:14
越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

混沌錄
2026-04-19 17:27:06
日本央行調(diào)查:83.7%的日本家庭預(yù)計一年后價格將上漲

日本央行調(diào)查:83.7%的日本家庭預(yù)計一年后價格將上漲

財聯(lián)社
2026-04-20 12:33:05
彭總在哈軍工用餐時,一學(xué)員同坐,責(zé)問陳賡:他有什么資格坐這?

彭總在哈軍工用餐時,一學(xué)員同坐,責(zé)問陳賡:他有什么資格坐這?

小莜讀史
2026-04-20 15:17:58
睡一覺5萬沒了!全國多地爆發(fā)新型盜刷,睡前必查手機這4處

睡一覺5萬沒了!全國多地爆發(fā)新型盜刷,睡前必查手機這4處

洞見小能手
2026-04-20 16:03:26
海外版“砍一刀”被美國消費者瘋狂吐槽:這質(zhì)量就是中國制造?

海外版“砍一刀”被美國消費者瘋狂吐槽:這質(zhì)量就是中國制造?

可達鴨面面觀
2026-04-20 16:18:29
強闖臺海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門口

強闖臺海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門口

基斯默默
2026-04-20 15:41:02
罰15億!拼多多一員工故意關(guān)門,對抗調(diào)查,導(dǎo)致執(zhí)法人員手指骨折

罰15億!拼多多一員工故意關(guān)門,對抗調(diào)查,導(dǎo)致執(zhí)法人員手指骨折

魔都姐姐雜談
2026-04-19 08:03:27
日本一觀光直升機墜入火山口,2名中國臺灣游客與1名日本機長失蹤已3月,日媒稱生還可能性極低,擬動用無人機重機具進入火口作業(yè)

日本一觀光直升機墜入火山口,2名中國臺灣游客與1名日本機長失蹤已3月,日媒稱生還可能性極低,擬動用無人機重機具進入火口作業(yè)

大風(fēng)新聞
2026-04-20 15:11:31
網(wǎng)友喊話請何潤東代言霸王茶姬,有人都把圖P好了,客服:建議已詳細登記;何潤東翻紅后,賬號漲粉近200萬

網(wǎng)友喊話請何潤東代言霸王茶姬,有人都把圖P好了,客服:建議已詳細登記;何潤東翻紅后,賬號漲粉近200萬

魯中晨報
2026-04-20 14:48:15
深圳女子花7299元從國美電器買格力空調(diào) 用1年就異響,一看銘牌發(fā)現(xiàn)是“僵尸機” 交涉30多次才解決

深圳女子花7299元從國美電器買格力空調(diào) 用1年就異響,一看銘牌發(fā)現(xiàn)是“僵尸機” 交涉30多次才解決

信網(wǎng)
2026-04-20 09:14:12
明晚成品油價或迎下調(diào)

明晚成品油價或迎下調(diào)

中國能源網(wǎng)
2026-04-20 15:23:09
孫宏斌現(xiàn)狀:公司負債大幅減少,63歲愁白了頭,兒子成了他的驕傲

孫宏斌現(xiàn)狀:公司負債大幅減少,63歲愁白了頭,兒子成了他的驕傲

洲洲影視娛評
2026-04-20 15:16:52
斯諾克世錦賽:丁俊暉被罰11分!領(lǐng)先優(yōu)勢縮水,世界冠軍開門黑!

斯諾克世錦賽:丁俊暉被罰11分!領(lǐng)先優(yōu)勢縮水,世界冠軍開門黑!

劉姚堯的文字城堡
2026-04-20 17:39:38
長沙火了!全球最大零食店開業(yè)3天就被擠停售,背后真相曝光

長沙火了!全球最大零食店開業(yè)3天就被擠停售,背后真相曝光

西昆侖Bruce
2026-04-19 19:52:58
小學(xué)生拒絕借車遭毆打搜家,一名施暴者及家長上門道歉,教育局稱校園欺凌專干介入,警方:“入室搶劫案”仍在調(diào)查

小學(xué)生拒絕借車遭毆打搜家,一名施暴者及家長上門道歉,教育局稱校園欺凌專干介入,警方:“入室搶劫案”仍在調(diào)查

極目新聞
2026-04-20 16:20:59
當女教練走進德甲更衣室:一場被鏡頭圍觀的實驗

當女教練走進德甲更衣室:一場被鏡頭圍觀的實驗

賽場名場面
2026-04-19 17:32:02
7.5級地震, 海嘯抵達日本! 日媒提醒: 立即逃生

7.5級地震, 海嘯抵達日本! 日媒提醒: 立即逃生

每日經(jīng)濟新聞
2026-04-20 17:47:38
海嘯抵達日本!日媒:請回想2011年大地震,立即逃生!

海嘯抵達日本!日媒:請回想2011年大地震,立即逃生!

揚子晚報
2026-04-20 16:37:00
太扎心了!上海男子年薪百萬失業(yè)引不滿,新婚3個月女子就想離婚

太扎心了!上海男子年薪百萬失業(yè)引不滿,新婚3個月女子就想離婚

火山詩話
2026-04-20 06:12:18
2026-04-20 20:24:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12811文章數(shù) 142632關(guān)注度
往期回顧 全部

科技要聞

華為Pura90逆周期定價,4699元起,未漲價

頭條要聞

小學(xué)生遭多名中小學(xué)生施暴搜家 家長以"入室搶劫"報案

頭條要聞

小學(xué)生遭多名中小學(xué)生施暴搜家 家長以"入室搶劫"報案

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜,被關(guān)曉彤撕下體面

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

教育
家居
數(shù)碼
時尚
健康

教育要聞

同一個詞,AI怎么知道它是什么意思?

家居要聞

自然慢調(diào) 慢享時光

數(shù)碼要聞

華為新內(nèi)存技術(shù)來了,Mate X7用戶6月有福

今年最流行的衣服竟然是它?高級又氣質(zhì)!

干細胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進入關(guān)懷版