網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

陶哲軒訪談：數(shù)學(xué)界正在經(jīng)歷哥白尼革命，人類智能不再是宇宙中心

2026-03-22 14:00:05　來源: DeepTech深科技

北京舉報(bào)

分享至

過去半年，AI 在數(shù)學(xué)領(lǐng)域的進(jìn)展令人目不暇接。2025 年 10 月，OpenAI 聲稱 GPT-5 解決了多道 Erd?s 難題，隨后被證實(shí)其中大部分只是文獻(xiàn)檢索，找到了數(shù)據(jù)庫(kù)維護(hù)者尚未收錄的已發(fā)表論文。

但到了 2026 年 1 月，情況發(fā)生了實(shí)質(zhì)變化：GPT-5.2 Pro 在一周內(nèi)攻克了三道 Erd?s 難題（#397、#728、#729），生成的證明經(jīng) Lean 形式化驗(yàn)證后被陶哲軒本人接受，且這些證明在已有文獻(xiàn)中找不到先例。

據(jù)《科學(xué)美國(guó)人》2026 年 2 月的報(bào)道，AI 工具迄今已幫助將約 100 道 Erd?s 問題轉(zhuǎn)入“已解決”狀態(tài)。與此同時(shí)，多位頂尖數(shù)學(xué)家開始向 AI 實(shí)驗(yàn)室靠攏：哥倫比亞大學(xué)的 Mehtaab Sawhney 休學(xué)加入了 OpenAI，另一位研究者 Pagano 也入職了 Google DeepMind。

就在這個(gè)節(jié)點(diǎn)上，3 月 20 日，菲爾茲獎(jiǎng)得主陶哲軒做客 Dwarkesh Podcast，從開普勒發(fā)現(xiàn)行星運(yùn)動(dòng)定律的故事講起，深入談?wù)摿?AI 正在如何改變數(shù)學(xué)與科學(xué)研究的方式。他在 2023 年曾預(yù)測(cè)到 2026 年 AI 將成為數(shù)學(xué)研究中“值得信賴的合著者”，如今他對(duì)這個(gè)預(yù)測(cè)表示滿意。但他也坦言，AI 讓他的論文更豐富了，核心突破仍然要靠紙筆完成。

（來源：YouTube）

對(duì)話核心要點(diǎn)如下：

? 陶哲軒 2023 年預(yù)測(cè)“到 2026 年 AI 將成為數(shù)學(xué)研究中值得信賴的合著者”，他認(rèn)為這個(gè)預(yù)測(cè)基本兌現(xiàn)；

? AI 工具已幫助解決約 50 道 Erd?s 難題（據(jù)《科學(xué)美國(guó)人》報(bào)道已接近 100 道），但純 AI 一擊命中的解題已經(jīng)停滯，剩余問題的成功率約為 1%–2%；

? AI 將想法生成的成本降到了接近于零，但驗(yàn)證和評(píng)估成為了新的瓶頸，科學(xué)界的同行評(píng)審體系正在被 AI 生成的投稿淹沒；

? 陶哲軒的論文現(xiàn)在包含更多代碼和圖表，如果沒有 AI 工具，寫出同類論文要花五倍時(shí)間；但數(shù)學(xué)問題中最核心的突破部分仍然依賴紙筆；

? AI 擅長(zhǎng)廣度，人類擅長(zhǎng)深度，二者高度互補(bǔ)；陶哲軒認(rèn)為人機(jī)混合將在數(shù)學(xué)領(lǐng)域占據(jù)主導(dǎo)地位更長(zhǎng)時(shí)間；

? 他認(rèn)為數(shù)學(xué)需要一種描述“策略”而非僅僅“證明”的半形式化語(yǔ)言，但目前還不知道這種語(yǔ)言該是什么樣的；

? 對(duì)年輕人的建議：心態(tài)要足夠靈活，傳統(tǒng)教育仍然重要，但要對(duì)全新的參與科學(xué)的方式保持開放。

以下是這場(chǎng)對(duì)話的編譯全文。

Patel：我想先請(qǐng)你講講開普勒發(fā)現(xiàn)行星運(yùn)動(dòng)定律的故事，因?yàn)槲矣X得這會(huì)是一個(gè)很好的跳板，讓我們從這里開始聊 AI 與數(shù)學(xué)。

陶哲軒：好的。我一直對(duì)天文學(xué)有業(yè)余的興趣，也很喜歡早期天文學(xué)家如何推算出宇宙本質(zhì)的故事。開普勒是在哥白尼的工作基礎(chǔ)上進(jìn)行研究的，而哥白尼本人又繼承了阿里斯塔克斯（Aristarchus）的思路。哥白尼最著名的貢獻(xiàn)是提出了日心說模型：不是行星和太陽(yáng)圍繞地球轉(zhuǎn)，而是太陽(yáng)位于太陽(yáng)系中心，其他行星圍繞太陽(yáng)運(yùn)行。哥白尼認(rèn)為行星的軌道是完美的圓形，他的理論在一定程度上與希臘人、阿拉伯人和印度人數(shù)百年來積累的觀測(cè)數(shù)據(jù)吻合。

我覺得開普勒應(yīng)該是在求學(xué)過程中接觸到了這些理論，然后他注意到，哥白尼所預(yù)測(cè)的各行星軌道的大小比例似乎蘊(yùn)含著某種幾何意義。他開始提出這樣一種想法：比如你取地球的軌道，把它嵌入一個(gè)立方體中，那么包圍這個(gè)立方體的外接球幾乎完美地吻合火星的軌道，依此類推。

當(dāng)時(shí)已知有六顆行星，行星之間有五個(gè)間隔，而恰好有五種正則柏拉圖立體：立方體、正四面體、正八面體、正十二面體和正二十面體。所以他提出了一個(gè)他認(rèn)為極其美妙的理論，認(rèn)為可以在各行星的球面之間嵌入這些柏拉圖立體。數(shù)據(jù)看上去確實(shí)吻合。對(duì)他來說，這意味著上帝設(shè)計(jì)行星的方式恰恰對(duì)應(yīng)了柏拉圖立體的數(shù)學(xué)完美性。

為了驗(yàn)證這個(gè)理論，他需要數(shù)據(jù)。當(dāng)時(shí)幾乎只存在一套真正高質(zhì)量的數(shù)據(jù)集，來自第谷·布拉赫（Tycho Brahe）。這位丹麥天文學(xué)家非常富有而又性情古怪，他說服了丹麥政府資助一座極其昂貴的天文臺(tái)，實(shí)際上是一整座島。他在那里持續(xù)了幾十年，每天晚上（至少是天氣晴朗的每個(gè)晚上）用肉眼觀測(cè)所有行星的位置。他是最后一批純?nèi)庋厶煳膶W(xué)家。他擁有的數(shù)據(jù)正是開普勒驗(yàn)證理論所需要的。

圖丨開普勒與布拉赫雕塑（來源：WikiPedia）

開普勒開始與布拉赫合作，但布拉赫對(duì)自己的數(shù)據(jù)非常吝嗇，每次只給一點(diǎn)點(diǎn)。據(jù)說開普勒最終偷了數(shù)據(jù)，偷偷抄了一份，還跟布拉赫的后人鬧了一場(chǎng)。但他確實(shí)拿到了數(shù)據(jù)，然后他發(fā)現(xiàn)，令他頗為失望的是，那個(gè)美妙的理論并不完全成立。數(shù)據(jù)與柏拉圖立體理論大約偏差了 10%。

他想了各種辦法來調(diào)整，挪動(dòng)圓的位置之類的，但就是不太對(duì)。他在這個(gè)問題上鉆研了很多年，最終找到了一種方法，利用數(shù)據(jù)推算出行星的實(shí)際軌道。那是一項(xiàng)了不起的數(shù)據(jù)分析工作。最終他發(fā)現(xiàn)行星軌道其實(shí)是橢圓而非圓形，這讓他很震撼。

他推導(dǎo)出了行星運(yùn)動(dòng)的前兩條定律：橢圓軌道，以及等面積等時(shí)間定律（即行星與太陽(yáng)的連線在相等時(shí)間內(nèi)掃過相等的面積）。然后又過了十年，在積累了更多數(shù)據(jù)之后（最遠(yuǎn)的行星如土星和木星是他最難搞定的），他最終推導(dǎo)出第三定律：行星完成一個(gè)軌道周期所需的時(shí)間，與它到太陽(yáng)距離的某個(gè)冪次成正比。這就是著名的三大運(yùn)動(dòng)定律。對(duì)開普勒而言，這些完全是由實(shí)驗(yàn)數(shù)據(jù)驅(qū)動(dòng)的。要到一個(gè)世紀(jì)后，牛頓才給出了一個(gè)統(tǒng)一的理論來解釋這三條定律。

Patel：我想提出一個(gè)看法，來看你怎么評(píng)價(jià)：開普勒就像一個(gè)“高溫度”的大語(yǔ)言模型（high temperature LLM）。牛頓后來解釋了行星運(yùn)動(dòng)三定律為何必然成立。開普勒推算出各行星相對(duì)軌道的方式，正如你所說，確實(shí)是天才之舉。但縱觀他的整個(gè)學(xué)術(shù)生涯，他一直在嘗試各種隨機(jī)的聯(lián)系。

事實(shí)上，在他寫下第三定律的那本書《世界的和聲》里，第三定律幾乎是一筆帶過。那本書的主題是關(guān)于不同行星擁有不同的和聲，地球上之所以充滿饑荒和苦難，是因?yàn)榈厍虻囊舴恰癿i”和“fa”。所以大量的內(nèi)容是隨機(jī)的占星學(xué)，但其中夾著立方平方定律（cube-square law），告訴你行星周期與到太陽(yáng)距離之間的關(guān)系。如果把這條定律加上牛頓的 F=ma 和向心加速度公式，就能推導(dǎo)出引力的平方反比定律。牛頓就是這樣推導(dǎo)出來的。

我覺得這個(gè)故事之所以有趣，是因?yàn)槲腋杏X大語(yǔ)言模型可以做開普勒那種事情：花 20 年嘗試各種隨機(jī)聯(lián)系，其中有些完全沒道理，只要有一個(gè)可驗(yàn)證的數(shù)據(jù)庫(kù)（就像布拉赫的數(shù)據(jù)集），那就行。我要試試關(guān)于音符的隨機(jī)想法，試試關(guān)于柏拉圖立體的隨機(jī)想法，試試各種不同的幾何。我有一個(gè)偏見，覺得這些軌道的幾何關(guān)系中一定有什么重要的東西。然后其中有一個(gè)想法成功了。只要你能驗(yàn)證它，這些經(jīng)驗(yàn)規(guī)律就可以推動(dòng)真正深層的科學(xué)進(jìn)步。

陶哲軒：傳統(tǒng)上，當(dāng)我們談?wù)摽茖W(xué)史的時(shí)候，“想法的生成”一直是科學(xué)中最有聲望的環(huán)節(jié)。一個(gè)科學(xué)問題涉及很多步驟：你必須先識(shí)別一個(gè)問題，然后判斷它是不是一個(gè)好問題。然后你需要收集數(shù)據(jù)，想出分析數(shù)據(jù)的策略，提出假說。到了這一步，你需要提出一個(gè)好的假說，然后驗(yàn)證它，然后還要寫出來、解釋清楚，涉及十幾個(gè)不同的環(huán)節(jié)。但我們慶祝的確實(shí)是那些靈光乍現(xiàn)的“尤里卡”時(shí)刻，也就是想法的生成。

開普勒當(dāng)然必須像你說的那樣，循環(huán)嘗試很多想法，其中好幾個(gè)不管用。我敢打賭還有很多他根本沒發(fā)表的，因?yàn)閿?shù)據(jù)就是對(duì)不上。這是過程中很重要的一部分：嘗試各種隨機(jī)的東西，看看哪個(gè)行得通。但正如你所說，這必須配合同等規(guī)模的驗(yàn)證工作，否則就太慢了。

我的意思是，我們紀(jì)念開普勒，但也應(yīng)該同樣紀(jì)念布拉赫。他那種一絲不茍的數(shù)據(jù)收集比之前的任何觀測(cè)精確了十倍。而那個(gè)額外的小數(shù)點(diǎn)的精度對(duì)開普勒得出他的結(jié)論至關(guān)重要。他當(dāng)時(shí)使用的是歐幾里得幾何，以及他所能掌握的最先進(jìn)數(shù)學(xué)來擬合數(shù)據(jù)模型。所以各個(gè)方面都必須到位：數(shù)據(jù)、理論、以及假說的生成。

我不確定如今假說生成還是不是瓶頸了。從那以來科學(xué)發(fā)生了很多變化。經(jīng)典上，科學(xué)有兩大范式：理論和實(shí)驗(yàn)。20 世紀(jì)又加入了數(shù)值模擬，你可以通過計(jì)算機(jī)模擬來檢驗(yàn)理論。

再往后，到了 20 世紀(jì)末，我們進(jìn)入了大數(shù)據(jù)時(shí)代，數(shù)據(jù)分析成了新的驅(qū)動(dòng)力�，F(xiàn)在很多新進(jìn)展實(shí)際上是通過分析海量數(shù)據(jù)集驅(qū)動(dòng)的：先收集大量數(shù)據(jù)，然后從中發(fā)現(xiàn)規(guī)律來推導(dǎo)想法。這和科學(xué)過去的運(yùn)作方式有些不同。過去是你先做幾次觀測(cè)，或者憑空冒出一個(gè)想法，然后收集數(shù)據(jù)來檢驗(yàn)它。這是經(jīng)典的科學(xué)方法。

現(xiàn)在幾乎是反過來的：你先收集大數(shù)據(jù)，然后試圖從中提取假說。開普勒也許是最早的數(shù)據(jù)科學(xué)家之一，但即便是他，也不是從布拉赫的數(shù)據(jù)集出發(fā)再去分析的，他先有了預(yù)設(shè)的理論。不過現(xiàn)在這種做法似乎越來越少了，因?yàn)閿?shù)據(jù)量實(shí)在太大，實(shí)在太有用了。

Patel：有意思。我倒覺得你描述的這種“20 世紀(jì)的科學(xué)范式”實(shí)際上很好地描述了開普勒的經(jīng)歷。他確實(shí)有一些先入為主的想法（1595 至 1596 年間他提出了正多邊形和柏拉圖立體的理論），但那些是錯(cuò)的。幾年后他拿到了布拉赫的數(shù)據(jù)，又經(jīng)過 20 年不斷嘗試各種隨機(jī)想法，才得出了那些經(jīng)驗(yàn)規(guī)律。

所以實(shí)際過程更接近于：布拉赫的數(shù)據(jù)就像某種海量模擬數(shù)據(jù)庫(kù)，有了數(shù)據(jù)之后你可以不斷嘗試。如果沒有這些數(shù)據(jù)，開普勒就只能在那兒不停寫關(guān)于和聲與柏拉圖立體的書，沒有什么東西可以用來驗(yàn)證。

陶哲軒：對(duì)，數(shù)據(jù)確實(shí)極其重要。但我想做的區(qū)分是，傳統(tǒng)上是先提出假說、再用數(shù)據(jù)檢驗(yàn)。但現(xiàn)在有了機(jī)器學(xué)習(xí)、數(shù)據(jù)分析和統(tǒng)計(jì)學(xué)，你可以從數(shù)據(jù)出發(fā)，直接用統(tǒng)計(jì)方法推導(dǎo)出規(guī)律。

開普勒的第三定律就有點(diǎn)像這樣，只不過對(duì)第三定律來說，他的數(shù)據(jù)點(diǎn)只有 6 個(gè)，不是上千個(gè)。每顆行星你知道軌道周期和到太陽(yáng)的距離，一共 5 到 6 個(gè)數(shù)據(jù)點(diǎn)。他做了我們今天所說的“回歸分析”，擬合了一條曲線，發(fā)現(xiàn)了三次方 - 平方的關(guān)系，這令人驚嘆。但其實(shí)他挺幸運(yùn)的。僅憑 6 個(gè)數(shù)據(jù)點(diǎn)就能得出正確結(jié)論，這其實(shí)不夠可靠。

后來有一位天文學(xué)家約翰·波德（Johann Bode），拿著同樣的行星距離數(shù)據(jù)，受開普勒啟發(fā)，他預(yù)測(cè)行星的距離構(gòu)成一個(gè)平移的等比數(shù)列。他也做了曲線擬合，但其中缺了一個(gè)點(diǎn)，火星和木星之間有一個(gè)很大的空隙。他的定律預(yù)測(cè)那里有一顆缺失的行星。這看起來像是個(gè)不靠譜的理論，但后來赫歇爾發(fā)現(xiàn)了天王星，天王星到太陽(yáng)的距離恰好完美吻合這個(gè)規(guī)律。再后來谷神星（Ceres）在小行星帶被發(fā)現(xiàn)，也吻合這個(gè)規(guī)律。人們非常興奮，覺得波德發(fā)現(xiàn)了一條驚人的自然法則。

圖丨約翰·波德（來源：WikiPedia）

但再后來海王星被發(fā)現(xiàn)了，它的距離與預(yù)測(cè)完全不符�；旧夏蔷褪莻€(gè)數(shù)字巧合，因?yàn)橹挥?6 個(gè)數(shù)據(jù)點(diǎn)嘛。也許開普勒之所以沒有像突出前兩條定律那樣突出第三定律，是因?yàn)榧幢闼麤]有現(xiàn)代統(tǒng)計(jì)學(xué)知識(shí)，他也憑直覺知道 6 個(gè)數(shù)據(jù)點(diǎn)得出的結(jié)論應(yīng)該持保留態(tài)度。

Patel：我來更明確地問一下這個(gè)類比吧。未來我們會(huì)有越來越聰明的 AI，數(shù)以百萬(wàn)計(jì)，它們可以到處去尋找各種經(jīng)驗(yàn)規(guī)律。聽起來你似乎認(rèn)為，科學(xué)的瓶頸不在于為每個(gè)領(lǐng)域找到更多類似“行星運(yùn)動(dòng)第三定律”這樣的東西，然后后人可以說“哦，我們需要一種方式來解釋這個(gè)，讓我們來推導(dǎo)一下數(shù)學(xué)，這就是引力的平方反比定律”？

陶哲軒：我覺得 AI 基本上已經(jīng)把想法生成的成本降到了接近于零，就像互聯(lián)網(wǎng)把通信成本降到了接近于零一樣�！斑@了不起，但光靠它還不會(huì)自動(dòng)帶來豐�！，F(xiàn)在瓶頸變了。

我們現(xiàn)在的處境是：突然之間人們可以針對(duì)一個(gè)科學(xué)問題生成成千上萬(wàn)的理論，然后我們必須去驗(yàn)證它們、評(píng)估它們。為此我們必須改變科學(xué)的組織結(jié)構(gòu)。以往，我們建造了各種“圍墻”。在 AI 生成的垃圾內(nèi)容（AI slop）出現(xiàn)之前，業(yè)余科學(xué)家們也會(huì)提出自己的宇宙理論，其中絕大多數(shù)沒什么價(jià)值，所以我們建立了同行評(píng)審和出版體系來過濾，試圖篩選出高信號(hào)的想法去檢驗(yàn)。

但現(xiàn)在我們可以大規(guī)模地生成這些可能的解釋，其中有些是好的，很多是糟糕的。人類審稿人已經(jīng)招架不住了。很多期刊報(bào)告說 AI 生成的投稿正在大量涌入。所以 AI 能生成各種東西，這很好，但這意味著科學(xué)的其他環(huán)節(jié)必須跟上來：驗(yàn)證、確認(rèn)、評(píng)估哪些想法真正推動(dòng)了學(xué)科進(jìn)步、哪些是死胡同或障眼法。這些事情我們還不知道怎么大規(guī)模地做。對(duì)于每篇單獨(dú)的論文，我們可以在科學(xué)家之間討論，經(jīng)過幾年達(dá)成共識(shí)。但當(dāng)我們每天生產(chǎn)成千上萬(wàn)篇的時(shí)候，這種方式就行不通了。

Patel：確實(shí)有一個(gè)極其有趣的問題：如果你有數(shù)十億個(gè) AI 科學(xué)家，不僅要判斷哪些是真正的進(jìn)步，還要判斷其中哪個(gè)發(fā)現(xiàn)可能像“比特”的發(fā)明那樣，具有跨領(lǐng)域的普遍意義。

人類科學(xué)界其實(shí)也面對(duì)過這個(gè)問題，而且我們某種程度上解決了。我其實(shí)不太確定我們是怎么解決的。比如在 1940 年代，你在貝爾實(shí)驗(yàn)室或者什么地方，有這些新技術(shù)涌現(xiàn)：脈沖編碼調(diào)制，基本上是如何傳輸信號(hào)、如何將信號(hào)數(shù)字化、如何在模擬線路上傳輸。

關(guān)于工程約束和細(xì)節(jié)有大量論文。然后其中有一篇提出了“比特”的概念，它對(duì)許多不同領(lǐng)域都有影響。你需要某種系統(tǒng)能夠看到它并說：好，我們要把這個(gè)應(yīng)用到概率論，要把這個(gè)應(yīng)用到計(jì)算機(jī)科學(xué)，等等。

未來，如果 AI 提出了某種下一代的統(tǒng)一概念，你怎么在上百萬(wàn)篇論文中識(shí)別出它？那些論文可能確實(shí)都構(gòu)成了進(jìn)步，但它們的思想遠(yuǎn)沒有那么普遍和統(tǒng)一。

陶哲軒：很多時(shí)候需要時(shí)間的檢驗(yàn)。許多偉大的想法在最初提出時(shí)并沒有得到很好的反響，只是在后來其他科學(xué)家發(fā)現(xiàn)可以把它們拿來進(jìn)一步發(fā)展、應(yīng)用到自己的領(lǐng)域時(shí)才被認(rèn)可。深度學(xué)習(xí)本身在很長(zhǎng)一段時(shí)間里都是 AI 中一個(gè)小眾方向。完全通過數(shù)據(jù)訓(xùn)練而不是第一性原理推理來得到答案，這在當(dāng)時(shí)非常有爭(zhēng)議，花了很長(zhǎng)時(shí)間才真正開花結(jié)果。

你提到了比特。實(shí)際上計(jì)算機(jī)架構(gòu)有過其他方案，不一定非得是 0 和 1。曾經(jīng)有人提出過三值邏輯（ternary logic），即 0、1、2。在另一個(gè)平行宇宙里，也許另一種范式會(huì)勝出。Transformer 是所有現(xiàn)代大語(yǔ)言模型的基礎(chǔ)，是第一個(gè)真正足夠復(fù)雜到能夠捕捉語(yǔ)言的深度學(xué)習(xí)架構(gòu)，但事情不一定必須如此�？赡苡衅渌軜�(gòu)先做到了同樣的事情，一旦被采用就成了標(biāo)準(zhǔn)。所以，評(píng)估一個(gè)給定的想法是否會(huì)有成果之所以困難，是因?yàn)樗Q于未來，也取決于文化和社會(huì)——哪些想法被采納了，哪些沒有。

十進(jìn)制數(shù)系在數(shù)學(xué)中極其有用，比羅馬數(shù)字系統(tǒng)好得多。但 10 這個(gè)底數(shù)本身沒什么特別的。它對(duì)我們有用，是因?yàn)槠渌腥硕荚谟盟覀円呀?jīng)圍繞它標(biāo)準(zhǔn)化了，我們的計(jì)算機(jī)和數(shù)字表示系統(tǒng)都是圍繞它構(gòu)建的。所以我們被它綁定了。偶爾有人推廣十進(jìn)制以外的系統(tǒng)，但慣性太大了。你不能把任何科學(xué)成就完全孤立地拿出來給它一個(gè)客觀分?jǐn)?shù)，而不考慮它過去和未來的語(yǔ)境。所以這可能永遠(yuǎn)不是你能像解決更局部的問題那樣用強(qiáng)化學(xué)習(xí)來搞定的事情。

Patel：對(duì)，科學(xué)史上似乎經(jīng)常出現(xiàn)這種情況：一個(gè)后來被證明是正確的新理論在提出時(shí)會(huì)產(chǎn)生一些推論，這些推論要么說不通（后來我們才明白為什么說不通），要么是正確的但在當(dāng)時(shí)看來荒謬至極。

你提過阿里斯塔克斯在公元前三世紀(jì)就有了日心說，但古雅典人說這不可能，因?yàn)槿绻厍驀@太陽(yáng)轉(zhuǎn)，我們應(yīng)該能看到恒星的相對(duì)位置變化。唯一的解釋是恒星太遠(yuǎn)了，遠(yuǎn)到你觀察不到任何視差。這其實(shí)是正確的推論。

但有時(shí)候推論確實(shí)不正確，我們需要進(jìn)入更高層次的理解才行。比如萊布尼茨批評(píng)牛頓的引力理論，理由是它意味著“超距作用”（action at a distance），我們不知道其中的機(jī)制。牛頓自己也對(duì)慣性質(zhì)量和引力質(zhì)量恰好是同一個(gè)量感到震驚。這些問題都是愛因斯坦解決的，但它仍然是進(jìn)步。如果 AI 做同行評(píng)審，它的問題就在于：即便你能證偽一個(gè)理論，你怎么識(shí)別出它相對(duì)于之前的理論仍然構(gòu)成了進(jìn)步？

陶哲軒：事實(shí)上，最終正確的理論在早期往往在很多方面看起來更差。哥白尼的行星理論就不如托勒密的理論精確。地心說到那時(shí)已經(jīng)發(fā)展了一千多年，有了非常多的調(diào)整和越來越復(fù)雜的臨時(shí)修正來使其越來越精確。哥白尼的理論簡(jiǎn)潔得多，但精確度低得多。一直到開普勒才使它比托勒密的理論更精確。

科學(xué)總是在不斷推進(jìn)的。當(dāng)你只得到了部分解答時(shí)，它看起來可能不如一個(gè)雖然錯(cuò)誤但已經(jīng)被完善到足以回答所有問題的理論。牛頓的理論有很大的謎團(tuán)（質(zhì)量等價(jià)和超距作用）這些直到幾個(gè)世紀(jì)后，通過一種概念上完全不同的方法才被解決。進(jìn)步的實(shí)現(xiàn)往往不是通過增加更多理論，而是通過刪除你頭腦中的某些假設(shè)。

地心說之所以能堅(jiān)持那么久，一個(gè)原因是我們有一種觀念，認(rèn)為物體天然趨向于靜止。這是亞里士多德的物理學(xué)概念。所以地球在運(yùn)動(dòng)這個(gè)想法……我們?cè)趺礇]有全都摔倒？一旦你有了慣性運(yùn)動(dòng)的概念那就說得通了。但在概念上，認(rèn)識(shí)到地球在運(yùn)動(dòng)是一個(gè)非常大的飛躍。你感覺不到它在動(dòng)。最大的進(jìn)步往往就是這類事情。

達(dá)爾文的進(jìn)化論也是如此。物種不是靜態(tài)的，但這并不顯而易見，因?yàn)槟阍谝簧畠?nèi)看不到進(jìn)化（當(dāng)然，現(xiàn)在我們實(shí)際上可以看到了）。

我們目前正在經(jīng)歷一場(chǎng)認(rèn)知版的哥白尼革命。我們過去認(rèn)為人類智能是宇宙的中心，現(xiàn)在我們看到外面存在著非常不同類型的智能，有著非常不同的優(yōu)勢(shì)和劣勢(shì)。我們對(duì)于“哪些任務(wù)需要智能、哪些不需要”的判斷必須大幅重新排序。試圖把 AI 塞進(jìn)我們現(xiàn)有的科學(xué)進(jìn)步理論、“什么是難的什么是容易的”這些框架里，我們相當(dāng)掙扎。我們不得不問一些以前從未真正需要問的問題，或許哲學(xué)家們問過，但現(xiàn)在我們所有人都得面對(duì)了。

Patel：這引出了一個(gè)我非常好奇的話題。你提到了達(dá)爾文的進(jìn)化論。有一本書叫《發(fā)條宇宙》（The Clockwork Universe），作者 Edward Dolnick，涵蓋了我們正在聊的這個(gè)歷史時(shí)期。他有一個(gè)有趣的觀察：《物種起源》發(fā)表于 1859 年，牛頓的《自然哲學(xué)的數(shù)學(xué)原理》發(fā)表于 1687 年。所以《物種起源》比《原理》晚了將近兩個(gè)世紀(jì)。

而在概念上，達(dá)爾文的理論似乎更簡(jiǎn)單。與達(dá)爾文同時(shí)代的生物學(xué)家托馬斯·赫胥黎讀完《物種起源》后說：“怎么會(huì)這么蠢，居然沒有想到這個(gè)�！钡珡膩頉]有人這樣說過牛頓的引力理論，不會(huì)有人責(zé)怪自己沒有搶在牛頓前面。

那為什么反而用了更長(zhǎng)的時(shí)間？一個(gè)很大的原因似乎是：自然選擇的證據(jù)是累積性和回溯性的，而牛頓可以直接寫出方程，看看月球的軌道周期和距離是否吻合。如果吻合，就說明取得了進(jìn)步。

盧克萊修（譯注：提圖斯·盧克萊修·卡魯斯，Titus Lucretius Carus，是羅馬詩(shī)人和哲學(xué)家）其實(shí)在公元前一世紀(jì)就有了物種適應(yīng)環(huán)境的想法，但直到達(dá)爾文之前沒人真正討論過，因?yàn)楸R克萊修做不了實(shí)驗(yàn)，無(wú)法迫使人們關(guān)注。所以我在想，我們回頭看的時(shí)候，是否會(huì)發(fā)現(xiàn)那些有緊密數(shù)據(jù)反饋循環(huán)、容易驗(yàn)證的領(lǐng)域取得了更多進(jìn)步，盡管它們?cè)诟拍钌峡赡芾щy得多。

圖丨盧克萊修（來源：Human Heritage）

陶哲軒：科學(xué)的一個(gè)方面不只是創(chuàng)造新理論和驗(yàn)證它，還有把它傳達(dá)給別人。達(dá)爾文其實(shí)是一位出色的科學(xué)傳播者。他用英語(yǔ)寫作，用自然語(yǔ)言，說得通俗易懂。他綜合了很多分散的事實(shí)。進(jìn)化論的一些零散部分以前就被發(fā)現(xiàn)了，但他提供了一種非常有說服力的愿景。他仍然缺少一些東西，比如他不知道遺傳的機(jī)制，沒有 DNA。但他的寫作風(fēng)格很有說服力，這幫了大忙。

牛頓用拉丁文寫作，他發(fā)明了全新的數(shù)學(xué)（譯注：微積分）來解釋他的工作。他所處的時(shí)代，科學(xué)家之間更加秘密和競(jìng)爭(zhēng)。雖然學(xué)術(shù)界至今仍然充滿競(jìng)爭(zhēng)，但牛頓那個(gè)年代更甚。他隱瞞了一些最好的洞見，因?yàn)椴幌胱寣?duì)手占便宜。據(jù)我所知他本人也不太好相處。實(shí)際上是在牛頓之后幾十年，其他科學(xué)家用更簡(jiǎn)單的語(yǔ)言解釋了他的工作，他的理論才廣泛傳播。

所以說，闡釋的藝術(shù)、論證的組織、構(gòu)建敘事，這些也是科學(xué)的重要組成部分。數(shù)據(jù)當(dāng)然有幫助，但人們需要被說服，否則他們不會(huì)去推進(jìn)這個(gè)方向。他們需要做出初始投資來學(xué)習(xí)你的理論并真正去探索它。而這又是一件很難用強(qiáng)化學(xué)習(xí)來做的事情，因?yàn)槟愫茈y明確給“說服力”打分。好吧，整個(gè)營(yíng)銷行業(yè)都在試圖做這件事。所以也許 AI 目前還沒有被優(yōu)化得太有說服力是件好事。

科學(xué)也有屬于社會(huì)層面的一部分。雖然我們?yōu)榭陀^性自豪，我們有數(shù)據(jù)，有實(shí)驗(yàn)驗(yàn)證，但我們?nèi)匀恍枰v故事，說服我們的同行科學(xué)家。

這是一件柔軟的、模糊的事情。它是數(shù)據(jù)和敘事的結(jié)合。而且是關(guān)于缺口的敘事。就像達(dá)爾文，正如我說的，他的理論有一些他無(wú)法解釋的部分，但他仍然能夠論證說，未來人們會(huì)找到過渡形態(tài)，會(huì)找到遺傳的機(jī)制。后來果然如此。但我不知道怎么把這些量化到足夠精確的程度去做強(qiáng)化學(xué)習(xí)。也許這將永遠(yuǎn)是科學(xué)中屬于人類的部分。

Patel：我從閱讀和觀看你關(guān)于宇宙距離階梯的內(nèi)容中得到的一個(gè)感悟是（順便說一句，我非常、非常推薦大家去看你和 Tim Nguyen 合作的關(guān)于宇宙距離階梯的系列講座），許多領(lǐng)域中的“推演盈余”（deductive overhang）可能比人們意識(shí)到的要大得多。

如果你有了研究問題的正確切入點(diǎn)，可能會(huì)驚訝于你能從世界中學(xué)到多少。你覺得這只是天文學(xué)在你研究的那些特定歷史時(shí)期的產(chǎn)物，還是說基于目前入射到地球上的數(shù)據(jù)，我們實(shí)際上可以推斷出遠(yuǎn)比我們恰好知道的更多的東西？

陶哲軒：天文學(xué)是最早真正擁抱數(shù)據(jù)分析的科學(xué)之一，它把手頭信息中每一滴可能的信息都榨干了。因?yàn)閿?shù)據(jù)就是瓶頸（現(xiàn)在仍然是），收集天文數(shù)據(jù)真的很難。所以天文學(xué)家在從微量數(shù)據(jù)線索中提取各種結(jié)論方面幾乎是世界級(jí)的，有點(diǎn)像福爾摩斯。我聽說很多量化對(duì)沖基金更喜歡招天文學(xué)博士，因?yàn)樗麄円矊?duì)從各種數(shù)據(jù)噪聲中提取信號(hào)很感興趣。

我們確實(shí)沒有充分探索如何從各種信號(hào)中提取額外信息。隨便舉一個(gè)例子。我記得讀過一項(xiàng)研究，人們想測(cè)量科學(xué)家實(shí)際閱讀他們所引用論文的頻率。怎么測(cè)量呢？你可以試著調(diào)查不同的科學(xué)家，但他們想到了一個(gè)聰明的辦法。很多引用都有小的排版錯(cuò)誤，比如一個(gè)數(shù)字不對(duì)或標(biāo)點(diǎn)符號(hào)有誤。他們測(cè)量了這些錯(cuò)誤從一篇論文的參考文獻(xiàn)被復(fù)制粘貼到另一篇論文的頻率。由此他們可以推斷一個(gè)作者是否只是復(fù)制粘貼了一條參考文獻(xiàn)，根本沒有去核實(shí)。從這一點(diǎn)出發(fā)，他們能夠推斷出科學(xué)家對(duì)引用文獻(xiàn)的關(guān)注度。

類似地，你前面提出的那些問題，比如如何評(píng)估一項(xiàng)科學(xué)進(jìn)展是否有成果、有趣、代表了進(jìn)步，也許存在一些真正有用的指標(biāo)或“足跡”隱藏在數(shù)據(jù)中。我們可以考察引文模式，看某個(gè)東西在文獻(xiàn)中被提及的頻率之類的。也許有大量科學(xué)社會(huì)學(xué)的研究工作可以做，來檢測(cè)這些東西。也許我們?cè)撜乙恍┨煳膶W(xué)家來做這件事。

Patel：好的，我覺得這自然地引入了 AI 在數(shù)學(xué)領(lǐng)域所取得的進(jìn)展。你最近發(fā)過一個(gè)帖子，指出在過去幾個(gè)月里，AI 程序已經(jīng)解決了大約 1100 道 Erd?s 問題中的 50 道。但我印象中大約一個(gè)月前你說過，由于低垂果實(shí)已經(jīng)被摘完了，進(jìn)展出現(xiàn)了一個(gè)停頓。首先我想確認(rèn)一下，這個(gè)判斷目前是否仍然成立，我們確實(shí)摘完了低垂果實(shí)，目前處于一個(gè)平臺(tái)期？

陶哲軒：看起來確實(shí)如此。活動(dòng)還在繼續(xù)，大約 50 道問題已經(jīng)被解決了，這很不錯(cuò)，但還剩大約 600 道。人們?nèi)栽谝粌傻酪粌傻赖乜�。我們現(xiàn)在看到的純 AI 解決方案要少得多了。那種 AI 直接一擊命中的情況，曾經(jīng)有過一個(gè)集中爆發(fā)期，但現(xiàn)在已經(jīng)停了。并不是沒人在嘗試，據(jù)我所知至少有三個(gè)獨(dú)立的團(tuán)隊(duì)試圖讓前沿模型同時(shí)攻擊所有剩余問題。它們能發(fā)現(xiàn)一些細(xì)小的觀察，或者發(fā)現(xiàn)某個(gè)問題其實(shí)已經(jīng)在文獻(xiàn)中被解決了，但還沒有出現(xiàn)新的純 AI 驅(qū)動(dòng)的解答。

人們目前大量使用 AI 作為輔助工具。比如有人用 AI 生成一個(gè)可能的證明策略，然后另一個(gè)人用另一個(gè)獨(dú)立的 AI 工具來批評(píng)它、改寫它、生成一些數(shù)值數(shù)據(jù)、或者做文獻(xiàn)綜述。有些問題是通過大量人類和大量 AI 工具之間持續(xù)對(duì)話來解決的。但那種集中爆發(fā)似乎是一次性的。

也許可以打一個(gè)比方。想象你在一片山脈中，到處是各種懸崖和巖壁。有些也許只有 1 米高，有些 2 米高，然后是 5 米高、10 米高，還有一些巨大的懸崖。你試圖攀登盡可能多的巖壁，但你在黑暗中，不知道哪些是矮的。于是我們點(diǎn)了一些蠟燭、畫了一些地圖，慢慢地弄清楚了一些情況。有些是可以攀登的，有些我們發(fā)現(xiàn)了可以先到達(dá)的部分路徑。

然后這些 AI 工具出現(xiàn)了，它們就像跳躍機(jī)器人，可以跳到 2 米的高度，比任何人類都高。有時(shí)候它們跳錯(cuò)方向，有時(shí)候墜毀，但有時(shí)候它們能到達(dá)那些我們之前到不了的最矮的巖壁頂端。于是我們把它們放到這片山脈中到處跳，經(jīng)歷了一段激動(dòng)人心的時(shí)期，它們確實(shí)找到了所有最矮的巖壁并到達(dá)了頂端。但然后就沒有了。

也許等下一次模型有了重大升級(jí)，人們會(huì)再試一次，也許更多的巖壁會(huì)被突破。但這和傳統(tǒng)的數(shù)學(xué)研究方式很不同。通常我們會(huì)做標(biāo)記、識(shí)別部分進(jìn)展、找出應(yīng)該優(yōu)先關(guān)注的中間階段。這些工具要么成功，要么失敗。它們?cè)趧?chuàng)造部分進(jìn)展或識(shí)別中間階段方面表現(xiàn)很差�；氐轿覀冎暗挠懻�，我們沒有一種方式來評(píng)估部分進(jìn)展，不像我們可以評(píng)估一次完整的成功或失敗那樣。

Patel：你剛才說的話可以從兩個(gè)方向來理解，一個(gè)看空，一個(gè)看多�？纯盏慕嵌仁牵核鼈冎荒艿竭_(dá)一定高度的巖壁，不如人類能到達(dá)的高度�？炊嗟慕嵌仁牵核鼈冇幸环N強(qiáng)大的特性，一旦達(dá)到某個(gè)水位線，就能填滿那個(gè)水位線上所有可用的問題。人類做不到這一點(diǎn)，我們不能復(fù)制一百萬(wàn)個(gè)陶哲軒，每個(gè)都給予一百萬(wàn)美元的推理算力，讓他們各自做 100 年的主觀時(shí)間研究。

但一旦 AI 達(dá)到了陶哲軒的水平，它們就能做到這些。即使它們達(dá)到的是中間水平，也能做到中間版本的事情。所以我們現(xiàn)在應(yīng)該看空的理由，恰恰是我們應(yīng)該格外看多的理由，甚至不需要等它們達(dá)到超人智能，只需要它們達(dá)到人類水平智能就行了，因?yàn)樗鼈兊娜祟愃街悄茉谫|(zhì)量上比我們的人類水平智能更寬、更強(qiáng)大。

陶哲軒：我同意。AI 擅長(zhǎng)廣度，人類擅長(zhǎng)深度。至少人類專家如此。它們是非常互補(bǔ)的。但我們目前做數(shù)學(xué)和科學(xué)的方式偏重深度，因?yàn)槿祟惖膶ｉL(zhǎng)在那里，人類做不了廣度。那么問題是：我們是否設(shè)計(jì)出了足夠科學(xué)的做法來充分利用我們現(xiàn)在擁有的這種廣度能力？

正如我所說，我們應(yīng)該投入更多精力來創(chuàng)建非常廣泛的問題類別去攻克，而不只是一兩個(gè)非常深的重要問題。當(dāng)然我們?nèi)匀粦?yīng)該保留那些深層的重要問題，人類應(yīng)該繼續(xù)研究它們。但現(xiàn)在我們有了另一種做科學(xué)的方式：我們可以先讓這些具有廣泛中等能力的 AI 去勘探、清理某個(gè)全新的科學(xué)領(lǐng)域，做出所有簡(jiǎn)單的觀察，然后識(shí)別出某些困難的“孤島”，讓人類專家來處理。我看到的是一個(gè)非�；パa(bǔ)的科學(xué)未來。

最終你會(huì)希望同時(shí)擁有廣度和深度，兩全其美。但我認(rèn)為我們?cè)趶V度方面還需要練習(xí)。它太新了。我們甚至還沒有真正建立起充分利用它的范式。但終究會(huì)建立起來的。到那時(shí)候，科學(xué)將面目全非。

Patel：說到互補(bǔ)性，程序員已經(jīng)注意到這些 AI 工具大大提高了他們的生產(chǎn)力。你作為數(shù)學(xué)家是否有同樣的感受？不過，”vibe coding“和”vibe researching“之間似乎有一個(gè)很大的區(qū)別：對(duì)于軟件來說，這個(gè)東西的全部意義在于對(duì)世界產(chǎn)生某種效果。如果 AI 幫你更好地理解了問題或者想出了一個(gè)干凈的抽象來體現(xiàn)在代碼中，那只是通向最終目標(biāo)的工具。

而對(duì)于研究來說，我們關(guān)心解決千禧年大獎(jiǎng)問題，大概是因?yàn)樵诮鉀Q它們的過程中，我們會(huì)發(fā)現(xiàn)新的數(shù)學(xué)對(duì)象或新的技術(shù)，推進(jìn)我們文明對(duì)數(shù)學(xué)的理解。所以證明本身是通向中間過程的工具，中間過程才是最重要的。你是否同意這個(gè)二分法？

陶哲軒：對(duì)，在數(shù)學(xué)中過程往往比問題本身更重要。問題有點(diǎn)像衡量進(jìn)步的代理指標(biāo)。

即使在軟件領(lǐng)域我覺得也有不同類型的任務(wù)。如果你只是創(chuàng)建一個(gè)跟其他一千個(gè)網(wǎng)頁(yè)做同樣事情的網(wǎng)頁(yè)，確實(shí)沒什么需要學(xué)習(xí)的。對(duì)于那種樣板代碼，肯定可以交給 AI。但有時(shí)候你做完了原型，開始維護(hù)它，在升級(jí)和兼容方面遇到問題。我聽說程序員反映，即使 AI 能創(chuàng)建第一個(gè)原型，但讓它與其他一切協(xié)調(diào)配合、以你期望的方式與現(xiàn)實(shí)世界互動(dòng)，這是一個(gè)持續(xù)的過程。

如果你在編寫代碼的過程中沒有積累技能，后續(xù)維護(hù)可能會(huì)受影響。數(shù)學(xué)家同樣如此。我們用問題來建立直覺，訓(xùn)練人們對(duì)什么是對(duì)的、什么是可以預(yù)期的、什么是可證明的、什么是困難的形成判斷。所以直接得到答案可能反而會(huì)抑制這個(gè)過程。

我之前提過理論和實(shí)驗(yàn)的區(qū)分。在大多數(shù)科學(xué)中，理論和實(shí)驗(yàn)有大致對(duì)等的分量。但數(shù)學(xué)幾乎是獨(dú)一無(wú)二的，它幾乎完全是理論性的。我們非常重視嘗試建立連貫、整潔的理論來解釋事物為什么為真或?yàn)榧�。我們�(cè)趯?shí)驗(yàn)方面做得不多，比如，也許有兩種不同的方法來解決一個(gè)問題，哪一種更有效？我們有一些直覺但沒有做過大規(guī)模研究，沒有拿 1000 個(gè)問題來測(cè)試。但現(xiàn)在我們可以做了。我認(rèn)為 AI 類工具確實(shí)會(huì)革新數(shù)學(xué)的實(shí)驗(yàn)方面。

你不那么在意單個(gè)問題和解決它的過程，而是想要收集大規(guī)模數(shù)據(jù)，了解什么方法管用、什么不管用。就像一個(gè)軟件公司想要部署 1000 個(gè)軟件，你不會(huì)想手工打磨每一個(gè)的經(jīng)驗(yàn)教訓(xùn)，你只想找到可以規(guī)模化的工作流程。我們?cè)凇按笠?guī)模做數(shù)學(xué)”這件事上還處于萌芽階段，但那正是 AI 將真正革新這個(gè)學(xué)科的地方。

Patel：我覺得這些關(guān)于 AI 對(duì)科學(xué)有多大幫助的討論中，一個(gè)關(guān)鍵分歧是：如果你把每一種已知技術(shù)應(yīng)用到每一個(gè)未解決的問題上，那會(huì)不會(huì)就構(gòu)成我們文明知識(shí)的一次巨大提升？還是說那并不會(huì)那么令人印象深刻？

陶哲軒：這是一個(gè)好問題，我們還沒有足夠的數(shù)據(jù)來完全回答。人類數(shù)學(xué)家做的很多工作確實(shí)是這樣的：拿到一個(gè)新問題，首先去看所有在類似問題上曾經(jīng)管用的標(biāo)準(zhǔn)方法，一個(gè)一個(gè)試。有時(shí)候就成功了。這仍然值得發(fā)表，因?yàn)閱栴}本身很重要。有時(shí)候差一點(diǎn)就成功，你需要再加一個(gè)小技巧，那也很有趣。但頂級(jí)期刊發(fā)表的論文通常是那些現(xiàn)有方法能解決 80% 的問題，但剩下的 20% 具有抗性，需要發(fā)明新技術(shù)來填補(bǔ)缺口的工作。

現(xiàn)在已經(jīng)非常罕見了，完全不依賴已有文獻(xiàn)、所有想法憑空而來的解題。這在過去更常見，但數(shù)學(xué)現(xiàn)在太成熟了，不利用已有文獻(xiàn)是一個(gè)巨大的劣勢(shì)。

AI 工具在第一部分做得越來越好，就是在一個(gè)問題上嘗試所有標(biāo)準(zhǔn)技術(shù)。實(shí)際上它們犯的錯(cuò)誤有時(shí)比人類還少。雖然仍然會(huì)犯錯(cuò)，我測(cè)試過這些工具，在一些我能做的小任務(wù)上，有時(shí)候它們發(fā)現(xiàn)了我的錯(cuò)誤，有時(shí)候我發(fā)現(xiàn)了它們的錯(cuò)誤。目前大致是平手。但我還沒看到它們邁出下一步。當(dāng)論證中出現(xiàn)漏洞、沒有已知技術(shù)能填上時(shí)，它們能提出一些隨機(jī)建議。但我發(fā)現(xiàn)試圖追蹤這些建議、讓它們成立，然后發(fā)現(xiàn)行不通，往往浪費(fèi)的時(shí)間比節(jié)省的更多。

我認(rèn)為有一部分我們目前認(rèn)為很難的問題會(huì)被這種方法攻破，尤其是那些沒有受到足夠關(guān)注的問題。就像 Erd?s 問題一樣，被 AI 解決的那 50 道問題幾乎全部是之前基本沒有什么文獻(xiàn)的。也許有人偶然試過做不出來，但從來沒有真正深入研究過。但結(jié)果證明存在一個(gè)解，也許是把某個(gè)不太知名的技術(shù)和文獻(xiàn)中的另一個(gè)結(jié)果組合在一起。這是 AI 目前能達(dá)到的中位水平。清理了 50 道問題，這很了不起。

如果你只看那些在社交媒體上被廣播的成功案例，那看起來確實(shí)驚人。幾十年沒解決的問題現(xiàn)在紛紛被攻克。但每次我們做系統(tǒng)性研究時(shí)，對(duì)于任何給定的問題，AI 工具的成功率大約只有 1% 到 2%。只是因?yàn)樗鼈兛梢源笠?guī)模投入，你只挑贏家出來看的話，效果確實(shí)很亮眼。

同樣的事情也會(huì)發(fā)生在那些真正有聲望的困難數(shù)學(xué)問題上。有上百個(gè)這樣的問題。也許有那么幾個(gè)，某個(gè) AI 會(huì)碰巧解決它們，因?yàn)橛心硞€(gè)后門式的解法是所有人都錯(cuò)過的。這會(huì)引起很大的關(guān)注。但然后人們會(huì)把這些工具用在自己最喜歡的問題上，他們將體驗(yàn)到 1% 的成功率。所以信號(hào)中會(huì)有很多噪聲。

越來越重要的是收集真正標(biāo)準(zhǔn)化的數(shù)據(jù)集�，F(xiàn)在有一些努力在創(chuàng)建標(biāo)準(zhǔn)化的 AI 挑戰(zhàn)問題集，而不是只依賴 AI 公司只公布他們的勝利、不披露失敗的結(jié)果。這會(huì)讓我們更清楚地了解我們實(shí)際上處在什么位置。

Patel：但我覺得值得強(qiáng)調(diào)的是，光是模型能夠應(yīng)用某種沒有人寫下來可以用于這個(gè)特定問題的技術(shù)，這本身就已經(jīng)是巨大的 AI 進(jìn)步了。

陶哲軒：這種進(jìn)步讓人又驚嘆又失望，感覺很奇怪。但人們也適應(yīng)得非�？臁Ｎ矣浀么蠹s 20 年前 Google 搜索出來的時(shí)候，它把其他所有搜索引擎都比下去了。你在第一頁(yè)就能得到精確的相關(guān)結(jié)果，幾乎恰好是你想要的。當(dāng)時(shí)覺得太神奇了。然后幾年后你就覺得能 Google 任何東西是理所當(dāng)然的了�，F(xiàn)在也一樣，2026 年的 AI 水平放在 2021 年會(huì)令人震驚。人臉識(shí)別、自然語(yǔ)音、大學(xué)水平的數(shù)學(xué)題，我們現(xiàn)在都覺得理所當(dāng)然了。

Patel：說到 2026 年，你在 2023 年做過一個(gè)預(yù)測(cè)……

陶哲軒：說 AI 到 2026 年將是數(shù)學(xué)中“值得信賴的合著者，如果使用得當(dāng)?shù)脑挕薄?/p>

Patel：回頭看這個(gè)預(yù)測(cè)相當(dāng)準(zhǔn)確。

陶哲軒：是的，我挺滿意的。

Patel：那我們看看能不能保持這個(gè)勢(shì)頭。你個(gè)人因?yàn)?AI 而生產(chǎn)力翻倍，你覺得那會(huì)是哪一年？

陶哲軒：生產(chǎn)力不完全是一個(gè)一維的量。我確實(shí)注意到我做數(shù)學(xué)的方式正在發(fā)生相當(dāng)大的變化，包括我做的事情的類型。比如，我的論文現(xiàn)在有更多的代碼和圖片，因?yàn)樯蛇@些東西現(xiàn)在太容易了。以前要花幾個(gè)小時(shí)做的圖，現(xiàn)在幾分鐘就能完成。但在過去我根本不會(huì)在論文里放那張圖，我會(huì)用文字描述。所以很難衡“2 倍”意味著什么。

一方面，如果我必須在沒有 AI 系統(tǒng)的情況下寫我今天寫的那類論文，肯定會(huì)花五倍的時(shí)間。但我不會(huì)用那種方式寫論文。

Patel：五倍？

陶哲軒：對(duì)，但那是因?yàn)檫@些是輔助性的東西。比如更深入的文獻(xiàn)檢索、提供更多的數(shù)值計(jì)算。它們豐富了論文。

核心工作，比如實(shí)際解決一個(gè)數(shù)學(xué)問題中最困難的部分，這方面變化不大，仍然需要紙和筆。但有很多其他事情，我現(xiàn)在用 AI Agent 來重新格式化，比如有時(shí)候我的括號(hào)大小不太對(duì)，以前我得手動(dòng)在腦子里改，現(xiàn)在可以讓 AI Agent 在后臺(tái)漂亮地處理。所以它們確實(shí)大大加速了很多輔助任務(wù)。它們還沒有加速我所做的核心工作，但讓我能在論文中添加更多東西。

反過來說，如果我要重新寫一篇 2020 年的論文，不加那些額外功能，只是達(dá)到同樣的基本水平的話，AI 其實(shí)也沒有加速多少。所以它讓論文變得更豐富、更寬廣了，但不一定更深。

Patel：你提出了“人工聰明”（artificial cleverness）和“人工智能”（artificial intelligence）的區(qū)分，我想更好地理解這兩個(gè)概念。什么是不僅僅是聰明的智能？

陶哲軒：智能出了名地難以定義。你看到的時(shí)候就知道了。當(dāng)我和別人合作解決一個(gè)數(shù)學(xué)問題時(shí)，有一種對(duì)話：我們都不知道怎么解決，但其中一個(gè)人有了某個(gè)想法，看起來有希望。然后我們有了一個(gè)原型策略，去測(cè)試它，發(fā)現(xiàn)不行，但可以修改。想法會(huì)不斷被調(diào)整和改進(jìn)。到最后，我們系統(tǒng)地摸清了什么行不通、什么行得通。

AI 有點(diǎn)能模仿這一點(diǎn)�；氐教S機(jī)器人的比方，它們可以跳上去、失敗、跳上去、失敗，反復(fù)如此。但它們做不到的是：跳了一點(diǎn)，抓住了某個(gè)著力點(diǎn)，然后在那里停下來，把其他人拉上來，然后從那個(gè)新位置繼續(xù)跳。不存在這種累積過程。在交互中用它們的時(shí)候，感覺更多還是反復(fù)試錯(cuò)和暴力窮舉。這在某些場(chǎng)景下確實(shí)可以靠規(guī)模取勝，效果也很驚人。但從部分進(jìn)展中一步步積累推進(jìn)，這一點(diǎn)目前還差得遠(yuǎn)。

Patel：有意思。你是說如果 Gemini 或者 Claude 解決了一個(gè)問題，它自己對(duì)數(shù)學(xué)的理解并沒有進(jìn)步？即使它在一個(gè)問題上工作但沒有解決，它自己的理解也沒有進(jìn)步？

陶哲軒：對(duì)，新的會(huì)話就忘記了之前做過什么。它沒有新的技能可以依賴來解決相關(guān)問題。也許它剛才做的東西會(huì)成為下一代模型訓(xùn)練數(shù)據(jù)的 0.001%，所以最終可能有一些被吸收。但基本上是這樣。

Patel：有一個(gè)大問題是：如果我們持續(xù)訓(xùn)練 AI 讓它越來越擅長(zhǎng)在 Lean（一種形式化證明語(yǔ)言）中解題，它們會(huì)繼續(xù)解決越來越令人印象深刻的問題嗎？然后回頭來看，我們會(huì)不會(huì)驚訝地發(fā)現(xiàn)，某個(gè) Lean 證明出來的黎曼猜想解答其實(shí)沒給我們什么洞見？你覺得解決黎曼猜想是否必然要求，即便是由完全在 Lean 中工作的 AI 來做，其中的構(gòu)造和定義也必須推進(jìn)我們對(duì)數(shù)學(xué)的理解？還是它可能只是一團(tuán)像匯編代碼一樣不可讀的東西？

陶哲軒：我們不知道。有些問題基本上就是靠純粹的暴力搜索解決的。四色定理就是一個(gè)著名的例子。我們至今沒有找到一個(gè)概念上優(yōu)雅的證明，基本上就是把問題分成了大量的情況然后對(duì)每種情況做計(jì)算機(jī)分析。也許我們永遠(yuǎn)找不到優(yōu)雅證明，有些問題可能只能通過窮舉來解決。

我們之所以特別看重黎曼猜想這樣的問題，是因?yàn)槲覀兿喈?dāng)確信必須創(chuàng)造出某種新數(shù)學(xué)，或者發(fā)現(xiàn)兩個(gè)之前沒有聯(lián)系的數(shù)學(xué)領(lǐng)域之間的新聯(lián)系，才能解決它。我們甚至不知道解的形態(tài)是什么，但它不像是那種靠窮舉就能搞定的問題。當(dāng)然，黎曼猜想理論上可能是假的。有一種不太可能但存在的場(chǎng)景：假設(shè)有一個(gè)零點(diǎn)不在臨界線上，通過大量計(jì)算機(jī)計(jì)算可以驗(yàn)證。那會(huì)非常令人失望。

我確實(shí)覺得完全自主的一擊式方法不是解決這些問題的正確路徑。我認(rèn)為人類與這些工具協(xié)作會(huì)帶來更大的收益。我可以想象某個(gè)這樣的問題會(huì)被某個(gè)聰明的人類在極其強(qiáng)大的 AI 工具的輔助下解決。

但那種協(xié)作的具體形態(tài)可能與我們現(xiàn)在設(shè)想的非常不同。它可能是一種目前還不存在的協(xié)作類型。也許有一種方法可以生成黎曼 zeta 函數(shù)的一百萬(wàn)種變體并做 AI 輔助的數(shù)據(jù)分析，發(fā)現(xiàn)之前不知道的連接它們的模式，從而把問題轉(zhuǎn)入另一個(gè)數(shù)學(xué)領(lǐng)域。各種場(chǎng)景都有可能。

Patel：假設(shè) AI 解決了某個(gè)問題，而在 Lean 代碼中隱含著某個(gè)全新的構(gòu)造。如果我們意識(shí)到它的重要性，就能在很多不同的場(chǎng)景中應(yīng)用它。你怎么識(shí)別出這個(gè)構(gòu)造？這是一個(gè)也許很天真的問題，但如果 AI 做出了等價(jià)于笛卡爾那種把代數(shù)和幾何統(tǒng)一起來的坐標(biāo)系思想，在 Lean 代碼中它可能就看起來像從 R 到 R 的映射，看起來完全不起眼。

陶哲軒：在 Lean 這樣的系統(tǒng)中把證明形式化的好處恰恰在于，你可以把它的任何部分拿出來單獨(dú)研究。

我讀人類寫的論文時(shí)，碰到一個(gè)解決困難問題的工作，里面往往是一長(zhǎng)串引理和定理。有些作者會(huì)告訴你哪些是重點(diǎn)、哪些不是，但也有人不會(huì)點(diǎn)明哪一步才是關(guān)鍵、哪一步只是常規(guī)操作。

不過你可以把每條引理單獨(dú)拿出來看。有些一眼就能認(rèn)出來：哦，這個(gè)很標(biāo)準(zhǔn)，跟我熟悉的某個(gè)東西差不多，沒什么特別的。但另一條引理讓你覺得，這是我以前沒見過的，而且我能理解為什么有了它就能推出主要定理。也就是說，你可以判斷一個(gè)步驟到底是論證的核心還是無(wú)關(guān)緊要的。Lean 的好處恰恰在這里：它讓你可以非常精確地審視每一個(gè)單獨(dú)的步驟。

我認(rèn)為未來會(huì)出現(xiàn)一整個(gè)數(shù)學(xué)家職業(yè)群體，他們可能拿到一個(gè)巨大的 Lean 生成的證明，然后對(duì)它做某種消融測(cè)試（ablation），嘗試移除部分步驟，找到更優(yōu)雅的方式。也許其他 AI 可以做一些強(qiáng)化學(xué)習(xí)來讓證明更優(yōu)雅？也許其他 AI 可以判斷這個(gè)證明是否看起來更好。

還有一件近期會(huì)明顯變化的事：一直以來，寫論文都是整個(gè)工作中最耗時(shí)、成本最高的環(huán)節(jié)，所以你不會(huì)輕易動(dòng)筆。結(jié)果通常只寫一遍，論證中的其他部分就在腦子里過一過就算了，因?yàn)橹貙懸槐�、重�?gòu)一遍實(shí)在太痛苦了。

但現(xiàn)在這件事借助現(xiàn)代 AI 工具變得容易多了。你不必只有一個(gè)版本的論文。一旦你有了一個(gè)版本，人們可以生成成百上千個(gè)變體。所以一個(gè)巨大的、混亂的 Lean 證明本身可能不太好理解，但其他人可以重構(gòu)它、對(duì)它做各種處理。

我們?cè)?Erd?s 問題網(wǎng)站上已經(jīng)看到了這種情況。人和 AI 會(huì)生成一個(gè)證明，然后給出 3000 行驗(yàn)證證明的代碼。但然后人們讓其他 AI 來總結(jié)這個(gè)證明，人們也會(huì)寫自己的證明。一旦你有了一個(gè)證明，后續(xù)處理實(shí)際上是有很多工具可用的。這是數(shù)學(xué)中一個(gè)非常新興的領(lǐng)域。我不太擔(dān)心那種“如果黎曼猜想被證明了但證明完全不可理解怎么辦”的問題。我覺得一旦我們有了證明這個(gè)產(chǎn)物，我們可以對(duì)它做很多分析。

Patel：你最近發(fā)了一個(gè)帖子說，擁有一種描述數(shù)學(xué)策略（而非僅僅是數(shù)學(xué)證明）的形式化或半形式化語(yǔ)言會(huì)很有幫助。Lean 專長(zhǎng)的是證明。我很想了解一下，這種描述策略的語(yǔ)言會(huì)是什么樣的。

陶哲軒：我們其實(shí)不太清楚。我們?cè)跀?shù)學(xué)中非常幸運(yùn)，已經(jīng)建立了邏輯和數(shù)學(xué)的規(guī)律。但這其實(shí)是一個(gè)相當(dāng)晚近的成就。從歐幾里得幾千年前開始，一直到 20 世紀(jì)初我們才最終確立了：這些是數(shù)學(xué)的公理（我們稱之為 ZFC 公理），這些是一階邏輯的公理，這就是“證明”的含義。

這些我們已經(jīng)成功自動(dòng)化了，有了形式語(yǔ)言。但也許還有某種方式來評(píng)估命題的合理性。比如你有一個(gè)猜想說某件事為真，你測(cè)試了幾個(gè)例子都成立，這如何增加你對(duì)該猜想為真的信心？我們有一些數(shù)學(xué)方法來建模，比如貝葉斯概率。但往往你必須設(shè)定某些基礎(chǔ)假設(shè)，仍然有很多主觀性。關(guān)于這些語(yǔ)言的討論，與其說是一個(gè)計(jì)劃，不如說是一個(gè)愿望。

但看看擁有像 Lean 這樣的形式框架如何大大便利了演繹證明的自動(dòng)化和 AI 訓(xùn)練，如果有一個(gè)類似的框架用于策略和猜想的生成就好了�，F(xiàn)在使用 AI 來創(chuàng)建策略和提出猜想的瓶頸在于，我們必須依賴人類專家和時(shí)間檢驗(yàn)來判斷某件事是否合理。

如果有這樣一種框架，介于嚴(yán)格形式和自然語(yǔ)言之間，能讓這個(gè)過程部分自動(dòng)化，同時(shí)不容易被鉆空子（這很重要，確保形式化證明助手沒有后門或漏洞至關(guān)重要，因?yàn)閺?qiáng)化學(xué)習(xí)特別擅長(zhǎng)找到這些后門）。

科學(xué)家之間的交流有一種特殊的方式：一半是數(shù)據(jù)和論證，一半是在講故事、構(gòu)建敘事。如果能有某種框架把這種交流方式捕捉下來就好了，但科學(xué)中那些主觀的成分，我們目前還不知道怎么讓 AI 有效地介入。所以這是一個(gè)未來的問題。有一些研究在嘗試創(chuàng)建自動(dòng)化的猜想系統(tǒng)，也許有辦法做基準(zhǔn)測(cè)試，但這一切都非常非常新。

Patel：能幫我建立一些直觀的感受嗎？第一，有沒有一個(gè)具體的例子，說明科學(xué)家之間交流中有哪些是我們還不能形式化的？第二，說“構(gòu)建敘事或自然語(yǔ)言解釋”同時(shí)又“將其形式化”，這聽起來幾乎在定義上就是自相矛盾的。我相信你心中有一種直覺，知道這兩者的重疊在哪里。

陶哲軒：舉一個(gè)猜想的例子。高斯（Gauss）對(duì)素?cái)?shù)很感興趣，他創(chuàng)建了最早的數(shù)學(xué)數(shù)據(jù)集之一，計(jì)算了前約 10 萬(wàn)個(gè)素?cái)?shù)，希望找到規(guī)律。他確實(shí)找到了一個(gè)規(guī)律，雖然也許不是他所預(yù)期的那種。他發(fā)現(xiàn)素?cái)?shù)中有一個(gè)統(tǒng)計(jì)性的規(guī)律：如果你數(shù)到 10、100、1000、100 萬(wàn)……有多少個(gè)素?cái)?shù)，素?cái)?shù)越來越稀疏，但密度的下降速率與數(shù)字范圍的自然對(duì)數(shù)成反比。

他由此猜想了我們現(xiàn)在稱為素?cái)?shù)定理的東西：不超過 x 的素?cái)?shù)個(gè)數(shù)約等于 x 除以 x 的自然對(duì)數(shù)。他完全沒有辦法證明這一點(diǎn)，這是純數(shù)據(jù)驅(qū)動(dòng)的。這在當(dāng)時(shí)是革命性的，因?yàn)樗赡苁菙?shù)學(xué)中第一個(gè)真正重要的統(tǒng)計(jì)性質(zhì)的猜想。

通常你說的規(guī)律，比如素?cái)?shù)之間的間隔有某種規(guī)則性。但這個(gè)猜想不能告訴你在任何給定范圍內(nèi)精確有多少個(gè)素?cái)?shù)，它只給你一個(gè)近似值，而且越往外這個(gè)近似越準(zhǔn)確。但它確實(shí)很有幫助。

這開創(chuàng)了我們稱之為解析數(shù)論的領(lǐng)域。它是一長(zhǎng)串類似猜想中的第一個(gè)，其中很多后來被證明了。這些猜想逐漸鞏固了一種觀念：素?cái)?shù)實(shí)際上沒有一個(gè)固定的規(guī)律，它們的行為像是隨機(jī)的數(shù)集，只是具有某種特定密度。

我的意思是，素?cái)?shù)確實(shí)有一些規(guī)律，比如它們幾乎全是奇數(shù)，它們不是真的隨機(jī)。它們是所謂的“偽隨機(jī)”，生成素?cái)?shù)不涉及隨機(jī)數(shù)生成器。但隨著時(shí)間推移，把素?cái)?shù)當(dāng)成仿佛是上帝不斷擲骰子生成的隨機(jī)集合來思考，變得越來越富有成效。這讓我們能做出各種其他預(yù)測(cè)。

比如孿生素?cái)?shù)猜想：應(yīng)該存在無(wú)窮多對(duì)只差 2 的素?cái)?shù)對(duì)，像 11 和 13。我們無(wú)法證明它，而且有很好的理由說明為什么目前無(wú)法證明。但因?yàn)樗財(cái)?shù)的這種統(tǒng)計(jì)隨機(jī)模型，我們絕對(duì)確信它是對(duì)的。我們知道如果素?cái)?shù)是通過拋硬幣生成的，那么就像無(wú)窮多只猴子在打字機(jī)上打字一樣，我們會(huì)看到孿生素?cái)?shù)不斷出現(xiàn)。

我們隨著時(shí)間發(fā)展出了一個(gè)非常精確的概念模型，描述素?cái)?shù)應(yīng)該如何表現(xiàn)，基于統(tǒng)計(jì)和概率。但這大部分是啟發(fā)式的、非嚴(yán)格的，卻極其準(zhǔn)確。那些少數(shù)我們確實(shí)能證明的關(guān)于素?cái)?shù)的事實(shí)，都與我們所說的“素?cái)?shù)的隨機(jī)模型”的預(yù)測(cè)相吻合。所以我們有了這個(gè)猜想性的概念框架來理解素?cái)?shù)，所有人都相信它。

這也是我們相信黎曼猜想為真的原因，是我們相信基于素?cái)?shù)的密碼學(xué)在數(shù)學(xué)上基本安全的原因。這些都是這個(gè)信念體系的一部分。

我們關(guān)心黎曼猜想的一個(gè)原因是：如果黎曼猜想被推翻了，如果它是假的，那將嚴(yán)重打擊這個(gè)模型。這意味著素?cái)?shù)中存在某種我們不知道的秘密規(guī)律。我認(rèn)為我們會(huì)非常迅速地放棄所有基于素?cái)?shù)的密碼學(xué)。因?yàn)槿绻幸粋€(gè)我們不知道的規(guī)律，那可能還有更多。而這些規(guī)律可能導(dǎo)致密碼學(xué)漏洞。這將是一個(gè)巨大的沖擊。所以我們真的想確保這不會(huì)發(fā)生。

我們之所以逐漸被黎曼猜想之類的命題說服，部分是實(shí)驗(yàn)證據(jù)，部分是少數(shù)情況下我們能夠做出的理論結(jié)果確實(shí)與預(yù)測(cè)吻合。

當(dāng)然，共識(shí)也有可能是錯(cuò)的，也許我們都遺漏了什么非�；镜臇|西�？茖W(xué)史上曾經(jīng)有過范式轉(zhuǎn)換。但我們目前沒有一種方法來衡量這些事情，部分原因是我們對(duì)數(shù)學(xué)和科學(xué)如何發(fā)展缺乏足夠的數(shù)據(jù)。我們只有一條歷史時(shí)間線，大約一百個(gè)轉(zhuǎn)折點(diǎn)的故事。

如果我們能接觸到一百萬(wàn)個(gè)外星文明，每個(gè)都有不同的科學(xué)發(fā)展順序和歷史，那也許我們就能真正對(duì)“如何衡量什么是進(jìn)步、什么是好策略”形成理解，也許可以開始形式化并建立框架。

也許我們需要做的是創(chuàng)建很多“迷你宇宙”，讓 AI 在非常基礎(chǔ)的問題（比如算術(shù)之類）上進(jìn)行模擬，讓它們自己發(fā)展出策略來解決這些問題，用這些小實(shí)驗(yàn)室來測(cè)試。有人在研究類似的東西，比如能做十位數(shù)乘法的最小神經(jīng)網(wǎng)絡(luò)之類的。我覺得我們確實(shí)可以從讓小型 AI 在簡(jiǎn)單問題上進(jìn)化中學(xué)到很多。

Patel：你需要快速學(xué)習(xí)新領(lǐng)域，而且要學(xué)得足夠深才能貢獻(xiàn)到前沿。從某種意義上說，你也是世界上最偉大的自學(xué)者之一。你學(xué)習(xí)新領(lǐng)域的過程是什么樣的？

陶哲軒：我們之前談到了深度和廣度的區(qū)分，這不純粹是人類與 AI 的區(qū)分。人類中也有這種分化。我記得有人把人分為刺猬和狐貍。刺猬對(duì)一件事知道得非常非常深，狐貍對(duì)很多事情都知道一點(diǎn)點(diǎn)。我肯定是狐貍型的。我經(jīng)常和刺猬合作，有時(shí)候我自己也可以充當(dāng)刺猬，但本質(zhì)上我是狐貍。

我一直有點(diǎn)強(qiáng)迫癥的傾向。如果我讀到某個(gè)東西，覺得自己應(yīng)該能理解但就是不明白為什么它管用，里面有某種魔法，比如有人使用了我不熟悉的數(shù)學(xué)方法，得到了我也想證明的結(jié)論，但我自己做不到。我就想知道他們的竅門是什么。讓我煩惱的是別人能做到我覺得我應(yīng)該能做到但做不到的事情。我一直有這種強(qiáng)迫式的完整主義傾向。

所以我不得不戒掉電子游戲，因?yàn)槲乙婚_始玩就想打通所有關(guān)卡。這就是我學(xué)習(xí)新領(lǐng)域的一種方式。

另一個(gè)方式是合作。我和很多人合作，他們教會(huì)了我其他類型的數(shù)學(xué)。我交一個(gè)在另一個(gè)數(shù)學(xué)領(lǐng)域工作的數(shù)學(xué)家朋友，覺得他們的問題很有趣，但他們需要教我一些基本的技巧、什么是已知的、什么是未知的。我從中學(xué)到了很多。

我發(fā)現(xiàn)把學(xué)到的東西寫下來很有用。我有一個(gè)博客，有時(shí)候會(huì)記錄我學(xué)到的東西。因?yàn)檫^去年輕的時(shí)候，我會(huì)學(xué)到某個(gè)東西、發(fā)現(xiàn)一個(gè)很酷的技巧然后想“我要記住這個(gè)”。結(jié)果六個(gè)月后就忘了。我記得自己曾經(jīng)理解過，但沒法重現(xiàn)論證。頭幾次經(jīng)歷這種“理解了又失去了”的挫敗感，讓我下定決心應(yīng)該把任何學(xué)到的有趣東西寫下來。博客就是這么來的。

Patel：你寫一篇博客文章需要多長(zhǎng)時(shí)間？

陶哲軒：這往往是我不想做其他工作時(shí)會(huì)做的事。比如有什么審稿報(bào)告之類的，那些在當(dāng)時(shí)讓我感覺略有壓力的任務(wù)。寫博客讓我覺得是創(chuàng)造性的、有趣的，是為自己做的事情。根據(jù)話題不同，可能半小時(shí)也可能好幾個(gè)小時(shí)。但因?yàn)樗俏易栽缸龅模瑢懙臅r(shí)候時(shí)間飛逝。相比之下，因?yàn)樾姓虿坏貌蛔龅氖虑榫褪强嗖钍铝�。不過話說回來，這類苦差事現(xiàn)在 AI 確實(shí)幫了不少忙。

Patel：如果文明可以從零開始決定如何使用陶哲軒的時(shí)間，把它當(dāng)作一種有限資源，當(dāng)前的時(shí)間分配和最優(yōu)分配之間最大的差距是什么？沒準(zhǔn)就不會(huì)有這期播客。

陶哲軒：雖然我確實(shí)會(huì)抱怨一些不想做但必須做的任務(wù)（在學(xué)術(shù)界越資深，就有越多的委員會(huì)和行政職責(zé)），但我也發(fā)現(xiàn)很多我勉強(qiáng)參加的活動(dòng)，因?yàn)槭俏业牧x務(wù)或者超出了我的舒適區(qū)，結(jié)果反而帶來了意想不到的收獲。我會(huì)遇到我通常不會(huì)交談的人（比如你），學(xué)到有趣的東西，獲得有趣的經(jīng)歷，以及結(jié)識(shí)新朋友的機(jī)會(huì)。

所以我非常相信偶然性（serendipity）的價(jià)值。我確實(shí)會(huì)優(yōu)化我的時(shí)間，一天中有些部分安排得很仔細(xì)。但我也愿意留出一些部分做點(diǎn)不是我平時(shí)做的事。也許是浪費(fèi)時(shí)間，也許會(huì)學(xué)到什么。多數(shù)情況下，我感覺收獲了計(jì)劃之外的積極體驗(yàn)。也許有一個(gè)危險(xiǎn)因素是，在現(xiàn)代社會(huì)，不只是 AI，我們也變得太擅長(zhǎng)優(yōu)化一切了。

比如新冠疫情期間，我們大量轉(zhuǎn)向遠(yuǎn)程會(huì)議。一切都有排期，我們忙碌程度差不多，至少在學(xué)術(shù)界，我們見的人和面對(duì)面時(shí)差不多多。但一切都得提前安排。我們失去的是那種在走廊上偶遇、去倒咖啡時(shí)碰到某人的隨機(jī)互動(dòng)。這些偶然的交流你可能覺得不是最優(yōu)的，但實(shí)際上非常重要。

我讀研的時(shí)候，如果要查一篇期刊論文，得親自去圖書館，借出期刊，讀那篇文章。有時(shí)候旁邊那篇文章也很有趣。你可以隨便翻翻，偶然發(fā)現(xiàn)有趣的東西�，F(xiàn)在這種事基本沒有了，因?yàn)槟阆氩槭裁粗苯虞斎胨阉饕婊蛘?AI 就能立刻得到你要的，但你不會(huì)得到那些“意外發(fā)現(xiàn)”。

我曾經(jīng)在普林斯頓高等研究院待過一年。那是一個(gè)很棒的地方，沒有干擾，你就是在那里做研究。頭幾周非常好，你把積攢了很久的論文寫出來，花大塊時(shí)間思考問題。但如果待超過幾個(gè)月，我發(fā)現(xiàn)靈感會(huì)枯竭。因?yàn)槟汩_始更多地刷網(wǎng)頁(yè)。你其實(shí)確實(shí)需要生活中有一定程度的干擾，它提供了足夠的隨機(jī)性，或者說高溫度（high temperature），如果你喜歡用這個(gè)類比的話。

我不知道安排生活的最優(yōu)方式是什么。好像自然而然就行得通。

Patel：我很好奇，你預(yù)計(jì) AI 什么時(shí)候能在前沿?cái)?shù)學(xué)方面至少做得和最好的人類數(shù)學(xué)家一樣好？

陶哲軒：在某些方面它們已經(jīng)在做人類做不到的前沿?cái)?shù)學(xué)了。這是一個(gè)不同的前沿。你可以說計(jì)算器也在做人類做不了的前沿?cái)?shù)學(xué)，只不過那是數(shù)字計(jì)算。

Patel：但完全取代陶哲軒呢？

陶哲軒：那還要我干什么？（笑）

Patel：去多上播客吧。（笑）

陶哲軒：可能這個(gè)問題需要修正一下，我覺得在十年之內(nèi)，數(shù)學(xué)家目前在做的很多事情（占我們大部分時(shí)間的工作，我們今天寫進(jìn)論文的很多內(nèi)容）都可以由 AI 完成。但我們會(huì)發(fā)現(xiàn)那些實(shí)際上不是我們工作中最重要的部分。

100 年前，很多數(shù)學(xué)家的工作就是解微分方程。物理學(xué)家需要某個(gè)系統(tǒng)的精確解，就雇一個(gè)數(shù)學(xué)家去一步步做微積分。19 世紀(jì)數(shù)學(xué)家做的很多事情，現(xiàn)在你調(diào)用 Mathematica、Wolfram Alpha 或某個(gè)計(jì)算機(jī)代數(shù)包，或者更近期用 AI，幾分鐘就能解決。但我們繼續(xù)前進(jìn)了，轉(zhuǎn)向了不同類型的問題。

Computer 這個(gè)詞以前指的是人。以前有人專門制作對(duì)數(shù)表和計(jì)算素?cái)?shù)，像高斯那樣。這些全都外包給了電子計(jì)算機(jī)，但我們繼續(xù)前進(jìn)了�；蚪M學(xué)也是如此，給一個(gè)生物體測(cè)序這項(xiàng)工作曾經(jīng)是一個(gè)遺傳學(xué)家的整個(gè)博士論文。現(xiàn)在花一千美元寄給測(cè)序公司就行了。但遺傳學(xué)作為學(xué)科并沒有死掉，你轉(zhuǎn)向不同的尺度了，也許研究整個(gè)生態(tài)系統(tǒng)而非單個(gè)個(gè)體。

Patel：你這個(gè)觀點(diǎn)我理解。但關(guān)于“什么時(shí)候大部分?jǐn)?shù)學(xué)進(jìn)步幾乎全是由 AI 做出的”這個(gè)問題呢？如果你聽說今年有一個(gè)千禧年大獎(jiǎng)問題被解決了，你有 95% 的把握是 AI 自主完成的，這樣的年份肯定會(huì)到來吧？

陶哲軒：也許吧。但我確實(shí)相信人類加 AI 的混合體將在數(shù)學(xué)中占據(jù)主導(dǎo)地位更長(zhǎng)時(shí)間。

這需要一些我們目前還沒有的額外突破。所以它會(huì)是隨機(jī)的。目前的 AI 在某些方面非常好，但在其他方面很差。雖然你可以加各種框架來減少錯(cuò)誤率、讓它們更好地協(xié)同工作，但我感覺我們還沒有湊齊所有的成分來真正提供一個(gè)令人滿意的、能替代所有智力任務(wù)的方案。

目前它是互補(bǔ)的，不是替代。也許新發(fā)現(xiàn)、新突破會(huì)更快地出現(xiàn)，因?yàn)楫?dāng)前水平的 AI 已經(jīng)在很多方面加速了科學(xué)。也有可能通過某種方式破壞了偶然性，我們反而抑制了某些類型的進(jìn)步。在目前這個(gè)時(shí)間點(diǎn)上，什么都有可能。世界是非常、非常不可預(yù)測(cè)的。

Patel：對(duì)于考慮進(jìn)入數(shù)學(xué)領(lǐng)域或剛開始數(shù)學(xué)職業(yè)的人，你有什么建議？尤其是考慮到 AI 的進(jìn)步，他們應(yīng)該怎樣調(diào)整自己對(duì)職業(yè)的思考？

陶哲軒：我們生活在一個(gè)變革時(shí)期。如我所說，當(dāng)前特別不可預(yù)測(cè)。我們幾個(gè)世紀(jì)以來視為理所當(dāng)然的事情可能不再成立。一切的做法都會(huì)改變，不只是數(shù)學(xué)。

我覺得人們就是得接受會(huì)有很多變化。你學(xué)的一些東西可能會(huì)過時(shí)或者被徹底革新，但有些東西會(huì)保留下來。

永遠(yuǎn)要關(guān)注那些你以前做不到、但現(xiàn)在可以做的新機(jī)會(huì)。在數(shù)學(xué)領(lǐng)域，以前基本上要經(jīng)過多年教育讀完博士才能對(duì)前沿研究做出貢獻(xiàn)。但現(xiàn)在，高中生就有可能借助這些 AI 工具和 Lean 等等參與數(shù)學(xué)項(xiàng)目并做出真正的貢獻(xiàn)。將會(huì)出現(xiàn)很多非傳統(tǒng)的學(xué)習(xí)和參與機(jī)會(huì)。

心態(tài)上要足夠靈活。保持好奇，樂于嘗試。傳統(tǒng)教育在一段時(shí)間內(nèi)仍然很重要，學(xué)數(shù)學(xué)學(xué)科學(xué)的老辦法暫時(shí)還得走。但同時(shí)也應(yīng)該對(duì)非常不同的做科學(xué)的方式保持開放，其中有些方式現(xiàn)在還不存在。

這是一個(gè)令人不安的時(shí)代，但也非常令人興奮。

參考資料：

https://www.youtube.com/watch?v=Q8Fkpi18QXU

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.