国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

陶哲軒訪談:數(shù)學(xué)界正在經(jīng)歷哥白尼革命,人類智能不再是宇宙中心

0
分享至

過去半年,AI 在數(shù)學(xué)領(lǐng)域的進(jìn)展令人目不暇接。2025 年 10 月,OpenAI 聲稱 GPT-5 解決了多道 Erd?s 難題,隨后被證實(shí)其中大部分只是文獻(xiàn)檢索,找到了數(shù)據(jù)庫(kù)維護(hù)者尚未收錄的已發(fā)表論文。

但到了 2026 年 1 月,情況發(fā)生了實(shí)質(zhì)變化:GPT-5.2 Pro 在一周內(nèi)攻克了三道 Erd?s 難題(#397、#728、#729),生成的證明經(jīng) Lean 形式化驗(yàn)證后被陶哲軒本人接受,且這些證明在已有文獻(xiàn)中找不到先例。

據(jù)《科學(xué)美國(guó)人》2026 年 2 月的報(bào)道,AI 工具迄今已幫助將約 100 道 Erd?s 問題轉(zhuǎn)入“已解決”狀態(tài)。與此同時(shí),多位頂尖數(shù)學(xué)家開始向 AI 實(shí)驗(yàn)室靠攏:哥倫比亞大學(xué)的 Mehtaab Sawhney 休學(xué)加入了 OpenAI,另一位研究者 Pagano 也入職了 Google DeepMind。

就在這個(gè)節(jié)點(diǎn)上,3 月 20 日,菲爾茲獎(jiǎng)得主陶哲軒做客 Dwarkesh Podcast,從開普勒發(fā)現(xiàn)行星運(yùn)動(dòng)定律的故事講起,深入談?wù)摿?AI 正在如何改變數(shù)學(xué)與科學(xué)研究的方式。他在 2023 年曾預(yù)測(cè)到 2026 年 AI 將成為數(shù)學(xué)研究中“值得信賴的合著者”,如今他對(duì)這個(gè)預(yù)測(cè)表示滿意。但他也坦言,AI 讓他的論文更豐富了,核心突破仍然要靠紙筆完成。


(來源:YouTube)

對(duì)話核心要點(diǎn)如下:

? 陶哲軒 2023 年預(yù)測(cè)“到 2026 年 AI 將成為數(shù)學(xué)研究中值得信賴的合著者”,他認(rèn)為這個(gè)預(yù)測(cè)基本兌現(xiàn);

? AI 工具已幫助解決約 50 道 Erd?s 難題(據(jù)《科學(xué)美國(guó)人》報(bào)道已接近 100 道),但純 AI 一擊命中的解題已經(jīng)停滯,剩余問題的成功率約為 1%–2%;

? AI 將想法生成的成本降到了接近于零,但驗(yàn)證和評(píng)估成為了新的瓶頸,科學(xué)界的同行評(píng)審體系正在被 AI 生成的投稿淹沒;

? 陶哲軒的論文現(xiàn)在包含更多代碼和圖表,如果沒有 AI 工具,寫出同類論文要花五倍時(shí)間;但數(shù)學(xué)問題中最核心的突破部分仍然依賴紙筆;

? AI 擅長(zhǎng)廣度,人類擅長(zhǎng)深度,二者高度互補(bǔ);陶哲軒認(rèn)為人機(jī)混合將在數(shù)學(xué)領(lǐng)域占據(jù)主導(dǎo)地位更長(zhǎng)時(shí)間;

? 他認(rèn)為數(shù)學(xué)需要一種描述“策略”而非僅僅“證明”的半形式化語(yǔ)言,但目前還不知道這種語(yǔ)言該是什么樣的;

? 對(duì)年輕人的建議:心態(tài)要足夠靈活,傳統(tǒng)教育仍然重要,但要對(duì)全新的參與科學(xué)的方式保持開放。

以下是這場(chǎng)對(duì)話的編譯全文。

Patel:我想先請(qǐng)你講講開普勒發(fā)現(xiàn)行星運(yùn)動(dòng)定律的故事,因?yàn)槲矣X得這會(huì)是一個(gè)很好的跳板,讓我們從這里開始聊 AI 與數(shù)學(xué)。

陶哲軒:好的。我一直對(duì)天文學(xué)有業(yè)余的興趣,也很喜歡早期天文學(xué)家如何推算出宇宙本質(zhì)的故事。開普勒是在哥白尼的工作基礎(chǔ)上進(jìn)行研究的,而哥白尼本人又繼承了阿里斯塔克斯(Aristarchus)的思路。哥白尼最著名的貢獻(xiàn)是提出了日心說模型:不是行星和太陽(yáng)圍繞地球轉(zhuǎn),而是太陽(yáng)位于太陽(yáng)系中心,其他行星圍繞太陽(yáng)運(yùn)行。哥白尼認(rèn)為行星的軌道是完美的圓形,他的理論在一定程度上與希臘人、阿拉伯人和印度人數(shù)百年來積累的觀測(cè)數(shù)據(jù)吻合。

我覺得開普勒應(yīng)該是在求學(xué)過程中接觸到了這些理論,然后他注意到,哥白尼所預(yù)測(cè)的各行星軌道的大小比例似乎蘊(yùn)含著某種幾何意義。他開始提出這樣一種想法:比如你取地球的軌道,把它嵌入一個(gè)立方體中,那么包圍這個(gè)立方體的外接球幾乎完美地吻合火星的軌道,依此類推。

當(dāng)時(shí)已知有六顆行星,行星之間有五個(gè)間隔,而恰好有五種正則柏拉圖立體:立方體、正四面體、正八面體、正十二面體和正二十面體。所以他提出了一個(gè)他認(rèn)為極其美妙的理論,認(rèn)為可以在各行星的球面之間嵌入這些柏拉圖立體。數(shù)據(jù)看上去確實(shí)吻合。對(duì)他來說,這意味著上帝設(shè)計(jì)行星的方式恰恰對(duì)應(yīng)了柏拉圖立體的數(shù)學(xué)完美性。

為了驗(yàn)證這個(gè)理論,他需要數(shù)據(jù)。當(dāng)時(shí)幾乎只存在一套真正高質(zhì)量的數(shù)據(jù)集,來自第谷·布拉赫(Tycho Brahe)。這位丹麥天文學(xué)家非常富有而又性情古怪,他說服了丹麥政府資助一座極其昂貴的天文臺(tái),實(shí)際上是一整座島。他在那里持續(xù)了幾十年,每天晚上(至少是天氣晴朗的每個(gè)晚上)用肉眼觀測(cè)所有行星的位置。他是最后一批純?nèi)庋厶煳膶W(xué)家。他擁有的數(shù)據(jù)正是開普勒驗(yàn)證理論所需要的。


圖丨開普勒與布拉赫雕塑(來源:WikiPedia)

開普勒開始與布拉赫合作,但布拉赫對(duì)自己的數(shù)據(jù)非常吝嗇,每次只給一點(diǎn)點(diǎn)。據(jù)說開普勒最終偷了數(shù)據(jù),偷偷抄了一份,還跟布拉赫的后人鬧了一場(chǎng)。但他確實(shí)拿到了數(shù)據(jù),然后他發(fā)現(xiàn),令他頗為失望的是,那個(gè)美妙的理論并不完全成立。數(shù)據(jù)與柏拉圖立體理論大約偏差了 10%。

他想了各種辦法來調(diào)整,挪動(dòng)圓的位置之類的,但就是不太對(duì)。他在這個(gè)問題上鉆研了很多年,最終找到了一種方法,利用數(shù)據(jù)推算出行星的實(shí)際軌道。那是一項(xiàng)了不起的數(shù)據(jù)分析工作。最終他發(fā)現(xiàn)行星軌道其實(shí)是橢圓而非圓形,這讓他很震撼。

他推導(dǎo)出了行星運(yùn)動(dòng)的前兩條定律:橢圓軌道,以及等面積等時(shí)間定律(即行星與太陽(yáng)的連線在相等時(shí)間內(nèi)掃過相等的面積)。然后又過了十年,在積累了更多數(shù)據(jù)之后(最遠(yuǎn)的行星如土星和木星是他最難搞定的),他最終推導(dǎo)出第三定律:行星完成一個(gè)軌道周期所需的時(shí)間,與它到太陽(yáng)距離的某個(gè)冪次成正比。這就是著名的三大運(yùn)動(dòng)定律。對(duì)開普勒而言,這些完全是由實(shí)驗(yàn)數(shù)據(jù)驅(qū)動(dòng)的。要到一個(gè)世紀(jì)后,牛頓才給出了一個(gè)統(tǒng)一的理論來解釋這三條定律。

Patel:我想提出一個(gè)看法,來看你怎么評(píng)價(jià):開普勒就像一個(gè)“高溫度”的大語(yǔ)言模型(high temperature LLM)。牛頓后來解釋了行星運(yùn)動(dòng)三定律為何必然成立。開普勒推算出各行星相對(duì)軌道的方式,正如你所說,確實(shí)是天才之舉。但縱觀他的整個(gè)學(xué)術(shù)生涯,他一直在嘗試各種隨機(jī)的聯(lián)系。

事實(shí)上,在他寫下第三定律的那本書《世界的和聲》里,第三定律幾乎是一筆帶過。那本書的主題是關(guān)于不同行星擁有不同的和聲,地球上之所以充滿饑荒和苦難,是因?yàn)榈厍虻囊舴恰癿i”和“fa”。所以大量的內(nèi)容是隨機(jī)的占星學(xué),但其中夾著立方平方定律(cube-square law),告訴你行星周期與到太陽(yáng)距離之間的關(guān)系。如果把這條定律加上牛頓的 F=ma 和向心加速度公式,就能推導(dǎo)出引力的平方反比定律。牛頓就是這樣推導(dǎo)出來的。

我覺得這個(gè)故事之所以有趣,是因?yàn)槲腋杏X大語(yǔ)言模型可以做開普勒那種事情:花 20 年嘗試各種隨機(jī)聯(lián)系,其中有些完全沒道理,只要有一個(gè)可驗(yàn)證的數(shù)據(jù)庫(kù)(就像布拉赫的數(shù)據(jù)集),那就行。我要試試關(guān)于音符的隨機(jī)想法,試試關(guān)于柏拉圖立體的隨機(jī)想法,試試各種不同的幾何。我有一個(gè)偏見,覺得這些軌道的幾何關(guān)系中一定有什么重要的東西。然后其中有一個(gè)想法成功了。只要你能驗(yàn)證它,這些經(jīng)驗(yàn)規(guī)律就可以推動(dòng)真正深層的科學(xué)進(jìn)步。

陶哲軒:傳統(tǒng)上,當(dāng)我們談?wù)摽茖W(xué)史的時(shí)候,“想法的生成”一直是科學(xué)中最有聲望的環(huán)節(jié)。一個(gè)科學(xué)問題涉及很多步驟:你必須先識(shí)別一個(gè)問題,然后判斷它是不是一個(gè)好問題。然后你需要收集數(shù)據(jù),想出分析數(shù)據(jù)的策略,提出假說。到了這一步,你需要提出一個(gè)好的假說,然后驗(yàn)證它,然后還要寫出來、解釋清楚,涉及十幾個(gè)不同的環(huán)節(jié)。但我們慶祝的確實(shí)是那些靈光乍現(xiàn)的“尤里卡”時(shí)刻,也就是想法的生成。

開普勒當(dāng)然必須像你說的那樣,循環(huán)嘗試很多想法,其中好幾個(gè)不管用。我敢打賭還有很多他根本沒發(fā)表的,因?yàn)閿?shù)據(jù)就是對(duì)不上。這是過程中很重要的一部分:嘗試各種隨機(jī)的東西,看看哪個(gè)行得通。但正如你所說,這必須配合同等規(guī)模的驗(yàn)證工作,否則就太慢了。

我的意思是,我們紀(jì)念開普勒,但也應(yīng)該同樣紀(jì)念布拉赫。他那種一絲不茍的數(shù)據(jù)收集比之前的任何觀測(cè)精確了十倍。而那個(gè)額外的小數(shù)點(diǎn)的精度對(duì)開普勒得出他的結(jié)論至關(guān)重要。他當(dāng)時(shí)使用的是歐幾里得幾何,以及他所能掌握的最先進(jìn)數(shù)學(xué)來擬合數(shù)據(jù)模型。所以各個(gè)方面都必須到位:數(shù)據(jù)、理論、以及假說的生成。

我不確定如今假說生成還是不是瓶頸了。從那以來科學(xué)發(fā)生了很多變化。經(jīng)典上,科學(xué)有兩大范式:理論和實(shí)驗(yàn)。20 世紀(jì)又加入了數(shù)值模擬,你可以通過計(jì)算機(jī)模擬來檢驗(yàn)理論。

再往后,到了 20 世紀(jì)末,我們進(jìn)入了大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析成了新的驅(qū)動(dòng)力,F(xiàn)在很多新進(jìn)展實(shí)際上是通過分析海量數(shù)據(jù)集驅(qū)動(dòng)的:先收集大量數(shù)據(jù),然后從中發(fā)現(xiàn)規(guī)律來推導(dǎo)想法。這和科學(xué)過去的運(yùn)作方式有些不同。過去是你先做幾次觀測(cè),或者憑空冒出一個(gè)想法,然后收集數(shù)據(jù)來檢驗(yàn)它。這是經(jīng)典的科學(xué)方法。

現(xiàn)在幾乎是反過來的:你先收集大數(shù)據(jù),然后試圖從中提取假說。開普勒也許是最早的數(shù)據(jù)科學(xué)家之一,但即便是他,也不是從布拉赫的數(shù)據(jù)集出發(fā)再去分析的,他先有了預(yù)設(shè)的理論。不過現(xiàn)在這種做法似乎越來越少了,因?yàn)閿?shù)據(jù)量實(shí)在太大,實(shí)在太有用了。

Patel:有意思。我倒覺得你描述的這種“20 世紀(jì)的科學(xué)范式”實(shí)際上很好地描述了開普勒的經(jīng)歷。他確實(shí)有一些先入為主的想法(1595 至 1596 年間他提出了正多邊形和柏拉圖立體的理論),但那些是錯(cuò)的。幾年后他拿到了布拉赫的數(shù)據(jù),又經(jīng)過 20 年不斷嘗試各種隨機(jī)想法,才得出了那些經(jīng)驗(yàn)規(guī)律。

所以實(shí)際過程更接近于:布拉赫的數(shù)據(jù)就像某種海量模擬數(shù)據(jù)庫(kù),有了數(shù)據(jù)之后你可以不斷嘗試。如果沒有這些數(shù)據(jù),開普勒就只能在那兒不停寫關(guān)于和聲與柏拉圖立體的書,沒有什么東西可以用來驗(yàn)證。

陶哲軒:對(duì),數(shù)據(jù)確實(shí)極其重要。但我想做的區(qū)分是,傳統(tǒng)上是先提出假說、再用數(shù)據(jù)檢驗(yàn)。但現(xiàn)在有了機(jī)器學(xué)習(xí)、數(shù)據(jù)分析和統(tǒng)計(jì)學(xué),你可以從數(shù)據(jù)出發(fā),直接用統(tǒng)計(jì)方法推導(dǎo)出規(guī)律。

開普勒的第三定律就有點(diǎn)像這樣,只不過對(duì)第三定律來說,他的數(shù)據(jù)點(diǎn)只有 6 個(gè),不是上千個(gè)。每顆行星你知道軌道周期和到太陽(yáng)的距離,一共 5 到 6 個(gè)數(shù)據(jù)點(diǎn)。他做了我們今天所說的“回歸分析”,擬合了一條曲線,發(fā)現(xiàn)了三次方 - 平方的關(guān)系,這令人驚嘆。但其實(shí)他挺幸運(yùn)的。僅憑 6 個(gè)數(shù)據(jù)點(diǎn)就能得出正確結(jié)論,這其實(shí)不夠可靠。

后來有一位天文學(xué)家約翰·波德(Johann Bode),拿著同樣的行星距離數(shù)據(jù),受開普勒啟發(fā),他預(yù)測(cè)行星的距離構(gòu)成一個(gè)平移的等比數(shù)列。他也做了曲線擬合,但其中缺了一個(gè)點(diǎn),火星和木星之間有一個(gè)很大的空隙。他的定律預(yù)測(cè)那里有一顆缺失的行星。這看起來像是個(gè)不靠譜的理論,但后來赫歇爾發(fā)現(xiàn)了天王星,天王星到太陽(yáng)的距離恰好完美吻合這個(gè)規(guī)律。再后來谷神星(Ceres)在小行星帶被發(fā)現(xiàn),也吻合這個(gè)規(guī)律。人們非常興奮,覺得波德發(fā)現(xiàn)了一條驚人的自然法則。


圖丨約翰·波德(來源:WikiPedia)

但再后來海王星被發(fā)現(xiàn)了,它的距離與預(yù)測(cè)完全不符;旧夏蔷褪莻(gè)數(shù)字巧合,因?yàn)橹挥?6 個(gè)數(shù)據(jù)點(diǎn)嘛。也許開普勒之所以沒有像突出前兩條定律那樣突出第三定律,是因?yàn)榧幢闼麤]有現(xiàn)代統(tǒng)計(jì)學(xué)知識(shí),他也憑直覺知道 6 個(gè)數(shù)據(jù)點(diǎn)得出的結(jié)論應(yīng)該持保留態(tài)度。

Patel:我來更明確地問一下這個(gè)類比吧。未來我們會(huì)有越來越聰明的 AI,數(shù)以百萬(wàn)計(jì),它們可以到處去尋找各種經(jīng)驗(yàn)規(guī)律。聽起來你似乎認(rèn)為,科學(xué)的瓶頸不在于為每個(gè)領(lǐng)域找到更多類似“行星運(yùn)動(dòng)第三定律”這樣的東西,然后后人可以說“哦,我們需要一種方式來解釋這個(gè),讓我們來推導(dǎo)一下數(shù)學(xué),這就是引力的平方反比定律”?

陶哲軒:我覺得 AI 基本上已經(jīng)把想法生成的成本降到了接近于零,就像互聯(lián)網(wǎng)把通信成本降到了接近于零一樣!斑@了不起,但光靠它還不會(huì)自動(dòng)帶來豐!,F(xiàn)在瓶頸變了。

我們現(xiàn)在的處境是:突然之間人們可以針對(duì)一個(gè)科學(xué)問題生成成千上萬(wàn)的理論,然后我們必須去驗(yàn)證它們、評(píng)估它們。為此我們必須改變科學(xué)的組織結(jié)構(gòu)。以往,我們建造了各種“圍墻”。在 AI 生成的垃圾內(nèi)容(AI slop)出現(xiàn)之前,業(yè)余科學(xué)家們也會(huì)提出自己的宇宙理論,其中絕大多數(shù)沒什么價(jià)值,所以我們建立了同行評(píng)審和出版體系來過濾,試圖篩選出高信號(hào)的想法去檢驗(yàn)。

但現(xiàn)在我們可以大規(guī)模地生成這些可能的解釋,其中有些是好的,很多是糟糕的。人類審稿人已經(jīng)招架不住了。很多期刊報(bào)告說 AI 生成的投稿正在大量涌入。所以 AI 能生成各種東西,這很好,但這意味著科學(xué)的其他環(huán)節(jié)必須跟上來:驗(yàn)證、確認(rèn)、評(píng)估哪些想法真正推動(dòng)了學(xué)科進(jìn)步、哪些是死胡同或障眼法。這些事情我們還不知道怎么大規(guī)模地做。對(duì)于每篇單獨(dú)的論文,我們可以在科學(xué)家之間討論,經(jīng)過幾年達(dá)成共識(shí)。但當(dāng)我們每天生產(chǎn)成千上萬(wàn)篇的時(shí)候,這種方式就行不通了。

Patel:確實(shí)有一個(gè)極其有趣的問題:如果你有數(shù)十億個(gè) AI 科學(xué)家,不僅要判斷哪些是真正的進(jìn)步,還要判斷其中哪個(gè)發(fā)現(xiàn)可能像“比特”的發(fā)明那樣,具有跨領(lǐng)域的普遍意義。

人類科學(xué)界其實(shí)也面對(duì)過這個(gè)問題,而且我們某種程度上解決了。我其實(shí)不太確定我們是怎么解決的。比如在 1940 年代,你在貝爾實(shí)驗(yàn)室或者什么地方,有這些新技術(shù)涌現(xiàn):脈沖編碼調(diào)制,基本上是如何傳輸信號(hào)、如何將信號(hào)數(shù)字化、如何在模擬線路上傳輸。

關(guān)于工程約束和細(xì)節(jié)有大量論文。然后其中有一篇提出了“比特”的概念,它對(duì)許多不同領(lǐng)域都有影響。你需要某種系統(tǒng)能夠看到它并說:好,我們要把這個(gè)應(yīng)用到概率論,要把這個(gè)應(yīng)用到計(jì)算機(jī)科學(xué),等等。

未來,如果 AI 提出了某種下一代的統(tǒng)一概念,你怎么在上百萬(wàn)篇論文中識(shí)別出它?那些論文可能確實(shí)都構(gòu)成了進(jìn)步,但它們的思想遠(yuǎn)沒有那么普遍和統(tǒng)一。

陶哲軒:很多時(shí)候需要時(shí)間的檢驗(yàn)。許多偉大的想法在最初提出時(shí)并沒有得到很好的反響,只是在后來其他科學(xué)家發(fā)現(xiàn)可以把它們拿來進(jìn)一步發(fā)展、應(yīng)用到自己的領(lǐng)域時(shí)才被認(rèn)可。深度學(xué)習(xí)本身在很長(zhǎng)一段時(shí)間里都是 AI 中一個(gè)小眾方向。完全通過數(shù)據(jù)訓(xùn)練而不是第一性原理推理來得到答案,這在當(dāng)時(shí)非常有爭(zhēng)議,花了很長(zhǎng)時(shí)間才真正開花結(jié)果。

你提到了比特。實(shí)際上計(jì)算機(jī)架構(gòu)有過其他方案,不一定非得是 0 和 1。曾經(jīng)有人提出過三值邏輯(ternary logic),即 0、1、2。在另一個(gè)平行宇宙里,也許另一種范式會(huì)勝出。Transformer 是所有現(xiàn)代大語(yǔ)言模型的基礎(chǔ),是第一個(gè)真正足夠復(fù)雜到能夠捕捉語(yǔ)言的深度學(xué)習(xí)架構(gòu),但事情不一定必須如此?赡苡衅渌軜(gòu)先做到了同樣的事情,一旦被采用就成了標(biāo)準(zhǔn)。所以,評(píng)估一個(gè)給定的想法是否會(huì)有成果之所以困難,是因?yàn)樗Q于未來,也取決于文化和社會(huì)——哪些想法被采納了,哪些沒有。

十進(jìn)制數(shù)系在數(shù)學(xué)中極其有用,比羅馬數(shù)字系統(tǒng)好得多。但 10 這個(gè)底數(shù)本身沒什么特別的。它對(duì)我們有用,是因?yàn)槠渌腥硕荚谟盟覀円呀?jīng)圍繞它標(biāo)準(zhǔn)化了,我們的計(jì)算機(jī)和數(shù)字表示系統(tǒng)都是圍繞它構(gòu)建的。所以我們被它綁定了。偶爾有人推廣十進(jìn)制以外的系統(tǒng),但慣性太大了。你不能把任何科學(xué)成就完全孤立地拿出來給它一個(gè)客觀分?jǐn)?shù),而不考慮它過去和未來的語(yǔ)境。所以這可能永遠(yuǎn)不是你能像解決更局部的問題那樣用強(qiáng)化學(xué)習(xí)來搞定的事情。

Patel:對(duì),科學(xué)史上似乎經(jīng)常出現(xiàn)這種情況:一個(gè)后來被證明是正確的新理論在提出時(shí)會(huì)產(chǎn)生一些推論,這些推論要么說不通(后來我們才明白為什么說不通),要么是正確的但在當(dāng)時(shí)看來荒謬至極。

你提過阿里斯塔克斯在公元前三世紀(jì)就有了日心說,但古雅典人說這不可能,因?yàn)槿绻厍驀@太陽(yáng)轉(zhuǎn),我們應(yīng)該能看到恒星的相對(duì)位置變化。唯一的解釋是恒星太遠(yuǎn)了,遠(yuǎn)到你觀察不到任何視差。這其實(shí)是正確的推論。

但有時(shí)候推論確實(shí)不正確,我們需要進(jìn)入更高層次的理解才行。比如萊布尼茨批評(píng)牛頓的引力理論,理由是它意味著“超距作用”(action at a distance),我們不知道其中的機(jī)制。牛頓自己也對(duì)慣性質(zhì)量和引力質(zhì)量恰好是同一個(gè)量感到震驚。這些問題都是愛因斯坦解決的,但它仍然是進(jìn)步。如果 AI 做同行評(píng)審,它的問題就在于:即便你能證偽一個(gè)理論,你怎么識(shí)別出它相對(duì)于之前的理論仍然構(gòu)成了進(jìn)步?

陶哲軒:事實(shí)上,最終正確的理論在早期往往在很多方面看起來更差。哥白尼的行星理論就不如托勒密的理論精確。地心說到那時(shí)已經(jīng)發(fā)展了一千多年,有了非常多的調(diào)整和越來越復(fù)雜的臨時(shí)修正來使其越來越精確。哥白尼的理論簡(jiǎn)潔得多,但精確度低得多。一直到開普勒才使它比托勒密的理論更精確。

科學(xué)總是在不斷推進(jìn)的。當(dāng)你只得到了部分解答時(shí),它看起來可能不如一個(gè)雖然錯(cuò)誤但已經(jīng)被完善到足以回答所有問題的理論。牛頓的理論有很大的謎團(tuán)(質(zhì)量等價(jià)和超距作用)這些直到幾個(gè)世紀(jì)后,通過一種概念上完全不同的方法才被解決。進(jìn)步的實(shí)現(xiàn)往往不是通過增加更多理論,而是通過刪除你頭腦中的某些假設(shè)。

地心說之所以能堅(jiān)持那么久,一個(gè)原因是我們有一種觀念,認(rèn)為物體天然趨向于靜止。這是亞里士多德的物理學(xué)概念。所以地球在運(yùn)動(dòng)這個(gè)想法……我們?cè)趺礇]有全都摔倒?一旦你有了慣性運(yùn)動(dòng)的概念那就說得通了。但在概念上,認(rèn)識(shí)到地球在運(yùn)動(dòng)是一個(gè)非常大的飛躍。你感覺不到它在動(dòng)。最大的進(jìn)步往往就是這類事情。

達(dá)爾文的進(jìn)化論也是如此。物種不是靜態(tài)的,但這并不顯而易見,因?yàn)槟阍谝簧畠?nèi)看不到進(jìn)化(當(dāng)然,現(xiàn)在我們實(shí)際上可以看到了)。

我們目前正在經(jīng)歷一場(chǎng)認(rèn)知版的哥白尼革命。我們過去認(rèn)為人類智能是宇宙的中心,現(xiàn)在我們看到外面存在著非常不同類型的智能,有著非常不同的優(yōu)勢(shì)和劣勢(shì)。我們對(duì)于“哪些任務(wù)需要智能、哪些不需要”的判斷必須大幅重新排序。試圖把 AI 塞進(jìn)我們現(xiàn)有的科學(xué)進(jìn)步理論、“什么是難的什么是容易的”這些框架里,我們相當(dāng)掙扎。我們不得不問一些以前從未真正需要問的問題,或許哲學(xué)家們問過,但現(xiàn)在我們所有人都得面對(duì)了。

Patel:這引出了一個(gè)我非常好奇的話題。你提到了達(dá)爾文的進(jìn)化論。有一本書叫《發(fā)條宇宙》(The Clockwork Universe),作者 Edward Dolnick,涵蓋了我們正在聊的這個(gè)歷史時(shí)期。他有一個(gè)有趣的觀察:《物種起源》發(fā)表于 1859 年,牛頓的《自然哲學(xué)的數(shù)學(xué)原理》發(fā)表于 1687 年。所以《物種起源》比《原理》晚了將近兩個(gè)世紀(jì)。

而在概念上,達(dá)爾文的理論似乎更簡(jiǎn)單。與達(dá)爾文同時(shí)代的生物學(xué)家托馬斯·赫胥黎讀完《物種起源》后說:“怎么會(huì)這么蠢,居然沒有想到這個(gè)!钡珡膩頉]有人這樣說過牛頓的引力理論,不會(huì)有人責(zé)怪自己沒有搶在牛頓前面。

那為什么反而用了更長(zhǎng)的時(shí)間?一個(gè)很大的原因似乎是:自然選擇的證據(jù)是累積性和回溯性的,而牛頓可以直接寫出方程,看看月球的軌道周期和距離是否吻合。如果吻合,就說明取得了進(jìn)步。

盧克萊修(譯注:提圖斯·盧克萊修·卡魯斯,Titus Lucretius Carus,是羅馬詩(shī)人和哲學(xué)家)其實(shí)在公元前一世紀(jì)就有了物種適應(yīng)環(huán)境的想法,但直到達(dá)爾文之前沒人真正討論過,因?yàn)楸R克萊修做不了實(shí)驗(yàn),無(wú)法迫使人們關(guān)注。所以我在想,我們回頭看的時(shí)候,是否會(huì)發(fā)現(xiàn)那些有緊密數(shù)據(jù)反饋循環(huán)、容易驗(yàn)證的領(lǐng)域取得了更多進(jìn)步,盡管它們?cè)诟拍钌峡赡芾щy得多。


圖丨盧克萊修(來源:Human Heritage)

陶哲軒:科學(xué)的一個(gè)方面不只是創(chuàng)造新理論和驗(yàn)證它,還有把它傳達(dá)給別人。達(dá)爾文其實(shí)是一位出色的科學(xué)傳播者。他用英語(yǔ)寫作,用自然語(yǔ)言,說得通俗易懂。他綜合了很多分散的事實(shí)。進(jìn)化論的一些零散部分以前就被發(fā)現(xiàn)了,但他提供了一種非常有說服力的愿景。他仍然缺少一些東西,比如他不知道遺傳的機(jī)制,沒有 DNA。但他的寫作風(fēng)格很有說服力,這幫了大忙。

牛頓用拉丁文寫作,他發(fā)明了全新的數(shù)學(xué)(譯注:微積分)來解釋他的工作。他所處的時(shí)代,科學(xué)家之間更加秘密和競(jìng)爭(zhēng)。雖然學(xué)術(shù)界至今仍然充滿競(jìng)爭(zhēng),但牛頓那個(gè)年代更甚。他隱瞞了一些最好的洞見,因?yàn)椴幌胱寣?duì)手占便宜。據(jù)我所知他本人也不太好相處。實(shí)際上是在牛頓之后幾十年,其他科學(xué)家用更簡(jiǎn)單的語(yǔ)言解釋了他的工作,他的理論才廣泛傳播。

所以說,闡釋的藝術(shù)、論證的組織、構(gòu)建敘事,這些也是科學(xué)的重要組成部分。數(shù)據(jù)當(dāng)然有幫助,但人們需要被說服,否則他們不會(huì)去推進(jìn)這個(gè)方向。他們需要做出初始投資來學(xué)習(xí)你的理論并真正去探索它。而這又是一件很難用強(qiáng)化學(xué)習(xí)來做的事情,因?yàn)槟愫茈y明確給“說服力”打分。好吧,整個(gè)營(yíng)銷行業(yè)都在試圖做這件事。所以也許 AI 目前還沒有被優(yōu)化得太有說服力是件好事。

科學(xué)也有屬于社會(huì)層面的一部分。雖然我們?yōu)榭陀^性自豪,我們有數(shù)據(jù),有實(shí)驗(yàn)驗(yàn)證,但我們?nèi)匀恍枰v故事,說服我們的同行科學(xué)家。

這是一件柔軟的、模糊的事情。它是數(shù)據(jù)和敘事的結(jié)合。而且是關(guān)于缺口的敘事。就像達(dá)爾文,正如我說的,他的理論有一些他無(wú)法解釋的部分,但他仍然能夠論證說,未來人們會(huì)找到過渡形態(tài),會(huì)找到遺傳的機(jī)制。后來果然如此。但我不知道怎么把這些量化到足夠精確的程度去做強(qiáng)化學(xué)習(xí)。也許這將永遠(yuǎn)是科學(xué)中屬于人類的部分。

Patel:我從閱讀和觀看你關(guān)于宇宙距離階梯的內(nèi)容中得到的一個(gè)感悟是(順便說一句,我非常、非常推薦大家去看你和 Tim Nguyen 合作的關(guān)于宇宙距離階梯的系列講座),許多領(lǐng)域中的“推演盈余”(deductive overhang)可能比人們意識(shí)到的要大得多。

如果你有了研究問題的正確切入點(diǎn),可能會(huì)驚訝于你能從世界中學(xué)到多少。你覺得這只是天文學(xué)在你研究的那些特定歷史時(shí)期的產(chǎn)物,還是說基于目前入射到地球上的數(shù)據(jù),我們實(shí)際上可以推斷出遠(yuǎn)比我們恰好知道的更多的東西?

陶哲軒:天文學(xué)是最早真正擁抱數(shù)據(jù)分析的科學(xué)之一,它把手頭信息中每一滴可能的信息都榨干了。因?yàn)閿?shù)據(jù)就是瓶頸(現(xiàn)在仍然是),收集天文數(shù)據(jù)真的很難。所以天文學(xué)家在從微量數(shù)據(jù)線索中提取各種結(jié)論方面幾乎是世界級(jí)的,有點(diǎn)像福爾摩斯。我聽說很多量化對(duì)沖基金更喜歡招天文學(xué)博士,因?yàn)樗麄円矊?duì)從各種數(shù)據(jù)噪聲中提取信號(hào)很感興趣。


我們確實(shí)沒有充分探索如何從各種信號(hào)中提取額外信息。隨便舉一個(gè)例子。我記得讀過一項(xiàng)研究,人們想測(cè)量科學(xué)家實(shí)際閱讀他們所引用論文的頻率。怎么測(cè)量呢?你可以試著調(diào)查不同的科學(xué)家,但他們想到了一個(gè)聰明的辦法。很多引用都有小的排版錯(cuò)誤,比如一個(gè)數(shù)字不對(duì)或標(biāo)點(diǎn)符號(hào)有誤。他們測(cè)量了這些錯(cuò)誤從一篇論文的參考文獻(xiàn)被復(fù)制粘貼到另一篇論文的頻率。由此他們可以推斷一個(gè)作者是否只是復(fù)制粘貼了一條參考文獻(xiàn),根本沒有去核實(shí)。從這一點(diǎn)出發(fā),他們能夠推斷出科學(xué)家對(duì)引用文獻(xiàn)的關(guān)注度。

類似地,你前面提出的那些問題,比如如何評(píng)估一項(xiàng)科學(xué)進(jìn)展是否有成果、有趣、代表了進(jìn)步,也許存在一些真正有用的指標(biāo)或“足跡”隱藏在數(shù)據(jù)中。我們可以考察引文模式,看某個(gè)東西在文獻(xiàn)中被提及的頻率之類的。也許有大量科學(xué)社會(huì)學(xué)的研究工作可以做,來檢測(cè)這些東西。也許我們?cè)撜乙恍┨煳膶W(xué)家來做這件事。

Patel:好的,我覺得這自然地引入了 AI 在數(shù)學(xué)領(lǐng)域所取得的進(jìn)展。你最近發(fā)過一個(gè)帖子,指出在過去幾個(gè)月里,AI 程序已經(jīng)解決了大約 1100 道 Erd?s 問題中的 50 道。但我印象中大約一個(gè)月前你說過,由于低垂果實(shí)已經(jīng)被摘完了,進(jìn)展出現(xiàn)了一個(gè)停頓。首先我想確認(rèn)一下,這個(gè)判斷目前是否仍然成立,我們確實(shí)摘完了低垂果實(shí),目前處于一個(gè)平臺(tái)期?

陶哲軒:看起來確實(shí)如此。活動(dòng)還在繼續(xù),大約 50 道問題已經(jīng)被解決了,這很不錯(cuò),但還剩大約 600 道。人們?nèi)栽谝粌傻酪粌傻赖乜。我們現(xiàn)在看到的純 AI 解決方案要少得多了。那種 AI 直接一擊命中的情況,曾經(jīng)有過一個(gè)集中爆發(fā)期,但現(xiàn)在已經(jīng)停了。并不是沒人在嘗試,據(jù)我所知至少有三個(gè)獨(dú)立的團(tuán)隊(duì)試圖讓前沿模型同時(shí)攻擊所有剩余問題。它們能發(fā)現(xiàn)一些細(xì)小的觀察,或者發(fā)現(xiàn)某個(gè)問題其實(shí)已經(jīng)在文獻(xiàn)中被解決了,但還沒有出現(xiàn)新的純 AI 驅(qū)動(dòng)的解答。

人們目前大量使用 AI 作為輔助工具。比如有人用 AI 生成一個(gè)可能的證明策略,然后另一個(gè)人用另一個(gè)獨(dú)立的 AI 工具來批評(píng)它、改寫它、生成一些數(shù)值數(shù)據(jù)、或者做文獻(xiàn)綜述。有些問題是通過大量人類和大量 AI 工具之間持續(xù)對(duì)話來解決的。但那種集中爆發(fā)似乎是一次性的。

也許可以打一個(gè)比方。想象你在一片山脈中,到處是各種懸崖和巖壁。有些也許只有 1 米高,有些 2 米高,然后是 5 米高、10 米高,還有一些巨大的懸崖。你試圖攀登盡可能多的巖壁,但你在黑暗中,不知道哪些是矮的。于是我們點(diǎn)了一些蠟燭、畫了一些地圖,慢慢地弄清楚了一些情況。有些是可以攀登的,有些我們發(fā)現(xiàn)了可以先到達(dá)的部分路徑。

然后這些 AI 工具出現(xiàn)了,它們就像跳躍機(jī)器人,可以跳到 2 米的高度,比任何人類都高。有時(shí)候它們跳錯(cuò)方向,有時(shí)候墜毀,但有時(shí)候它們能到達(dá)那些我們之前到不了的最矮的巖壁頂端。于是我們把它們放到這片山脈中到處跳,經(jīng)歷了一段激動(dòng)人心的時(shí)期,它們確實(shí)找到了所有最矮的巖壁并到達(dá)了頂端。但然后就沒有了。

也許等下一次模型有了重大升級(jí),人們會(huì)再試一次,也許更多的巖壁會(huì)被突破。但這和傳統(tǒng)的數(shù)學(xué)研究方式很不同。通常我們會(huì)做標(biāo)記、識(shí)別部分進(jìn)展、找出應(yīng)該優(yōu)先關(guān)注的中間階段。這些工具要么成功,要么失敗。它們?cè)趧?chuàng)造部分進(jìn)展或識(shí)別中間階段方面表現(xiàn)很差;氐轿覀冎暗挠懻,我們沒有一種方式來評(píng)估部分進(jìn)展,不像我們可以評(píng)估一次完整的成功或失敗那樣。

Patel:你剛才說的話可以從兩個(gè)方向來理解,一個(gè)看空,一個(gè)看多?纯盏慕嵌仁牵核鼈冎荒艿竭_(dá)一定高度的巖壁,不如人類能到達(dá)的高度?炊嗟慕嵌仁牵核鼈冇幸环N強(qiáng)大的特性,一旦達(dá)到某個(gè)水位線,就能填滿那個(gè)水位線上所有可用的問題。人類做不到這一點(diǎn),我們不能復(fù)制一百萬(wàn)個(gè)陶哲軒,每個(gè)都給予一百萬(wàn)美元的推理算力,讓他們各自做 100 年的主觀時(shí)間研究。

但一旦 AI 達(dá)到了陶哲軒的水平,它們就能做到這些。即使它們達(dá)到的是中間水平,也能做到中間版本的事情。所以我們現(xiàn)在應(yīng)該看空的理由,恰恰是我們應(yīng)該格外看多的理由,甚至不需要等它們達(dá)到超人智能,只需要它們達(dá)到人類水平智能就行了,因?yàn)樗鼈兊娜祟愃街悄茉谫|(zhì)量上比我們的人類水平智能更寬、更強(qiáng)大。

陶哲軒:我同意。AI 擅長(zhǎng)廣度,人類擅長(zhǎng)深度。至少人類專家如此。它們是非常互補(bǔ)的。但我們目前做數(shù)學(xué)和科學(xué)的方式偏重深度,因?yàn)槿祟惖膶iL(zhǎng)在那里,人類做不了廣度。那么問題是:我們是否設(shè)計(jì)出了足夠科學(xué)的做法來充分利用我們現(xiàn)在擁有的這種廣度能力?

正如我所說,我們應(yīng)該投入更多精力來創(chuàng)建非常廣泛的問題類別去攻克,而不只是一兩個(gè)非常深的重要問題。當(dāng)然我們?nèi)匀粦?yīng)該保留那些深層的重要問題,人類應(yīng)該繼續(xù)研究它們。但現(xiàn)在我們有了另一種做科學(xué)的方式:我們可以先讓這些具有廣泛中等能力的 AI 去勘探、清理某個(gè)全新的科學(xué)領(lǐng)域,做出所有簡(jiǎn)單的觀察,然后識(shí)別出某些困難的“孤島”,讓人類專家來處理。我看到的是一個(gè)非;パa(bǔ)的科學(xué)未來。

最終你會(huì)希望同時(shí)擁有廣度和深度,兩全其美。但我認(rèn)為我們?cè)趶V度方面還需要練習(xí)。它太新了。我們甚至還沒有真正建立起充分利用它的范式。但終究會(huì)建立起來的。到那時(shí)候,科學(xué)將面目全非。

Patel:說到互補(bǔ)性,程序員已經(jīng)注意到這些 AI 工具大大提高了他們的生產(chǎn)力。你作為數(shù)學(xué)家是否有同樣的感受?不過,”vibe coding“和”vibe researching“之間似乎有一個(gè)很大的區(qū)別:對(duì)于軟件來說,這個(gè)東西的全部意義在于對(duì)世界產(chǎn)生某種效果。如果 AI 幫你更好地理解了問題或者想出了一個(gè)干凈的抽象來體現(xiàn)在代碼中,那只是通向最終目標(biāo)的工具。

而對(duì)于研究來說,我們關(guān)心解決千禧年大獎(jiǎng)問題,大概是因?yàn)樵诮鉀Q它們的過程中,我們會(huì)發(fā)現(xiàn)新的數(shù)學(xué)對(duì)象或新的技術(shù),推進(jìn)我們文明對(duì)數(shù)學(xué)的理解。所以證明本身是通向中間過程的工具,中間過程才是最重要的。你是否同意這個(gè)二分法?

陶哲軒:對(duì),在數(shù)學(xué)中過程往往比問題本身更重要。問題有點(diǎn)像衡量進(jìn)步的代理指標(biāo)。

即使在軟件領(lǐng)域我覺得也有不同類型的任務(wù)。如果你只是創(chuàng)建一個(gè)跟其他一千個(gè)網(wǎng)頁(yè)做同樣事情的網(wǎng)頁(yè),確實(shí)沒什么需要學(xué)習(xí)的。對(duì)于那種樣板代碼,肯定可以交給 AI。但有時(shí)候你做完了原型,開始維護(hù)它,在升級(jí)和兼容方面遇到問題。我聽說程序員反映,即使 AI 能創(chuàng)建第一個(gè)原型,但讓它與其他一切協(xié)調(diào)配合、以你期望的方式與現(xiàn)實(shí)世界互動(dòng),這是一個(gè)持續(xù)的過程。

如果你在編寫代碼的過程中沒有積累技能,后續(xù)維護(hù)可能會(huì)受影響。數(shù)學(xué)家同樣如此。我們用問題來建立直覺,訓(xùn)練人們對(duì)什么是對(duì)的、什么是可以預(yù)期的、什么是可證明的、什么是困難的形成判斷。所以直接得到答案可能反而會(huì)抑制這個(gè)過程。

我之前提過理論和實(shí)驗(yàn)的區(qū)分。在大多數(shù)科學(xué)中,理論和實(shí)驗(yàn)有大致對(duì)等的分量。但數(shù)學(xué)幾乎是獨(dú)一無(wú)二的,它幾乎完全是理論性的。我們非常重視嘗試建立連貫、整潔的理論來解釋事物為什么為真或?yàn)榧。我們(cè)趯?shí)驗(yàn)方面做得不多,比如,也許有兩種不同的方法來解決一個(gè)問題,哪一種更有效?我們有一些直覺但沒有做過大規(guī)模研究,沒有拿 1000 個(gè)問題來測(cè)試。但現(xiàn)在我們可以做了。我認(rèn)為 AI 類工具確實(shí)會(huì)革新數(shù)學(xué)的實(shí)驗(yàn)方面。

你不那么在意單個(gè)問題和解決它的過程,而是想要收集大規(guī)模數(shù)據(jù),了解什么方法管用、什么不管用。就像一個(gè)軟件公司想要部署 1000 個(gè)軟件,你不會(huì)想手工打磨每一個(gè)的經(jīng)驗(yàn)教訓(xùn),你只想找到可以規(guī)模化的工作流程。我們?cè)凇按笠?guī)模做數(shù)學(xué)”這件事上還處于萌芽階段,但那正是 AI 將真正革新這個(gè)學(xué)科的地方。

Patel:我覺得這些關(guān)于 AI 對(duì)科學(xué)有多大幫助的討論中,一個(gè)關(guān)鍵分歧是:如果你把每一種已知技術(shù)應(yīng)用到每一個(gè)未解決的問題上,那會(huì)不會(huì)就構(gòu)成我們文明知識(shí)的一次巨大提升?還是說那并不會(huì)那么令人印象深刻?

陶哲軒:這是一個(gè)好問題,我們還沒有足夠的數(shù)據(jù)來完全回答。人類數(shù)學(xué)家做的很多工作確實(shí)是這樣的:拿到一個(gè)新問題,首先去看所有在類似問題上曾經(jīng)管用的標(biāo)準(zhǔn)方法,一個(gè)一個(gè)試。有時(shí)候就成功了。這仍然值得發(fā)表,因?yàn)閱栴}本身很重要。有時(shí)候差一點(diǎn)就成功,你需要再加一個(gè)小技巧,那也很有趣。但頂級(jí)期刊發(fā)表的論文通常是那些現(xiàn)有方法能解決 80% 的問題,但剩下的 20% 具有抗性,需要發(fā)明新技術(shù)來填補(bǔ)缺口的工作。

現(xiàn)在已經(jīng)非常罕見了,完全不依賴已有文獻(xiàn)、所有想法憑空而來的解題。這在過去更常見,但數(shù)學(xué)現(xiàn)在太成熟了,不利用已有文獻(xiàn)是一個(gè)巨大的劣勢(shì)。

AI 工具在第一部分做得越來越好,就是在一個(gè)問題上嘗試所有標(biāo)準(zhǔn)技術(shù)。實(shí)際上它們犯的錯(cuò)誤有時(shí)比人類還少。雖然仍然會(huì)犯錯(cuò),我測(cè)試過這些工具,在一些我能做的小任務(wù)上,有時(shí)候它們發(fā)現(xiàn)了我的錯(cuò)誤,有時(shí)候我發(fā)現(xiàn)了它們的錯(cuò)誤。目前大致是平手。但我還沒看到它們邁出下一步。當(dāng)論證中出現(xiàn)漏洞、沒有已知技術(shù)能填上時(shí),它們能提出一些隨機(jī)建議。但我發(fā)現(xiàn)試圖追蹤這些建議、讓它們成立,然后發(fā)現(xiàn)行不通,往往浪費(fèi)的時(shí)間比節(jié)省的更多。

我認(rèn)為有一部分我們目前認(rèn)為很難的問題會(huì)被這種方法攻破,尤其是那些沒有受到足夠關(guān)注的問題。就像 Erd?s 問題一樣,被 AI 解決的那 50 道問題幾乎全部是之前基本沒有什么文獻(xiàn)的。也許有人偶然試過做不出來,但從來沒有真正深入研究過。但結(jié)果證明存在一個(gè)解,也許是把某個(gè)不太知名的技術(shù)和文獻(xiàn)中的另一個(gè)結(jié)果組合在一起。這是 AI 目前能達(dá)到的中位水平。清理了 50 道問題,這很了不起。

如果你只看那些在社交媒體上被廣播的成功案例,那看起來確實(shí)驚人。幾十年沒解決的問題現(xiàn)在紛紛被攻克。但每次我們做系統(tǒng)性研究時(shí),對(duì)于任何給定的問題,AI 工具的成功率大約只有 1% 到 2%。只是因?yàn)樗鼈兛梢源笠?guī)模投入,你只挑贏家出來看的話,效果確實(shí)很亮眼。

同樣的事情也會(huì)發(fā)生在那些真正有聲望的困難數(shù)學(xué)問題上。有上百個(gè)這樣的問題。也許有那么幾個(gè),某個(gè) AI 會(huì)碰巧解決它們,因?yàn)橛心硞(gè)后門式的解法是所有人都錯(cuò)過的。這會(huì)引起很大的關(guān)注。但然后人們會(huì)把這些工具用在自己最喜歡的問題上,他們將體驗(yàn)到 1% 的成功率。所以信號(hào)中會(huì)有很多噪聲。

越來越重要的是收集真正標(biāo)準(zhǔn)化的數(shù)據(jù)集,F(xiàn)在有一些努力在創(chuàng)建標(biāo)準(zhǔn)化的 AI 挑戰(zhàn)問題集,而不是只依賴 AI 公司只公布他們的勝利、不披露失敗的結(jié)果。這會(huì)讓我們更清楚地了解我們實(shí)際上處在什么位置。

Patel:但我覺得值得強(qiáng)調(diào)的是,光是模型能夠應(yīng)用某種沒有人寫下來可以用于這個(gè)特定問題的技術(shù),這本身就已經(jīng)是巨大的 AI 進(jìn)步了。

陶哲軒:這種進(jìn)步讓人又驚嘆又失望,感覺很奇怪。但人們也適應(yīng)得非?臁N矣浀么蠹s 20 年前 Google 搜索出來的時(shí)候,它把其他所有搜索引擎都比下去了。你在第一頁(yè)就能得到精確的相關(guān)結(jié)果,幾乎恰好是你想要的。當(dāng)時(shí)覺得太神奇了。然后幾年后你就覺得能 Google 任何東西是理所當(dāng)然的了,F(xiàn)在也一樣,2026 年的 AI 水平放在 2021 年會(huì)令人震驚。人臉識(shí)別、自然語(yǔ)音、大學(xué)水平的數(shù)學(xué)題,我們現(xiàn)在都覺得理所當(dāng)然了。

Patel:說到 2026 年,你在 2023 年做過一個(gè)預(yù)測(cè)……

陶哲軒:說 AI 到 2026 年將是數(shù)學(xué)中“值得信賴的合著者,如果使用得當(dāng)?shù)脑挕薄?/p>

Patel:回頭看這個(gè)預(yù)測(cè)相當(dāng)準(zhǔn)確。

陶哲軒:是的,我挺滿意的。

Patel:那我們看看能不能保持這個(gè)勢(shì)頭。你個(gè)人因?yàn)?AI 而生產(chǎn)力翻倍,你覺得那會(huì)是哪一年?

陶哲軒:生產(chǎn)力不完全是一個(gè)一維的量。我確實(shí)注意到我做數(shù)學(xué)的方式正在發(fā)生相當(dāng)大的變化,包括我做的事情的類型。比如,我的論文現(xiàn)在有更多的代碼和圖片,因?yàn)樯蛇@些東西現(xiàn)在太容易了。以前要花幾個(gè)小時(shí)做的圖,現(xiàn)在幾分鐘就能完成。但在過去我根本不會(huì)在論文里放那張圖,我會(huì)用文字描述。所以很難衡“2 倍”意味著什么。

一方面,如果我必須在沒有 AI 系統(tǒng)的情況下寫我今天寫的那類論文,肯定會(huì)花五倍的時(shí)間。但我不會(huì)用那種方式寫論文。

Patel:五倍?

陶哲軒:對(duì),但那是因?yàn)檫@些是輔助性的東西。比如更深入的文獻(xiàn)檢索、提供更多的數(shù)值計(jì)算。它們豐富了論文。

核心工作,比如實(shí)際解決一個(gè)數(shù)學(xué)問題中最困難的部分,這方面變化不大,仍然需要紙和筆。但有很多其他事情,我現(xiàn)在用 AI Agent 來重新格式化,比如有時(shí)候我的括號(hào)大小不太對(duì),以前我得手動(dòng)在腦子里改,現(xiàn)在可以讓 AI Agent 在后臺(tái)漂亮地處理。所以它們確實(shí)大大加速了很多輔助任務(wù)。它們還沒有加速我所做的核心工作,但讓我能在論文中添加更多東西。

反過來說,如果我要重新寫一篇 2020 年的論文,不加那些額外功能,只是達(dá)到同樣的基本水平的話,AI 其實(shí)也沒有加速多少。所以它讓論文變得更豐富、更寬廣了,但不一定更深。

Patel:你提出了“人工聰明”(artificial cleverness)和“人工智能”(artificial intelligence)的區(qū)分,我想更好地理解這兩個(gè)概念。什么是不僅僅是聰明的智能?

陶哲軒:智能出了名地難以定義。你看到的時(shí)候就知道了。當(dāng)我和別人合作解決一個(gè)數(shù)學(xué)問題時(shí),有一種對(duì)話:我們都不知道怎么解決,但其中一個(gè)人有了某個(gè)想法,看起來有希望。然后我們有了一個(gè)原型策略,去測(cè)試它,發(fā)現(xiàn)不行,但可以修改。想法會(huì)不斷被調(diào)整和改進(jìn)。到最后,我們系統(tǒng)地摸清了什么行不通、什么行得通。

AI 有點(diǎn)能模仿這一點(diǎn);氐教S機(jī)器人的比方,它們可以跳上去、失敗、跳上去、失敗,反復(fù)如此。但它們做不到的是:跳了一點(diǎn),抓住了某個(gè)著力點(diǎn),然后在那里停下來,把其他人拉上來,然后從那個(gè)新位置繼續(xù)跳。不存在這種累積過程。在交互中用它們的時(shí)候,感覺更多還是反復(fù)試錯(cuò)和暴力窮舉。這在某些場(chǎng)景下確實(shí)可以靠規(guī)模取勝,效果也很驚人。但從部分進(jìn)展中一步步積累推進(jìn),這一點(diǎn)目前還差得遠(yuǎn)。

Patel:有意思。你是說如果 Gemini 或者 Claude 解決了一個(gè)問題,它自己對(duì)數(shù)學(xué)的理解并沒有進(jìn)步?即使它在一個(gè)問題上工作但沒有解決,它自己的理解也沒有進(jìn)步?

陶哲軒:對(duì),新的會(huì)話就忘記了之前做過什么。它沒有新的技能可以依賴來解決相關(guān)問題。也許它剛才做的東西會(huì)成為下一代模型訓(xùn)練數(shù)據(jù)的 0.001%,所以最終可能有一些被吸收。但基本上是這樣。

Patel:有一個(gè)大問題是:如果我們持續(xù)訓(xùn)練 AI 讓它越來越擅長(zhǎng)在 Lean(一種形式化證明語(yǔ)言)中解題,它們會(huì)繼續(xù)解決越來越令人印象深刻的問題嗎?然后回頭來看,我們會(huì)不會(huì)驚訝地發(fā)現(xiàn),某個(gè) Lean 證明出來的黎曼猜想解答其實(shí)沒給我們什么洞見?你覺得解決黎曼猜想是否必然要求,即便是由完全在 Lean 中工作的 AI 來做,其中的構(gòu)造和定義也必須推進(jìn)我們對(duì)數(shù)學(xué)的理解?還是它可能只是一團(tuán)像匯編代碼一樣不可讀的東西?

陶哲軒:我們不知道。有些問題基本上就是靠純粹的暴力搜索解決的。四色定理就是一個(gè)著名的例子。我們至今沒有找到一個(gè)概念上優(yōu)雅的證明,基本上就是把問題分成了大量的情況然后對(duì)每種情況做計(jì)算機(jī)分析。也許我們永遠(yuǎn)找不到優(yōu)雅證明,有些問題可能只能通過窮舉來解決。

我們之所以特別看重黎曼猜想這樣的問題,是因?yàn)槲覀兿喈?dāng)確信必須創(chuàng)造出某種新數(shù)學(xué),或者發(fā)現(xiàn)兩個(gè)之前沒有聯(lián)系的數(shù)學(xué)領(lǐng)域之間的新聯(lián)系,才能解決它。我們甚至不知道解的形態(tài)是什么,但它不像是那種靠窮舉就能搞定的問題。當(dāng)然,黎曼猜想理論上可能是假的。有一種不太可能但存在的場(chǎng)景:假設(shè)有一個(gè)零點(diǎn)不在臨界線上,通過大量計(jì)算機(jī)計(jì)算可以驗(yàn)證。那會(huì)非常令人失望。

我確實(shí)覺得完全自主的一擊式方法不是解決這些問題的正確路徑。我認(rèn)為人類與這些工具協(xié)作會(huì)帶來更大的收益。我可以想象某個(gè)這樣的問題會(huì)被某個(gè)聰明的人類在極其強(qiáng)大的 AI 工具的輔助下解決。

但那種協(xié)作的具體形態(tài)可能與我們現(xiàn)在設(shè)想的非常不同。它可能是一種目前還不存在的協(xié)作類型。也許有一種方法可以生成黎曼 zeta 函數(shù)的一百萬(wàn)種變體并做 AI 輔助的數(shù)據(jù)分析,發(fā)現(xiàn)之前不知道的連接它們的模式,從而把問題轉(zhuǎn)入另一個(gè)數(shù)學(xué)領(lǐng)域。各種場(chǎng)景都有可能。

Patel:假設(shè) AI 解決了某個(gè)問題,而在 Lean 代碼中隱含著某個(gè)全新的構(gòu)造。如果我們意識(shí)到它的重要性,就能在很多不同的場(chǎng)景中應(yīng)用它。你怎么識(shí)別出這個(gè)構(gòu)造?這是一個(gè)也許很天真的問題,但如果 AI 做出了等價(jià)于笛卡爾那種把代數(shù)和幾何統(tǒng)一起來的坐標(biāo)系思想,在 Lean 代碼中它可能就看起來像從 R 到 R 的映射,看起來完全不起眼。

陶哲軒:在 Lean 這樣的系統(tǒng)中把證明形式化的好處恰恰在于,你可以把它的任何部分拿出來單獨(dú)研究。

我讀人類寫的論文時(shí),碰到一個(gè)解決困難問題的工作,里面往往是一長(zhǎng)串引理和定理。有些作者會(huì)告訴你哪些是重點(diǎn)、哪些不是,但也有人不會(huì)點(diǎn)明哪一步才是關(guān)鍵、哪一步只是常規(guī)操作。

不過你可以把每條引理單獨(dú)拿出來看。有些一眼就能認(rèn)出來:哦,這個(gè)很標(biāo)準(zhǔn),跟我熟悉的某個(gè)東西差不多,沒什么特別的。但另一條引理讓你覺得,這是我以前沒見過的,而且我能理解為什么有了它就能推出主要定理。也就是說,你可以判斷一個(gè)步驟到底是論證的核心還是無(wú)關(guān)緊要的。Lean 的好處恰恰在這里:它讓你可以非常精確地審視每一個(gè)單獨(dú)的步驟。

我認(rèn)為未來會(huì)出現(xiàn)一整個(gè)數(shù)學(xué)家職業(yè)群體,他們可能拿到一個(gè)巨大的 Lean 生成的證明,然后對(duì)它做某種消融測(cè)試(ablation),嘗試移除部分步驟,找到更優(yōu)雅的方式。也許其他 AI 可以做一些強(qiáng)化學(xué)習(xí)來讓證明更優(yōu)雅?也許其他 AI 可以判斷這個(gè)證明是否看起來更好。

還有一件近期會(huì)明顯變化的事:一直以來,寫論文都是整個(gè)工作中最耗時(shí)、成本最高的環(huán)節(jié),所以你不會(huì)輕易動(dòng)筆。結(jié)果通常只寫一遍,論證中的其他部分就在腦子里過一過就算了,因?yàn)橹貙懸槐、重?gòu)一遍實(shí)在太痛苦了。

但現(xiàn)在這件事借助現(xiàn)代 AI 工具變得容易多了。你不必只有一個(gè)版本的論文。一旦你有了一個(gè)版本,人們可以生成成百上千個(gè)變體。所以一個(gè)巨大的、混亂的 Lean 證明本身可能不太好理解,但其他人可以重構(gòu)它、對(duì)它做各種處理。

我們?cè)?Erd?s 問題網(wǎng)站上已經(jīng)看到了這種情況。人和 AI 會(huì)生成一個(gè)證明,然后給出 3000 行驗(yàn)證證明的代碼。但然后人們讓其他 AI 來總結(jié)這個(gè)證明,人們也會(huì)寫自己的證明。一旦你有了一個(gè)證明,后續(xù)處理實(shí)際上是有很多工具可用的。這是數(shù)學(xué)中一個(gè)非常新興的領(lǐng)域。我不太擔(dān)心那種“如果黎曼猜想被證明了但證明完全不可理解怎么辦”的問題。我覺得一旦我們有了證明這個(gè)產(chǎn)物,我們可以對(duì)它做很多分析。

Patel:你最近發(fā)了一個(gè)帖子說,擁有一種描述數(shù)學(xué)策略(而非僅僅是數(shù)學(xué)證明)的形式化或半形式化語(yǔ)言會(huì)很有幫助。Lean 專長(zhǎng)的是證明。我很想了解一下,這種描述策略的語(yǔ)言會(huì)是什么樣的。

陶哲軒:我們其實(shí)不太清楚。我們?cè)跀?shù)學(xué)中非常幸運(yùn),已經(jīng)建立了邏輯和數(shù)學(xué)的規(guī)律。但這其實(shí)是一個(gè)相當(dāng)晚近的成就。從歐幾里得幾千年前開始,一直到 20 世紀(jì)初我們才最終確立了:這些是數(shù)學(xué)的公理(我們稱之為 ZFC 公理),這些是一階邏輯的公理,這就是“證明”的含義。

這些我們已經(jīng)成功自動(dòng)化了,有了形式語(yǔ)言。但也許還有某種方式來評(píng)估命題的合理性。比如你有一個(gè)猜想說某件事為真,你測(cè)試了幾個(gè)例子都成立,這如何增加你對(duì)該猜想為真的信心?我們有一些數(shù)學(xué)方法來建模,比如貝葉斯概率。但往往你必須設(shè)定某些基礎(chǔ)假設(shè),仍然有很多主觀性。關(guān)于這些語(yǔ)言的討論,與其說是一個(gè)計(jì)劃,不如說是一個(gè)愿望。

但看看擁有像 Lean 這樣的形式框架如何大大便利了演繹證明的自動(dòng)化和 AI 訓(xùn)練,如果有一個(gè)類似的框架用于策略和猜想的生成就好了,F(xiàn)在使用 AI 來創(chuàng)建策略和提出猜想的瓶頸在于,我們必須依賴人類專家和時(shí)間檢驗(yàn)來判斷某件事是否合理。

如果有這樣一種框架,介于嚴(yán)格形式和自然語(yǔ)言之間,能讓這個(gè)過程部分自動(dòng)化,同時(shí)不容易被鉆空子(這很重要,確保形式化證明助手沒有后門或漏洞至關(guān)重要,因?yàn)閺?qiáng)化學(xué)習(xí)特別擅長(zhǎng)找到這些后門)。

科學(xué)家之間的交流有一種特殊的方式:一半是數(shù)據(jù)和論證,一半是在講故事、構(gòu)建敘事。如果能有某種框架把這種交流方式捕捉下來就好了,但科學(xué)中那些主觀的成分,我們目前還不知道怎么讓 AI 有效地介入。所以這是一個(gè)未來的問題。有一些研究在嘗試創(chuàng)建自動(dòng)化的猜想系統(tǒng),也許有辦法做基準(zhǔn)測(cè)試,但這一切都非常非常新。

Patel:能幫我建立一些直觀的感受嗎?第一,有沒有一個(gè)具體的例子,說明科學(xué)家之間交流中有哪些是我們還不能形式化的?第二,說“構(gòu)建敘事或自然語(yǔ)言解釋”同時(shí)又“將其形式化”,這聽起來幾乎在定義上就是自相矛盾的。我相信你心中有一種直覺,知道這兩者的重疊在哪里。

陶哲軒:舉一個(gè)猜想的例子。高斯(Gauss)對(duì)素?cái)?shù)很感興趣,他創(chuàng)建了最早的數(shù)學(xué)數(shù)據(jù)集之一,計(jì)算了前約 10 萬(wàn)個(gè)素?cái)?shù),希望找到規(guī)律。他確實(shí)找到了一個(gè)規(guī)律,雖然也許不是他所預(yù)期的那種。他發(fā)現(xiàn)素?cái)?shù)中有一個(gè)統(tǒng)計(jì)性的規(guī)律:如果你數(shù)到 10、100、1000、100 萬(wàn)……有多少個(gè)素?cái)?shù),素?cái)?shù)越來越稀疏,但密度的下降速率與數(shù)字范圍的自然對(duì)數(shù)成反比。

他由此猜想了我們現(xiàn)在稱為素?cái)?shù)定理的東西:不超過 x 的素?cái)?shù)個(gè)數(shù)約等于 x 除以 x 的自然對(duì)數(shù)。他完全沒有辦法證明這一點(diǎn),這是純數(shù)據(jù)驅(qū)動(dòng)的。這在當(dāng)時(shí)是革命性的,因?yàn)樗赡苁菙?shù)學(xué)中第一個(gè)真正重要的統(tǒng)計(jì)性質(zhì)的猜想。

通常你說的規(guī)律,比如素?cái)?shù)之間的間隔有某種規(guī)則性。但這個(gè)猜想不能告訴你在任何給定范圍內(nèi)精確有多少個(gè)素?cái)?shù),它只給你一個(gè)近似值,而且越往外這個(gè)近似越準(zhǔn)確。但它確實(shí)很有幫助。

這開創(chuàng)了我們稱之為解析數(shù)論的領(lǐng)域。它是一長(zhǎng)串類似猜想中的第一個(gè),其中很多后來被證明了。這些猜想逐漸鞏固了一種觀念:素?cái)?shù)實(shí)際上沒有一個(gè)固定的規(guī)律,它們的行為像是隨機(jī)的數(shù)集,只是具有某種特定密度。

我的意思是,素?cái)?shù)確實(shí)有一些規(guī)律,比如它們幾乎全是奇數(shù),它們不是真的隨機(jī)。它們是所謂的“偽隨機(jī)”,生成素?cái)?shù)不涉及隨機(jī)數(shù)生成器。但隨著時(shí)間推移,把素?cái)?shù)當(dāng)成仿佛是上帝不斷擲骰子生成的隨機(jī)集合來思考,變得越來越富有成效。這讓我們能做出各種其他預(yù)測(cè)。

比如孿生素?cái)?shù)猜想:應(yīng)該存在無(wú)窮多對(duì)只差 2 的素?cái)?shù)對(duì),像 11 和 13。我們無(wú)法證明它,而且有很好的理由說明為什么目前無(wú)法證明。但因?yàn)樗財(cái)?shù)的這種統(tǒng)計(jì)隨機(jī)模型,我們絕對(duì)確信它是對(duì)的。我們知道如果素?cái)?shù)是通過拋硬幣生成的,那么就像無(wú)窮多只猴子在打字機(jī)上打字一樣,我們會(huì)看到孿生素?cái)?shù)不斷出現(xiàn)。

我們隨著時(shí)間發(fā)展出了一個(gè)非常精確的概念模型,描述素?cái)?shù)應(yīng)該如何表現(xiàn),基于統(tǒng)計(jì)和概率。但這大部分是啟發(fā)式的、非嚴(yán)格的,卻極其準(zhǔn)確。那些少數(shù)我們確實(shí)能證明的關(guān)于素?cái)?shù)的事實(shí),都與我們所說的“素?cái)?shù)的隨機(jī)模型”的預(yù)測(cè)相吻合。所以我們有了這個(gè)猜想性的概念框架來理解素?cái)?shù),所有人都相信它。

這也是我們相信黎曼猜想為真的原因,是我們相信基于素?cái)?shù)的密碼學(xué)在數(shù)學(xué)上基本安全的原因。這些都是這個(gè)信念體系的一部分。

我們關(guān)心黎曼猜想的一個(gè)原因是:如果黎曼猜想被推翻了,如果它是假的,那將嚴(yán)重打擊這個(gè)模型。這意味著素?cái)?shù)中存在某種我們不知道的秘密規(guī)律。我認(rèn)為我們會(huì)非常迅速地放棄所有基于素?cái)?shù)的密碼學(xué)。因?yàn)槿绻幸粋(gè)我們不知道的規(guī)律,那可能還有更多。而這些規(guī)律可能導(dǎo)致密碼學(xué)漏洞。這將是一個(gè)巨大的沖擊。所以我們真的想確保這不會(huì)發(fā)生。

我們之所以逐漸被黎曼猜想之類的命題說服,部分是實(shí)驗(yàn)證據(jù),部分是少數(shù)情況下我們能夠做出的理論結(jié)果確實(shí)與預(yù)測(cè)吻合。

當(dāng)然,共識(shí)也有可能是錯(cuò)的,也許我們都遺漏了什么非;镜臇|西?茖W(xué)史上曾經(jīng)有過范式轉(zhuǎn)換。但我們目前沒有一種方法來衡量這些事情,部分原因是我們對(duì)數(shù)學(xué)和科學(xué)如何發(fā)展缺乏足夠的數(shù)據(jù)。我們只有一條歷史時(shí)間線,大約一百個(gè)轉(zhuǎn)折點(diǎn)的故事。

如果我們能接觸到一百萬(wàn)個(gè)外星文明,每個(gè)都有不同的科學(xué)發(fā)展順序和歷史,那也許我們就能真正對(duì)“如何衡量什么是進(jìn)步、什么是好策略”形成理解,也許可以開始形式化并建立框架。

也許我們需要做的是創(chuàng)建很多“迷你宇宙”,讓 AI 在非常基礎(chǔ)的問題(比如算術(shù)之類)上進(jìn)行模擬,讓它們自己發(fā)展出策略來解決這些問題,用這些小實(shí)驗(yàn)室來測(cè)試。有人在研究類似的東西,比如能做十位數(shù)乘法的最小神經(jīng)網(wǎng)絡(luò)之類的。我覺得我們確實(shí)可以從讓小型 AI 在簡(jiǎn)單問題上進(jìn)化中學(xué)到很多。

Patel:你需要快速學(xué)習(xí)新領(lǐng)域,而且要學(xué)得足夠深才能貢獻(xiàn)到前沿。從某種意義上說,你也是世界上最偉大的自學(xué)者之一。你學(xué)習(xí)新領(lǐng)域的過程是什么樣的?

陶哲軒:我們之前談到了深度和廣度的區(qū)分,這不純粹是人類與 AI 的區(qū)分。人類中也有這種分化。我記得有人把人分為刺猬和狐貍。刺猬對(duì)一件事知道得非常非常深,狐貍對(duì)很多事情都知道一點(diǎn)點(diǎn)。我肯定是狐貍型的。我經(jīng)常和刺猬合作,有時(shí)候我自己也可以充當(dāng)刺猬,但本質(zhì)上我是狐貍。

我一直有點(diǎn)強(qiáng)迫癥的傾向。如果我讀到某個(gè)東西,覺得自己應(yīng)該能理解但就是不明白為什么它管用,里面有某種魔法,比如有人使用了我不熟悉的數(shù)學(xué)方法,得到了我也想證明的結(jié)論,但我自己做不到。我就想知道他們的竅門是什么。讓我煩惱的是別人能做到我覺得我應(yīng)該能做到但做不到的事情。我一直有這種強(qiáng)迫式的完整主義傾向。

所以我不得不戒掉電子游戲,因?yàn)槲乙婚_始玩就想打通所有關(guān)卡。這就是我學(xué)習(xí)新領(lǐng)域的一種方式。

另一個(gè)方式是合作。我和很多人合作,他們教會(huì)了我其他類型的數(shù)學(xué)。我交一個(gè)在另一個(gè)數(shù)學(xué)領(lǐng)域工作的數(shù)學(xué)家朋友,覺得他們的問題很有趣,但他們需要教我一些基本的技巧、什么是已知的、什么是未知的。我從中學(xué)到了很多。

我發(fā)現(xiàn)把學(xué)到的東西寫下來很有用。我有一個(gè)博客,有時(shí)候會(huì)記錄我學(xué)到的東西。因?yàn)檫^去年輕的時(shí)候,我會(huì)學(xué)到某個(gè)東西、發(fā)現(xiàn)一個(gè)很酷的技巧然后想“我要記住這個(gè)”。結(jié)果六個(gè)月后就忘了。我記得自己曾經(jīng)理解過,但沒法重現(xiàn)論證。頭幾次經(jīng)歷這種“理解了又失去了”的挫敗感,讓我下定決心應(yīng)該把任何學(xué)到的有趣東西寫下來。博客就是這么來的。

Patel:你寫一篇博客文章需要多長(zhǎng)時(shí)間?

陶哲軒:這往往是我不想做其他工作時(shí)會(huì)做的事。比如有什么審稿報(bào)告之類的,那些在當(dāng)時(shí)讓我感覺略有壓力的任務(wù)。寫博客讓我覺得是創(chuàng)造性的、有趣的,是為自己做的事情。根據(jù)話題不同,可能半小時(shí)也可能好幾個(gè)小時(shí)。但因?yàn)樗俏易栽缸龅模瑢懙臅r(shí)候時(shí)間飛逝。相比之下,因?yàn)樾姓虿坏貌蛔龅氖虑榫褪强嗖钍铝。不過話說回來,這類苦差事現(xiàn)在 AI 確實(shí)幫了不少忙。

Patel:如果文明可以從零開始決定如何使用陶哲軒的時(shí)間,把它當(dāng)作一種有限資源,當(dāng)前的時(shí)間分配和最優(yōu)分配之間最大的差距是什么?沒準(zhǔn)就不會(huì)有這期播客。

陶哲軒:雖然我確實(shí)會(huì)抱怨一些不想做但必須做的任務(wù)(在學(xué)術(shù)界越資深,就有越多的委員會(huì)和行政職責(zé)),但我也發(fā)現(xiàn)很多我勉強(qiáng)參加的活動(dòng),因?yàn)槭俏业牧x務(wù)或者超出了我的舒適區(qū),結(jié)果反而帶來了意想不到的收獲。我會(huì)遇到我通常不會(huì)交談的人(比如你),學(xué)到有趣的東西,獲得有趣的經(jīng)歷,以及結(jié)識(shí)新朋友的機(jī)會(huì)。

所以我非常相信偶然性(serendipity)的價(jià)值。我確實(shí)會(huì)優(yōu)化我的時(shí)間,一天中有些部分安排得很仔細(xì)。但我也愿意留出一些部分做點(diǎn)不是我平時(shí)做的事。也許是浪費(fèi)時(shí)間,也許會(huì)學(xué)到什么。多數(shù)情況下,我感覺收獲了計(jì)劃之外的積極體驗(yàn)。也許有一個(gè)危險(xiǎn)因素是,在現(xiàn)代社會(huì),不只是 AI,我們也變得太擅長(zhǎng)優(yōu)化一切了。

比如新冠疫情期間,我們大量轉(zhuǎn)向遠(yuǎn)程會(huì)議。一切都有排期,我們忙碌程度差不多,至少在學(xué)術(shù)界,我們見的人和面對(duì)面時(shí)差不多多。但一切都得提前安排。我們失去的是那種在走廊上偶遇、去倒咖啡時(shí)碰到某人的隨機(jī)互動(dòng)。這些偶然的交流你可能覺得不是最優(yōu)的,但實(shí)際上非常重要。

我讀研的時(shí)候,如果要查一篇期刊論文,得親自去圖書館,借出期刊,讀那篇文章。有時(shí)候旁邊那篇文章也很有趣。你可以隨便翻翻,偶然發(fā)現(xiàn)有趣的東西,F(xiàn)在這種事基本沒有了,因?yàn)槟阆氩槭裁粗苯虞斎胨阉饕婊蛘?AI 就能立刻得到你要的,但你不會(huì)得到那些“意外發(fā)現(xiàn)”。

我曾經(jīng)在普林斯頓高等研究院待過一年。那是一個(gè)很棒的地方,沒有干擾,你就是在那里做研究。頭幾周非常好,你把積攢了很久的論文寫出來,花大塊時(shí)間思考問題。但如果待超過幾個(gè)月,我發(fā)現(xiàn)靈感會(huì)枯竭。因?yàn)槟汩_始更多地刷網(wǎng)頁(yè)。你其實(shí)確實(shí)需要生活中有一定程度的干擾,它提供了足夠的隨機(jī)性,或者說高溫度(high temperature),如果你喜歡用這個(gè)類比的話。

我不知道安排生活的最優(yōu)方式是什么。好像自然而然就行得通。

Patel:我很好奇,你預(yù)計(jì) AI 什么時(shí)候能在前沿?cái)?shù)學(xué)方面至少做得和最好的人類數(shù)學(xué)家一樣好?

陶哲軒:在某些方面它們已經(jīng)在做人類做不到的前沿?cái)?shù)學(xué)了。這是一個(gè)不同的前沿。你可以說計(jì)算器也在做人類做不了的前沿?cái)?shù)學(xué),只不過那是數(shù)字計(jì)算。

Patel:但完全取代陶哲軒呢?

陶哲軒:那還要我干什么?(笑)

Patel:去多上播客吧。(笑)

陶哲軒:可能這個(gè)問題需要修正一下,我覺得在十年之內(nèi),數(shù)學(xué)家目前在做的很多事情(占我們大部分時(shí)間的工作,我們今天寫進(jìn)論文的很多內(nèi)容)都可以由 AI 完成。但我們會(huì)發(fā)現(xiàn)那些實(shí)際上不是我們工作中最重要的部分。

100 年前,很多數(shù)學(xué)家的工作就是解微分方程。物理學(xué)家需要某個(gè)系統(tǒng)的精確解,就雇一個(gè)數(shù)學(xué)家去一步步做微積分。19 世紀(jì)數(shù)學(xué)家做的很多事情,現(xiàn)在你調(diào)用 Mathematica、Wolfram Alpha 或某個(gè)計(jì)算機(jī)代數(shù)包,或者更近期用 AI,幾分鐘就能解決。但我們繼續(xù)前進(jìn)了,轉(zhuǎn)向了不同類型的問題。

Computer 這個(gè)詞以前指的是人。以前有人專門制作對(duì)數(shù)表和計(jì)算素?cái)?shù),像高斯那樣。這些全都外包給了電子計(jì)算機(jī),但我們繼續(xù)前進(jìn)了;蚪M學(xué)也是如此,給一個(gè)生物體測(cè)序這項(xiàng)工作曾經(jīng)是一個(gè)遺傳學(xué)家的整個(gè)博士論文。現(xiàn)在花一千美元寄給測(cè)序公司就行了。但遺傳學(xué)作為學(xué)科并沒有死掉,你轉(zhuǎn)向不同的尺度了,也許研究整個(gè)生態(tài)系統(tǒng)而非單個(gè)個(gè)體。

Patel:你這個(gè)觀點(diǎn)我理解。但關(guān)于“什么時(shí)候大部分?jǐn)?shù)學(xué)進(jìn)步幾乎全是由 AI 做出的”這個(gè)問題呢?如果你聽說今年有一個(gè)千禧年大獎(jiǎng)問題被解決了,你有 95% 的把握是 AI 自主完成的,這樣的年份肯定會(huì)到來吧?

陶哲軒:也許吧。但我確實(shí)相信人類加 AI 的混合體將在數(shù)學(xué)中占據(jù)主導(dǎo)地位更長(zhǎng)時(shí)間。

這需要一些我們目前還沒有的額外突破。所以它會(huì)是隨機(jī)的。目前的 AI 在某些方面非常好,但在其他方面很差。雖然你可以加各種框架來減少錯(cuò)誤率、讓它們更好地協(xié)同工作,但我感覺我們還沒有湊齊所有的成分來真正提供一個(gè)令人滿意的、能替代所有智力任務(wù)的方案。

目前它是互補(bǔ)的,不是替代。也許新發(fā)現(xiàn)、新突破會(huì)更快地出現(xiàn),因?yàn)楫?dāng)前水平的 AI 已經(jīng)在很多方面加速了科學(xué)。也有可能通過某種方式破壞了偶然性,我們反而抑制了某些類型的進(jìn)步。在目前這個(gè)時(shí)間點(diǎn)上,什么都有可能。世界是非常、非常不可預(yù)測(cè)的。

Patel:對(duì)于考慮進(jìn)入數(shù)學(xué)領(lǐng)域或剛開始數(shù)學(xué)職業(yè)的人,你有什么建議?尤其是考慮到 AI 的進(jìn)步,他們應(yīng)該怎樣調(diào)整自己對(duì)職業(yè)的思考?

陶哲軒:我們生活在一個(gè)變革時(shí)期。如我所說,當(dāng)前特別不可預(yù)測(cè)。我們幾個(gè)世紀(jì)以來視為理所當(dāng)然的事情可能不再成立。一切的做法都會(huì)改變,不只是數(shù)學(xué)。

我覺得人們就是得接受會(huì)有很多變化。你學(xué)的一些東西可能會(huì)過時(shí)或者被徹底革新,但有些東西會(huì)保留下來。

永遠(yuǎn)要關(guān)注那些你以前做不到、但現(xiàn)在可以做的新機(jī)會(huì)。在數(shù)學(xué)領(lǐng)域,以前基本上要經(jīng)過多年教育讀完博士才能對(duì)前沿研究做出貢獻(xiàn)。但現(xiàn)在,高中生就有可能借助這些 AI 工具和 Lean 等等參與數(shù)學(xué)項(xiàng)目并做出真正的貢獻(xiàn)。將會(huì)出現(xiàn)很多非傳統(tǒng)的學(xué)習(xí)和參與機(jī)會(huì)。

心態(tài)上要足夠靈活。保持好奇,樂于嘗試。傳統(tǒng)教育在一段時(shí)間內(nèi)仍然很重要,學(xué)數(shù)學(xué)學(xué)科學(xué)的老辦法暫時(shí)還得走。但同時(shí)也應(yīng)該對(duì)非常不同的做科學(xué)的方式保持開放,其中有些方式現(xiàn)在還不存在。

這是一個(gè)令人不安的時(shí)代,但也非常令人興奮。

參考資料:

https://www.youtube.com/watch?v=Q8Fkpi18QXU

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
華山醫(yī)院候診屏現(xiàn)“照顧號(hào)”引熱議,院方:為75歲以上老人等優(yōu)待群體提供便利

華山醫(yī)院候診屏現(xiàn)“照顧號(hào)”引熱議,院方:為75歲以上老人等優(yōu)待群體提供便利

上游新聞
2026-03-26 15:33:08
4.66克變2.71克?女子用兩件金飾換“一口價(jià)”項(xiàng)鏈后克重“縮水”嚴(yán)重;金店:可補(bǔ)折舊費(fèi)換回足克

4.66克變2.71克?女子用兩件金飾換“一口價(jià)”項(xiàng)鏈后克重“縮水”嚴(yán)重;金店:可補(bǔ)折舊費(fèi)換回足克

大風(fēng)新聞
2026-03-26 19:31:03
比亞迪推出革命性可變磁通電機(jī),徹底解決電動(dòng)車高速掉電難題

比亞迪推出革命性可變磁通電機(jī),徹底解決電動(dòng)車高速掉電難題

娛樂圈的筆娛君
2026-03-26 17:21:17
唯一不含草酸的蔬菜!比薺菜、韭菜還鮮嫩,鮮嫩營(yíng)養(yǎng)正當(dāng)時(shí),好吃

唯一不含草酸的蔬菜!比薺菜、韭菜還鮮嫩,鮮嫩營(yíng)養(yǎng)正當(dāng)時(shí),好吃

阿龍美食記
2026-03-24 09:50:48
史詩(shī)級(jí)!曝1.7億“頂星”空降阿森納!兩大攻擊手遭“打包”放逐

史詩(shī)級(jí)!曝1.7億“頂星”空降阿森納!兩大攻擊手遭“打包”放逐

頭狼追球
2026-03-26 13:48:03
玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說明3個(gè)問題

玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說明3個(gè)問題

洞讀君
2026-03-04 14:30:12
裁員潮下的工程人普遍都不想找工作了!

裁員潮下的工程人普遍都不想找工作了!

黯泉
2026-03-26 18:41:24
沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國(guó)別造島

沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國(guó)別造島

云上烏托邦
2026-03-24 14:50:45
歐盟威脅越南:若中方參與了…

歐盟威脅越南:若中方參與了…

觀察者網(wǎng)
2026-03-25 15:19:16
立陶宛請(qǐng)求訪華,要當(dāng)面向中方認(rèn)錯(cuò)?中方開出條件,做不到就免談

立陶宛請(qǐng)求訪華,要當(dāng)面向中方認(rèn)錯(cuò)?中方開出條件,做不到就免談

掉了顆大白兔糖
2026-03-26 07:31:17
高速停車區(qū)衛(wèi)生間,滿地手紙無(wú)從下腳;甘肅高速回應(yīng):是個(gè)待開發(fā)停車區(qū),已打掃干凈

高速停車區(qū)衛(wèi)生間,滿地手紙無(wú)從下腳;甘肅高速回應(yīng):是個(gè)待開發(fā)停車區(qū),已打掃干凈

大風(fēng)新聞
2026-03-26 18:19:03
特朗普再次就停戰(zhàn)談判威脅伊朗

特朗普再次就停戰(zhàn)談判威脅伊朗

澎湃新聞
2026-03-26 20:24:03
暴賺144億美元!美烏沒轍,朝鮮兵工廠24小時(shí)全開,狂掃中國(guó)機(jī)床

暴賺144億美元!美烏沒轍,朝鮮兵工廠24小時(shí)全開,狂掃中國(guó)機(jī)床

知法而形
2026-03-24 15:57:37
新加坡預(yù)測(cè):印度將趕中超美!美印爭(zhēng)世界老大,中國(guó)將成新阿三

新加坡預(yù)測(cè):印度將趕中超美!美印爭(zhēng)世界老大,中國(guó)將成新阿三

荷蘭豆愛健康
2026-03-26 08:26:08
美軍合作商CEO急眼,竟狂言“終將破解并癱瘓北斗信號(hào)”

美軍合作商CEO急眼,竟狂言“終將破解并癱瘓北斗信號(hào)”

觀察者網(wǎng)
2026-03-25 14:58:54
油價(jià)調(diào)整消息:今天3月26日,全國(guó)加油站調(diào)整后92、95汽油新售價(jià)

油價(jià)調(diào)整消息:今天3月26日,全國(guó)加油站調(diào)整后92、95汽油新售價(jià)

沙雕小琳琳
2026-03-26 10:31:28
47年毛主席深陷生死絕境,許光達(dá)晝夜奔襲,血戰(zhàn)一天挽救中央機(jī)關(guān)

47年毛主席深陷生死絕境,許光達(dá)晝夜奔襲,血戰(zhàn)一天挽救中央機(jī)關(guān)

山月明史
2026-03-22 19:03:08
黃仁勛呼吁所有人使用AI提升自己:大學(xué)生畢業(yè)時(shí)都要成AI專家

黃仁勛呼吁所有人使用AI提升自己:大學(xué)生畢業(yè)時(shí)都要成AI專家

快科技
2026-03-24 22:46:04
美伊談崩內(nèi)幕:伊萬(wàn)卡是“肉票”,特朗普女婿是“以色列內(nèi)線”?

美伊談崩內(nèi)幕:伊萬(wàn)卡是“肉票”,特朗普女婿是“以色列內(nèi)線”?

矚望云霄
2026-03-25 18:20:59
全國(guó)最大比亞迪中心落地常州,預(yù)計(jì)今年5月中旬正式運(yùn)營(yíng)

全國(guó)最大比亞迪中心落地常州,預(yù)計(jì)今年5月中旬正式運(yùn)營(yíng)

財(cái)聞
2026-03-26 12:53:13
2026-03-26 21:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16491文章數(shù) 514797關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
數(shù)碼
健康
房產(chǎn)
公開課

教育要聞

來上課了——高考閱讀難題大綜合(細(xì)節(jié)+主旨+含義)(下)第1段

數(shù)碼要聞

小米Book Pro 14超薄設(shè)計(jì)引爆市場(chǎng)!這家國(guó)產(chǎn)廠商立功了

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補(bǔ)償方案出爐!

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版