国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

馬丁·海勒(Martin Hairer)教授近期接受《紐約時報》采訪分享他對數(shù)學(xué)和AI人工智能的見解

0
分享至

置頂zzllrr小樂公眾號(主頁右上角)數(shù)學(xué)科普不迷路!

EPFL(洛桑聯(lián)邦理工學(xué)院)很高興與大家分享近期《紐約時報》于2026年2月7日刊登的對其主任馬丁·海勒教授的專訪 。在這次內(nèi)容廣泛的對話中,海勒教授反思了人工智能與數(shù)學(xué)研究之間不斷演變的關(guān)系,探討了人工智能在解決深奧的數(shù)學(xué)問題方面能夠做什么,以及不能做什么。

作為菲爾茲獎得主,他結(jié)合自身經(jīng)驗,深入剖析了當(dāng)今的前沿實驗、現(xiàn)有人工智能系統(tǒng)在證明原創(chuàng)性結(jié)論方面的局限性,以及人類創(chuàng)造力在數(shù)學(xué)領(lǐng)域經(jīng)久不衰的作用。此次訪談為我們提供了一個富有洞見的視角,讓我們得以了解人工智能如何重塑數(shù)學(xué)研究,同時也重申了嚴謹數(shù)學(xué)思維的基礎(chǔ)性重要性。

作者:EPFL洛桑聯(lián)邦理工學(xué)院官網(wǎng) & Siobhan Roberts(紐約時報記者)2026-2-11

譯者:zzllrr小樂(數(shù)學(xué)科普公眾號)2026-2-12

《紐約時報》原文標題——對話:這群數(shù)學(xué)家正在測試 AI人工智能

大語言模型難以解決研究級別的數(shù)學(xué)問題。要判斷它們到底有多差,還得靠人類。

馬丁?海勒身著深綠色高領(lǐng)毛衣,在寫滿公式與圖表的黑板前留影。


馬丁?海勒(Martin Hairer),瑞士洛桑聯(lián)邦理工學(xué)院數(shù)學(xué)家。他同時在該校與倫敦帝國理工學(xué)院任職。

圖片版權(quán):Aurelien Bergot,《紐約時報》


文 / 西沃恩?羅伯茨(Siobhan Roberts)發(fā)表于2026年2月7日

更新于2026年2月10日

幾周前,一名高中生給以驚人創(chuàng)造力聞名的數(shù)學(xué)家馬丁?海勒(Martin Hairer)發(fā)了一封郵件。這名少年立志成為數(shù)學(xué)家,但隨著AI人工智能的崛起,他開始產(chǎn)生懷疑?!昂茈y理解到底發(fā)生了什么,” 他寫道,“感覺這些模型每天都在進步,用不了多久,我們就會變得毫無用處?!?/p>

他問道:“如果有一臺機器在解題上遠比我們厲害,數(shù)學(xué)難道不會失去一部分魔力嗎?”

海勒博士于 2014 年獲得數(shù)學(xué)界最高榮譽菲爾茲獎(Fields Medal),并于 2021 年獲得獎金豐厚的科學(xué)突破獎(Breakthrough Prize)。他同時任職于瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)與倫敦帝國理工學(xué)院(Imperial College London)。在回復(fù)這名學(xué)生時,他指出,很多領(lǐng)域都在面對 AI 帶來的 “被淘汰” 焦慮。

“我相信數(shù)學(xué)其實相當(dāng)‘安全’?!?海勒博士說。他提到,大語言模型(LLM)—— 也就是聊天機器人的核心技術(shù) —— 現(xiàn)在確實很擅長解決人為設(shè)計出來的題目。但他表示:“我還沒見過任何一個可信的例子,能證明 LLM 提出了真正全新的想法和(或)概念?!?/p>

海勒博士在談?wù)撘黄}為

First Proof
(首輪驗證)的新論文 https://arxiv.org/abs/2602.05192 時,提到了這段對話。這篇論文由他與多位數(shù)學(xué)家合著,包括:斯坦福大學(xué)的穆罕默德?阿布扎伊德(Mohammed Abouzaid)、哈佛大學(xué)的勞倫?威廉姆斯(Lauren Williams)、運營舊金山灣區(qū)咨詢公司 MathSci.ai 的 塔瑪拉?科爾達(Tamara Kolda)。

這篇論文介紹了一項剛剛啟動的實驗:收集來自作者未發(fā)表研究的真實測試題,旨在為 AI 的數(shù)學(xué)能力提供一次有實際意義的衡量。

作者們希望,這項研究能為 “AI 已‘攻克’數(shù)學(xué)領(lǐng)域” 這類常常過于夸張的敘事增添更細致的視角,并減輕炒作帶來的后果 —— 比如嚇走下一代學(xué)生、讓科研資助者卻步。

“盡管商用 AI 系統(tǒng)無疑已經(jīng)達到了可以成為數(shù)學(xué)家有用工具的水平,” 作者們寫道,“但在沒有專家介入的情況下,AI 系統(tǒng)獨立解決研究級數(shù)學(xué)問題的能力究竟如何,目前仍不明確?!?/p>

AI 公司使用一些數(shù)學(xué)家口中 “人為編造” 或 “限制條件過多” 的題目,來評估和評測 LLM 在無人輔助下的表現(xiàn) 【https://epoch.ai/frontiermath 詳情參閱 】。有時,他們會邀請數(shù)學(xué)家出題,每題報酬約 5000 美元。(First Proof 項目的所有作者均與 AI 公司無任何關(guān)聯(lián)。)

去年4月,2017 年數(shù)學(xué)新視野獎(New Horizons in Mathematics Prize) 得主阿布扎伊德博士拒絕了這樣一份邀請。

“我認為應(yīng)該有一項更廣泛、獨立且公開的行動?!?他說。他補充道,F(xiàn)irst Proof 項目就是第一輪嘗試。

“目標是對 AI 的研究能力做出客觀評估?!?近期獲得古根海姆學(xué)者與麥克阿瑟學(xué)者稱號的勞倫?威廉姆斯(Lauren Williams)博士說。

勞倫?威廉姆斯身著深紅色高領(lǐng)毛衣,在哈佛大學(xué)一棟建筑的欄桿旁留影。


哈佛大學(xué)的勞倫?威廉姆斯。

圖片版權(quán):露西?盧(Lucy Lu),《紐約時報》

在這項實驗中,來自不同數(shù)學(xué)領(lǐng)域的作者們,每人貢獻了一道來自自己正在進行但尚未發(fā)表的研究的測試題。他們也確定了答案;這些解答已在線加密,將于2月13日公布 https://1stproof.org 。

“我們的目標是理解邊界 ——AI 究竟能在多大程度上超越它的訓(xùn)練數(shù)據(jù)和在網(wǎng)上找到的現(xiàn)有解法?” 科爾達博士說。她是少數(shù)當(dāng)選美國國家工程院院士的數(shù)學(xué)家之一。

研究團隊對 OpenAI 的 ChatGPT?5.2 Pro 與谷歌的 Gemini 3.0 Deep Think 進行了初步測試。作者寫道,在僅給一次作答機會的情況下,“目前公開可用的最佳 AI 系統(tǒng)在回答我們的許多問題時都十分吃力?!?/p>

論文引言對標題做出了解釋:“在烘焙中,首輪發(fā)酵(first proof首次醒發(fā))是關(guān)鍵步驟:將整團面團作為一個整體發(fā)酵,之后再分割、塑形為面包?!?在發(fā)布第一批測試題后,團隊邀請數(shù)學(xué)界共同探索。幾個月后,在意見與思路 “發(fā)酵” 之后,將開展第二輪更結(jié)構(gòu)化的評測,使用全新一批題目。

團隊趕在歐拉日(Euler Day)——2月7日,星期六 —— 發(fā)布了 First Proof 論文。該節(jié)日以 18 世紀瑞士數(shù)學(xué)家萊昂哈德?歐拉(Leonhard Euler) 命名。日期對應(yīng)歐拉數(shù),一個像圓周率 π 一樣用途廣泛的數(shù)學(xué)常數(shù),約等于 2.71828……,記為 e。神經(jīng)網(wǎng)絡(luò) AI 系統(tǒng)的訓(xùn)練,基于歐拉為求解常微分方程所發(fā)現(xiàn)的方法,即歐拉法(Euler’s method)。

以下對話通過視頻會議與郵件進行,經(jīng)精簡與編輯以便清晰閱讀。

問:First Proof 方法與其他評測工作相比,新穎之處在哪?

穆罕默德?阿布扎伊德(Mohammed Abouzaid):最主要的新穎點是,我們的測試題真正取自我們自己的研究—— 從我們關(guān)心的問題出發(fā)。在這個范圍內(nèi),我們嘗試設(shè)計可以被測試的問題。

問:什么樣的問題適合用來測試?

當(dāng)前的 AI 系統(tǒng)有一些公認的局限。比如,它們在視覺推理上出了名地差,所以我們避開了這類問題;如果我們的目標是刻意刁難,就會出帶圖的題。

而且,公司會限制模型單次回復(fù)的長度,因為超過一定長度后答案質(zhì)量會下降,所以我們確保避免答案需要超過五頁篇幅的問題。

問:論文謹慎地澄清了 “什么是數(shù)學(xué)研究”。它到底是什么?

阿布扎伊德:在現(xiàn)代研究中,關(guān)鍵一步往往是識別出核心驅(qū)動問題,以及應(yīng)該從什么方向去處理這個問題。這涉及各種前期工作,而數(shù)學(xué)創(chuàng)造力就體現(xiàn)在這里。

一旦問題被解決,數(shù)學(xué)家往往會根據(jù)由此引出的新問題,來評價研究貢獻的重要性。有時,以某種方式解決一個猜想反而會令人失望,因為它堵死了產(chǎn)生新研究問題的可能。

穆罕默德?阿布扎伊德身著夾克襯衫,未系領(lǐng)帶,在戶外條板墻前留影。


斯坦福大學(xué)的穆罕默德?阿布扎伊德(Mohammed Abouzaid)

圖片版權(quán):卡羅琳?方(Carolyn Fong),《紐約時報》

勞倫?威廉姆斯(Lauren Williams):我打個不太嚴謹?shù)谋确?。在實驗科學(xué)里,我可以把研究分成三部分:一、提出重大問題,希望其研究能照亮我們的領(lǐng)域;二、設(shè)計實驗來回答這個問題;三、執(zhí)行實驗并分析結(jié)果。

我可以類似地把數(shù)學(xué)研究分成對應(yīng)的三部分:一、提出重大問題,希望其研究能引領(lǐng)我們的領(lǐng)域;二、構(gòu)建求解框架,把大問題拆成更小、更容易處理的問題 —— 就像我們的測試題;三、找到這些小問題的解,并證明其正確性。

這三部分都必不可少。在 First Proof 項目中,我們聚焦第三部分,因為它最容易被量化。我們可以用小而定義清晰的問題去詢問 AI 模型,然后判斷答案是否正確。如果讓 AI 提出大問題或構(gòu)建框架,評估其表現(xiàn)會難得多。

問:AI 系統(tǒng)在 “首輪驗證” (First Proof)評測中表現(xiàn)如何?

威廉姆斯:針對我的問題,有一次測試出現(xiàn)了一連串有趣的回復(fù)。模型會給出一個答案,然后說 “好了,這就是最終解”。接著又說 “等等,停一下,這個情況呢?” 然后以某種方式修改答案。如此反復(fù):“好了,最終解。等等,這里有個坑!” 它陷入了無限循環(huán)。

還有一次回答,解的是一道高度相關(guān)但并不相同的題。

塔瑪拉?科爾達(Tamara Kolda):我的初步結(jié)果令人失望:AI 完全搞不懂問題,在答案的某些部分忽略關(guān)鍵信息,而且邏輯根本不連貫。我后來修改了問題表述,加了更明確的說明,試圖給 AI 更好的機會。最終結(jié)果如何,我們拭目以待。

馬丁?海勒(Martin Hairer):我整體注意到一點:模型傾向于在簡單的地方鋪陳大量細節(jié),你會心想:“行吧,快點,這些我聽膩了?!倍搅苏撟C的關(guān)鍵部分,它又說得極少。

有時就像在讀一篇差勁本科生寫的論文:他們大概知道起點在哪,也知道要去哪,但真的不知道怎么過去。于是東拉西扯,到某個點直接塞一句 “因此”,然后祈禱正確。

問:聽起來就是典型的 “糊弄式論證”—— 缺乏嚴謹,跳過復(fù)雜環(huán)節(jié)。

海勒:對,它特別擅長給出這種糊弄式的答案。

問:所以你并不 impressed(被打動)?

海勒:不,我不會這么說。有些時候我其實相當(dāng) impressed—— 比如,它能把一堆已知論證串起來,中間夾雜一些計算,而且做得相當(dāng)正確。這方面它確實很厲害。

問:在你理想的世界里,AI 能為你做什么?

海勒:目前 LLM 的輸出很難讓人信任。它們表現(xiàn)得無比自信,但你要花很大力氣才能確認答案到底對不對;我覺得這在智力上很折磨人。

再說一次,這就像面對一個研究生,你說不清他是真的強,還是只是很會胡說八道。理想的模型應(yīng)該是可以信任的。

科爾達:AI 被吹得像同事或合作者,但我并不覺得是真的。我的人類同事有各自獨特的視角,我尤其喜歡和他們辯論不同觀點。而 AI 只有我讓它有的觀點,這一點意思都沒有!

我越來越擔(dān)心的一點是,AI 可能會無意中減慢科學(xué)進步。理論物理學(xué)家馬克斯?普朗克有句名言常被引用:“科學(xué)是在一場場葬禮中進步的?!?我很清楚,我的觀點可能大錯特錯。但如果我的觀點被編碼進 AI 系統(tǒng)并永遠保留下去,會不會阻礙新科學(xué)思想的演進?

參考資料

https://actu.epfl.ch/news/prof-m-hairer-on-artificial-intelligence-and-mathe/

https://www.nytimes.com/2026/02/07/science/mathematics-ai-proof-hairer.html

https://arxiv.org/abs/2602.05192

https://1stproof.org

https://epoch.ai/frontiermath

https://arxiv.org/abs/2509.26076

https://arxiv.org/abs/2505.12575

小樂數(shù)學(xué)科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數(shù)學(xué)

更加

易學(xué)易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉(zhuǎn)載、投稿

查看原始文章出處

點擊zzllrr小樂

公眾號主頁

右上角

置頂加星

數(shù)學(xué)科普不迷路!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
郭藹明港姐訪談片出土自爆有後臺,胞妹神顏值震驚網(wǎng)民:個妹仲靚

郭藹明港姐訪談片出土自爆有後臺,胞妹神顏值震驚網(wǎng)民:個妹仲靚

粵睇先生
2026-03-02 23:12:50
那邊死了一個神棍,這邊火了一堆神婆神漢

那邊死了一個神棍,這邊火了一堆神婆神漢

李老逵亂擺龍門陣
2026-03-02 09:57:56
史詩級封殺!2000萬網(wǎng)紅“聽風(fēng)的蠶”徹底涼了

史詩級封殺!2000萬網(wǎng)紅“聽風(fēng)的蠶”徹底涼了

互聯(lián)網(wǎng)品牌官
2026-02-12 01:17:23
上海影院丈夫抓小三后續(xù):女主帶著丈夫和兒子,還有男小三看電影

上海影院丈夫抓小三后續(xù):女主帶著丈夫和兒子,還有男小三看電影

漢史趣聞
2026-02-28 11:58:20
曼昱究竟輸在了哪?劉國正一針見血:問題不在技術(shù),而在這3點

曼昱究竟輸在了哪?劉國正一針見血:問題不在技術(shù),而在這3點

生活新鮮市
2026-03-03 00:30:08
美軍公布最新傷亡情況

美軍公布最新傷亡情況

環(huán)球時報國際
2026-03-02 23:57:00
只要中國人敢參戰(zhàn),我將讓只靠步槍作戰(zhàn)的中國人尸橫遍野

只要中國人敢參戰(zhàn),我將讓只靠步槍作戰(zhàn)的中國人尸橫遍野

忠于法紀
2025-12-05 21:54:58
2026年,退休人員工齡滿40年,一年工齡的單價就能有2元了嗎?

2026年,退休人員工齡滿40年,一年工齡的單價就能有2元了嗎?

碎月導(dǎo)師
2026-03-02 07:00:03
黃一鳴帶小孩給爺爺奶奶拜年,嘴巴很甜,被懷疑是變相要紅包

黃一鳴帶小孩給爺爺奶奶拜年,嘴巴很甜,被懷疑是變相要紅包

新游戲大妹子
2026-02-18 09:18:57
繼 “斬殺線” 之后,中國網(wǎng)友又為美國人送上新標簽:北美懦夫

繼 “斬殺線” 之后,中國網(wǎng)友又為美國人送上新標簽:北美懦夫

我心縱橫天地間
2026-01-29 14:21:49
火箭隊傳聞:泰厄斯·瓊斯被獨行俠裁掉后,火箭隊會考慮他嗎?

火箭隊傳聞:泰厄斯·瓊斯被獨行俠裁掉后,火箭隊會考慮他嗎?

好火子
2026-03-03 02:30:22
牛鬼蛇神現(xiàn)原形!周煒當(dāng)選會長還不到3天,惡心的一幕出現(xiàn)了

牛鬼蛇神現(xiàn)原形!周煒當(dāng)選會長還不到3天,惡心的一幕出現(xiàn)了

開著車去流浪
2026-02-10 02:58:51
心酸!女子年后回娘家被趕出門后續(xù): 原因曝光令人憤怒,評論淪陷

心酸!女子年后回娘家被趕出門后續(xù): 原因曝光令人憤怒,評論淪陷

離離言幾許
2026-03-02 17:19:50
中方呼吁美以立即停止對伊軍事行動

中方呼吁美以立即停止對伊軍事行動

看看新聞Knews
2026-03-01 12:31:25
超2萬名旅客滯留迪拜!外交部提醒

超2萬名旅客滯留迪拜!外交部提醒

看看新聞Knews
2026-03-02 14:27:08
特朗普同意對話,以色列卻再撂狠話,美以聯(lián)合行動能持續(xù)多久?

特朗普同意對話,以色列卻再撂狠話,美以聯(lián)合行動能持續(xù)多久?

新民晚報
2026-03-02 10:32:41
“大學(xué)女兒非要買LV”視頻火了,網(wǎng)友:窮人穿上龍袍也不像太子

“大學(xué)女兒非要買LV”視頻火了,網(wǎng)友:窮人穿上龍袍也不像太子

妍妍教育日記
2026-02-25 21:18:14
中英香港談判中方為何吃暗虧?因我方出內(nèi)鬼,6年后中央布局抓捕

中英香港談判中方為何吃暗虧?因我方出內(nèi)鬼,6年后中央布局抓捕

阿胡
2024-10-11 16:54:21
沉默整整9天,毛寧一錘定音,中美戰(zhàn)機已交手,美方要見中國代表

沉默整整9天,毛寧一錘定音,中美戰(zhàn)機已交手,美方要見中國代表

boss外傳
2026-03-02 00:00:04
以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

八斗小先生
2025-12-26 09:33:27
2026-03-03 06:04:49
小樂數(shù)學(xué)科普 incentive-icons
小樂數(shù)學(xué)科普
zzllrr小樂,小樂數(shù)學(xué)科普,讓前沿數(shù)學(xué)流行起來~
251文章數(shù) 7關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運

頭條要聞

媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

手機
藝術(shù)
家居
健康
游戲

手機要聞

小米17 Ultra徠卡版全新黑銀配色預(yù)售:7999元起,10日發(fā)售

藝術(shù)要聞

這四位老人的花鳥畫,竟讓人欲罷不能!

家居要聞

萬物互聯(lián) 享科技福祉

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

外媒給《寶可夢》新作60分:不夠有趣的縫合怪

無障礙瀏覽 進入關(guān)懷版