国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌最新論文宣告AI成獨(dú)立科研主體

0
分享至

日前,谷歌DeepMind 與多所頂尖學(xué)術(shù)機(jī)構(gòu)的研究者聯(lián)合發(fā)布論文《Aletheia:自主攻克FirstProof數(shù)學(xué)難題挑戰(zhàn)賽》(arXiv:2602.21201) 。


論文的核心是,評(píng)估名為 Aletheia 的數(shù)學(xué)研究代理系統(tǒng)在 FirstProof 這一公開挑戰(zhàn)中的表現(xiàn)。

在沒有人類干預(yù)的情況下,Aletheia成功完成多道研究級(jí)數(shù)學(xué)難題。

這不是簡(jiǎn)單的“算對(duì)了題”,而是達(dá)到了接近學(xué)術(shù)發(fā)表標(biāo)準(zhǔn)的證明水平。

這意味著 AI 開始真正觸及“數(shù)學(xué)創(chuàng)造力”,這個(gè)長(zhǎng)期被認(rèn)為是人類專屬的領(lǐng)域。

FirstProof 不是簡(jiǎn)單的算術(shù)或者基礎(chǔ)證明題,而是由專業(yè)數(shù)學(xué)家設(shè)定的一組十個(gè)研究級(jí)難度的問題。

這些問題往往涉及抽象概念和嚴(yán)謹(jǐn)推理,傳統(tǒng)上只有受過訓(xùn)練的數(shù)學(xué)家才能應(yīng)對(duì)。組織方希望通過這個(gè)挑戰(zhàn)評(píng)估當(dāng)前 AI 在數(shù)學(xué)領(lǐng)域的真實(shí)能力邊界。


Aletheia 也并不是一個(gè)普通的自動(dòng)答題機(jī)器人,而是一個(gè)結(jié)合了生成式模型和驗(yàn)證機(jī)制的智能體,基于谷歌最新的大模型架構(gòu) Gemini 3 Deep Think。

它的設(shè)計(jì)目標(biāo)不僅是輸出答案,而是在 無(wú)人類干預(yù)的前提下 盡可能自動(dòng)地提出數(shù)學(xué)證明。

也就是說,從理解題意、構(gòu)思思路、生成證明草稿,到最終輸出一段嚴(yán)謹(jǐn) LaTeX 格式的證明文本,整個(gè)過程都是由智能體自主完成的。

Aletheia 由三個(gè)核心模塊構(gòu)成:

猜想生成:從數(shù)學(xué)文獻(xiàn)中識(shí)別有價(jià)值的開放問題,并生成形式化命題。

自主證明搜索:結(jié)合符號(hào)推理、啟發(fā)式搜索與自我修正,尋找形式化證明。

嚴(yán)謹(jǐn)驗(yàn)證:使用自動(dòng)證明檢驗(yàn)器與自我批判機(jī)制,過濾無(wú)效論證并確保正確性。


整個(gè)流程完全自動(dòng)化,無(wú)需人類撰寫提示、選擇問題或?qū)徍酥虚g步驟。Aletheia 自主判斷哪些問題可解、哪些方向有價(jià)值、以及證明何時(shí)完成且正確。

論文作者為了評(píng)估其真實(shí)能力,在整個(gè)流程中嚴(yán)格排除了人為提示和干預(yù),只保留最終專家對(duì)結(jié)果的判斷與評(píng)價(jià)。

在 FirstProof 的十個(gè)問題中,Aletheia 成功給出了六個(gè)問題的可評(píng)估解答,被獨(dú)立數(shù)學(xué)專家(有些來自論文作者之外的學(xué)術(shù)界)認(rèn)為,滿足出版前的“可修訂發(fā)表”標(biāo)準(zhǔn)。


更重要的是,這種能力是在沒有人工設(shè)計(jì)思路的情況下實(shí)現(xiàn)的,充分體現(xiàn)了 AI 在數(shù)學(xué)推理上從輔助工具向真正“研究伙伴”的轉(zhuǎn)變。

值得注意的是,Aletheia 并不是在所有問題上都做到了完美。在那些極其復(fù)雜或高度依賴深厚數(shù)學(xué)直覺的問題上,它仍然無(wú)法給出有效輸出。所以說,暫時(shí)它還不是完全合格的數(shù)學(xué)家。

但總的來說,這項(xiàng)工作標(biāo)志著 AI 在數(shù)學(xué)研究領(lǐng)域取得了實(shí)質(zhì)性的進(jìn)展。

從 ChatGPT 或 Gemini 這類大語(yǔ)言模型能會(huì)話式討論數(shù)學(xué),到 Aletheia 能在沒有人類引導(dǎo)的情況下解決復(fù)雜證明問題,是科研史上的一次重要里程碑。

雖然距離完全取代人類數(shù)學(xué)家還有很長(zhǎng)的路要走,但這一成果無(wú)疑推動(dòng)了人工智能在創(chuàng)意推理與科學(xué)發(fā)現(xiàn)方面的邊界。

這不僅對(duì)數(shù)學(xué)界是重要突破,也預(yù)示著未來 AI 將在數(shù)學(xué)、物理、計(jì)算機(jī)科學(xué),乃至整個(gè)基礎(chǔ)科研領(lǐng)域,承擔(dān)越來越重要的角色。

也就是說,AI第一次真正從“輔助工具”進(jìn)化為獨(dú)立科研主體,開創(chuàng)了“AI自主做科學(xué)研究”的全新范式。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
貝克漢姆全家出席活動(dòng)失控大哭?貝嫂認(rèn)輸愿單獨(dú)赴美找兒媳求和,還求助好大兒的國(guó)寶級(jí)教父?

貝克漢姆全家出席活動(dòng)失控大哭?貝嫂認(rèn)輸愿單獨(dú)赴美找兒媳求和,還求助好大兒的國(guó)寶級(jí)教父?

英國(guó)報(bào)姐
2026-03-28 21:09:42
女排名將周曉蘭:曾和郎平齊名,退役后辭官赴美,如今過得咋樣

女排名將周曉蘭:曾和郎平齊名,退役后辭官赴美,如今過得咋樣

小徐講八卦
2026-02-15 16:20:07
山西一兒媳住院公公陪床,趁護(hù)士換藥塞紙條,護(hù)士看后直接報(bào)警

山西一兒媳住院公公陪床,趁護(hù)士換藥塞紙條,護(hù)士看后直接報(bào)警

五元講堂
2024-10-24 10:54:37
海南解放后,鄧華希望40軍把繳獲的裝備留下,韓先楚:我不同意!

海南解放后,鄧華希望40軍把繳獲的裝備留下,韓先楚:我不同意!

墨說古今
2026-03-15 23:35:07
瞞天過海40年!李嘉誠(chéng)成最大贏家,日產(chǎn)百萬(wàn)桶,把石油全賣給中國(guó)

瞞天過海40年!李嘉誠(chéng)成最大贏家,日產(chǎn)百萬(wàn)桶,把石油全賣給中國(guó)

阿鳧愛吐槽
2026-03-24 00:54:18
緊急提醒!如果你手里還有這些資產(chǎn),請(qǐng)務(wù)必讀完這篇:風(fēng)暴將在停戰(zhàn)后降臨

緊急提醒!如果你手里還有這些資產(chǎn),請(qǐng)務(wù)必讀完這篇:風(fēng)暴將在停戰(zhàn)后降臨

澳洲財(cái)經(jīng)見聞
2026-03-28 15:35:11
父親退休金全給弟弟,我平靜接受,過年來電:年夜飯2萬(wàn),轉(zhuǎn)一下

父親退休金全給弟弟,我平靜接受,過年來電:年夜飯2萬(wàn),轉(zhuǎn)一下

風(fēng)起見你
2026-03-29 14:30:27
李梓萌,私生活傳聞太荒唐

李梓萌,私生活傳聞太荒唐

做一個(gè)合格的吃瓜群眾
2026-03-21 19:20:55
排面!全紅嬋曬19歲慶生照:跳水奧運(yùn)冠軍集體亮相,楊倩也出席

排面!全紅嬋曬19歲慶生照:跳水奧運(yùn)冠軍集體亮相,楊倩也出席

李喜林籃球絕殺
2026-03-29 10:56:49
家里這7樣舊東西別丟!今年漲了80%,比黃金還吃香

家里這7樣舊東西別丟!今年漲了80%,比黃金還吃香

小鹿姐姐情感說
2026-03-29 10:26:08
原來精神小妹的生活方式這么離譜!看完網(wǎng)友分享,大開眼界了

原來精神小妹的生活方式這么離譜!看完網(wǎng)友分享,大開眼界了

另子維愛讀史
2026-03-02 19:55:07
多位院士共識(shí):低密度脂蛋白在安全值,無(wú)需用藥降脂

多位院士共識(shí):低密度脂蛋白在安全值,無(wú)需用藥降脂

醫(yī)學(xué)科普匯
2026-03-28 22:55:03
曾國(guó)藩論人: 下者好辯, 中者善算, 上者守拙、戒欺、慎獨(dú)

曾國(guó)藩論人: 下者好辯, 中者善算, 上者守拙、戒欺、慎獨(dú)

千秋文化
2026-03-26 21:14:48
陳思誠(chéng)野心真大,開啟刑偵八虎篇章,張譯扛大旗,票房劍指40億

陳思誠(chéng)野心真大,開啟刑偵八虎篇章,張譯扛大旗,票房劍指40億

娛樂圈筆娛君
2026-03-28 09:30:13
豐田把5樣配置塞進(jìn)15萬(wàn)的車,預(yù)售3周破萬(wàn)單

豐田把5樣配置塞進(jìn)15萬(wàn)的車,預(yù)售3周破萬(wàn)單

碼上閑敘
2026-03-29 15:35:53
烏軍“火烈鳥”打爆俄羅斯炸藥廠,美俄議員會(huì)晤引發(fā)跨大西洋風(fēng)暴

烏軍“火烈鳥”打爆俄羅斯炸藥廠,美俄議員會(huì)晤引發(fā)跨大西洋風(fēng)暴

史政先鋒
2026-03-28 21:51:15
一句顧客像狗,羅技兩天蒸發(fā)5.7億:毀掉深耕30年的中國(guó)市場(chǎng)!

一句顧客像狗,羅技兩天蒸發(fā)5.7億:毀掉深耕30年的中國(guó)市場(chǎng)!

有范又有料
2026-03-28 18:38:15
周末炸雷!兩大政策送錢,下周一A股這幾板塊要嗨翻天!

周末炸雷!兩大政策送錢,下周一A股這幾板塊要嗨翻天!

慧眼看世界哈哈
2026-03-29 13:48:57
男人一天排尿接近這個(gè)數(shù),尿毒癥可能離你很近,不妨自查瞧瞧

男人一天排尿接近這個(gè)數(shù),尿毒癥可能離你很近,不妨自查瞧瞧

王二哥老搞笑
2026-03-29 14:22:19
一場(chǎng)30年來規(guī)模最大的債務(wù)大清洗,正在中國(guó)悄然上演

一場(chǎng)30年來規(guī)模最大的債務(wù)大清洗,正在中國(guó)悄然上演

流蘇晚晴
2026-03-29 16:33:20
2026-03-29 17:24:49
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應(yīng)用精選與評(píng)測(cè)
466文章數(shù) 69關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

中國(guó)警告美國(guó):勿將"沖突戰(zhàn)亂"引入亞太地區(qū)

頭條要聞

中國(guó)警告美國(guó):勿將"沖突戰(zhàn)亂"引入亞太地區(qū)

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂要聞

張凌赫事件持續(xù)升級(jí)!官方點(diǎn)名怒批

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

本地
旅游
家居
公開課
軍事航空

本地新聞

在濰坊待了三天,沒遇到一個(gè)“濰坊人”

旅游要聞

單日入境外籍游客數(shù)再創(chuàng)新高!吳淞口國(guó)際郵輪港樞紐能級(jí)持續(xù)提升

家居要聞

曲線華爾茲 現(xiàn)代簡(jiǎn)約

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美兩棲攻擊艦載3500名增援到達(dá)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版