国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清華AI數(shù)學(xué)家系統(tǒng)攻克均勻化理論難題!人機(jī)協(xié)同完成17頁(yè)嚴(yán)謹(jǐn)證明

0
分享至

當(dāng)AI不再只是解題機(jī)器,而能與人類(lèi)并肩完成嚴(yán)謹(jǐn)?shù)目蒲凶C明,這意味著什么?

清華大學(xué)科研團(tuán)隊(duì)以自主研發(fā)的AI數(shù)學(xué)家系統(tǒng)(AIM)為協(xié)作伙伴,通過(guò)人機(jī)交互的模式成功解決了一項(xiàng)均勻化理論研究問(wèn)題,形成約17頁(yè)數(shù)學(xué)證明。

該成果系統(tǒng)性驗(yàn)證了AI從“數(shù)學(xué)解題工具”升級(jí)為“科研協(xié)作伙伴”的可行性,為復(fù)雜數(shù)學(xué)問(wèn)題的突破提供了新路徑。

這一突破,也讓AI真正踏入了“原創(chuàng)科研”的核心地帶,為未來(lái)數(shù)學(xué)發(fā)現(xiàn)的方式打開(kāi)了新的想象空間。


數(shù)學(xué)研究的“AI困境”

近年來(lái),AI在數(shù)學(xué)領(lǐng)域的表現(xiàn)屢獲突破:

  • Gemini憑借Deep Think技術(shù)達(dá)到國(guó)際數(shù)學(xué)奧林匹克(IMO 2025)金牌水平;

  • o4-mini模型在專家級(jí)數(shù)學(xué)基準(zhǔn)測(cè)試FrontierMath中超越人類(lèi)平均團(tuán)隊(duì)表現(xiàn);

  • GPT-5-Thinking協(xié)助研究者解決了量子計(jì)算領(lǐng)域的難題。

然而,這些成果多集中在“短時(shí)間、標(biāo)準(zhǔn)化”的競(jìng)賽類(lèi)任務(wù)中,與真實(shí)數(shù)學(xué)研究的需求存在巨大鴻溝。

當(dāng)前主流AI系統(tǒng)在數(shù)學(xué)研究中存在明顯局限:FunSearch、AlphaEvolve等依賴問(wèn)題的程序化表述,僅適用于部分?jǐn)?shù)學(xué)領(lǐng)域;AlphaGeometry系列則聚焦幾何推理,難以覆蓋更廣泛的數(shù)學(xué)分支。

即便部分AI能提供碎片化見(jiàn)解,完整證明的構(gòu)建與驗(yàn)證仍需依賴人類(lèi),難以真正融入研究全流程。

該研究的核心目標(biāo)正是打破這一困境,通過(guò)構(gòu)建“人類(lèi)分析+AI推導(dǎo)”的協(xié)同范式,讓AI的推理能力與人類(lèi)的邏輯分析能力、知識(shí)經(jīng)驗(yàn)儲(chǔ)備形成互補(bǔ),共同攻克單一主體難以突破的復(fù)雜數(shù)學(xué)難題。

五大模式為AI輔助數(shù)學(xué)研究提供“操作指南”

均勻化理論是連接材料科學(xué)、流體力學(xué)與數(shù)學(xué)的核心橋梁,其核心是分析異質(zhì)材料微觀結(jié)構(gòu)變化對(duì)宏觀力學(xué)行為的影響。

本研究聚焦的具體問(wèn)題為:當(dāng)周期性分布的流體夾雜尺度趨近于零(ε→0)時(shí),如何推導(dǎo)耦合Stokes-Lamé系統(tǒng)的極限均勻化方程,并嚴(yán)格證明原解與極限解的誤差估計(jì)。

該問(wèn)題來(lái)源于真實(shí)數(shù)學(xué)研究,具有顯著挑戰(zhàn)性。

最終,團(tuán)隊(duì)通過(guò)人機(jī)協(xié)同不僅得出極限方程,更精確證明了誤差階數(shù) α=1/2,形成約17頁(yè)數(shù)學(xué)證明。


Stokes-Lamé系統(tǒng)

具體來(lái)看,團(tuán)隊(duì)在人機(jī)協(xié)同模式下,通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的迭代分析,將原問(wèn)題拆解為六個(gè)子問(wèn)題(見(jiàn)下圖),通過(guò)系統(tǒng)性的人機(jī)協(xié)同工作對(duì)六個(gè)子問(wèn)題進(jìn)行各個(gè)擊破,最終在此基礎(chǔ)上獲得原問(wèn)題的完整證明。

AIM系統(tǒng)在幾個(gè)最困難子問(wèn)題的證明過(guò)程中作出非平凡貢獻(xiàn)。


子問(wèn)題拆解及人機(jī)分工

在研究過(guò)程中,團(tuán)隊(duì)并非簡(jiǎn)單“使用AI”,而是系統(tǒng)性總結(jié)出了五大高效人機(jī)交互模式,為數(shù)學(xué)家運(yùn)用AI開(kāi)展研究提供了可復(fù)用、可推廣的實(shí)踐框架:

1、直接提示(Direct Prompting)

通過(guò)“定理提示”(提供關(guān)鍵定理及適用條件)、“概念引導(dǎo)”(明確證明框架與策略方向)、“細(xì)節(jié)優(yōu)化”(校準(zhǔn)符號(hào)定義與局部推導(dǎo)錯(cuò)誤),引導(dǎo)AIM聚焦核心推理路徑,減少無(wú)效探索。

例如,在“Cell Problem”的分析中,人類(lèi)專家向AIM提供了相關(guān)理論方法的輔助引理,使其推理錨定在嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)基礎(chǔ)上,避免邏輯偏離。

2、理論協(xié)同應(yīng)用(Theory-Coordinated Application)

將某一數(shù)學(xué)分支的完整理論體系(定義、引理、推理規(guī)則)打包為“知識(shí)包”提供給AIM,使其在預(yù)設(shè)理論框架內(nèi)開(kāi)展多步驟連貫推導(dǎo)。

在證明“Cell Problem”的正則性時(shí),人類(lèi)專家提供了“Schauder Theory”的全套核心引理,AIM據(jù)此逐步推導(dǎo),最終得出符合預(yù)期的結(jié)論,展現(xiàn)出對(duì)復(fù)雜理論體系的應(yīng)用能力。

3、交互式迭代優(yōu)化(Interactive Iterative Refinement)

遵循“AI輸出→人類(lèi)診斷→反饋修正→AI再推理→…”的循環(huán),逐步完善證明鏈條。

在誤差估計(jì)階段,人類(lèi)專家發(fā)現(xiàn)AIM的證明存在邏輯缺口后,通過(guò)對(duì)問(wèn)題本身和實(shí)驗(yàn)結(jié)果的分析,拆分了多個(gè)中間問(wèn)題,最終讓AIM自主修正證明結(jié)論,形成完整推理鏈。

4、明確運(yùn)用邊界(Applicability Boundary and Exclusive Domain)

針對(duì)AIM當(dāng)前難以勝任的任務(wù)(如復(fù)雜幾何構(gòu)型構(gòu)建、多尺度符號(hào)推理),由人類(lèi)主導(dǎo)完成,避免資源浪費(fèi)。

例如,“雙尺度展開(kāi)”需精準(zhǔn)處理x、y雙尺度變量的導(dǎo)數(shù)分解,AIM易出現(xiàn)符號(hào)混淆,人類(lèi)專家通過(guò)手動(dòng)推導(dǎo)確保這一基礎(chǔ)環(huán)節(jié)的正確性,為后續(xù)AI推導(dǎo)掃清障礙。

5、輔助優(yōu)化策略(Auxiliary Optimization)

通過(guò)多輪嘗試篩選最優(yōu)證明(如利用LLM的輸出隨機(jī)性)、提供目標(biāo)結(jié)論約束推理方向(如明確誤差估計(jì)的預(yù)期形式)、根據(jù)任務(wù)類(lèi)型選擇適配模型(如o4-mini擅長(zhǎng)框架構(gòu)建,DeepSeek-R1擅長(zhǎng)細(xì)節(jié)推導(dǎo)),進(jìn)一步提升AI輸出的可靠性與效率。

舉例來(lái)看,在“Regularity of Cell Problem”這一子問(wèn)題的證明過(guò)程中,人類(lèi)專家明確引入了來(lái)自Schauder Theory的輔助引理,并將這些引理作為提示信息提供給AIM。


人類(lèi)專家將Schauder Theory的輔助引理提供給AIM

通過(guò)這種方式,人類(lèi)專家引導(dǎo)AIM在推導(dǎo)后續(xù)結(jié)論時(shí)運(yùn)用這些引理,從而有效構(gòu)建并約束其推理過(guò)程,使其朝著得出有效且完整的論證方向推進(jìn)。

在該提示的引導(dǎo)下,AIM的輸出結(jié)果表明,其能主動(dòng)且恰當(dāng)?shù)卣咸崾局邪男畔?,并?zhí)行正確的推導(dǎo)流程。


AIM輸出結(jié)果 17頁(yè)證明背后的三重突破

本研究并非局限于單一問(wèn)題的解決,更在理論范式、實(shí)踐驗(yàn)證與方法指導(dǎo)三方面取得突破,為數(shù)學(xué)研究與AI的深度融合提供基礎(chǔ)。

價(jià)值一:驗(yàn)證人機(jī)協(xié)同數(shù)學(xué)研究范式

團(tuán)隊(duì)深度驗(yàn)證“人類(lèi)引導(dǎo)+AI推理”的協(xié)同研究模式,將AI的推理能力與人類(lèi)數(shù)學(xué)工作者的知識(shí)經(jīng)驗(yàn)和邏輯推理系統(tǒng)性融合。

這種協(xié)作模式,拓寬了數(shù)學(xué)工作者的能力邊界,也進(jìn)一步提高了AI證明數(shù)學(xué)理論的實(shí)驗(yàn)表現(xiàn)。

價(jià)值二:攻克均勻化理論難題

團(tuán)隊(duì)給出了這項(xiàng)均勻化問(wèn)題的長(zhǎng)達(dá)17頁(yè)的完整證明。

該證明的很大一部分內(nèi)容由AI生成,其在整個(gè)證明過(guò)程中做出了非平凡貢獻(xiàn),充分體現(xiàn)了人機(jī)協(xié)同范式在解決復(fù)雜、研究級(jí)數(shù)學(xué)問(wèn)題方面的潛力。

價(jià)值三:系統(tǒng)梳理交互模式

團(tuán)隊(duì)對(duì)人機(jī)交互模式進(jìn)行了系統(tǒng)化梳理,并提煉出具有實(shí)證價(jià)值的見(jiàn)解。

這些見(jiàn)解可為未來(lái)人工智能輔助數(shù)學(xué)研究框架的設(shè)計(jì)提供參考,同時(shí)也能為希望在自身研究中利用AI的數(shù)學(xué)家提供實(shí)際參考意見(jiàn),幫助數(shù)學(xué)工作者快速掌握與AI的協(xié)作研究,加速AI與數(shù)學(xué)科研的融合落地。

從協(xié)同到自主:AI數(shù)學(xué)研究的下一階段目標(biāo)

AI在數(shù)學(xué)研究中的比較優(yōu)勢(shì)體現(xiàn)在基于現(xiàn)有理論的分析、搜索與適配方面,例如自動(dòng)拆解問(wèn)題、梳理文獻(xiàn)、優(yōu)化已知方法等。

與之相對(duì),數(shù)學(xué)理論的核心突破當(dāng)前仍依賴于人類(lèi)的原始直覺(jué)與抽象思維能力,如提出新概念、構(gòu)建新框架、設(shè)計(jì)新的證明范式等,以解決長(zhǎng)期懸而未決的難題。

由于這類(lèi)突破對(duì)嚴(yán)謹(jǐn)性要求極高,而當(dāng)前AI存在幻覺(jué)輸出(生成看似合理卻錯(cuò)誤的內(nèi)容)與置信度誤判(對(duì)錯(cuò)誤結(jié)論過(guò)度自信)等問(wèn)題,因此完全自主的AI證明目前仍無(wú)法實(shí)現(xiàn),分步的人工驗(yàn)證仍是必不可少的環(huán)節(jié)。

基于現(xiàn)有研究發(fā)現(xiàn),團(tuán)隊(duì)提出了未來(lái)研究的兩個(gè)重要方向:

深化并系統(tǒng)化人機(jī)交互模式

團(tuán)隊(duì)已提煉出一套能顯著加速數(shù)學(xué)理論進(jìn)展、拓展研究者能力邊界的交互模式。

下一步,團(tuán)隊(duì)將研究這些模式能否遷移到其他數(shù)學(xué)領(lǐng)域,以及能否針對(duì)特定領(lǐng)域需求設(shè)計(jì)更豐富、更高效的交互模式。

同時(shí),團(tuán)隊(duì)將從多個(gè)維度對(duì)人機(jī)交互框架進(jìn)行系統(tǒng)化構(gòu)建,包括但不限于問(wèn)題拆解、過(guò)程監(jiān)督、誤差修正、定理引用及依賴管理。

這需要基于大量實(shí)驗(yàn)分析制定嚴(yán)格的分類(lèi)標(biāo)準(zhǔn),并明確交互模式效果等信息,以確保所構(gòu)建系統(tǒng)的嚴(yán)謹(jǐn)性。

基于交互反饋優(yōu)化AIM系統(tǒng)

團(tuán)隊(duì)的長(zhǎng)期研究目標(biāo)是實(shí)現(xiàn)數(shù)學(xué)定理證明的自動(dòng)化,因此AIM系統(tǒng)架構(gòu)的迭代優(yōu)化既關(guān)鍵又具內(nèi)在挑戰(zhàn)性。

通過(guò)人機(jī)協(xié)同的定理證明實(shí)驗(yàn),團(tuán)隊(duì)已明確智能體擅長(zhǎng)的任務(wù)類(lèi)型與存在困難的任務(wù)類(lèi)型。這些積累的見(jiàn)解為系統(tǒng)設(shè)計(jì)的后續(xù)迭代提供了依據(jù)。

團(tuán)隊(duì)將以這些不足為出發(fā)點(diǎn),嘗試提出訓(xùn)練方法以提升模型的推理能力,進(jìn)而改善實(shí)驗(yàn)表現(xiàn),從而增強(qiáng)大型語(yǔ)言模型在數(shù)學(xué)理論研究領(lǐng)域的能力。

論文鏈接:
https://arxiv.org/abs/2510.26380

文章來(lái)源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
裝逼撞到你擅長(zhǎng)的領(lǐng)域是啥體驗(yàn)?網(wǎng)友:我曾經(jīng)也干過(guò)這種事呀

裝逼撞到你擅長(zhǎng)的領(lǐng)域是啥體驗(yàn)?網(wǎng)友:我曾經(jīng)也干過(guò)這種事呀

夜深?lèi)?ài)雜談
2025-12-21 17:57:28
又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買(mǎi)了個(gè)牌子殼!

又一百年巨頭塌了!從技術(shù)神話到貼牌代工,網(wǎng)友:買(mǎi)了個(gè)牌子殼!

青眼財(cái)經(jīng)
2025-11-18 23:16:47
定居美國(guó)13年回國(guó)撈金遭驅(qū)逐,52歲被笑話

定居美國(guó)13年回國(guó)撈金遭驅(qū)逐,52歲被笑話

白日追夢(mèng)人
2025-12-24 04:30:11
宗慶后被曝有7子,看了宗馥莉?yàn)樗⒌哪贡?,才知道她早就布局?>
    </a>
        <h3>
      <a href=麥大人
2025-07-18 12:05:16
紫牛頭條|下班遭車(chē)禍,接受公司賠償后他發(fā)現(xiàn)一份意外險(xiǎn)保單被公司隱瞞

紫牛頭條|下班遭車(chē)禍,接受公司賠償后他發(fā)現(xiàn)一份意外險(xiǎn)保單被公司隱瞞

揚(yáng)子晚報(bào)
2025-12-23 09:06:09
南京博物院又揭大瓜,前文物局局長(zhǎng)曾問(wèn):賣(mài)幾個(gè)兵馬俑行不行?

南京博物院又揭大瓜,前文物局局長(zhǎng)曾問(wèn):賣(mài)幾個(gè)兵馬俑行不行?

攬星河的筆記
2025-12-22 18:12:17
突發(fā)!法拉利撞上護(hù)欄后迅速起火,知名游戲大佬被困車(chē)內(nèi)身亡,警方通報(bào)!他被譽(yù)為“《使命召喚》之父”,眾多同行與玩家哀悼

突發(fā)!法拉利撞上護(hù)欄后迅速起火,知名游戲大佬被困車(chē)內(nèi)身亡,警方通報(bào)!他被譽(yù)為“《使命召喚》之父”,眾多同行與玩家哀悼

每日經(jīng)濟(jì)新聞
2025-12-23 15:06:07
受中國(guó)004核航母刺激太大,法國(guó)掀桌子了,砸鍋賣(mài)鐵也要建新航母

受中國(guó)004核航母刺激太大,法國(guó)掀桌子了,砸鍋賣(mài)鐵也要建新航母

云舟史策
2025-12-24 07:22:16
CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

CBA歷史第一人!新秀直接打成本土得分王,球迷:讓混子情何以堪

弄月公子
2025-12-23 23:10:43
錢(qián)多有什么用?42歲離婚無(wú)兒無(wú)女的尼格買(mǎi)提,走上了另外一條道路

錢(qián)多有什么用?42歲離婚無(wú)兒無(wú)女的尼格買(mǎi)提,走上了另外一條道路

古事尋蹤記
2025-12-20 07:13:47
南京博物院盜賣(mài)文物,捐贈(zèng)后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國(guó)寶還有多少黑幕

南京博物院盜賣(mài)文物,捐贈(zèng)后人追查十年遭打碼“證據(jù)”糊弄,失蹤五件國(guó)寶還有多少黑幕

爆角追蹤
2025-12-18 15:36:33
他用藥7年換來(lái)肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

他用藥7年換來(lái)肌肉,卻失去了X欲!完美肌肉背后的秘密:98%都在上科技...

健身迷
2025-12-22 10:19:04
轉(zhuǎn)告父母:這6種病屬于老年病,過(guò)度治療反而傷身,安然接受

轉(zhuǎn)告父母:這6種病屬于老年病,過(guò)度治療反而傷身,安然接受

讀懂世界歷史
2025-12-23 20:31:37
卷走53億!又一大佬帶全家跑路,欠中國(guó)銀行20億,投資者血本無(wú)歸

卷走53億!又一大佬帶全家跑路,欠中國(guó)銀行20億,投資者血本無(wú)歸

以茶帶書(shū)
2025-12-09 23:33:58
向大陸交底、對(duì)內(nèi)攤牌,鄭麗文把最怕被說(shuō)破的那層窗戶紙,捅穿了

向大陸交底、對(duì)內(nèi)攤牌,鄭麗文把最怕被說(shuō)破的那層窗戶紙,捅穿了

科普100克克
2025-12-24 00:10:32
哈佛大學(xué)研究:活過(guò)90歲的人29項(xiàng)共同特征

哈佛大學(xué)研究:活過(guò)90歲的人29項(xiàng)共同特征

尚曦讀史
2025-12-06 08:27:08
廣東5連勝,杜鋒:在廣東打球是幸福的!

廣東5連勝,杜鋒:在廣東打球是幸福的!

帶你領(lǐng)略快樂(lè)真諦
2025-12-24 02:50:13
黃金狂飆,一種交易正在悄悄進(jìn)行

黃金狂飆,一種交易正在悄悄進(jìn)行

鳳凰網(wǎng)財(cái)經(jīng)
2025-12-23 09:08:05
美國(guó)外交開(kāi)始大洗牌

美國(guó)外交開(kāi)始大洗牌

陸棄
2025-12-23 08:25:03
肥腸再次成為關(guān)注對(duì)象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會(huì)出現(xiàn)6大變化

肥腸再次成為關(guān)注對(duì)象!醫(yī)生發(fā)現(xiàn):常吃肥腸,身體會(huì)出現(xiàn)6大變化

看世界的人
2025-12-04 10:51:31
2025-12-24 08:47:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5276文章數(shù) 64597關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

體育要聞

楊瀚森連續(xù)5場(chǎng)DNP!開(kāi)拓者遭活塞雙殺

娛樂(lè)要聞

朱孝天回應(yīng)阿信感謝,自曝沒(méi)再收到邀約

財(cái)經(jīng)要聞

快手到底惹了誰(shuí)?

汽車(chē)要聞

四款新車(chē)集中發(fā)布 星途正式走進(jìn)3.0時(shí)代

態(tài)度原創(chuàng)

藝術(shù)
親子
數(shù)碼
本地
公開(kāi)課

藝術(shù)要聞

毛主席手書(shū)《水調(diào)歌頭》,生前最后發(fā)表的詞作曝光。

親子要聞

嚴(yán)禁引入第三方,管住幼兒園亂收費(fèi)|新京報(bào)快評(píng)

數(shù)碼要聞

華為鴻蒙智選小豚當(dāng)家智能攝像頭鯨瞳Max現(xiàn)身,功能強(qiáng)大價(jià)格揭曉

本地新聞

云游安徽|宣城何以動(dòng)人心,百年塔影一城徽韻

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版