国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nature重磅:首個“AI科學(xué)家”的誕生!實現(xiàn)端到端自動化科研,撰寫論文通過頂會同行評審

0
分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

2024 年 8 月,Sakana AI 公司、不列顛哥倫比亞大學(xué)、牛津大學(xué)的研究人員組成的研究團隊在預(yù)印本平臺 arXiv 推出首個旨在全面自動化科學(xué)流程的人工智能工具——“AI 科學(xué)家”(AI scientist),其能夠完成科學(xué)發(fā)現(xiàn)的整個周期——從提出想法到驗證想法再到撰寫科學(xué)論文。

如今,一年多過去了,可供研究人員使用的 AI 研究助手種類繁多,其中一些也能夠像“AI 科學(xué)家”那樣進行自主研究甚至撰寫科學(xué)論文。

而現(xiàn)在, “AI 科學(xué)家”再次完成了一個新壯舉——其完成了首個通過人類專家同行評審的完全 AI 生成論文 ,從 研究想法、編寫代碼、運行實驗、繪制和分析數(shù)據(jù),到撰寫完整的科學(xué)論文,均由“AI 科學(xué)家”自主完成。

2026 年 3 月 25 日,研究團隊在國際頂尖學(xué)術(shù)期刊Nature上發(fā)表了題為:Towards end-to-end automation of AI research 的研究論文,更新了 2024 年的這篇描述“AI 科學(xué)家”的預(yù)印本論文,對其能力進行了適度調(diào)整,進一步展示了“AI 科學(xué)家”將生成的三篇原創(chuàng)研究論文提交給了一個頂級機器學(xué)習(xí)會議——國際學(xué)習(xí)表征會議(ICLR),其中一篇論文通過人類專家同行評審后被接收,且評分超過了該會議接收論文的平均值。

這一成就展示了 AI 在科學(xué)貢獻方面日益增強的能力,并預(yù)示著科學(xué)研究方式可能發(fā)生的范式轉(zhuǎn)變。研究團隊表示,如果負責(zé)任地開發(fā),“AI 科學(xué)家”等自主系統(tǒng)能夠極大地加速科學(xué)發(fā)現(xiàn)。


什么是“AI 科學(xué)家”?

“AI 科學(xué)家”是一個端到端自動化科學(xué)研究全過程的 AI 系統(tǒng),由一系列“智能體”(Agent)構(gòu)成,這些智能體建立在現(xiàn)有的大語言模型(LLM)之上(例如 GPT-4o 或 Claude Sonnet 4)。

它能夠自主完成從研究構(gòu)思到論文發(fā)表的整個科研生命周期,包括——

1、生成研究想法:在用戶指定的機器學(xué)習(xí)研究子領(lǐng)域中,迭代生成高水平的研究方向和假設(shè);

2、執(zhí)行實驗:編寫代碼、運行實驗、可視化結(jié)果;

3、撰寫論文:按照標準機器學(xué)習(xí)會議論文格式,使用 LaTeX 模板逐節(jié)撰寫完整論文;

4、進行同行評審:通過自動評審系統(tǒng)評估論文的科學(xué)質(zhì)量。

這個“AI 科學(xué)家”有兩種工作模式:基于模板的模(使用人類提供的代碼模板作為起點)和模板自由的模式(完全自主生成代碼并進行更廣泛的科學(xué)探索)。


“AI 科學(xué)家”工作流程

突破:AI 論文通過同行評審

為了驗證“AI 科學(xué)家”的實際能力,研究團隊進行了一項大膽的實驗:將完全由“AI 科學(xué)家”生成的研究論文提交給國際學(xué)習(xí)表征會議(ICLR)的一個研討會進行同行評審。ICLR 是由圖靈獎得主Yoshua Bengio楊立昆于 2013 年創(chuàng)立的深度學(xué)習(xí)領(lǐng)域?qū)W術(shù)會議,其與 NeurIPS、ICML 并稱為機器學(xué)習(xí)領(lǐng)域主要會議,在谷歌學(xué)術(shù)會議期刊排名中位列全球前十。

整個實驗過程完全透明且符合倫理規(guī)范:

  • 會議組織者事先知情并同意;

  • 人類評審專家被告知有部分論文是 AI 生成的,但不知道具體是哪幾篇;

  • 所有 AI 生成的論文在評審后都會被撤回,避免在科學(xué)界建立明確標準前設(shè)定先例。

結(jié)果令人震驚:“AI 科學(xué)家”提交的三篇 AI 生成論文中,有一篇獲得了人類評審專家的平均分 6.33 分(個人評分分別為 6、7、6),成為第一篇完全由 AI 生成并通過了標準的科學(xué)同行評審流程的研究論文,這一分數(shù)超過了該研討會接收論文的平均分數(shù)。這篇題為:Compositional regularization: Unexpected obstacles in enhancing neural network generalization(組合正則化:增強神經(jīng)網(wǎng)絡(luò)泛化能力中的意外障)的論文報告了一個負面結(jié)果,與研討會關(guān)注“有趣負面結(jié)果”的主題高度契合。


“AI 科學(xué)家”生成的一篇論文的精選部分,該論文已通過同行評審,在頂級機器學(xué)習(xí)會議的研討會上被接受

自動評審系統(tǒng):與人類評審者媲美

“AI 科學(xué)家”不僅能夠生成論文,還配備了“自動評審器”來評估論文質(zhì)量。這個自動評審系統(tǒng)的表現(xiàn)如何?

根據(jù)論文中的對比數(shù)據(jù),自動評審器在關(guān)鍵指標上與人類評審者表現(xiàn)相當(dāng)甚至更優(yōu):

  • 平衡準確率:自動評審器 69% vs 人類評審者 66%;

  • F1 分數(shù):自動評審器 0.62 vs 人類評審者 0.49;

  • 曲線下面積(AUC):自動評審器 0.69 vs 人類評審者 0.65。

即使在訓(xùn)練數(shù)據(jù)截止日期后的 2025 年的新論文上,自動評審器仍保持 66% 的平衡準確率,與人類評審者水平相當(dāng)。

系統(tǒng)工作原理:四階段科研流程

“AI 科學(xué)家”按照四個主要階段順序工作——

第一階段:想法生成與篩選,系統(tǒng)迭代生成研究想法檔案,為每個方向生成描述性標題、研究理由和實驗計劃。然后通過連接語義學(xué)者API和網(wǎng)絡(luò)訪問工具,篩選掉與現(xiàn)有文獻過于相似的想法。

第二階段:實驗執(zhí)行與可視化,系統(tǒng)執(zhí)行提出的實驗計劃,可視化結(jié)果,并為后續(xù)寫作做好筆記記錄。在模板自由模式下,系統(tǒng)會從零開始生成代碼,并通過樹搜索優(yōu)化實驗執(zhí)行。

第三階段:論文撰寫,系統(tǒng)使用筆記和圖表,按照會議論文模板逐節(jié)填充內(nèi)容,通過查詢獲取相關(guān)文獻,并在 20 輪比較中為論文添加適當(dāng)引用。

第四階段:自動評審,生成的論文由自動評審系統(tǒng)評估,提供數(shù)值評分、優(yōu)缺點列表和接受/拒絕的二元決策。


“AI 科學(xué)家”工作的四個階段

意義與局限:科學(xué)研究的范式轉(zhuǎn)變

這項研究的成功標志著 AI 在科學(xué)貢獻能力上的重大進步,可能預(yù)示著科學(xué)研究方式的范式轉(zhuǎn)變。如果負責(zé)任地開發(fā),這種自主系統(tǒng)可以極大地加速科學(xué)發(fā)現(xiàn)。

當(dāng)然,研究團隊也坦誠指出了當(dāng)前系統(tǒng)的局限性:三篇提交論文中只有一篇被接受,且研討會接受率(70%)遠高于主會議(32%);提交的論文尚不能達到頂尖論文的標準;常見失敗模式包括想法幼稚、實現(xiàn)錯誤、方法嚴謹性不足、實驗錯誤和多種類型的幻覺。

未來展望與倫理考量

隨著 AI 系統(tǒng)能力的指數(shù)級增長和成本的指數(shù)級下降,“AI 科學(xué)家”的性能有望大幅提升。未來,同樣的方法可以應(yīng)用于其他科學(xué)領(lǐng)域,例如自動化化學(xué)實驗室。

然而,自動化論文生成能力也帶來了重要的倫理和社會關(guān)切——可能壓垮同行評審系統(tǒng)、人為夸大研究資歷、未經(jīng)適當(dāng)認可地挪用他人想法、消除科學(xué)家工作崗位、進行不道德或危險的實驗等等。

研究團隊強調(diào),在科學(xué)界建立明確的披露和評估標準前,需要謹慎推進這類 AI 系統(tǒng)的應(yīng)用,確保它們被用于促進而非破壞科學(xué)誠信。

“AI 科學(xué)家”生成并通過同行評審的論文,是 AI 發(fā)展史上的一個重要里程碑。它不僅是技術(shù)能力的展示,更是對傳統(tǒng)科研模式的深刻挑戰(zhàn)。當(dāng) AI 開始涉足人類智慧的最高殿堂——科學(xué)發(fā)現(xiàn)時,我們既看到了加速進步的巨大潛力,也面臨著重新定義科研倫理邊界的緊迫任務(wù)。

論文鏈接

https://www.nature.com/articles/s41586-026-10265-5

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
學(xué)醫(yī)后才知道,高血壓最危險信號,不是頭暈,而是頻繁出現(xiàn)4癥狀

學(xué)醫(yī)后才知道,高血壓最危險信號,不是頭暈,而是頻繁出現(xiàn)4癥狀

醫(yī)學(xué)科普匯
2026-03-26 19:55:03
19歲王鈺棟再談留洋:出國非易事 有合適機遇才去 不關(guān)注外界批評

19歲王鈺棟再談留洋:出國非易事 有合適機遇才去 不關(guān)注外界批評

我愛英超
2026-03-26 18:48:21
馬英九疑似患失智癥,臺律師:大陸已注意到,沒讓其擔(dān)任統(tǒng)一大使

馬英九疑似患失智癥,臺律師:大陸已注意到,沒讓其擔(dān)任統(tǒng)一大使

愛意隨風(fēng)起呀
2026-03-26 16:51:41
原來她是張雪峰妻子,高校副教授歷史博士,相差7歲認識40天閃婚

原來她是張雪峰妻子,高校副教授歷史博士,相差7歲認識40天閃婚

奇思妙想草葉君
2026-03-26 14:01:49
大意了!張雪峰不同時段坐姿,證明他越來越疲憊了,可惜錯過了

大意了!張雪峰不同時段坐姿,證明他越來越疲憊了,可惜錯過了

魔都姐姐雜談
2026-03-26 10:53:11
越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場

越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場

林輕吟
2026-03-26 07:34:21
張雪峰猝死全過程曝光!知情人發(fā)聲,本來可以活,3次機會沒抓住

張雪峰猝死全過程曝光!知情人發(fā)聲,本來可以活,3次機會沒抓住

智慧生活筆記
2026-03-25 18:23:01
中原消費金融為催收“買”借款人手機號碼 三大運營商均中標 或涉買賣個人信息惹爭議

中原消費金融為催收“買”借款人手機號碼 三大運營商均中標 或涉買賣個人信息惹爭議

信網(wǎng)
2026-03-26 19:12:37
拉里賈尼繼任者不到一天被殺,川普加派82空降師開赴中東

拉里賈尼繼任者不到一天被殺,川普加派82空降師開赴中東

移光幻影
2026-03-26 09:56:37
人社部明確:事業(yè)編制改革啟動,3100萬人的“鐵飯碗”要變了

人社部明確:事業(yè)編制改革啟動,3100萬人的“鐵飯碗”要變了

慧眼看世界哈哈
2026-03-24 06:36:05
這4種魚,可能含有甲醛和重金屬,建議:還是少吃比較好!

這4種魚,可能含有甲醛和重金屬,建議:還是少吃比較好!

阿龍美食記
2026-03-24 21:52:23
油價反轉(zhuǎn)!95號汽油破9元后迎下調(diào),4月7日調(diào)價最新預(yù)測

油價反轉(zhuǎn)!95號汽油破9元后迎下調(diào),4月7日調(diào)價最新預(yù)測

復(fù)轉(zhuǎn)這些年
2026-03-26 09:40:14
喪夫僅5個月,49歲翁帆突傳“喜訊”高調(diào)露面,狀態(tài)好到出人意料

喪夫僅5個月,49歲翁帆突傳“喜訊”高調(diào)露面,狀態(tài)好到出人意料

冷紫葉
2026-03-24 19:12:36
贏球不到24小時,薩巴倫卡銳評鄭欽文,只字不提球技,卻字字珠璣

贏球不到24小時,薩巴倫卡銳評鄭欽文,只字不提球技,卻字字珠璣

林子說事
2026-03-26 14:10:10
伊朗最高領(lǐng)袖死里逃生細節(jié)曝光: 最可怕的“內(nèi)鬼”亮相了!

伊朗最高領(lǐng)袖死里逃生細節(jié)曝光: 最可怕的“內(nèi)鬼”亮相了!

仕道
2026-03-23 10:34:55
日媒重磅判斷:中國將成全球首個武器不用進口的大國

日媒重磅判斷:中國將成全球首個武器不用進口的大國

楊風(fēng)
2026-03-24 22:16:20
北京年近八旬老太每天看直播,4000元退休金全網(wǎng)購,家中

北京年近八旬老太每天看直播,4000元退休金全網(wǎng)購,家中

大象新聞
2026-03-26 11:49:02
穩(wěn)居西部第二!馬刺三大年輕核心,已成聯(lián)盟無解難題!

穩(wěn)居西部第二!馬刺三大年輕核心,已成聯(lián)盟無解難題!

田先生籃球
2026-03-26 14:23:29
省長劉捷在臺州專題調(diào)研開發(fā)區(qū)高質(zhì)量發(fā)展工作

省長劉捷在臺州專題調(diào)研開發(fā)區(qū)高質(zhì)量發(fā)展工作

臺州發(fā)布
2026-03-26 20:57:28
張雪峰好兄弟曝內(nèi)情泣不成聲,人民日報悼念官媒定義,衛(wèi)健委追責(zé)

張雪峰好兄弟曝內(nèi)情泣不成聲,人民日報悼念官媒定義,衛(wèi)健委追責(zé)

潮鹿逐夢
2026-03-26 10:55:41
2026-03-26 21:40:49
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學(xué)研究
9101文章數(shù) 145036關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

美國總統(tǒng)特朗普公開宣布訪華行程 外交部回應(yīng)

頭條要聞

美國總統(tǒng)特朗普公開宣布訪華行程 外交部回應(yīng)

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

健康
數(shù)碼
游戲
親子
旅游

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

iQOO Z11x發(fā)布:LCD黨的護眼神機 1499元起

開沖!PS會員4月離庫名單公布:獨立神作進入倒計時

親子要聞

你好,我是饅頭,快開門!

旅游要聞

別再人擠人,泰州的這條老街,傳承1200年!

無障礙瀏覽 進入關(guān)懷版