国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI科學(xué)家登上Nature,論文從構(gòu)思到發(fā)表全自動化,一篇已通過評審

0
分享至

幾小時前,Nature 宣布了真正意義上的 AI 科學(xué)家的首次實現(xiàn)。由“Transformer 八子”之一聯(lián)合創(chuàng)辦的日本 Sakana AI 與英國牛津大學(xué)、英屬哥倫比亞大學(xué)的研究團隊打造了一個從零開始搞科研的 AI,實現(xiàn)了從構(gòu)思到論文發(fā)表的完整端到端自動化,并有 AI 論文通過國際頂會 ICLR 2025 同行評審,這是 AI 科研范式的突破,觸及了人類創(chuàng)造力的邊界。


圖 | 被選中的 AI 論文節(jié)選(來源:https://www.nature.com/art)

值得注意的是,來自英國牛津大學(xué)的 Chris Lu 和來自英屬哥倫比亞大學(xué)的 Cong Lu 是共同一作之一。


圖 | 從左到右:Chris Lu 和 Cong Lu(來源:資料圖)

研究中,他們造出了一個叫 AI 科學(xué)家( AI Scientist)的系統(tǒng),從想點子、寫代碼、跑實驗、分析數(shù)據(jù),到寫論文、自己審稿,全由AI自己完成。

更讓人震驚的是,其中一篇完全由AI生成的論文,投到了 ICLR 2025 的一個研討會,拿到了 6 分、7 分、6 分的評審分?jǐn)?shù),超過了這個研討會平均的錄取線。這篇論文如果沒被主動撤稿,大概率會被接收。


(來源:https://www.nature.com/articles/s41586-026-10265-5)

據(jù)了解,AI 科學(xué)家的工作流程分成四塊。

第一步是想點子。

它被喂進一個研究領(lǐng)域后,會自己生成一批研究方向,每一條都帶著標(biāo)題、研究理由、實驗方案,還給自己打分,有趣程度、新穎程度、可行性,1 到 10 分自己評。然后它連上 Semantic Scholar 的學(xué)術(shù)搜索引擎,把跟已有工作太像的點子扔掉。

第二步是做實驗。

這里分兩種模式。

第一種是模板模式,研究人員先給它一段能跑通的代碼做起點,它在這個基礎(chǔ)上想新點子,然后叫一個叫 Aider 的代碼助手來改代碼、跑實驗,出錯了自己看日志、自己修,修好了繼續(xù)跑。

另一種是無模板模式,它連起點代碼都沒有,得從零開始寫。這時候它會搞一個樹形搜索,一個點子長出好幾個分支,每個分支跑不同參數(shù)、不同設(shè)置,跑完一輪選最好的那個繼續(xù)往下走。這個過程會并行跑很多個節(jié)點,誰效果好誰被選中繼續(xù)深挖。

第三步是寫論文。

它把自己實驗里記的筆記、生成的圖表填進一個標(biāo)準(zhǔn)的 LaTeX 模板里,一節(jié)一節(jié)地寫,引言、方法、結(jié)果、結(jié)論,全齊。要寫相關(guān)工作部分的時候,它再去查 Semantic Scholar,把相關(guān)的論文找出來,然后讀摘要和寫引用。寫完還會自己編譯 LaTeX,報錯了自己改,最多可以改五次,直到出一份能看的 PDF。

第四步是自己審稿。

研究團隊還造了一個自動化審稿器,照著 NeurIPS 的審稿指南,對論文打分,給優(yōu)點、缺點、倫理問題,最后給一個接受或拒絕的建議。五份獨立審稿結(jié)果匯總,再由它自己當(dāng)領(lǐng)域主席做一個綜合判斷。

這個自動化審稿器不是隨便做的,研究團隊拿它跟真實的人類審稿記錄做了對比。他們從 OpenReview 上拿了 ICLR 的論文數(shù)據(jù),讓自動化審稿器打分,結(jié)果它的平衡準(zhǔn)確率達到 了69%,跟人類審稿人的 66% 差不多。

在 F1 分?jǐn)?shù)上,它甚至比 NeurIPS 2021 那個著名的審稿一致性實驗里的人類審稿人之間的一致性還高。這意味著自動化審稿器打出來的分?jǐn)?shù),跟一個真實的人類審稿專家基本在一個水平線上。

他們還專門測了數(shù)據(jù)污染的問題。模型訓(xùn)練時用的數(shù)據(jù)可能包含 2017 到 2024 年的論文,所以他們又拿 2025 年出的新論文測了一遍,結(jié)果平衡準(zhǔn)確率降到了 66%,仍然和人類審稿人持平。這說明自動化審稿器不是靠背答案,它其實是真的能夠自己判斷論文質(zhì)量。


(來源:https://www.nature.com/articles/s41586-026-10265-5)

研究團隊還發(fā)現(xiàn)了一個規(guī)律,AI 科學(xué)家生成的論文質(zhì)量,跟它底下用的基礎(chǔ)模型強相關(guān)。他們用不同時間發(fā)布的模型跑同一套流程,從較老的模型到最新的模型,生成的論文評分一直在漲。這說明隨著基礎(chǔ)模型越來越強,AI 科學(xué)家寫出來的論文也會越來越接近人類水平。

同時,給 AI 科學(xué)家分配的計算資源越多,它寫出來的論文質(zhì)量也越高。這有點像給一個研究生更多時間做實驗,最后成果也會更好。這兩個趨勢加在一起,意味著未來 AI 科學(xué)家的能力會隨著模型升級和算力增長持續(xù)提升。


(來源:Nature)

被研討會評審看上的那篇論文,研究的是深度學(xué)習(xí)里的一個負向結(jié)果,正好契合那個叫 ICBINB 的研討會主題。這篇論文由AI科學(xué)家在無模板模式下生成,從頭到尾沒有人類修改過。它從選題、設(shè)計實驗、跑代碼、出圖表、寫 LaTeX,全部是自己完成的。

研究團隊一共投了三篇,只有這一篇過了線,另外兩篇沒達標(biāo)。這說明 AI 科學(xué)家目前還不是每次都能寫出高質(zhì)量論文,但這明確證明 AI 寫出來的東西已經(jīng)能騙過人類審稿人,讓它以為自己是在審一個人類研究生的作業(yè)。

當(dāng)然,AI 科學(xué)家現(xiàn)在還遠不夠完美。它偶爾會想出很幼稚的點子,方法論不夠嚴(yán)謹(jǐn),寫代碼時會出各種 bug,還會產(chǎn)生幻覺,比如引文明明是錯的它硬說對,或者附錄里把同一張圖放兩遍。

不過,研究團隊發(fā)現(xiàn)在機器學(xué)習(xí)這個領(lǐng)域,很多技術(shù)剛出現(xiàn)時都不完美,甚至漏洞百出,但只要它能讓做出來這件事本身成立,后續(xù)通過擴大規(guī)模、更好的模型、更優(yōu)的技術(shù),這項能力就會迅速提升,進而很快超越人類水平。

總的來說,這項工作的意義遠遠不止讓 AI 寫幾篇論文,它把整個科研流程從頭到尾連起來了,從想點子到做實驗到寫論文到審稿,全在計算機里跑通。

未來可以用 AI 來加速科研,比如在藥物發(fā)現(xiàn)、材料設(shè)計、氣候建模這些領(lǐng)域,讓 AI 科學(xué)家 7×24 小時地跑實驗、試方向,而人類科學(xué)家只需要在關(guān)鍵節(jié)點做判斷和選擇。

同時,研究團隊在論文最后也提到了風(fēng)險,比如AI論文洪流可能會壓垮現(xiàn)有的審稿系統(tǒng),或者有人拿 AI 灌水、批量發(fā)假論文。所以他們主動把投出去的論文撤回來了,也在所有生成的論文里加了水印,方便識別。他們還建議學(xué)術(shù)界盡快建立規(guī)范,告訴人們 AI 寫的論文應(yīng)該怎么標(biāo)注和怎么對待。

參考資料:

相關(guān)論文https://www.nature.com/articles/s41586-026-10265-5

https://www.linkedin.com/in/chris-lu-37471b119/

https://chrislu.page/

https://www.linkedin.com/in/cong-lu-530b74104/

https://www.conglu.co.uk/

https://sakana.ai/ai-scientist-nature/

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
臺灣創(chuàng)投圈的大佬蔣友松最近砸出了一個讓整個島內(nèi)政壇炸鍋的決定

臺灣創(chuàng)投圈的大佬蔣友松最近砸出了一個讓整個島內(nèi)政壇炸鍋的決定

小馬姨
2026-04-12 13:10:53
3月銷量出爐,廣汽豐田三月三冠

3月銷量出爐,廣汽豐田三月三冠

IT之家
2026-04-12 20:03:24
稱重快餐2年倒閉4.8萬家,怪15元的自助盒飯?zhí)恚?>
    </a>
        <h3>
      <a href=三人成虎V5
2026-04-12 16:20:10
一場戰(zhàn)爭徹底把中國打醒!美軍作戰(zhàn)最毒的是什么?中國用30年看清

一場戰(zhàn)爭徹底把中國打醒!美軍作戰(zhàn)最毒的是什么?中國用30年看清

小蘭聊歷史
2026-04-08 01:20:00
萬茜蹲火了

萬茜蹲火了

動物奇奇怪怪
2026-04-11 17:32:32
一夜之間,中國網(wǎng)球連奪2冠!吳易昺破荒,張帥解鎖全新紀(jì)錄!

一夜之間,中國網(wǎng)球連奪2冠!吳易昺破荒,張帥解鎖全新紀(jì)錄!

劉姚堯的文字城堡
2026-04-13 10:12:02
小天賜,終為父母當(dāng)年的“沖動”買了單,年僅6歲活得不像個小孩

小天賜,終為父母當(dāng)年的“沖動”買了單,年僅6歲活得不像個小孩

奇怪的鯊魚們
2026-03-02 13:11:54
亞錦賽2場決賽被取消!安洗瑩社媒發(fā)文,石宇奇定下奧運金牌目標(biāo)

亞錦賽2場決賽被取消!安洗瑩社媒發(fā)文,石宇奇定下奧運金牌目標(biāo)

排球黃金眼
2026-04-12 23:55:21
SGA數(shù)據(jù)碾壓歷史,MVP卻要給未來讓路?

SGA數(shù)據(jù)碾壓歷史,MVP卻要給未來讓路?

茅塞盾開本尊
2026-04-13 13:16:48
特朗普宣布將封鎖霍爾木茲海峽,比伊朗的封鎖更狠

特朗普宣布將封鎖霍爾木茲海峽,比伊朗的封鎖更狠

名人茍或
2026-04-12 23:03:38
看上去像“公務(wù)員”,其實連編制都沒有的6個職業(yè)

看上去像“公務(wù)員”,其實連編制都沒有的6個職業(yè)

細說職場
2026-04-12 17:02:40
西部季后賽剛鎖死,湖人卻把自己埋進附加賽

西部季后賽剛鎖死,湖人卻把自己埋進附加賽

綠茵狂熱者
2026-04-13 15:48:22
11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

半糖甜而不膩
2026-04-06 12:09:15
國際油價飆漲8%,黃金跌破4650美元,美軍開始封鎖伊朗港口

國際油價飆漲8%,黃金跌破4650美元,美軍開始封鎖伊朗港口

21世紀(jì)經(jīng)濟報道
2026-04-13 06:48:42
浪姐史上翻車最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的

浪姐史上翻車最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的

阿坹武器裝備科普
2026-04-13 06:37:44
西班牙首相和夫人逛北京什剎海,夫人穿七分褲超精致優(yōu)雅

西班牙首相和夫人逛北京什剎海,夫人穿七分褲超精致優(yōu)雅

點點細語
2026-04-13 09:44:52
ASPI智庫涉臺報告純屬荒誕鬧劇

ASPI智庫涉臺報告純屬荒誕鬧劇

烽火瞭望者
2026-04-13 06:19:34
爆大冷!大黑馬26分慘?。狠喰葜髁Σ幌脍A球,如愿避開哈登騎士

爆大冷!大黑馬26分慘?。狠喰葜髁Σ幌脍A球,如愿避開哈登騎士

體壇小李
2026-04-13 09:35:21
伊朗戰(zhàn)爭徹底打醒巴基斯坦:反對黨公開支持政府,中巴合作穩(wěn)了

伊朗戰(zhàn)爭徹底打醒巴基斯坦:反對黨公開支持政府,中巴合作穩(wěn)了

安夢入天下
2026-04-13 13:45:44
35歲傅彪兒子,住豪宅生活奢華,單身滿頭白發(fā),走上了“不歸路”

35歲傅彪兒子,住豪宅生活奢華,單身滿頭白發(fā),走上了“不歸路”

林輕吟
2026-04-02 19:51:37
2026-04-13 16:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16572文章數(shù) 514868關(guān)注度
往期回顧 全部

科技要聞

傳榮耀與字節(jié)跳動接洽“豆包手機”合作

頭條要聞

女子名下多出一套上海房產(chǎn)很苦惱:丈夫去世 房子沒了

頭條要聞

女子名下多出一套上海房產(chǎn)很苦惱:丈夫去世 房子沒了

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

賈玲減重后現(xiàn)身馮鞏生日宴 身材未反彈

財經(jīng)要聞

起底AI"造黃"灰產(chǎn):19.9元"一鍵脫衣"

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

旅游
數(shù)碼
房產(chǎn)
本地
公開課

旅游要聞

洛陽國際牡丹園“混血”黑牡丹——水墨丹青迎來最佳觀賞期

數(shù)碼要聞

高管親自放風(fēng) 何剛暗示華為 WATCH FIT 5 Pro即將發(fā)布

房產(chǎn)要聞

6000億投資盛宴,全球巨頭齊聚,海南又要干件大事!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版