国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

港大團(tuán)隊(duì)開源7x24小時(shí)AI科學(xué)家,把人類時(shí)間還給創(chuàng)造力!

0
分享至

假如你是一名科研工作者,面對(duì)浩瀚的文獻(xiàn)和復(fù)雜的實(shí)驗(yàn),你是否渴望擁有一個(gè)不知疲倦、知識(shí)淵博并且能夠全程協(xié)作的超級(jí)助手?這個(gè)愿景正由香港大學(xué)教授黃超團(tuán)隊(duì)開發(fā)的 AI-Researcher 變?yōu)楝F(xiàn)實(shí)。

實(shí)驗(yàn)中,該團(tuán)隊(duì)揭示了以下實(shí)驗(yàn)效果:在技術(shù)實(shí)現(xiàn)上,以 Claude 為后端的 AI-Researcher 在 93.8%的情況下能夠成功產(chǎn)出可運(yùn)行的代碼;在科學(xué)質(zhì)量上,盡管 AI 論文平均分?jǐn)?shù)略低,但是相當(dāng)一部分已經(jīng)可以和人類工作比肩。例如,根據(jù) GPT-4o 評(píng)審,超過 78%的 AI 生成論文達(dá)到了可比水平。

它既是一個(gè)工具,也是一個(gè)能夠自主完成從文獻(xiàn)調(diào)研、假設(shè)生成、算法實(shí)現(xiàn)到論文撰寫全流程的 AI 科學(xué)家。實(shí)驗(yàn)表明,其所完成的學(xué)術(shù)成果在多個(gè)領(lǐng)域已經(jīng)慢慢接近人類高質(zhì)量研究水平。

黃超告訴 DeepTech:“我們的愿景就是希望通過 AI-Researcher 大幅提升科研效率。比如以前我們一個(gè)月可能只能驗(yàn)證一種算法思路,但有了 AI-Researcher 的輔助,我們一個(gè)月可以探索上百種不同的算法路徑,這種指數(shù)級(jí)的試錯(cuò)速度將帶來科研突破的質(zhì)的飛躍。”


(來源:https://arxiv.org/abs/2505.18705)

多智能體系統(tǒng)的科研助手

AI-Researcher 的強(qiáng)大源于其多智能體協(xié)作框架。這套系統(tǒng)模擬了人類科研團(tuán)隊(duì)的完整分工,將復(fù)雜任務(wù)進(jìn)行了分解執(zhí)行。

系統(tǒng)首先會(huì)由知識(shí)獲取智能體啟動(dòng),它僅需用戶提供少量種子論文,便能自主檢索并篩選出最相關(guān)的高質(zhì)量學(xué)術(shù)論文和代碼庫。

隨后,資源分析智能體將扮演關(guān)鍵角色:其論文分析模塊通過 RAG 技術(shù)從論文中提取核心數(shù)學(xué)公式,代碼分析模塊則在倉庫中定位具體實(shí)現(xiàn),借此建立理論與實(shí)踐的雙向映射,將抽象概念原子化。最終,規(guī)劃智能體整合分析結(jié)果,形成涵蓋數(shù)據(jù)、訓(xùn)練、測試的詳細(xì)開發(fā)計(jì)劃。

在扎實(shí)的知識(shí)地基上,創(chuàng)意生成器開始工作。它采用發(fā)散-收斂的模式,首先生成多個(gè)方向迥異的研究設(shè)想,然后基于科學(xué)性、新穎性和可行性篩選,形成結(jié)構(gòu)完整的研究提案。

核心突破體現(xiàn)在算法實(shí)現(xiàn)環(huán)節(jié)。AI-Researcher 摒棄了傳統(tǒng)AI變成一次性生成的脆弱模式,引入了類人迭代精煉范式。

代碼智能體負(fù)責(zé)根據(jù)計(jì)劃進(jìn)行初始實(shí)現(xiàn),顧問智能體則像導(dǎo)師一樣審核代碼的正確性,并通過分析初步實(shí)驗(yàn)結(jié)果提供修改建議。兩者形成多輪的實(shí)現(xiàn)-反饋-優(yōu)化循環(huán),顯著提高了復(fù)雜算法的實(shí)現(xiàn)成功率。

接著,自動(dòng)化文檔智能體采用三階段分層生成框架應(yīng)對(duì)長文本一致性的挑戰(zhàn):先根據(jù)模板生成論文大綱,再逐步填充內(nèi)容并維護(hù)邏輯一致性,最后依據(jù)專業(yè)清單核查修訂報(bào)告中的內(nèi)容及參考文獻(xiàn),確保學(xué)術(shù)上的嚴(yán)謹(jǐn)性。


(來源:https://arxiv.org/abs/2505.18705)

科學(xué)評(píng)估與嚴(yán)格評(píng)測,能力邊界與意外發(fā)現(xiàn)

為了客觀評(píng)價(jià)AI的科研能力,該團(tuán)隊(duì)創(chuàng)建了 Scientist-Bench 基準(zhǔn),精選了涵蓋計(jì)算機(jī)視覺、圖機(jī)器學(xué)習(xí)等領(lǐng)域的22篇頂會(huì)論文作為評(píng)估標(biāo)準(zhǔn)。

評(píng)估設(shè)置了兩層難度:Level-1 提供明確指令,測試 AI-Researcher 實(shí)現(xiàn)并執(zhí)行既定科研想法的能力;Level-2 只給參考文獻(xiàn),要求 AI-Researcher 自主發(fā)現(xiàn)新穎研究方向,挑戰(zhàn)性更高。

評(píng)估框架極為嚴(yán)格:先由代碼評(píng)審智能體驗(yàn)證技術(shù)實(shí)現(xiàn),再進(jìn)行科學(xué)貢獻(xiàn)評(píng)估,使用校準(zhǔn)后的論文評(píng)審智能體,以雙盲方式比較AI論文與人類原稿。

評(píng)審標(biāo)準(zhǔn)對(duì)標(biāo) ICLR 等頂會(huì),從創(chuàng)新性、方法嚴(yán)謹(jǐn)性、實(shí)驗(yàn)驗(yàn)證三個(gè)維度打分。為了消除偏差,他們針對(duì)論文順序進(jìn)行隨機(jī)交換,并匯集了多個(gè)頂尖大模型的獨(dú)立評(píng)審意見,形成了類似于評(píng)審委員會(huì)的集體決策。

期間還有一個(gè)反直覺的發(fā)現(xiàn)是:在開放探索任務(wù)中,AI-Researcher 的表現(xiàn)普遍優(yōu)于有明確指令的任務(wù),其平均評(píng)分和可比比例均有著顯著提升。

這表明,當(dāng)前AI科研智能體在整合內(nèi)部知識(shí)、自主發(fā)現(xiàn)方向等方面展現(xiàn)出獨(dú)特的優(yōu)勢,過細(xì)的指令反而會(huì)限制它的創(chuàng)造性。這挑戰(zhàn)了 AI 僅擅長執(zhí)行而非創(chuàng)造的舊有認(rèn)知。

實(shí)驗(yàn)也指出了一定局限:在需要深厚專業(yè)背景的理論分析和前沿優(yōu)化技術(shù)實(shí),AI 依然顯得稚嫩;在需要多步驟的嚴(yán)密數(shù)學(xué)推導(dǎo)時(shí),現(xiàn)有架構(gòu)依然容易出錯(cuò);跨越多天的科研長流程也對(duì)記憶系統(tǒng)提出了挑戰(zhàn)。


(來源:https://arxiv.org/abs/2505.18705)

盡管如此,AI-Researcher 展示了一條通往增強(qiáng)科學(xué)發(fā)現(xiàn)的切實(shí)路徑。目前,該框架已在物理、化學(xué)、生物等領(lǐng)域得到廣泛應(yīng)用。黃超表示,用戶普遍反饋 AI-Researcher 具備助力領(lǐng)域?qū)<覍?shí)現(xiàn)AI賦能的潛力。這一過程顯著降低了 AI 應(yīng)用門檻,讓研究者無需具備深厚的計(jì)算機(jī)或編程背景,也能利用 AI 技術(shù)推動(dòng)本學(xué)科的研究,實(shí)現(xiàn)跨領(lǐng)域的智能增強(qiáng)。

參考資料:

相關(guān)論文https://arxiv.org/abs/2505.18705

開源系統(tǒng)https://github.com/HKUDS/AI-Researcher

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
哈登31分創(chuàng)5大神跡:NBA歷史第一+率快船成11年首次做到這點(diǎn)球隊(duì)

哈登31分創(chuàng)5大神跡:NBA歷史第一+率快船成11年首次做到這點(diǎn)球隊(duì)

Emily說個(gè)球
2026-01-10 11:22:57
俄再次動(dòng)用“榛樹”高超導(dǎo)彈打擊烏克蘭,報(bào)復(fù)“俄總統(tǒng)官邸遭襲”

俄再次動(dòng)用“榛樹”高超導(dǎo)彈打擊烏克蘭,報(bào)復(fù)“俄總統(tǒng)官邸遭襲”

澎湃新聞
2026-01-09 16:08:27
教過那么多孩子,我發(fā)現(xiàn)小學(xué)數(shù)學(xué)就很差的,大概率會(huì)一直差下去!

教過那么多孩子,我發(fā)現(xiàn)小學(xué)數(shù)學(xué)就很差的,大概率會(huì)一直差下去!

好爸育兒
2025-12-30 17:30:47
我38歲,廣東塑料廠工程師,120萬死磕萬華化學(xué)20年,凈賺1800萬

我38歲,廣東塑料廠工程師,120萬死磕萬華化學(xué)20年,凈賺1800萬

真實(shí)人物采訪
2026-01-09 12:00:07
中方重拳出擊,瞄準(zhǔn)日本經(jīng)濟(jì)的地基,日本專家算了一筆“慘賬”!

中方重拳出擊,瞄準(zhǔn)日本經(jīng)濟(jì)的地基,日本專家算了一筆“慘賬”!

講者普拉斯
2026-01-09 21:39:39
美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡直是行走的 荷爾蒙

美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡直是行走的 荷爾蒙

小喬古裝漢服
2025-09-24 07:20:03
面對(duì)50年來最大危機(jī),伊朗采取極端措施,能否穩(wěn)住局勢?

面對(duì)50年來最大危機(jī),伊朗采取極端措施,能否穩(wěn)住局勢?

兵國大事
2026-01-09 18:17:51
羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

瓜汁橘長Dr
2025-12-29 11:29:56
周末突發(fā)!邢宏偉被查

周末突發(fā)!邢宏偉被查

中國基金報(bào)
2026-01-10 11:09:17
秦海璐春晚彩排被偶遇,穿大衣戴墨鏡氣場全開,網(wǎng)友:被帥一臉!

秦海璐春晚彩排被偶遇,穿大衣戴墨鏡氣場全開,網(wǎng)友:被帥一臉!

木子愛娛樂大號(hào)
2026-01-09 21:45:16
3 大生肖迎暴富!1 月 11 日起橫財(cái)扎堆,一路富到春節(jié)

3 大生肖迎暴富!1 月 11 日起橫財(cái)扎堆,一路富到春節(jié)

人閒情事
2026-01-10 16:12:38
特朗普接受專訪:“我不需要國際法”

特朗普接受專訪:“我不需要國際法”

澎湃新聞
2026-01-09 13:57:08
烏專家:中國“吸干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

烏專家:中國“吸干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

博覽歷史
2025-12-29 19:26:45
劉曉慶擔(dān)心的事發(fā)生了!意外摔倒、分不清人,75歲不服老不行了?

劉曉慶擔(dān)心的事發(fā)生了!意外摔倒、分不清人,75歲不服老不行了?

楠楠自語
2025-12-03 15:57:03
建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

文史季季紅
2026-01-10 16:30:03
五十六歲的鐘麗緹更加油膩了,從機(jī)場出來,150斤的體重驚呆眾人

五十六歲的鐘麗緹更加油膩了,從機(jī)場出來,150斤的體重驚呆眾人

可樂談情感
2026-01-08 06:28:33
可控核聚變領(lǐng)域,國內(nèi)表現(xiàn)優(yōu)秀的10家公司名單曝光?。ńㄗh收藏)

可控核聚變領(lǐng)域,國內(nèi)表現(xiàn)優(yōu)秀的10家公司名單曝光!(建議收藏)

元爸體育
2026-01-09 08:49:12
她是國家一級(jí)演員,享正軍級(jí)待遇,離異后至今單身,67歲依然美麗

她是國家一級(jí)演員,享正軍級(jí)待遇,離異后至今單身,67歲依然美麗

老謝談史
2025-12-16 14:59:41
瑾汐回溫州看望父母,一張圖片讓大家覺得傷感,二哈最重姐妹情誼

瑾汐回溫州看望父母,一張圖片讓大家覺得傷感,二哈最重姐妹情誼

阿雹娛樂
2026-01-10 14:25:54
肥腸再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):常吃肥腸,身體會(huì)收獲3大好處

肥腸再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):常吃肥腸,身體會(huì)收獲3大好處

全球軍事記
2025-12-29 21:28:37
2026-01-10 17:47:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16103文章數(shù) 514469關(guān)注度
往期回顧 全部

科技要聞

傳DeepSeek準(zhǔn)備第二次震驚全世界

頭條要聞

男生遭老師按地上強(qiáng)制要求剪頭發(fā) 被老師勒脖子騎身上

頭條要聞

男生遭老師按地上強(qiáng)制要求剪頭發(fā) 被老師勒脖子騎身上

體育要聞

怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

娛樂要聞

吳速玲曝兒子Joe是戀愛腦

財(cái)經(jīng)要聞

這不算詐騙嗎?水滴保誘導(dǎo)扣款惹眾怒

汽車要聞

寶馬25年全球銷量246.3萬臺(tái) 中國仍是第一大市場

態(tài)度原創(chuàng)

本地
家居
游戲
手機(jī)
軍事航空

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

家居要聞

木色留白 演繹現(xiàn)代自由

《神界》新作設(shè)計(jì)將對(duì)“讀檔重來”功能持開放態(tài)度

手機(jī)要聞

破3000萬臺(tái)!三星Galaxy S25系列手機(jī)打破安卓魔咒

軍事要聞

海空英雄高翔逝世 曾駕駛殲-6打爆美軍機(jī)

無障礙瀏覽 進(jìn)入關(guān)懷版