国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清華發(fā)布AutoSOTA:一周刷新105個(gè)頂會(huì)SOTA,推動(dòng)AI科研回歸本質(zhì)

0
分享至



在人工智能研究中,許多研究者將大量時(shí)間投入到為那 1% 的性能提升反復(fù)調(diào)參與實(shí)驗(yàn)迭代之中。

一個(gè)越來(lái)越值得重視的問(wèn)題是:人類(lèi)科學(xué)家最寶貴的直覺(jué)與創(chuàng)造力,是否正被困在無(wú)止境的「增量式優(yōu)化」中?

SOTA(State-of-the-Art,當(dāng)前最佳水平的 AI 模型)長(zhǎng)期被視為衡量研究?jī)r(jià)值的「金標(biāo)準(zhǔn)」。

當(dāng)一篇學(xué)術(shù)論文刷新 SOTA 時(shí),人們看到的,往往只是結(jié)果的躍升。但在結(jié)果背后,真正支撐起一次次「當(dāng)前最佳」的,往往不是某一個(gè)瞬間的靈感,而是此后持續(xù)數(shù)月甚至數(shù)年的高強(qiáng)度實(shí)驗(yàn)迭代、參數(shù)調(diào)整與工程優(yōu)化。

以 Transformer 架構(gòu)的發(fā)展為例。自 2017 年問(wèn)世以來(lái),全球科研人員圍繞這一架構(gòu)投入了大量人力與算力,不斷提出新變體、設(shè)計(jì)新模塊、優(yōu)化訓(xùn)練策略,才最終將其在通用語(yǔ)言理解評(píng)測(cè)集 GLUE 上的性能從約 75% 提升到 90% 以上。



Transformer 架構(gòu)在 GLUE 評(píng)測(cè)集上的性能爬升

問(wèn)題在于,這些優(yōu)化工作雖然重要,卻并不總是最值得由人類(lèi)科學(xué)家重點(diǎn)投入的那一部分。

如果最優(yōu)秀的科研人才被長(zhǎng)期綁定在重復(fù)性的性能優(yōu)化中,那么那些更具原創(chuàng)性、更需要長(zhǎng)期思考的問(wèn)題,誰(shuí)來(lái)持續(xù)投入?

AutoSOTA 讓 AI 科研自動(dòng)化走向端到端閉環(huán)

正是在這樣的背景下,在近期召開(kāi)的中關(guān)村論壇上,清華大學(xué)與北京中關(guān)村學(xué)院聯(lián)合發(fā)布研究成果 ——AutoSOTA。

目前,AutoSOTA項(xiàng)目已發(fā)布預(yù)印本論文。



論文地址:https://arxiv.org/abs/2604.05550

AutoSOTA 面向端到端的 AI 科研自動(dòng)化,致力于通過(guò)科研智能體加速高強(qiáng)度、重復(fù)性的實(shí)驗(yàn)迭代與優(yōu)化過(guò)程,將研究者從持續(xù)的性能打磨中解放出來(lái)。



AutoSOTA 研究問(wèn)題框架

不同于現(xiàn)有的代碼優(yōu)化框架,AutoSOTA 并不是對(duì)單一實(shí)驗(yàn)環(huán)節(jié)的局部加速。它將 AI 智能體的賦能邊界進(jìn)一步延伸到實(shí)驗(yàn)準(zhǔn)備、實(shí)驗(yàn)執(zhí)行等底層繁瑣任務(wù),以及研究思路生成等頂層構(gòu)思環(huán)節(jié),旨在實(shí)現(xiàn)從已有 SOTA 到新 SOTA、從現(xiàn)有代碼倉(cāng)庫(kù)到新代碼倉(cāng)庫(kù)的端到端 AI 科研自動(dòng)化。



AutoSOTA 端到端 AI 科研自動(dòng)化系統(tǒng)

AutoSOTA 采用多智能體協(xié)作框架,借鑒人類(lèi)算法研究中的分工流程與協(xié)作邏輯,使不同科研智能體能夠圍繞同一目標(biāo)開(kāi)展協(xié)同設(shè)計(jì)、實(shí)驗(yàn)執(zhí)行、結(jié)果分析與方案迭代。

與此同時(shí),AutoSOTA 配備了完善的工具庫(kù)(Toolkit)與技能集(Skill Set),不僅能夠處理實(shí)驗(yàn)運(yùn)行中的復(fù)雜狀況,還能夠完成文獻(xiàn)調(diào)研、思路生成、方案設(shè)計(jì)等高層次任務(wù),從而在頂層規(guī)劃與底層執(zhí)行之間形成閉環(huán)。

這意味著,AutoSOTA 所追求的并不只是「把實(shí)驗(yàn)跑得更快」,而是真正推動(dòng) AI 科研自動(dòng)化從單點(diǎn)輔助走向系統(tǒng)化、持續(xù)化、智能化的科研協(xié)作過(guò)程。

一周時(shí)間,發(fā)現(xiàn) 105 個(gè)性能顯著提升的 SOTA 模型

在為期一周的實(shí)驗(yàn)中,AutoSOTA 以前一年 AI 頂會(huì)論文中的優(yōu)秀成果為基礎(chǔ),自動(dòng)發(fā)現(xiàn)了 105 個(gè)性能顯著提升的模型方案。其中,超過(guò) 60% 的模型具有新穎的結(jié)構(gòu)設(shè)計(jì),平均性能提升接近 10%。



基于A(yíng)utoSOTA的大規(guī)模SOTA AI模型發(fā)現(xiàn)

項(xiàng)目地址:https://tsinghua-fib-lab.github.io/AutoSOTA/

這組結(jié)果的意義在于,AutoSOTA 并非只是沿著既有路徑進(jìn)行簡(jiǎn)單搜索,也不局限于參數(shù)組合層面的窮舉式優(yōu)化。它在優(yōu)化性能的同時(shí),展現(xiàn)出一定程度的結(jié)構(gòu)創(chuàng)新能力,能夠在已有研究基礎(chǔ)上繼續(xù)挖掘新的設(shè)計(jì)空間,發(fā)現(xiàn)兼具性能提升與結(jié)構(gòu)新穎性的模型方案。

AutoSOTA 的意義,不止于「再提幾分」


AutoSOTA 的意義,不僅在于獲得了一批新的 SOTA 結(jié)果,更在于它啟發(fā)人類(lèi)科學(xué)家重新審視科研創(chuàng)新的本質(zhì):SOTA 性能的刷新,是否等同于重要的科學(xué)突破?

AutoSOTA 啟示我們進(jìn)一步思考:如何將人類(lèi)科學(xué)家最寶貴的注意力,從重復(fù)性的實(shí)驗(yàn)迭代中重新釋放出來(lái),回歸到更具原創(chuàng)性、也更需要長(zhǎng)期判斷與創(chuàng)造力的研究問(wèn)題上?

一種可能的人智協(xié)作模式是:由科研智能體系統(tǒng)承擔(dān)大量重復(fù)性、密集型、長(zhǎng)周期的優(yōu)化過(guò)程,由人類(lèi)科學(xué)家聚焦于提出問(wèn)題、定義方向、識(shí)別機(jī)會(huì)與構(gòu)想機(jī)制。在這一意義上,AutoSOTA 更像是一種面向科研流程的「創(chuàng)造力放大器」。

它并不是要替代科學(xué)家的原創(chuàng)性,而是要把原創(chuàng)性從低效、重復(fù)的實(shí)驗(yàn)勞動(dòng)中解放出來(lái)。



AutoSOTA啟發(fā)的人智協(xié)同科研范式

真正重要的,不是讓研究者永遠(yuǎn)停留在「把已有模型再推高一點(diǎn)」的循環(huán)里,而是讓他們有更多機(jī)會(huì)去面對(duì)那些尚未被定義、尚未被解釋、也尚未被系統(tǒng)探索的問(wèn)題。

AutoSOTA 正在朝這一方向邁出關(guān)鍵一步。它不僅展示了科研智能體在 AI 研究自動(dòng)化中的巨大潛力,也讓我們看到,當(dāng)「性能優(yōu)化」這項(xiàng)沉重工作逐步被智能體接管之后,科學(xué)研究有機(jī)會(huì)真正回到它最珍貴的起點(diǎn) ——提出大膽的問(wèn)題,探索未知的方向,追求不可替代的原創(chuàng)性突破。

項(xiàng)目網(wǎng)站:https://tsinghua-fib-lab.github.io/AutoSOTA/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
前阿里財(cái)務(wù)總監(jiān)爆火言論:普通家庭買(mǎi)車(chē)是最蠢的動(dòng)作!評(píng)論炸鍋

前阿里財(cái)務(wù)總監(jiān)爆火言論:普通家庭買(mǎi)車(chē)是最蠢的動(dòng)作!評(píng)論炸鍋

許三歲
2026-04-10 09:31:44
官宣!馬刺傷情報(bào)告出爐,掘金有意挑火箭,湖人干就完了

官宣!馬刺傷情報(bào)告出爐,掘金有意挑火箭,湖人干就完了

世界體育圈
2026-04-12 11:59:28
1954年,甘祖昌得知被評(píng)為準(zhǔn)軍級(jí):我有意見(jiàn),要向中央討要個(gè)說(shuō)法

1954年,甘祖昌得知被評(píng)為準(zhǔn)軍級(jí):我有意見(jiàn),要向中央討要個(gè)說(shuō)法

史之銘
2026-04-12 17:55:26
狂轟11:2,溫瑞博3:1淘汰日乒世界冠軍,球迷怒噴王皓撞南墻不拐

狂轟11:2,溫瑞博3:1淘汰日乒世界冠軍,球迷怒噴王皓撞南墻不拐

觀(guān)察鑒娛
2026-04-12 10:28:21
中年男人最大的悲哀是什么?網(wǎng)友:我,中年女人,也對(duì)啥都沒(méi)興趣

中年男人最大的悲哀是什么?網(wǎng)友:我,中年女人,也對(duì)啥都沒(méi)興趣

帶你感受人間冷暖
2026-04-10 01:21:44
美伊談判破裂的三大癥結(jié):霍爾木茲、濃縮鈾和百億凍結(jié)資金

美伊談判破裂的三大癥結(jié):霍爾木茲、濃縮鈾和百億凍結(jié)資金

華爾街見(jiàn)聞官方
2026-04-12 16:55:53
“留學(xué)回來(lái),15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒(méi)有

“留學(xué)回來(lái),15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒(méi)有

皓皓情感說(shuō)
2026-04-10 22:54:59
廣東戰(zhàn)廣廈12人名單,黃明依入圍,杜鋒變陣,徐杰替補(bǔ)三將關(guān)鍵

廣東戰(zhàn)廣廈12人名單,黃明依入圍,杜鋒變陣,徐杰替補(bǔ)三將關(guān)鍵

佳佳說(shuō)奇事故事
2026-04-12 16:58:26
教育部通知!9月入學(xué)迎來(lái)顛覆性改革,孩子上學(xué)不用再拼家底了

教育部通知!9月入學(xué)迎來(lái)顛覆性改革,孩子上學(xué)不用再拼家底了

今朝牛馬
2026-04-10 22:35:42
熱議!雖然把醫(yī)生投訴了,但醫(yī)生醫(yī)術(shù)好,還想找你看?。♂t(yī)生能拒診嗎?

熱議!雖然把醫(yī)生投訴了,但醫(yī)生醫(yī)術(shù)好,還想找你看病!醫(yī)生能拒診嗎?

華醫(yī)網(wǎng)
2026-04-12 05:41:34
廣東莫氏雞煲老板誠(chéng)實(shí)經(jīng)營(yíng):雞源已斷卻贏(yíng)得食客信賴(lài)

廣東莫氏雞煲老板誠(chéng)實(shí)經(jīng)營(yíng):雞源已斷卻贏(yíng)得食客信賴(lài)

馬蹄燙嘴說(shuō)美食
2026-04-12 12:04:59
中美印負(fù)債金額差距斷崖:美36萬(wàn)億,印160萬(wàn)億,中國(guó)有多少?

中美印負(fù)債金額差距斷崖:美36萬(wàn)億,印160萬(wàn)億,中國(guó)有多少?

夢(mèng)史
2026-04-12 04:48:05
政變只是一個(gè)開(kāi)始,伊朗要變天了,中國(guó)最擔(dān)心的事情,恐將發(fā)生

政變只是一個(gè)開(kāi)始,伊朗要變天了,中國(guó)最擔(dān)心的事情,恐將發(fā)生

舊鐵皮往南開(kāi)
2026-04-12 12:31:02
亞錦賽戰(zhàn)報(bào):韓國(guó)3金1銀收官!國(guó)羽鎖定1金2銀只待石宇奇

亞錦賽戰(zhàn)報(bào):韓國(guó)3金1銀收官!國(guó)羽鎖定1金2銀只待石宇奇

老汆古裝影視解說(shuō)
2026-04-12 17:11:36
機(jī)關(guān)事業(yè)單位職工未來(lái)要調(diào)整為“一周4天工作制”,你贊同嗎?

機(jī)關(guān)事業(yè)單位職工未來(lái)要調(diào)整為“一周4天工作制”,你贊同嗎?

細(xì)說(shuō)職場(chǎng)
2026-04-12 09:39:35
農(nóng)村酒席嚴(yán)查!2026新規(guī)落地,這3種酒堅(jiān)決不能辦,違者直接處罰

農(nóng)村酒席嚴(yán)查!2026新規(guī)落地,這3種酒堅(jiān)決不能辦,違者直接處罰

復(fù)轉(zhuǎn)這些年
2026-04-08 13:04:32
2換1神級(jí)交易!狂攬31助攻5失誤!詹姆斯等來(lái)頂級(jí)控衛(wèi)

2換1神級(jí)交易!狂攬31助攻5失誤!詹姆斯等來(lái)頂級(jí)控衛(wèi)

籃球教學(xué)論壇
2026-04-12 13:27:10
蘭州擒獲殺人惡魔:八名特警破門(mén)而入,搏斗十分鐘,情節(jié)堪比武俠劇

蘭州擒獲殺人惡魔:八名特警破門(mén)而入,搏斗十分鐘,情節(jié)堪比武俠劇

隴史薈王文元
2026-04-11 07:34:39
全程眼突鼓腮,看了觀(guān)眾對(duì)孫儷的評(píng)價(jià),才知張藝謀這句話(huà)的含金量

全程眼突鼓腮,看了觀(guān)眾對(duì)孫儷的評(píng)價(jià),才知張藝謀這句話(huà)的含金量

陳述影視
2026-04-04 17:53:34
一場(chǎng)3-1,讓國(guó)乒收獲第2冠!太原賽12日賽程出爐:溫瑞博沖雙冠王

一場(chǎng)3-1,讓國(guó)乒收獲第2冠!太原賽12日賽程出爐:溫瑞博沖雙冠王

侃球熊弟
2026-04-11 20:26:26
2026-04-12 18:35:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12729文章數(shù) 142623關(guān)注度
往期回顧 全部

科技要聞

理想稱(chēng)遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

伊朗不接受美"紅線(xiàn)" 消息人士:美在談判決策上犯了錯(cuò)

頭條要聞

伊朗不接受美"紅線(xiàn)" 消息人士:美在談判決策上犯了錯(cuò)

體育要聞

五大聯(lián)賽首冠出爐?拜仁或提前4輪衛(wèi)冕德甲

娛樂(lè)要聞

46歲趙達(dá)官宣結(jié)婚!曾與殷桃談婚論嫁

財(cái)經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車(chē)要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

健康
本地
數(shù)碼
親子
公開(kāi)課

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

數(shù)碼要聞

破壁機(jī)哪個(gè)牌子好?安全無(wú)毒材質(zhì)是重點(diǎn),揭秘TOP10家用哪種好

親子要聞

“孩子都8歲了 一定要分床睡”,醫(yī)生分享:如果孩子長(zhǎng)期不和家人分床,“會(huì)影響性格發(fā)育、情商發(fā)育 很難培養(yǎng)獨(dú)立性”

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版