国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

研究員首次全線落敗——AI架構、數(shù)據(jù)、算法三戰(zhàn)獲科學發(fā)現(xiàn)級突破

0
分享至



「AI的發(fā)展,已經(jīng)進入決賽圈。決賽圈比拼的,是AI自進化的加速度」 —— 項目負責人

DeepMind 德米斯·哈薩比斯曾用一句話定義他畢生的使命:「先解決智能問題,然后用它來解決其他一切問題。

這句話背后藏著一個極其深刻的邏輯——智能,是打開人類一切重大命題的萬能鑰匙。物理、化學、生物……所有領域的突破,本質上都在等待同一件事的發(fā)生:AI 真正掌握自我進化的能力。一旦這道門被打開,它所釋放的能量,將同時涌入人類知識版圖的每一個角落。

AI 的每一次進步,背后都是人類研究員在架構設計、數(shù)據(jù)清洗、算法調優(yōu)上投入的海量人力——這是一條以人力為燃料的線性賽道:效率低下,迭代緩慢,而我們所期望的是那條指數(shù)級躍升的曲線。

AI 在加速,但駕駛它的,還是人類的雙手。這,正是決賽圈真正的瓶頸所在。直到今天,這個瓶頸,第一次被正面擊穿。



圖:AI自主實現(xiàn)架構、數(shù)據(jù)、算法三大核心領域的科學發(fā)現(xiàn)級突破,其光芒向外輻射,驅動數(shù)學、生物醫(yī)學、物理學等整片知識星系,邁入全新軌道。

來自創(chuàng)智學院、上海交通大學劉鵬飛研究團隊(GAIR)發(fā)布的「超智能-進化」框架:ASI-Evolve,已經(jīng)可以在不依賴人類研究員的前提下,獨立完成「發(fā)現(xiàn)問題 → 設計方案 → 迭代驗證 → 提煉規(guī)律」的完整科研閉環(huán)。

更重要的是,這一次并非某個局部領域的小試牛刀——而是在 AI 研發(fā)最硬核的三大核心戰(zhàn)場上,同時交出了科學發(fā)現(xiàn)級別的答卷:

  • 神經(jīng)網(wǎng)絡架構設計——AI 獨立發(fā)現(xiàn)超越人類專家的全新架構。
  • 預訓練數(shù)據(jù)篩選——AI 自主優(yōu)化數(shù)據(jù)策略,MMLU 評測提升超 18 個百分點。
  • ??強化學習算法設計——AI 設計出全新訓練算法,數(shù)學競賽題上超越 GRPO 基線達 12.5 分。

三場硬仗,三場勝利。人類研究員,在 AI 自我進化的加速度競賽中,首次全線落敗。如果說過去大家更多看到的是 AI 幫人類做研究,那么 ASI-Evolve 展示的是另一件事:AI 開始加速 AI。

不僅如此,團隊還進一步證明,AI 優(yōu)化出的設計可以直接遷移到真實藥物發(fā)現(xiàn)任務,形成從 AI 研究到科學應用的完整鏈條。

開源鏈接:https://github.com/GAIR-NLP/ASI-Evolve

技術報告:https://github.com/GAIR-NLP/ASI-Evolve/blob/main/assets/paper.pdf

為什么這件事難?

AI 研究不是「給一個答案」

真實世界里的 AI 研究,本質上要同時跨過三重門檻:

  • 執(zhí)行成本高:一次有效驗證往往要消耗數(shù)小時甚至更久的計算資源,還伴隨真實工程接入與運行成本。
  • 搜索空間大:目標開放、邊界不預設,系統(tǒng)必須在大規(guī)模候選方向中自主找到有價值的探索路徑。
  • 反饋維度多:結果不是簡單的「對 / 錯」,而是多維、間接、甚至彼此沖突的信號,必須經(jīng)過分析才能轉化為下一步行動。

真正困難的,不是生成一個點子,而是在漫長、昂貴、弱反饋的實驗循環(huán)里,持續(xù)進化自己的研究能力。ASI-Evolve 正是為這個問題而設計的。

三大核心成果:

AI 首次打通 AI 研發(fā)閉環(huán)

ASI-Evolve 的核心結果,不是幾個彼此并列的案例,而是一條完整主線:AI 首次在統(tǒng)一框架下,打通了 AI 研發(fā)的三大核心支柱。

架構:AI 開始自主做模型架構研究

在神經(jīng)網(wǎng)絡架構設計任務中,ASI-Evolve 以 DeltaNet 為起點,圍繞高效線性注意力展開長周期自主探索。系統(tǒng)累計進行了1773 輪演化實驗,在驗證階段發(fā)現(xiàn)了105 個超過 DeltaNet 的新架構,最終最優(yōu)模型相較 DeltaNet 獲得大幅提升,接近當前人類設計 SOTA 增益的3 倍



更重要的是,這不是只在單一開發(fā)集上「刷出來」的結果。在擴展到1.3B 參數(shù)、100B token的大規(guī)模驗證后:

  • 開發(fā)集最高達到57.28%平均準確率,超過 DeltaNet 的 55.76%。
  • 6 個 held-out OOD 任務上也達到45.40%,超過 DeltaNet 的 44.74%。

這說明 AI 發(fā)現(xiàn)的不是只對榜單有效的技巧,而是真正可以泛化的結構性改進。

數(shù)據(jù):AI 開始自主塑造下一代模型要吃什么數(shù)據(jù)





AI自主處理訓練數(shù)據(jù),大幅提升模型表現(xiàn)



數(shù)據(jù)策略不再只是人工規(guī)則工程,也開始成為AI 可以持續(xù)研究、反復迭代、主動優(yōu)化的對象。

算法:AI 不只是調超參,而是在發(fā)明新的 RL 訓練算法

在強化學習算法設計任務中,ASI-Evolve 以 GRPO 為強基線,直接改寫 advantage 分配與梯度更新機制。系統(tǒng)在 300 輪演化中訓練并評估大量候選算法,其中 10 個在探索階段超過 GRPO,最終有 3 個算法進入 14B 規(guī)模驗證。最終算法在數(shù)學與代碼等多類任務上相對 GRPO 取得一致提升:AMC32 上最高 +12.5 分、AIME24 上 +11.67 分、OlympiadBench 上 +5.04 分,并在數(shù)學、抽象推理、STEM、金融與代碼等更廣泛評測上保持優(yōu)勢。



AI自主設計算法

最有代表性的兩個創(chuàng)新方向:

  • 一個方向通過成對比較的 advantage 估計和不對稱 clipping,顯式建?!负玫幕卮鹁烤贡绕渌卮鸷枚嗌佟?。
  • 另一個方向引入全局更新預算,為每個 token 動態(tài)分配可信更新半徑,從數(shù)學上約束 noisy training 中的策略更新穩(wěn)定性。

它做的不是參數(shù)搜索,而是在真正進入算法層面的數(shù)學創(chuàng)新。這三項結果合在一起,說明AI 已經(jīng)開始在架構、數(shù)據(jù)、算法這三大核心研發(fā)環(huán)節(jié)中形成閉環(huán),直接參與 AI 自身的進化。

ASI-Evolve:

完整的 Learn-Design-Experiment-Analyze 閉環(huán)





為了解決這些復雜的科研任務,框架設計了「學習-設計-實驗-分析」閉環(huán),由五個相互配合的角色構成:

  • 研究員:提出新假設、生成候選方案。
  • 工程師:把方案真正放進實驗環(huán)境執(zhí)行,拿到真實結果。
  • 分析者:閱讀復雜實驗輸出,把雜亂日志、指標和現(xiàn)象提煉成可復用的洞察。
  • 數(shù)據(jù)庫:積累自身研究經(jīng)驗,形成對于具體任務的專業(yè)見解。
  • 認知池:作為人類知識的圖書館,提供高質量的領域信息。

相比于以往的自動化科研工作流,改進在于兩方面:一是讓 AI 在實驗中充分吸收人類科研積累,站在巨人的肩膀上,把盲目、冗余的探索壓到最低;二是真正讀懂并剖析實驗輸出,讓每一次實驗都被充分利用。



橫向對比,效率明顯提升

論文中的分析實驗也展示了這一設計的必要性:在數(shù)學領域的 circle packing 任務上,ASI-Evolve 最快只用17 步就達到 SOTA 級結果,明顯快于 OpenEvolve 和 GEPA;而當去除分析者,系統(tǒng)進化很快進入平臺期;離開了認知池,啟動明顯變慢。這更說明了自主科研不是以量取勝的盲目搜索,而應該是「知識先驗 + 實驗反思」雙重驅動下的高效演化。



消融實驗,分析和認知缺一不可

從 AI 研究到真實應用:藥物發(fā)現(xiàn)的遷移驗證

然而,AI 優(yōu)化出的 AI,在真實應用場景下真的有用嗎?

為回答這個問題,GAIR 團隊把 ASI-Evolve 演化出的架構遷移到了藥物-靶點相互作用預測任務中,用 AI 自動發(fā)現(xiàn)的新架構去解決生物醫(yī)藥問題。





ASI-Evolve自主優(yōu)化模型架構,實現(xiàn)跨領域應用提升

相較 DrugBAN 基線,ASI-Evolve 發(fā)現(xiàn)的架構在多個 benchmark 上都實現(xiàn)了穩(wěn)定提升:

  • BindingDB 開發(fā)集:AUROC 提升 +1.91,F(xiàn)1 提升 +2.95。
  • 隨機測試集:AUROC 提升 +1.05。

更重要的是,在更困難、也更接近真實應用價值的cold-start場景里,面對從未見過的新藥或新蛋白時,提升更大:

  • unseen drug 場景:AUROC 最高提升 +6.94。
  • unseen protein 場景:AUROC 提升 +3.56。
  • 雙重泛化(藥物 + 蛋白均未見):AUROC 提升 +4.36。

這說明 AI 自主研究得到的并不是「只對 AI benchmark 有效」的技巧,而是具有跨領域遷移價值的真實設計能力。AI 優(yōu)化的 AI,開始在真實科學應用場景里顯示出實用價值。

對開源社區(qū)與 AI 研究范式的意義

ASI-Evolve 真正值得關注的,不只是拿到了幾個更高的分數(shù),而是第一次在統(tǒng)一系統(tǒng)中,把「AI Accelerates AI」這件事系統(tǒng)性地展開并驗證了出來。

GAIR 團隊展示的是:AI 已經(jīng)可以在架構、數(shù)據(jù)、算法這些 AI 發(fā)展的基礎環(huán)節(jié)上,通過系統(tǒng)的自我進化閉環(huán)持續(xù)推進研究。這意味著,當 AI 智能快速發(fā)展時,這種增長不只體現(xiàn)在解題、寫代碼或執(zhí)行任務上,也開始能夠反哺 AI 自身科研,加速下一輪發(fā)明,形成 AI research level 的迭代進化,并輻射賦能 Math、Drug 等其他學科。

未來展望

隨著 AI 持續(xù)變強,這種自我科研加速不會停留在架構、數(shù)據(jù)、算法三層,而可能進一步擴展到框架優(yōu)化、推理加速等更完整的 AI 工作流。

在更宏觀的層面上,隨著進化系統(tǒng)承擔越來越多實現(xiàn)、試驗和迭代工作,人類可以把更多精力從「執(zhí)行方案」轉向「定義問題」,把最重要的問題設定、研究方向判斷和價值選擇留給人,把更大規(guī)模的假設空間探索交給 AI。

ASI-Evolve 展示的,是 AI 自我科研加速從設想走向系統(tǒng)性驗證的一步。當 AI 開始真正參與 AI 的發(fā)明過程,我們看到的或許不只是效率提升,而是AI 研發(fā)范式本身開始發(fā)生變化

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅馬尼亞無緣世界杯,80歲老帥真被氣暈了

羅馬尼亞無緣世界杯,80歲老帥真被氣暈了

體壇周報
2026-03-30 10:30:14
全網(wǎng)震動!字節(jié)跳動多人被抓!

全網(wǎng)震動!字節(jié)跳動多人被抓!

大佬灼見
2026-03-30 11:39:00
麻將、關系、性生活是縣城的底色!

麻將、關系、性生活是縣城的底色!

黯泉
2026-03-28 15:09:09
4月1日起嚴查風暴啟動:終身追責動真格,這些紅線千萬別碰

4月1日起嚴查風暴啟動:終身追責動真格,這些紅線千萬別碰

小鹿姐姐情感說
2026-03-30 15:40:24
賈躍亭曬喜訊:兒子圓夢斯坦福大學研究生 為他驕傲

賈躍亭曬喜訊:兒子圓夢斯坦福大學研究生 為他驕傲

快科技
2026-03-30 09:40:20
中央政法委發(fā)布2026年第一季度見義勇為勇士榜

中央政法委發(fā)布2026年第一季度見義勇為勇士榜

澎湃新聞
2026-03-30 09:37:05
小米汽車代言人翻車?舒淇竟無駕照!雷軍:我預判了你的預判!

小米汽車代言人翻車?舒淇竟無駕照!雷軍:我預判了你的預判!

品牌新
2026-03-30 12:08:31
大學生怒砸食堂后續(xù)!人已被抓,知情人爆猛料,賠幾十萬只是一角

大學生怒砸食堂后續(xù)!人已被抓,知情人爆猛料,賠幾十萬只是一角

潮鹿逐夢
2026-03-29 14:54:28
單依純發(fā)長文致歉“錯誤全在我”, 李榮浩:不要賠償,早點休息

單依純發(fā)長文致歉“錯誤全在我”, 李榮浩:不要賠償,早點休息

韓小娛
2026-03-30 05:40:11
三大運營商利潤被抽走15%:國家要錢了,5G故事講完了

三大運營商利潤被抽走15%:國家要錢了,5G故事講完了

字節(jié)漫游指南
2026-03-30 10:15:13
米萊高調宣布:我將阿根廷的貧困率降低了27%,全靠尊重產(chǎn)權和市場經(jīng)濟

米萊高調宣布:我將阿根廷的貧困率降低了27%,全靠尊重產(chǎn)權和市場經(jīng)濟

風向觀察
2026-03-30 14:33:04
周杰倫: 鬼火少年老了

周杰倫: 鬼火少年老了

爆角追蹤
2026-03-29 21:26:58
不可錯過!3月30日晚上19:30比賽!中央5套CCTV5、CCTV5+直播表

不可錯過!3月30日晚上19:30比賽!中央5套CCTV5、CCTV5+直播表

皮皮觀天下
2026-03-30 12:00:47
楊瀚森復出6+4+1帽吃生涯首T!開拓者3人20+大勝奇才 阿夫20+7

楊瀚森復出6+4+1帽吃生涯首T!開拓者3人20+大勝奇才 阿夫20+7

醉臥浮生
2026-03-30 08:30:08
伊朗女足球員:澳方承諾給我們房子、車子和永居權,來說服我們留下

伊朗女足球員:澳方承諾給我們房子、車子和永居權,來說服我們留下

懂球帝
2026-03-30 13:45:07
火爆沖突3人吃T!掘金逆轉勇士6連勝 約基奇25+15+8波神里程碑

火爆沖突3人吃T!掘金逆轉勇士6連勝 約基奇25+15+8波神里程碑

醉臥浮生
2026-03-30 12:38:53
善惡有報!逼人民日報怒批、暗諷張雪峰,1300萬網(wǎng)紅終為荒唐買單

善惡有報!逼人民日報怒批、暗諷張雪峰,1300萬網(wǎng)紅終為荒唐買單

觀察鑒娛
2026-03-29 09:24:41
香港新規(guī):過境旅客交出密碼,違者罰款10萬港元+3年牢飯

香港新規(guī):過境旅客交出密碼,違者罰款10萬港元+3年牢飯

我是一個粉刷匠2
2026-03-30 14:28:06
剛送別張雪峰,11歲女兒收到第一張江湖令!

剛送別張雪峰,11歲女兒收到第一張江湖令!

職場火鍋
2026-03-30 15:42:03
東契奇被踢出MVP爭奪 名記:他是防守最差球員之一

東契奇被踢出MVP爭奪 名記:他是防守最差球員之一

體壇周報
2026-03-30 16:22:29
2026-03-30 18:04:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12640文章數(shù) 142599關注度
往期回顧 全部

科技要聞

一句謊言引發(fā)的硅谷血案

頭條要聞

尹正發(fā)文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

頭條要聞

尹正發(fā)文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發(fā)長文道歉!李榮浩再回應

財經(jīng)要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態(tài)度原創(chuàng)

游戲
親子
本地
時尚
公開課

2025年的神作有中文了!M站92分 IGN9分超好評

親子要聞

兒科護士精準控場,孩子哭得收放自如

本地新聞

用Color Walk的方式解鎖城市春日

來到1980的周也,好毛利蘭

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版