国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

英偉達(dá)23人夢(mèng)之隊(duì),讓AI用7天干翻了自己的GPU專家

0
分享至

AI在7天內(nèi)自主完成了通常需要專家數(shù)月甚至數(shù)年的GPU內(nèi)核優(yōu)化,而且結(jié)果比自己家的王牌產(chǎn)品還快10%——今天,學(xué)術(shù)預(yù)印本平臺(tái)arXiv上發(fā)布了一項(xiàng)被視為可能徹底改變軟件和芯片優(yōu)化方式的突破性研究。


這一研究由NVIDIA組建的一支23人的頂級(jí)團(tuán)隊(duì)完成,名為《AVO: Agentic Variation Operators for Autonomous Evolutionary Search》(AVO:用于自主進(jìn)化搜索的智能體變異算子)。

簡(jiǎn)單來說,AVO(Agentic Variation Operators,智能體變異算子)是讓AI自己當(dāng)起了“程序員+架構(gòu)師+測(cè)試員”的合體,去探索人類工程師可能永遠(yuǎn)想不到的底層代碼優(yōu)化方案,最終在英偉達(dá)最新的Blackwell(B200)GPU上,寫出了比當(dāng)今最頂尖人類專家團(tuán)隊(duì)(如cuDNN和FlashAttention-4)編寫的代碼還要快10%以上的高性能計(jì)算內(nèi)核。

值得注意的是,其核心開發(fā)者許冰在X上表示,他一開始根本不懂GPU編程,也由此開啟了這一段“盲編碼”的探索——也許,“不懂”才是最大的優(yōu)勢(shì),人類的認(rèn)知反而會(huì)成為進(jìn)化的局限。

再見!傳統(tǒng)進(jìn)化算法的局限

想象一下,你有一套非常精密的計(jì)算程序(比如現(xiàn)在最火的AI模型中的“注意力機(jī)制”),這套程序要在顯卡(GPU)上跑得飛快。為了達(dá)到這個(gè)目標(biāo),專業(yè)的程序員們通常要花費(fèi)幾個(gè)月甚至幾年時(shí)間,手動(dòng)調(diào)整代碼、優(yōu)化內(nèi)存訪問、設(shè)計(jì)特殊算法,最終才能比通用版本快個(gè)20%、30%。

但這些手工優(yōu)化有個(gè)大問題:太慢了、太依賴個(gè)人經(jīng)驗(yàn)了。硬件在變、算法在變,每次都需要重新優(yōu)化。

為了自動(dòng)化這個(gè)過程,科學(xué)家們想到了“進(jìn)化算法”:就像生物進(jìn)化一樣,隨機(jī)生成一批代碼,測(cè)試哪個(gè)跑得快,保留快的,變異出下一代,不斷重復(fù)。但這個(gè)方法有個(gè)致命缺陷:變異操作是“盲目的”——傳統(tǒng)進(jìn)化算法中的"變異"就是簡(jiǎn)單的隨機(jī)修改、交換代碼片段。這就好比你想讓猴子打出莎士比亞的作品,純靠隨機(jī)敲鍵盤是不行的。

而且,傳統(tǒng)的進(jìn)化算法和“大模型輔助設(shè)計(jì)”思路,通常把AI(大語言模型)限定在一個(gè)固定的流程里。比如,人類設(shè)定好規(guī)則(“變異”和“交叉”),讓AI生成一堆代碼候選方案,然后由人類或另一個(gè)程序來篩選和測(cè)試。


AVO的革命性在于,它徹底顛覆了這個(gè)關(guān)系。 它不再把AI當(dāng)作流程中的一個(gè)“候選生成器”,而是將整個(gè)變異過程本身,交給一個(gè)自主的智能體循環(huán)來完成。這個(gè)智能體擁有更高的權(quán)限和更全面的視角,它可以:

  • 查閱整個(gè)進(jìn)化家譜:查看當(dāng)前所有代碼版本的優(yōu)劣和歷史。
  • 調(diào)用領(lǐng)域知識(shí)庫(kù):學(xué)習(xí)特定領(lǐng)域(如GPU硬件架構(gòu))的專門知識(shí)。
  • 分析執(zhí)行反饋:根據(jù)代碼的實(shí)際運(yùn)行性能數(shù)據(jù),進(jìn)行自我診斷。

基于這些信息,這個(gè)智能體可以自主完成提出修改、修復(fù)錯(cuò)誤、批判方案、驗(yàn)證結(jié)果等一系列完整動(dòng)作。這就像一個(gè)不知疲倦、知識(shí)淵博且具備批判性思維的全棧工程師,在持續(xù)地重構(gòu)和優(yōu)化代碼。


實(shí)戰(zhàn)成績(jī):在最難優(yōu)化的戰(zhàn)場(chǎng)上擊敗人類冠軍

為了證明AVO的強(qiáng)大,研究團(tuán)隊(duì)選擇了一個(gè)公認(rèn)的“硬骨頭”作為測(cè)試場(chǎng):注意力機(jī)制(Attention)的計(jì)算內(nèi)核。這是驅(qū)動(dòng)當(dāng)今所有大語言模型(如ChatGPT、Gemini)的核心組件,也是全球頂尖工程師和科學(xué)家投入巨資、激烈優(yōu)化的焦點(diǎn)。英偉達(dá)的cuDNN和Tri Dao團(tuán)隊(duì)的FlashAttention系列,就是這一領(lǐng)域的標(biāo)桿。

在讓AVO在最新的NVIDIA Blackwell (B200)顯卡上運(yùn)行7天后,實(shí)驗(yàn)的結(jié)果驚人:



  • 超越cuDNN:AVO形成的多頭注意力(Multi-Head Attention,MHA)計(jì)算內(nèi)核,在測(cè)試的各項(xiàng)配置中,性能超越了cuDNN高達(dá)3.5%。cuDNN是NVIDIA自家工程師花了多年打磨的閉源庫(kù),AVO一個(gè)AI系統(tǒng)跑了7天就超越了它。這相當(dāng)于學(xué)生超越了老師,而且這個(gè)老師已經(jīng)是全世界最好的。
  • 超越FlashAttention-4:比學(xué)術(shù)界最先進(jìn)注意力計(jì)算方法FlashAttention-4快10.5%。這種程度的提升已經(jīng)可以稱之為革命性的突破了。
  • 遷移能力:更神奇的是,AVO優(yōu)化好的代碼還能舉一反三——在MHA上進(jìn)化7天的成果,遷移到GQA(Grouped-Query Attention,分組查詢注意力)只需30分鐘就能獲得7%-9%的提升。說明AVO學(xué)到的不是死記硬背的特定優(yōu)化,而是通用的優(yōu)化策略和思維方式。
  • 微架構(gòu)級(jí)別的深度優(yōu)化:AVO發(fā)現(xiàn)的優(yōu)化不是簡(jiǎn)單的換個(gè)算法,而是深入到GPU寄存器分配、warp調(diào)度、流水線時(shí)序的微架構(gòu)級(jí)別。這說明AI已經(jīng)具備了理解硬件底層行為的能力。
這意味著什么?

傳統(tǒng)方法像是在填空題里選答案,而AVO像是在開放題中自由發(fā)揮,可以探索各種可能性。而且,AVO不是靠猜什么優(yōu)化有用,而是真正運(yùn)行代碼、測(cè)量性能,用數(shù)據(jù)驅(qū)動(dòng)進(jìn)化。同時(shí),智能體會(huì)從每次嘗試中學(xué)習(xí),失敗的嘗試也有價(jià)值,告訴它這條路不通。

AVO讓AI像真正的程序員一樣,會(huì)學(xué)習(xí)、會(huì)思考、會(huì)測(cè)試,最終寫出了比人類專家還快的代碼。這是AI優(yōu)化自身能力的重要一步。

從其進(jìn)化結(jié)果來看,對(duì)AI硬件優(yōu)化意味著:更快的大模型訓(xùn)練,如果注意力機(jī)制計(jì)算能加速10%,整個(gè)大模型訓(xùn)練都能更快;降低硬件門檻,同樣的硬件能跑更大的模型,或者同樣的模型能用更便宜的硬件;解放專家,不再需要頂尖優(yōu)化工程師花費(fèi)數(shù)月手工調(diào)優(yōu)。

從這一AI研究方向而言,這篇論文證明了一個(gè)重要觀點(diǎn):AI不僅可以用來自動(dòng)化任務(wù),還可以用來自動(dòng)化優(yōu)化本身。未來可能會(huì)有更多“AI優(yōu)化AI”的場(chǎng)景。

結(jié)語

這篇論文全部23位作者涵蓋了AI編譯器、高性能計(jì)算、計(jì)算機(jī)視覺、生成式AI等多個(gè)頂級(jí)子方向——AI智能體編程先鋒(Terry Chen, 許冰)、 AI編譯器之父(陳天奇)、NVIDIA研究VP(Ming-Yu Liu)、 GPU內(nèi)核專家(John Tran, Andrew Kerr)、注意力機(jī)制專家(Ali Hassani)、學(xué)術(shù)界權(quán)威(Humphrey Shi, Luis Ceze),以及系統(tǒng)工程支撐團(tuán)隊(duì)。

這是一個(gè)從理論到工程、從學(xué)術(shù)到產(chǎn)品全鏈路覆蓋的頂級(jí)團(tuán)隊(duì)。AVO不是一篇試試看的探索性論文,而是NVIDIA精心布局的戰(zhàn)略級(jí)成果。

從更宏觀的視角看,AVO代表了AI研發(fā)范式的又一次進(jìn)化。它不再滿足于讓AI生成內(nèi)容或遵循指令,而是賦予其長(zhǎng)期的、目標(biāo)導(dǎo)向的、具備反思能力的自主探索權(quán)。它也為我們打開了一扇門:未來,在芯片設(shè)計(jì)、編譯器優(yōu)化、算法創(chuàng)新等需要極度專業(yè)知識(shí)和創(chuàng)造力的領(lǐng)域,自主進(jìn)化的AI智能體可能成為人類最得力的“共研者”。它們可以不知疲倦地探索人類思維難以觸及的“微觀架構(gòu)”組合空間,加速我們邁向更強(qiáng)大、更高效計(jì)算未來的進(jìn)程。

或許,這項(xiàng)研究正像一顆投入湖面的石子,其漣漪將逐漸擴(kuò)散至整個(gè)計(jì)算產(chǎn)業(yè)的每一個(gè)角落。

論文地址 https://arxiv.org/pdf/2603.24517v1

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大唐名將李靖,陳塘關(guān)李靖,托塔天王李靖,到底是不是同一個(gè)人?

大唐名將李靖,陳塘關(guān)李靖,托塔天王李靖,到底是不是同一個(gè)人?

銘記歷史呀
2026-03-26 11:16:18
最大的訪問團(tuán),國(guó)王攜家族三百多名成員訪問中國(guó),在中國(guó)生活至今

最大的訪問團(tuán),國(guó)王攜家族三百多名成員訪問中國(guó),在中國(guó)生活至今

丞丞故事匯
2026-03-26 11:34:08
越南5年免簽新政策4.1開始實(shí)施

越南5年免簽新政策4.1開始實(shí)施

創(chuàng)作者_(dá)cLg1
2026-03-26 09:42:32
美軍中央司令部:美軍“亞伯拉罕·林肯”號(hào)航空母艦“在區(qū)域海域航行期間,繼續(xù)針對(duì)伊朗境內(nèi)的軍事目標(biāo)開展作戰(zhàn)行動(dòng)”

美軍中央司令部:美軍“亞伯拉罕·林肯”號(hào)航空母艦“在區(qū)域海域航行期間,繼續(xù)針對(duì)伊朗境內(nèi)的軍事目標(biāo)開展作戰(zhàn)行動(dòng)”

瀟湘晨報(bào)
2026-03-26 10:55:27
一審重判整整17年,柯文哲當(dāng)庭最后一搏,藏著賴清德最擔(dān)心的結(jié)局

一審重判整整17年,柯文哲當(dāng)庭最后一搏,藏著賴清德最擔(dān)心的結(jié)局

李健政觀察
2026-03-26 18:16:56
事情鬧大了,日本內(nèi)閣連發(fā)公告,中國(guó)的態(tài)度,告訴了世界一個(gè)事實(shí)

事情鬧大了,日本內(nèi)閣連發(fā)公告,中國(guó)的態(tài)度,告訴了世界一個(gè)事實(shí)

榮亭小吏
2026-03-26 11:23:02
重磅官宣!倫敦世乒賽國(guó)乒再添1人直通,8人名單正式出爐

重磅官宣!倫敦世乒賽國(guó)乒再添1人直通,8人名單正式出爐

寶哥精彩賽事
2026-03-26 18:04:15
五代最弱小的政權(quán),全國(guó)僅3萬兵甲,靠著打家劫舍度過40年和平

五代最弱小的政權(quán),全國(guó)僅3萬兵甲,靠著打家劫舍度過40年和平

瘋狂的小歷史
2026-03-26 13:06:45
46歲童蕾近況曝光,帶女兒回農(nóng)村住平房,親自種菜日子十分勤儉

46歲童蕾近況曝光,帶女兒回農(nóng)村住平房,親自種菜日子十分勤儉

科學(xué)發(fā)掘
2026-03-26 17:46:48
延壽9年,心臟病風(fēng)險(xiǎn)降60%!悉尼大學(xué)最新:飲食、睡眠、運(yùn)動(dòng)最佳組合出爐,小改變也大有益

延壽9年,心臟病風(fēng)險(xiǎn)降60%!悉尼大學(xué)最新:飲食、睡眠、運(yùn)動(dòng)最佳組合出爐,小改變也大有益

醫(yī)諾維
2026-03-24 17:02:18
女人偷吃后晚上跟丈夫同房是什么體驗(yàn)?這位46歲出軌女人說出答案

女人偷吃后晚上跟丈夫同房是什么體驗(yàn)?這位46歲出軌女人說出答案

混音情感
2026-03-26 14:25:07
沒護(hù)照沒簽證,這只叫LV的貓?zhí)焯炜鐕?guó)走私老鼠,兩國(guó)海關(guān)都拿它沒轍!

沒護(hù)照沒簽證,這只叫LV的貓?zhí)焯炜鐕?guó)走私老鼠,兩國(guó)海關(guān)都拿它沒轍!

英國(guó)那些事兒
2026-03-24 23:16:58
中國(guó)電信:全面轉(zhuǎn)向token經(jīng)營(yíng)!

中國(guó)電信:全面轉(zhuǎn)向token經(jīng)營(yíng)!

最通信
2026-03-25 20:45:14
余承東:?jiǎn)柦鏜6 24小時(shí)訂單突破60000臺(tái) 展車已到店

余承東:?jiǎn)柦鏜6 24小時(shí)訂單突破60000臺(tái) 展車已到店

CNMO科技
2026-03-24 17:14:29
伊朗微松口:特朗普女婿庫(kù)什納無法信任,但跟副總統(tǒng)萬斯或許能談

伊朗微松口:特朗普女婿庫(kù)什納無法信任,但跟副總統(tǒng)萬斯或許能談

阿龍聊軍事
2026-03-26 20:41:08
又內(nèi)訌,泰山隊(duì)內(nèi)部又出問題,慘敗原因找到了,內(nèi)部矛盾曝光

又內(nèi)訌,泰山隊(duì)內(nèi)部又出問題,慘敗原因找到了,內(nèi)部矛盾曝光

體壇風(fēng)之子
2026-03-26 04:30:03
張雪峰說得對(duì)!深圳社保就是淘汰本末倒置的!直接封神!

張雪峰說得對(duì)!深圳社保就是淘汰本末倒置的!直接封神!

煙潯渺渺
2026-03-26 17:07:45
賴昌星前妻近狀曝光:拒絕政府安置,獨(dú)居3000平老宅,只做一件事

賴昌星前妻近狀曝光:拒絕政府安置,獨(dú)居3000平老宅,只做一件事

芳芳?xì)v史燴
2026-03-23 03:53:23
笑掉大牙!伊朗高層當(dāng)眾互撕,吹破天的強(qiáng)硬,連軍餉都發(fā)不出來

笑掉大牙!伊朗高層當(dāng)眾互撕,吹破天的強(qiáng)硬,連軍餉都發(fā)不出來

老馬拉車莫少裝
2026-03-25 19:39:00
伊朗首都德黑蘭遭空襲,多地傳出爆炸聲!伊朗武裝部隊(duì)向以色列發(fā)射新一輪導(dǎo)彈

伊朗首都德黑蘭遭空襲,多地傳出爆炸聲!伊朗武裝部隊(duì)向以色列發(fā)射新一輪導(dǎo)彈

大象新聞
2026-03-26 20:45:02
2026-03-26 21:24:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
131380文章數(shù) 862012關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

本地
旅游
教育
手機(jī)
公開課

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

旅游要聞

20元人民幣背景觀景臺(tái)亂收費(fèi)?景區(qū)通報(bào):不存在封閉管控、強(qiáng)制收費(fèi)等

教育要聞

來上課了——高考閱讀難題大綜合(細(xì)節(jié)+主旨+含義)(下)第1段

手機(jī)要聞

OPPO K15 Pro系列突然官宣:天璣9500s+主動(dòng)散熱,4月1日發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版