国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實(shí)錘了:GPU越多,論文接收率越高、引用越多

0
分享至



機(jī)器之心報道

機(jī)器之心編輯部

在過去三年里,AI 領(lǐng)域取得了顯著進(jìn)步,這一飛躍主要得益于基礎(chǔ)模型的發(fā)展。這些模型在大規(guī)模多模態(tài)數(shù)據(jù)上進(jìn)行訓(xùn)練,并在公開發(fā)布后取得了巨大成功。

然而,基礎(chǔ)模型的研究需要大量的數(shù)據(jù)、算力和人力資源。這一問題引發(fā)了廣泛關(guān)注與討論,更大的資源獲取是否會直接帶來更有影響力的研究成果,例如更多的論文發(fā)表或更高的引用量。

這一問題的答案對于資源分配策略、研究方向的優(yōu)先級設(shè)定,以及如何保障基礎(chǔ)模型研究的公平與可持續(xù)參與,都具有重要意義。

然而,由于缺乏統(tǒng)一的資源披露標(biāo)準(zhǔn),研究成本往往難以量化。在缺乏全面公開的情況下,研究經(jīng)費(fèi)最直觀的衡量方式,通常是購買或租用硬件(如計(jì)算集群或芯片)的具體成本。當(dāng)然,研究還包括軟件、云存儲服務(wù)以及專業(yè)平臺等其他開支。

在這些資源中,GPU 是一個尤其關(guān)鍵的指標(biāo),因?yàn)樗且环N供應(yīng)量有限、受嚴(yán)格控制的資源。

在本文中,來自 MIT、劍橋等機(jī)構(gòu)的研究者研究了硬件資源與 AI/ML 領(lǐng)域頂級會議論文發(fā)表之間的關(guān)系。他們重點(diǎn)考察了兩種計(jì)算能力指標(biāo):GPU 數(shù)量和 TFLOPs(每秒浮點(diǎn)運(yùn)算次數(shù)),并將這些數(shù)據(jù)與 2022 至 2024 年間共 34,828 篇錄用論文進(jìn)行關(guān)聯(lián)分析。

本文共識別出 5,889 篇基礎(chǔ)模型相關(guān)論文,并發(fā)現(xiàn) GPU 獲取能力越強(qiáng),其在八個頂級會議中的論文接收率和引用量也越高。

此外,本文還對 312 篇論文的 229 位作者進(jìn)行了問卷調(diào)查后發(fā)現(xiàn):

  • 大多數(shù)基礎(chǔ)模型論文由學(xué)術(shù)界研究者撰寫(共 4,851 篇),而產(chǎn)業(yè)界研究者的論文數(shù)量相對較少(1,425 篇);
  • 大多數(shù)論文使用的是開源模型(如 LLaMA),其次是閉源模型(如 GPT);
  • GPU 使用信息在論文中很少被披露,這表明當(dāng)前亟需制定統(tǒng)一的計(jì)算資源報告規(guī)范,以提升研究的透明度與可復(fù)現(xiàn)性。



  • 論文標(biāo)題:THE ROLE OF COMPUTING RESOURCES IN PUBLISHING FOUNDATION MODEL RESEARCH
  • 論文地址:https://arxiv.org/pdf/2510.13621

計(jì)算資源識別方法

研究者收集了2022 年至 2024 年間、八個頂級機(jī)器學(xué)習(xí)會議上被接收的論文(2025 年 3 月之前已可獲?。?NeurIPS、ICLR、ICML、COLM、EMNLP、ACL、NAACL、EACL。

采用的方法是:在論文標(biāo)題或摘要中搜索關(guān)鍵詞來識別與基礎(chǔ)模型(FM)相關(guān)的論文。最終在總計(jì) 34828 篇論文中,挑選出了5889 篇與 FM 相關(guān)的已接收論文。此外收集了同期被拒稿或撤稿的 ICLR 與 FM 相關(guān)的論文,共計(jì) 613 篇,用于對比分析。

在完成論文標(biāo)題和摘要的整理后,研究者使用 GPT-4o mini 將每篇論文分為三個類別,即領(lǐng)域(Domain)、階段(Phase)和方法(Method)。這些類別的定義見下表 1。



更進(jìn)一步地,研究者通過系統(tǒng) API 從全部 5889 篇已接收論文中收集結(jié)構(gòu)化信息,包括文章 ID、標(biāo)題、作者信息(姓名、人數(shù)及所屬機(jī)構(gòu))、發(fā)表信息(年份、會議、接收或拒稿狀態(tài)、論文鏈接、評審意見和摘要)。對于系統(tǒng) API 中缺失的信息,研究者使用 GPT-4o mini 處理論文 PDF,以提取資深作者的所屬機(jī)構(gòu)、GPU 使用情況、數(shù)據(jù)集描述以及資助信息。

在調(diào)研中,118 所機(jī)構(gòu)的研究者參與了本次調(diào)查,包括了 267 名學(xué)術(shù)界一作和 36 名產(chǎn)業(yè)界一作,最終共有 229 位 FM 論文的一作(包括 312 篇論文)提供有效反饋。當(dāng)論文中未記錄計(jì)算資源使用情況時,參與者需在調(diào)查中自行報告相關(guān)信息

圖 1 (B) 展示了不同年份和會議中有效 GPU 類型的比例,以及各會議作者和審稿人檢查清單中是否包含報告計(jì)算資源使用情況的相關(guān)指南。圖 1 (C) 展示了由 GPT-4o 自動抓取的數(shù)據(jù)與論文作者自報數(shù)據(jù)在 GPU 使用量與 FP 16 計(jì)算性能(TFLOPS 16)上的差異。



為確保提取的 GPU 信息準(zhǔn)確性,兩位 FM 研究者在盲評條件下獨(dú)立檢查了 312 篇論文,并與 GPT-4o mini 的提取結(jié)果進(jìn)行對比。研究者交叉比對了 GPT-4o mini 提取的信息、人工標(biāo)注結(jié)果以及論文一作自報的 GPU 數(shù)據(jù)。

結(jié)果顯示:在被調(diào)查的 312 篇論文中,288 篇自報了 GPU 數(shù)量,292 篇自報了 GPU 類型,281 篇自報了 GPU 使用時長;另有 24 篇使用了非 GPU 計(jì)算資源(如 TPU、NPU 或 CPU)。

不過,兩位 FM 研究者發(fā)現(xiàn)僅有 172 篇論文中包含 GPU 數(shù)量信息,141 篇包含 GPU 類型信息,249 篇包含 GPU 時長信息。GPT-4o mini 僅從 116 篇論文中成功提取到 GPU 數(shù)量,與作者報告相比存在 59.7% 的缺失率。GPU 類型與 GPU 時長的缺失率也較高,分別為 48.3% 和 88.6%。

結(jié)果

基礎(chǔ)模型研究呈爆炸式增長

從 2022 年到 2024 年,基礎(chǔ)模型的研究在廣度和深度上都經(jīng)歷了顯著增長。

一個直觀的體現(xiàn)是,在八個頂級 AI 會議中,基礎(chǔ)模型相關(guān)論文的占比迅速攀升

  • 2022 年: 2.07%
  • 2023 年: 10.29%
  • 2024 年:飆升至 34.64%(圖 A)



尤其在NLP 領(lǐng)域,這一趨勢更為明顯。在 COLM、EMNLP 和 ACL 等專業(yè)會議上,基礎(chǔ)模型論文的比例甚至超過了 ICLR、ICML 和 NeurIPS 等綜合性機(jī)器學(xué)習(xí)會議。

從研究方向來看,與推理相關(guān)的論文增長最快。從研究類型來看,算法和實(shí)證研究的增長速度超過了數(shù)據(jù)集、基準(zhǔn)測試和工具包等類別(圖 B)。



有趣的是,盡管論文數(shù)量激增,但單個項(xiàng)目使用的 GPU 數(shù)量保持相對穩(wěn)定。無論是已發(fā)表的論文還是待發(fā)表的研究,大多數(shù)項(xiàng)目使用的 GPU 數(shù)量集中在 1 到 8 個,其中 1 到 4 個 GPU 的配置最為常見,占據(jù)了約一半的比例(圖 C)。不過,考慮到目前 GPU 的采購周期越來越長,這一趨勢未來是否會變化,值得我們持續(xù)關(guān)注。



工業(yè)界與學(xué)術(shù)界共同引領(lǐng)研究浪潮

基礎(chǔ)模型的研究延續(xù)了計(jì)算機(jī)科學(xué)領(lǐng)域產(chǎn)學(xué)研緊密結(jié)合的傳統(tǒng)。

數(shù)據(jù)顯示,學(xué)術(shù)界貢獻(xiàn)了更多的論文總量,但頂尖的工業(yè)界實(shí)驗(yàn)室在單一機(jī)構(gòu)產(chǎn)出上表現(xiàn)突出。具體來看:

  • 學(xué)術(shù)界: 611 個機(jī)構(gòu)共發(fā)表了 4851 篇論文。
  • 工業(yè)界: 163 個機(jī)構(gòu)共發(fā)表了 1425 篇論文。

其中,谷歌和微軟是論文產(chǎn)出最多的兩個單一實(shí)體,緊隨其后的是清華大學(xué)、Meta 和斯坦福大學(xué)。



值得注意的是,兩大陣營的研究效率相當(dāng)。工業(yè)界研究者人均發(fā)表 8.72 篇論文,學(xué)術(shù)界人均發(fā)表 7.93 篇。這表明,基礎(chǔ)模型的研究高度集中在少數(shù)能提供強(qiáng)大算力支持的頂級學(xué)術(shù)和工業(yè)機(jī)構(gòu)中。如果獲取大規(guī)模算力的門檻持續(xù)提高,這種集中化趨勢可能會進(jìn)一步加劇。

從國家層面看,美國和中國在基礎(chǔ)模型研究產(chǎn)出方面處于領(lǐng)先地位(圖 B),這可能與兩國在高等教育和人工智能領(lǐng)域的長期投入有關(guān)。



開源模型成為研究的主流選擇

在眾多模型中,以LLaMA 系列為代表的開源權(quán)重模型是研究中使用最頻繁的(圖 C)。



這一現(xiàn)象至關(guān)重要。雖然像 GPT 系列這樣的專有閉源模型因其卓越的性能和便捷的 API 接口,在研究中仍占有一席之地,但開源模型憑借其高度的靈活性和可訪問性贏得了研究社區(qū)的青睞。研究人員可以基于開源模型進(jìn)行微調(diào)、領(lǐng)域適配和深入的基準(zhǔn)測試,而這些操作在閉源模型上通常難以實(shí)現(xiàn)。

GPU 使用情況:NVIDIA A100 成為核心算力

在具體的 GPU 類型上,NVIDIA A100 是基礎(chǔ)模型研究中使用最廣泛的核心,并且排名前十的 GPU 均來自 NVIDIA 家族(圖 3D)。

進(jìn)一步分析發(fā)現(xiàn),算力資源的使用并非均勻分布:

  • 研究階段: 專注于預(yù)訓(xùn)練的研究,其 GPU 使用數(shù)量顯著高于側(cè)重于后訓(xùn)練或推理的研究(p<0.001)。
  • 其他維度: 在不同機(jī)構(gòu)、應(yīng)用領(lǐng)域或研究方法之間,GPU 的使用量沒有表現(xiàn)出統(tǒng)計(jì)學(xué)上的顯著差異。例如,安全相關(guān)研究的 GPU 使用量中位數(shù)較低,而工具包開發(fā)研究的使用量較高,但這些差異并不顯著(圖 D)。



從論文的研究重點(diǎn)來看:

  • 47.4% 關(guān)注算法開發(fā)。
  • 86.4% 集中在 NLP 領(lǐng)域,僅有 5.7% 涉及 CV。
  • 48.7% 的論文研究推理過程,遠(yuǎn)超預(yù)訓(xùn)練(13.3%)。

政府是基礎(chǔ)模型研究的最大資助方

通過分析論文中披露的資金信息,發(fā)現(xiàn)政府是基礎(chǔ)模型研究最主要的資助來源(圖 4)。在提供了資助信息的論文中:

  • 85.5%(848 篇)獲得了政府資助。
  • 29.3%(291 篇)獲得了企業(yè)資助。
  • 10.3%(102 篇)獲得了基金會資助(圖 4A)。

有趣的是,一個國家的人均 GDP 與其資助的論文數(shù)量之間沒有必然聯(lián)系(圖 4B)。這表明,機(jī)構(gòu)的支持力度和相關(guān)政策,比單純的國家經(jīng)濟(jì)實(shí)力更能影響基礎(chǔ)模型的研究產(chǎn)出。(注:僅有 15.3% 的論文披露了詳細(xì)的資助信息。)



研究產(chǎn)出與影響力:算力比 GPU 數(shù)量更關(guān)鍵

一個典型的基礎(chǔ)模型研究項(xiàng)目是怎樣的?數(shù)據(jù)顯示,一篇被接收的論文,通常有 5 名作者,使用 4 個 GPU,項(xiàng)目平均持續(xù)約 5 個月。

進(jìn)一步探究了計(jì)算資源與研究成果(論文數(shù)量和引用量)之間的關(guān)系,發(fā)現(xiàn)了更深層的規(guī)律:

對于產(chǎn)出(論文數(shù)量): 單純的 GPU 數(shù)量與論文產(chǎn)出不成正比。然而,以 TFLOPs(每秒萬億次浮點(diǎn)運(yùn)算)衡量的總計(jì)算能力,與論文產(chǎn)出呈現(xiàn)出更強(qiáng)的正相關(guān)性,尤其是在工業(yè)界(圖 4C)。這說明,決定研究產(chǎn)出效率的,是高質(zhì)量的計(jì)算基礎(chǔ)設(shè)施,而不僅僅是 GPU 的堆砌。

對于影響力(引用次數(shù)): 同樣,TFLOPs 比 GPU 數(shù)量更能預(yù)測一篇論文的引用潛力(圖 4D)。擁有更強(qiáng)算力支持的機(jī)構(gòu),其研究成果往往能獲得更多引用

盡管如此,算力并非決定性因素。許多高引用論文同樣來自計(jì)算資源相對有限的機(jī)構(gòu),證明了研究影響力是由多種因素共同決定的。

論文接收與否:資源多少并非決定性因素

更多的 GPU 或更強(qiáng)的算力,能提高論文被接收的概率嗎?

研究者對 ICLR 會議 2022-2024 年的數(shù)據(jù)進(jìn)行了分析。結(jié)果發(fā)現(xiàn),平均而言,被拒稿的論文確實(shí)比被接收的論文使用了略少的 GPU、略低的 TFLOPs和規(guī)模略小的作者團(tuán)隊(duì)。

但是,兩者在資源使用上的分布情況非常相似,差距微乎其微。這與頂級會議的審稿指南相符,即審稿人更應(yīng)關(guān)注研究的新穎性、清晰度和貢獻(xiàn),而非其使用的資源多寡。(注:由于只有 ICLR 公開了被拒稿論文的數(shù)據(jù),這個結(jié)論的普適性還有待更多數(shù)據(jù)驗(yàn)證。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
臺灣費(fèi)盡心思安排到解放軍內(nèi)部的間諜,全都被李志豪給揪了出來

臺灣費(fèi)盡心思安排到解放軍內(nèi)部的間諜,全都被李志豪給揪了出來

雪中風(fēng)車
2026-02-06 08:12:58
央媒怒批、坑害老百姓!臭名昭著的四大相聲演員,各個難以原諒

央媒怒批、坑害老百姓!臭名昭著的四大相聲演員,各個難以原諒

青橘罐頭
2026-02-18 07:08:27
陳慧琳稱金城武不會看社交軟件:他好像絕跡了

陳慧琳稱金城武不會看社交軟件:他好像絕跡了

紅星新聞
2026-03-01 15:33:08
斬首哈梅內(nèi)伊,活捉馬杜羅!你可以說美國壞,但真不能說美國菜

斬首哈梅內(nèi)伊,活捉馬杜羅!你可以說美國壞,但真不能說美國菜

垛垛糖
2026-03-02 12:18:19
請注意:伊朗的事情已經(jīng)再無懸念,川普應(yīng)已開始著手加拿大

請注意:伊朗的事情已經(jīng)再無懸念,川普應(yīng)已開始著手加拿大

邵旭峰域
2026-03-02 11:52:58
官方通報:上海市崇明區(qū)長興鎮(zhèn)一村干部被查

官方通報:上海市崇明區(qū)長興鎮(zhèn)一村干部被查

上觀新聞
2026-03-02 16:37:21
五角大樓擔(dān)心沖突不斷升級 官員稱導(dǎo)彈防御系統(tǒng)已“告急”

五角大樓擔(dān)心沖突不斷升級 官員稱導(dǎo)彈防御系統(tǒng)已“告急”

財(cái)聞
2026-03-02 17:48:31
從1200萬到100萬,日本圍棋實(shí)際被精致利己主義毀掉了

從1200萬到100萬,日本圍棋實(shí)際被精致利己主義毀掉了

月滿大江流
2026-03-01 14:52:46
抗美援朝被彭總火線撤職的5位師級將領(lǐng),后來都授了什么軍銜

抗美援朝被彭總火線撤職的5位師級將領(lǐng),后來都授了什么軍銜

鶴羽說個事
2026-03-01 18:26:08
哈梅尸體被找到,伊朗發(fā)起五波反制,美軍損失慘重,中國開始行動

哈梅尸體被找到,伊朗發(fā)起五波反制,美軍損失慘重,中國開始行動

影孖看世界
2026-03-01 18:08:56
大陸為什么總是演習(xí),遲遲不進(jìn)攻臺灣?看看金門島戰(zhàn)役就知道了!

大陸為什么總是演習(xí),遲遲不進(jìn)攻臺灣?看看金門島戰(zhàn)役就知道了!

煙斂的寒林
2026-02-11 22:31:12
哈梅內(nèi)伊遇難,革命衛(wèi)隊(duì)對海灣多國無差別攻擊,十萬援兵已經(jīng)參戰(zhàn)

哈梅內(nèi)伊遇難,革命衛(wèi)隊(duì)對海灣多國無差別攻擊,十萬援兵已經(jīng)參戰(zhàn)

古史青云啊
2026-03-02 17:23:05
網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

眼光很亮
2026-03-01 16:12:51
讓央視春晚給全國道歉,入美國籍回中國撈金,她到底有什么來頭?

讓央視春晚給全國道歉,入美國籍回中國撈金,她到底有什么來頭?

陌上桃花開的
2026-02-28 16:16:42
哈梅內(nèi)伊死了,美伊戰(zhàn)爭烈度比想象的要大很多

哈梅內(nèi)伊死了,美伊戰(zhàn)爭烈度比想象的要大很多

黑噪音
2026-03-01 09:49:45
伊朗真要干掉美軍航母!4枚彈道導(dǎo)彈突擊林肯航母:別急這才開始

伊朗真要干掉美軍航母!4枚彈道導(dǎo)彈突擊林肯航母:別急這才開始

時負(fù)相知
2026-03-02 16:39:59
導(dǎo)彈飛向航母,特朗普緊急剎車,伊朗的內(nèi)鬼,終于藏不住了

導(dǎo)彈飛向航母,特朗普緊急剎車,伊朗的內(nèi)鬼,終于藏不住了

書紀(jì)文譚
2026-03-02 17:25:17
苑舉正預(yù)言:一旦美以伊開戰(zhàn),中國將獲得長達(dá)20年的戰(zhàn)略緩沖時間

苑舉正預(yù)言:一旦美以伊開戰(zhàn),中國將獲得長達(dá)20年的戰(zhàn)略緩沖時間

林子說事
2026-03-02 17:05:05
佩林卡神操作?加盟湖人的肯納德,什么水平?

佩林卡神操作?加盟湖人的肯納德,什么水平?

籃球?qū)嶄?/span>
2026-03-02 14:57:08
油市“末日時鐘”!若霍爾木茲海峽關(guān)閉25天 中東產(chǎn)油國將被迫停產(chǎn)?

油市“末日時鐘”!若霍爾木茲海峽關(guān)閉25天 中東產(chǎn)油國將被迫停產(chǎn)?

財(cái)聯(lián)社
2026-03-02 14:08:05
2026-03-02 18:24:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12393文章數(shù) 142575關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

36歲副鎮(zhèn)長開會暈倒除夕當(dāng)天不幸離世 家中有3個孩子

頭條要聞

36歲副鎮(zhèn)長開會暈倒除夕當(dāng)天不幸離世 家中有3個孩子

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

金銀大漲 市場仍在評估沖突會否長期化

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

手機(jī)
時尚
本地
教育
家居

手機(jī)要聞

vivo韓伯嘯揭秘X300 Ultra手機(jī)視頻拍攝升級亮點(diǎn)

從每天只睡4小時到8小時:一個失眠者的自救指南

本地新聞

津南好·四時總相宜

教育要聞

2月28日雅思大作文示范寫作 | 違規(guī)駕駛成因與最優(yōu)對策分析

家居要聞

萬物互聯(lián) 享科技福祉

無障礙瀏覽 進(jìn)入關(guān)懷版