国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

實(shí)錘了:GPU越多,論文接收率越高、引用越多

0
分享至



機(jī)器之心報(bào)道

機(jī)器之心編輯部

在過去三年里,AI 領(lǐng)域取得了顯著進(jìn)步,這一飛躍主要得益于基礎(chǔ)模型的發(fā)展。這些模型在大規(guī)模多模態(tài)數(shù)據(jù)上進(jìn)行訓(xùn)練,并在公開發(fā)布后取得了巨大成功。

然而,基礎(chǔ)模型的研究需要大量的數(shù)據(jù)、算力和人力資源。這一問題引發(fā)了廣泛關(guān)注與討論,更大的資源獲取是否會(huì)直接帶來更有影響力的研究成果,例如更多的論文發(fā)表或更高的引用量。

這一問題的答案對(duì)于資源分配策略、研究方向的優(yōu)先級(jí)設(shè)定,以及如何保障基礎(chǔ)模型研究的公平與可持續(xù)參與,都具有重要意義。

然而,由于缺乏統(tǒng)一的資源披露標(biāo)準(zhǔn),研究成本往往難以量化。在缺乏全面公開的情況下,研究經(jīng)費(fèi)最直觀的衡量方式,通常是購買或租用硬件(如計(jì)算集群或芯片)的具體成本。當(dāng)然,研究還包括軟件、云存儲(chǔ)服務(wù)以及專業(yè)平臺(tái)等其他開支。

在這些資源中,GPU 是一個(gè)尤其關(guān)鍵的指標(biāo),因?yàn)樗且环N供應(yīng)量有限、受嚴(yán)格控制的資源。

在本文中,來自 MIT、劍橋等機(jī)構(gòu)的研究者研究了硬件資源與 AI/ML 領(lǐng)域頂級(jí)會(huì)議論文發(fā)表之間的關(guān)系。他們重點(diǎn)考察了兩種計(jì)算能力指標(biāo):GPU 數(shù)量和 TFLOPs(每秒浮點(diǎn)運(yùn)算次數(shù)),并將這些數(shù)據(jù)與 2022 至 2024 年間共 34,828 篇錄用論文進(jìn)行關(guān)聯(lián)分析。

本文共識(shí)別出 5,889 篇基礎(chǔ)模型相關(guān)論文,并發(fā)現(xiàn) GPU 獲取能力越強(qiáng),其在八個(gè)頂級(jí)會(huì)議中的論文接收率和引用量也越高。

此外,本文還對(duì) 312 篇論文的 229 位作者進(jìn)行了問卷調(diào)查后發(fā)現(xiàn):

  • 大多數(shù)基礎(chǔ)模型論文由學(xué)術(shù)界研究者撰寫(共 4,851 篇),而產(chǎn)業(yè)界研究者的論文數(shù)量相對(duì)較少(1,425 篇);
  • 大多數(shù)論文使用的是開源模型(如 LLaMA),其次是閉源模型(如 GPT);
  • GPU 使用信息在論文中很少被披露,這表明當(dāng)前亟需制定統(tǒng)一的計(jì)算資源報(bào)告規(guī)范,以提升研究的透明度與可復(fù)現(xiàn)性。



  • 論文標(biāo)題:THE ROLE OF COMPUTING RESOURCES IN PUBLISHING FOUNDATION MODEL RESEARCH
  • 論文地址:https://arxiv.org/pdf/2510.13621

計(jì)算資源識(shí)別方法

研究者收集了2022 年至 2024 年間、八個(gè)頂級(jí)機(jī)器學(xué)習(xí)會(huì)議上被接收的論文(2025 年 3 月之前已可獲。 NeurIPS、ICLR、ICML、COLM、EMNLP、ACL、NAACL、EACL。

采用的方法是:在論文標(biāo)題或摘要中搜索關(guān)鍵詞來識(shí)別與基礎(chǔ)模型(FM)相關(guān)的論文。最終在總計(jì) 34828 篇論文中,挑選出了5889 篇與 FM 相關(guān)的已接收論文。此外收集了同期被拒稿或撤稿的 ICLR 與 FM 相關(guān)的論文,共計(jì) 613 篇,用于對(duì)比分析。

在完成論文標(biāo)題和摘要的整理后,研究者使用 GPT-4o mini 將每篇論文分為三個(gè)類別,即領(lǐng)域(Domain)、階段(Phase)和方法(Method)。這些類別的定義見下表 1。



更進(jìn)一步地,研究者通過系統(tǒng) API 從全部 5889 篇已接收論文中收集結(jié)構(gòu)化信息,包括文章 ID、標(biāo)題、作者信息(姓名、人數(shù)及所屬機(jī)構(gòu))、發(fā)表信息(年份、會(huì)議、接收或拒稿狀態(tài)、論文鏈接、評(píng)審意見和摘要)。對(duì)于系統(tǒng) API 中缺失的信息,研究者使用 GPT-4o mini 處理論文 PDF,以提取資深作者的所屬機(jī)構(gòu)、GPU 使用情況、數(shù)據(jù)集描述以及資助信息。

在調(diào)研中,118 所機(jī)構(gòu)的研究者參與了本次調(diào)查,包括了 267 名學(xué)術(shù)界一作和 36 名產(chǎn)業(yè)界一作,最終共有 229 位 FM 論文的一作(包括 312 篇論文)提供有效反饋。當(dāng)論文中未記錄計(jì)算資源使用情況時(shí),參與者需在調(diào)查中自行報(bào)告相關(guān)信息

圖 1 (B) 展示了不同年份和會(huì)議中有效 GPU 類型的比例,以及各會(huì)議作者和審稿人檢查清單中是否包含報(bào)告計(jì)算資源使用情況的相關(guān)指南。圖 1 (C) 展示了由 GPT-4o 自動(dòng)抓取的數(shù)據(jù)與論文作者自報(bào)數(shù)據(jù)在 GPU 使用量與 FP 16 計(jì)算性能(TFLOPS 16)上的差異。



為確保提取的 GPU 信息準(zhǔn)確性,兩位 FM 研究者在盲評(píng)條件下獨(dú)立檢查了 312 篇論文,并與 GPT-4o mini 的提取結(jié)果進(jìn)行對(duì)比。研究者交叉比對(duì)了 GPT-4o mini 提取的信息、人工標(biāo)注結(jié)果以及論文一作自報(bào)的 GPU 數(shù)據(jù)。

結(jié)果顯示:在被調(diào)查的 312 篇論文中,288 篇自報(bào)了 GPU 數(shù)量,292 篇自報(bào)了 GPU 類型,281 篇自報(bào)了 GPU 使用時(shí)長;另有 24 篇使用了非 GPU 計(jì)算資源(如 TPU、NPU 或 CPU)。

不過,兩位 FM 研究者發(fā)現(xiàn)僅有 172 篇論文中包含 GPU 數(shù)量信息,141 篇包含 GPU 類型信息,249 篇包含 GPU 時(shí)長信息。GPT-4o mini 僅從 116 篇論文中成功提取到 GPU 數(shù)量,與作者報(bào)告相比存在 59.7% 的缺失率。GPU 類型與 GPU 時(shí)長的缺失率也較高,分別為 48.3% 和 88.6%。

結(jié)果

基礎(chǔ)模型研究呈爆炸式增長

從 2022 年到 2024 年,基礎(chǔ)模型的研究在廣度和深度上都經(jīng)歷了顯著增長。

一個(gè)直觀的體現(xiàn)是,在八個(gè)頂級(jí) AI 會(huì)議中,基礎(chǔ)模型相關(guān)論文的占比迅速攀升

  • 2022 年: 2.07%
  • 2023 年: 10.29%
  • 2024 年:飆升至 34.64%(圖 A)



尤其在NLP 領(lǐng)域,這一趨勢(shì)更為明顯。在 COLM、EMNLP 和 ACL 等專業(yè)會(huì)議上,基礎(chǔ)模型論文的比例甚至超過了 ICLR、ICML 和 NeurIPS 等綜合性機(jī)器學(xué)習(xí)會(huì)議。

從研究方向來看,與推理相關(guān)的論文增長最快。從研究類型來看,算法和實(shí)證研究的增長速度超過了數(shù)據(jù)集、基準(zhǔn)測(cè)試和工具包等類別(圖 B)。



有趣的是,盡管論文數(shù)量激增,但單個(gè)項(xiàng)目使用的 GPU 數(shù)量保持相對(duì)穩(wěn)定。無論是已發(fā)表的論文還是待發(fā)表的研究,大多數(shù)項(xiàng)目使用的 GPU 數(shù)量集中在 1 到 8 個(gè),其中 1 到 4 個(gè) GPU 的配置最為常見,占據(jù)了約一半的比例(圖 C)。不過,考慮到目前 GPU 的采購周期越來越長,這一趨勢(shì)未來是否會(huì)變化,值得我們持續(xù)關(guān)注。



工業(yè)界與學(xué)術(shù)界共同引領(lǐng)研究浪潮

基礎(chǔ)模型的研究延續(xù)了計(jì)算機(jī)科學(xué)領(lǐng)域產(chǎn)學(xué)研緊密結(jié)合的傳統(tǒng)。

數(shù)據(jù)顯示,學(xué)術(shù)界貢獻(xiàn)了更多的論文總量,但頂尖的工業(yè)界實(shí)驗(yàn)室在單一機(jī)構(gòu)產(chǎn)出上表現(xiàn)突出。具體來看:

  • 學(xué)術(shù)界: 611 個(gè)機(jī)構(gòu)共發(fā)表了 4851 篇論文。
  • 工業(yè)界: 163 個(gè)機(jī)構(gòu)共發(fā)表了 1425 篇論文。

其中,谷歌和微軟是論文產(chǎn)出最多的兩個(gè)單一實(shí)體,緊隨其后的是清華大學(xué)、Meta 和斯坦福大學(xué)。



值得注意的是,兩大陣營的研究效率相當(dāng)。工業(yè)界研究者人均發(fā)表 8.72 篇論文,學(xué)術(shù)界人均發(fā)表 7.93 篇。這表明,基礎(chǔ)模型的研究高度集中在少數(shù)能提供強(qiáng)大算力支持的頂級(jí)學(xué)術(shù)和工業(yè)機(jī)構(gòu)中。如果獲取大規(guī)模算力的門檻持續(xù)提高,這種集中化趨勢(shì)可能會(huì)進(jìn)一步加劇。

從國家層面看,美國和中國在基礎(chǔ)模型研究產(chǎn)出方面處于領(lǐng)先地位(圖 B),這可能與兩國在高等教育和人工智能領(lǐng)域的長期投入有關(guān)。



開源模型成為研究的主流選擇

在眾多模型中,以LLaMA 系列為代表的開源權(quán)重模型是研究中使用最頻繁的(圖 C)。



這一現(xiàn)象至關(guān)重要。雖然像 GPT 系列這樣的專有閉源模型因其卓越的性能和便捷的 API 接口,在研究中仍占有一席之地,但開源模型憑借其高度的靈活性和可訪問性贏得了研究社區(qū)的青睞。研究人員可以基于開源模型進(jìn)行微調(diào)、領(lǐng)域適配和深入的基準(zhǔn)測(cè)試,而這些操作在閉源模型上通常難以實(shí)現(xiàn)。

GPU 使用情況:NVIDIA A100 成為核心算力

在具體的 GPU 類型上,NVIDIA A100 是基礎(chǔ)模型研究中使用最廣泛的核心,并且排名前十的 GPU 均來自 NVIDIA 家族(圖 3D)。

進(jìn)一步分析發(fā)現(xiàn),算力資源的使用并非均勻分布:

  • 研究階段: 專注于預(yù)訓(xùn)練的研究,其 GPU 使用數(shù)量顯著高于側(cè)重于后訓(xùn)練或推理的研究(p<0.001)。
  • 其他維度: 在不同機(jī)構(gòu)、應(yīng)用領(lǐng)域或研究方法之間,GPU 的使用量沒有表現(xiàn)出統(tǒng)計(jì)學(xué)上的顯著差異。例如,安全相關(guān)研究的 GPU 使用量中位數(shù)較低,而工具包開發(fā)研究的使用量較高,但這些差異并不顯著(圖 D)。



從論文的研究重點(diǎn)來看:

  • 47.4% 關(guān)注算法開發(fā)。
  • 86.4% 集中在 NLP 領(lǐng)域,僅有 5.7% 涉及 CV。
  • 48.7% 的論文研究推理過程,遠(yuǎn)超預(yù)訓(xùn)練(13.3%)。

政府是基礎(chǔ)模型研究的最大資助方

通過分析論文中披露的資金信息,發(fā)現(xiàn)政府是基礎(chǔ)模型研究最主要的資助來源(圖 4)。在提供了資助信息的論文中:

  • 85.5%(848 篇)獲得了政府資助。
  • 29.3%(291 篇)獲得了企業(yè)資助。
  • 10.3%(102 篇)獲得了基金會(huì)資助(圖 4A)。

有趣的是,一個(gè)國家的人均 GDP 與其資助的論文數(shù)量之間沒有必然聯(lián)系(圖 4B)。這表明,機(jī)構(gòu)的支持力度和相關(guān)政策,比單純的國家經(jīng)濟(jì)實(shí)力更能影響基礎(chǔ)模型的研究產(chǎn)出。(注:僅有 15.3% 的論文披露了詳細(xì)的資助信息。)



研究產(chǎn)出與影響力:算力比 GPU 數(shù)量更關(guān)鍵

一個(gè)典型的基礎(chǔ)模型研究項(xiàng)目是怎樣的?數(shù)據(jù)顯示,一篇被接收的論文,通常有 5 名作者,使用 4 個(gè) GPU,項(xiàng)目平均持續(xù)約 5 個(gè)月。

進(jìn)一步探究了計(jì)算資源與研究成果(論文數(shù)量和引用量)之間的關(guān)系,發(fā)現(xiàn)了更深層的規(guī)律:

對(duì)于產(chǎn)出(論文數(shù)量): 單純的 GPU 數(shù)量與論文產(chǎn)出不成正比。然而,以 TFLOPs(每秒萬億次浮點(diǎn)運(yùn)算)衡量的總計(jì)算能力,與論文產(chǎn)出呈現(xiàn)出更強(qiáng)的正相關(guān)性,尤其是在工業(yè)界(圖 4C)。這說明,決定研究產(chǎn)出效率的,是高質(zhì)量的計(jì)算基礎(chǔ)設(shè)施,而不僅僅是 GPU 的堆砌。

對(duì)于影響力(引用次數(shù)): 同樣,TFLOPs 比 GPU 數(shù)量更能預(yù)測(cè)一篇論文的引用潛力(圖 4D)。擁有更強(qiáng)算力支持的機(jī)構(gòu),其研究成果往往能獲得更多引用

盡管如此,算力并非決定性因素。許多高引用論文同樣來自計(jì)算資源相對(duì)有限的機(jī)構(gòu),證明了研究影響力是由多種因素共同決定的。

論文接收與否:資源多少并非決定性因素

更多的 GPU 或更強(qiáng)的算力,能提高論文被接收的概率嗎?

研究者對(duì) ICLR 會(huì)議 2022-2024 年的數(shù)據(jù)進(jìn)行了分析。結(jié)果發(fā)現(xiàn),平均而言,被拒稿的論文確實(shí)比被接收的論文使用了略少的 GPU、略低的 TFLOPs和規(guī)模略小的作者團(tuán)隊(duì)。

但是,兩者在資源使用上的分布情況非常相似,差距微乎其微。這與頂級(jí)會(huì)議的審稿指南相符,即審稿人更應(yīng)關(guān)注研究的新穎性、清晰度和貢獻(xiàn),而非其使用的資源多寡。(注:由于只有 ICLR 公開了被拒稿論文的數(shù)據(jù),這個(gè)結(jié)論的普適性還有待更多數(shù)據(jù)驗(yàn)證。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
新娘全家都是演員!這場(chǎng)“完美婚禮”全是戲!

新娘全家都是演員!這場(chǎng)“完美婚禮”全是戲!

看看新聞Knews
2026-03-02 17:55:03
掘金后悔了!小波特+首輪簽交易虧麻了,近4戰(zhàn)場(chǎng)均7分,想送走他

掘金后悔了!小波特+首輪簽交易虧麻了,近4戰(zhàn)場(chǎng)均7分,想送走他

你的籃球頻道
2026-03-02 08:57:26
欠中國的錢,委內(nèi)瑞拉不還了?美財(cái)長:中國已無法繼續(xù)獲得委石油

欠中國的錢,委內(nèi)瑞拉不還了?美財(cái)長:中國已無法繼續(xù)獲得委石油

萌城少年強(qiáng)
2026-01-22 12:47:40
天塌了!柳州一已婚女子出軌感染艾滋,涉事小伙是工廠班組長…

天塌了!柳州一已婚女子出軌感染艾滋,涉事小伙是工廠班組長…

火山詩話
2026-03-02 05:47:48
中美關(guān)系走到今天,回頭看毛主席當(dāng)年說的兩句話,太精準(zhǔn)了!

中美關(guān)系走到今天,回頭看毛主席當(dāng)年說的兩句話,太精準(zhǔn)了!

素年文史
2026-01-15 13:29:54
吳辰君移居迪拜報(bào)平安,稱當(dāng)?shù)匚镔Y充足生活如常,暫時(shí)不打算離開

吳辰君移居迪拜報(bào)平安,稱當(dāng)?shù)匚镔Y充足生活如常,暫時(shí)不打算離開

東方不敗然多多
2026-03-02 16:43:07
干掉強(qiáng)硬派,然后來談判?伊朗外長愿意和美國談判,特朗普同意

干掉強(qiáng)硬派,然后來談判?伊朗外長愿意和美國談判,特朗普同意

陳蕙侃故事
2026-03-02 18:11:53
美國已經(jīng)成為第二個(gè)蘇聯(lián),只需要犯一個(gè)錯(cuò),國家就分崩離析了

美國已經(jīng)成為第二個(gè)蘇聯(lián),只需要犯一個(gè)錯(cuò),國家就分崩離析了

歷史有些冷
2026-03-01 17:50:03
3天付清16億!山東80后拒上市,44歲穩(wěn)坐首富,千億帝國靠啥硬撐

3天付清16億!山東80后拒上市,44歲穩(wěn)坐首富,千億帝國靠啥硬撐

青眼財(cái)經(jīng)
2026-01-13 22:58:50
特朗普訪華行程定了,國務(wù)卿魯比奧卻卡制裁名單里,放話加稅逼開綠燈?

特朗普訪華行程定了,國務(wù)卿魯比奧卻卡制裁名單里,放話加稅逼開綠燈?

流年拾光
2026-03-02 19:54:11
他接受監(jiān)察調(diào)查

他接受監(jiān)察調(diào)查

錫望
2026-03-01 18:21:26
59歲宋祖英現(xiàn)身活動(dòng)狀態(tài)驚艷!短發(fā)利落大氣,黑色套裝優(yōu)雅端莊

59歲宋祖英現(xiàn)身活動(dòng)狀態(tài)驚艷!短發(fā)利落大氣,黑色套裝優(yōu)雅端莊

琴聲飛揚(yáng)
2026-02-12 11:51:25
孟加拉國女足主帥談戰(zhàn)中國女足:這是一場(chǎng)大衛(wèi)對(duì)歌利亞的較量

孟加拉國女足主帥談戰(zhàn)中國女足:這是一場(chǎng)大衛(wèi)對(duì)歌利亞的較量

懂球帝
2026-03-02 15:34:47
煮湯圓,有人用開水,用冷水!廚師長:都不對(duì),教您做法,不粘鍋

煮湯圓,有人用開水,用冷水!廚師長:都不對(duì),教您做法,不粘鍋

阿龍美食記
2026-02-23 17:09:09
終于換對(duì)發(fā)型!前港姐冠軍摘掉假劉海,顏值瞬間回春

終于換對(duì)發(fā)型!前港姐冠軍摘掉假劉海,顏值瞬間回春

暖心萌阿菇?jīng)?/span>
2026-03-01 21:09:44
4-2!邁阿密半場(chǎng)連扳4球獲賽季首勝 38歲梅西2射1傳+生涯進(jìn)898球

4-2!邁阿密半場(chǎng)連扳4球獲賽季首勝 38歲梅西2射1傳+生涯進(jìn)898球

我愛英超
2026-03-02 10:16:26
黃金大漲后,套的就是你

黃金大漲后,套的就是你

新浪財(cái)經(jīng)
2026-03-02 20:29:36
發(fā)燒友用56節(jié)5號(hào)電池運(yùn)行臺(tái)式機(jī)電腦:實(shí)測(cè)玩掃雷續(xù)航不到5分鐘

發(fā)燒友用56節(jié)5號(hào)電池運(yùn)行臺(tái)式機(jī)電腦:實(shí)測(cè)玩掃雷續(xù)航不到5分鐘

快科技
2026-03-02 09:58:11
3月2日,小米股這是怎么了?一路狂瀉5個(gè)點(diǎn),竟然跌破34了!

3月2日,小米股這是怎么了?一路狂瀉5個(gè)點(diǎn),竟然跌破34了!

劉森森
2026-03-02 11:14:19
安東尼奧計(jì)劃招入4位07后球員,進(jìn)入U(xiǎn)23國足名單

安東尼奧計(jì)劃招入4位07后球員,進(jìn)入U(xiǎn)23國足名單

吳朑愛游泳
2026-03-02 20:22:34
2026-03-02 21:08:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12395文章數(shù) 142575關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普稱對(duì)伊行動(dòng)還要打四周 學(xué)者:達(dá)成目標(biāo)需"補(bǔ)槍"

頭條要聞

特朗普稱對(duì)伊行動(dòng)還要打四周 學(xué)者:達(dá)成目標(biāo)需"補(bǔ)槍"

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

金銀大漲 市場(chǎng)仍在評(píng)估沖突會(huì)否長期化

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

旅游
家居
親子
公開課
軍事航空

旅游要聞

火龍巡夜,花燈入夢(mèng):在韶關(guān)灣頭古村,看見四百年的中式浪漫

家居要聞

萬物互聯(lián) 享科技福祉

親子要聞

混血3姐弟,今天在家拆沙發(fā)蓋城堡!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國中央司令部透露對(duì)伊朗動(dòng)武全部武器裝備清單

無障礙瀏覽 進(jìn)入關(guān)懷版