国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

Nvidia在MLPerf基準測試中展示Blackwell Ultra性能

0
分享至

MLCommons本周發(fā)布了最新MLPerf基準測試結果,Nvidia GPU良好的表現(xiàn)一如既往,其中最亮眼的則是最新的Nvidia Blackwell Ultra GPU,結果令人印象深刻。


在MLCommons發(fā)布的MLPerf 5.1基準測試的93個項目中,74個系統(tǒng)包含Nvidia Blackwell GPU,而19個系統(tǒng)配備了各種AMD Instinct GPU。Nvidia系統(tǒng)在MLPerf 5.1中包含的七個AI模型中均排名第一,這些模型涵蓋了大型語言模型(LLM)、圖像生成、推薦系統(tǒng)、計算機視覺和圖神經網絡。

比Nvidia的勝利更重要的是有機會展示其最新、最強大的設備——Blackwell Ultra GB300 GPU,該GPU于2024年3月推出,兩個月前才開始批量出貨。

基準測試顯示,Blackwell Ultra GB300能夠提供大約兩倍于Blackwell GB200的FP4性能,是Nvidia于2022年3月推出并于當年晚些時候開始出貨的Hopper H100 GPU的四至五倍。

例如,在Llama 3.1 405B預訓練基準測試中,配備512個Blackwell Ultra GB300 GPU的系統(tǒng)能夠在64.6分鐘內完成測試。這大約是配備512個Blackwell GB200 GPU的系統(tǒng)在MLPerf 5.0基準測試中完成任務的速度的兩倍,也比同樣在MLPerf 1.0上的等效H100系統(tǒng)快4倍。


在涉及Llama 2 70B LoRA模型的微調基準測試中,8 GPU Blackwell Ultra GB300設置將在8.5分鐘內完成任務,這比在MLPerf 4.1上運行的8 GPU Hopper H100設置快5倍,比在MLPerf 5.0上運行的Blackwell GB200等效設置快1.6倍。

雖然MLPerf版本每年都在變化,但各個基準保持一致,從而能夠進行公平的比較。對于MLPerf 5.1,MLCommons拋棄了兩個舊模型,BERT Large and Stable Diffusion,并用Llama 3.1 8B和FLUX.1(用于圖像生成)替換了它們。這種演變也反映了與人工智能訓練工作負載相比,人工智能推理工作負載的重要性日益增加。

MLCommons MLPerf負責人David Kanter在一篇博客文章中表示:“總的來說,向GenAI基準提交的數據增加以及這些測試中記錄的可觀的性能改進表明,大家非常關注GenAI場景,在某種程度上以犧牲AI技術的其他潛在應用為代價?!?/p>


這些測試還使Nvidia能夠展示Blackwell Ultra GB300在使用超低精度4位浮點數據格式的新興AI工作負載上的性能。6月,Nvidia推出了第二種FP4數據格式NVFP4,以配合Blackwell和Blackwell Ultra現(xiàn)有的MXFP4格式。

在周一的新聞發(fā)布會上,Nvidia分享了記錄NVPF4格式與MXFP4相比準確度的數據。雖然兩者都不如16位浮點格式bfloat16(BF16)準確,但NVPF4顯示的損失比MXFP4少,高達8000億個Token,之后兩種格式的損失率都會加速。

Nvidia加速計算主管Dave Salvator表示:“基本的結論是,我們通過自己的經驗觀察發(fā)現(xiàn),NVFP4實際上比MXFP4提供了更好的準確性,這就是為什么我們不僅傾向于在推理方面,而且在訓練方面使用它?!?/p>

Salvator還指出,Blackwell Ultra擁有279GB的HBM3內存,可提供15petaflops的NVFP4計算,英偉達配置了一組配備5120個GPU的GB300 NVL72系統(tǒng),通過800Gbps Quantum-X800 InfiniBand互聯(lián)連接。它能夠在10.0分鐘內完成Llama 3.1 405B的預訓練工作負載,這比Nvidia之前的系統(tǒng)快2.7倍,Nvidia以前的系統(tǒng)有大約2500個GPU。


Salvator說:“正如你所看到的,當我們從512個GPU增加到5120個GPU時,我們基本上能夠實現(xiàn)約85%的縮放效率?!薄坝嬎悴⒉皇腔鶞蕼y試中的唯一因素。還有其他因素。有內存移動、I/O、網絡通信,還有其他因素在起作用。因此,我們實現(xiàn)了85%的擴展效率,同時基本上將GPU數量增加了10倍,這一事實真的令人印象深刻?!?/p>

Nvidia在本輪新增的兩個基準測試中創(chuàng)造了性能記錄,包括Llama 3.1 8B和FLUX.1。Nvidia能夠在5.2分鐘內用512個Blackwell Ultra GPU組成的系統(tǒng)訓練Llama 3.1 8B模型。它能夠在由1152個Blackwell CPU組成的系統(tǒng)上以12.5分鐘的創(chuàng)紀錄時間完成FLUX.1圖像生成器基準測試。該公司現(xiàn)有的圖神經網絡、對象檢測和推薦系統(tǒng)測試記錄仍然有效。


在人工智能時代,一個訓練或微調模型,然后過渡到生產(即推理)模式的速度將決定競爭能力。正如Salvator所指出的那樣,Nvidia的設備在人工智能游戲的每個階段都占據主導地位。

他說:“訓練領域的性能提升轉化為模型的更快收斂。模型收斂越快,模型部署得越快,組織獲得投資回報率的速度就越快,這最終是許多組織的目標,即能夠以一種實際上有利可圖的方式部署這些東西?!?/p>

與 Ai 時代前沿合作,將大門向更多普通用戶敞開!無論你是對新技術充滿好奇心的愛好者,還是希望提升自己技能的職場人士,這里都有適合你的課程和資源。歡迎掃碼加入我們!


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

換了車我才悟了:寧可多花點錢,汽車也要堅持4不買!建議收藏!

藍色海邊
2025-12-27 07:14:15
中國11月工業(yè)企業(yè)利潤同比降13.1%?,創(chuàng)下一年來的最大跌幅

中國11月工業(yè)企業(yè)利潤同比降13.1%?,創(chuàng)下一年來的最大跌幅

黑噪音
2025-12-28 12:37:21
徐湖平在部隊期間因“手腳不干凈”,被營長岳振華踢出了軍隊?

徐湖平在部隊期間因“手腳不干凈”,被營長岳振華踢出了軍隊?

方圓文史
2025-12-27 16:56:27
孫穎莎躺冠!覃予萱獨得2分獲前國手稱贊 王曼昱意外缺席 大美女唏噓

孫穎莎躺冠!覃予萱獨得2分獲前國手稱贊 王曼昱意外缺席 大美女唏噓

硯底沉香
2025-12-28 14:14:26
“去一趟封關后的海南,我被自己‘窮’笑了”

“去一趟封關后的海南,我被自己‘窮’笑了”

鳳凰網財經
2025-12-27 19:48:31
萊利預言成真,火箭擺出終極陣容!杜蘭特笑納大勝申京成唯一輸家

萊利預言成真,火箭擺出終極陣容!杜蘭特笑納大勝申京成唯一輸家

鍋子籃球
2025-12-28 13:10:00
來聚餐還補工資!東莞一工廠年底聚餐,當晚按工時3.5小時核工資

來聚餐還補工資!東莞一工廠年底聚餐,當晚按工時3.5小時核工資

火山詩話
2025-12-28 11:03:19
NBA最年輕40分先生是弗拉格,70分是布克,那50分和60分呢?

NBA最年輕40分先生是弗拉格,70分是布克,那50分和60分呢?

大西體育
2025-12-28 14:02:41
國民黨中央委員選舉結果出爐!陳菁徽得第一,連勝武排第九

國民黨中央委員選舉結果出爐!陳菁徽得第一,連勝武排第九

海峽導報社
2025-12-28 10:44:03
什么情況?CBA超級外援自宣告別上海 球迷:盧偉更衣室管理失控?

什么情況?CBA超級外援自宣告別上海 球迷:盧偉更衣室管理失控?

體育哲人
2025-12-28 12:39:33
漂亮岳母突然懷孕,可岳父已經去世一年了,詢問下,岳母說都怪我

漂亮岳母突然懷孕,可岳父已經去世一年了,詢問下,岳母說都怪我

神奇的錘子
2024-07-08 21:49:17
54歲埃梅里封神!震撼11連勝創(chuàng)111年紀錄 已掀翻5豪門+阿森納顫抖

54歲埃梅里封神!震撼11連勝創(chuàng)111年紀錄 已掀翻5豪門+阿森納顫抖

我愛英超
2025-12-28 03:55:16
長春某雷燒烤后續(xù):門頭不見了,老板娘車里痛哭,后悔求原諒

長春某雷燒烤后續(xù):門頭不見了,老板娘車里痛哭,后悔求原諒

觀察鑒娛
2025-12-27 09:36:09
澤連斯基很精明,特朗普憤怒表示“除非他批準,否則什么都沒有”

澤連斯基很精明,特朗普憤怒表示“除非他批準,否則什么都沒有”

山河路口
2025-12-27 13:41:04
山西省司法廳原一級巡視員周濤接受審查調查

山西省司法廳原一級巡視員周濤接受審查調查

界面新聞
2025-12-28 11:31:42
中國經濟的未來,取決于分配制度的改革

中國經濟的未來,取決于分配制度的改革

生命可以承受之輕
2025-12-27 11:07:22
亞洲周刊曝光徐鶯偽造身份11年,篡改民國收藏史,文博圈大佬站臺

亞洲周刊曝光徐鶯偽造身份11年,篡改民國收藏史,文博圈大佬站臺

阿纂看事
2025-12-25 13:38:27
我發(fā)現(xiàn):晚年最悲催的不是變老和生病,是看見子女出現(xiàn)這3種狀況

我發(fā)現(xiàn):晚年最悲催的不是變老和生病,是看見子女出現(xiàn)這3種狀況

小馬達情感故事
2025-12-27 13:55:03
36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

釋凡電影
2025-08-14 09:33:19
安徽畫家關玉梅被判處死刑,死前拒吃斷頭飯,臨行前一句話眾人淚目

安徽畫家關玉梅被判處死刑,死前拒吃斷頭飯,臨行前一句話眾人淚目

紅豆講堂
2024-11-15 11:25:33
2025-12-28 15:07:00
Ai時代前沿
Ai時代前沿
人工智能新聞動態(tài)及應用案例。
1608文章數 510關注度
往期回顧 全部

數碼要聞

硬件監(jiān)測軟件HWMonitor更新1.61版,支持AMD Zen 6和英特爾新架構

頭條要聞

四川原副省長葉寒冰被通報:長期出入私人會所聚餐飲酒

頭條要聞

四川原副省長葉寒冰被通報:長期出入私人會所聚餐飲酒

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

姚晨打卡絕版機位 高崎機場背后的遺憾

財經要聞

英偉達的收購史

科技要聞

AR眼鏡第一案,究竟在爭什么?

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

時尚
教育
親子
房產
公開課

瑞典拉普蘭:凜冽北境的萬物平衡之道

教育要聞

孩子職業(yè)規(guī)劃越早越好

親子要聞

62歲懷二胎真相驚人!醫(yī)生擔憂的惡心一幕曝光!

房產要聞

年銷20億+!中交·藍色港灣用好房子致敬好生活

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版