国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

單卡突破1000TFLOPS!摩爾線程旗艦GPU參數(shù)首曝光:對標H100,訓練性能大漲30%

0
分享至


芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影

芯東西2月12日報道,今日,摩爾線程發(fā)文宣布旗艦級AI訓推一體全功能GPU MTT S5000率先完成對GLM-5大模型的適配,并首次曝光MTT S5000的硬件參數(shù)。

MTT S5000支持FP8FP64的全精度計算,F(xiàn)P8精度下單卡AI算力最高可達1000TFLOPS,配備80GB顯存,顯存帶寬達1.6TB/s,卡間互聯(lián)帶寬達784GB/s。

根據(jù)業(yè)內人士消息,MTT S5000實測性能對標H100,在多模態(tài)大模型微調任務中,部分性能甚至超越H100。


MTT S5000由摩爾線程在2024年推出,專為大模型訓練、推理及高性能計算而設計。

據(jù)接近測試項目的行業(yè)人士透露,S5000在產(chǎn)品精度上已超越H100,更接近英偉達Blackwell架構

在近期一次數(shù)千億參數(shù)模型的全流程訓練驗證中,該卡表現(xiàn)出了與H100集群極高的結果一致性,最終模型關鍵指標誤差僅維持在千分之幾的范圍內,整體訓練效果甚至實現(xiàn)小幅超越

另據(jù)來自互聯(lián)網(wǎng)廠商場景的實測信息反饋,S5000在典型端到端推理及訓練任務中,性能可達競品H20的2.5倍左右。

摩爾線程官網(wǎng)也已上線MTT S5000的詳情頁面。

產(chǎn)品形態(tài)上,S5000遵循OAM標準設計,提供兩種計算模組形態(tài):

  • 液冷版:專為高密度綠色數(shù)據(jù)中心打造,釋放極致算力密度的同時,顯著降低PUE與能耗;
  • 風冷版:適配標準通用服務器,部署靈活便捷,有效降低運維門檻與長期持有成本。

同時,摩爾線程推出面向AI和高性能計算的MGX 8-GPU模塊化平臺:8顆MTT S5000 OAM計算模組通過MTLink高速互聯(lián),可為大模型訓練、推理及科學計算等應用場景提供超大規(guī)模算力。


MCCX D800 X2服務器是搭載8顆MTT S5000 OAM計算模組的一體化AI服務器,提供計算、存儲、網(wǎng)絡的高端配置,可支撐千億、萬億參數(shù)大模型高效運行。

該服務器在散熱、供電、I/O 擴展性等方面充分優(yōu)化,支持風冷和液冷兩種機型,可預裝優(yōu)化訓練、推理軟件棧,實現(xiàn)軟硬件一體化交付,開箱即用。


一、基于第四代MUSA架構,原生支持FP8精度,訓練性能提升30%

在大模型參數(shù)持續(xù)擴張的趨勢下,F(xiàn)P8計算精度的支持已成為訓練與推理的核心精度標準。相比傳統(tǒng)的BF16/FP16,F(xiàn)P8可將數(shù)據(jù)位寬減半,顯存帶寬壓力降低50%,理論計算吞吐量翻倍

MTT S5000是國內最早一批原生支持FP8精度的訓練GPU,配置了硬件級FP8 Tensor Core加速單元。其FP8引擎全面支持DeepSeek、Qwen等前沿架構,在實測中可提升30%以上訓練性能。


S5000采用第四代MUSA架構“平湖”,專為大規(guī)模AI訓練優(yōu)化,依托MUSA全棧軟件平臺,原生適配PyTorch、Megatron-LM、vLLM及 SGLang等主流框架,讓用戶能夠以“零成本”完成代碼遷移,兼容國際主流CUDA生態(tài)。


這款AI計算卡深度優(yōu)化了Prefill階段的處理效率,在超長序列輸入場景下,能顯著加速Prompt預處理過程,提供更快的上下文理解與首Token響應速度,有效解決大規(guī)模知識庫檢索及長文檔分析中的延遲瓶頸。

在16k長序列輸入測試中,S5000單卡Prefill吞吐量是H20的2.5倍。這意味著在處理長文本Prompt時,國產(chǎn)算力具備更快的上下文理解速度。


這主要得益于其高達1000TFLOPS的單卡算力。在絕大多數(shù)計算密集型場景中,該卡不僅能提供更強勁的算力輸出,也在整體性價比上展現(xiàn)出顯著優(yōu)勢。

基于FSDP2框架,MTT S5000已率先完成Wan2.1視頻生成全模型訓練驗證,2節(jié)點16卡配置下訓練吞吐量達61.83samples/s,模型算力利用率(MFU)達51%,生成效果在視頻邏輯、畫質細膩度、動態(tài)一致性上均對齊行業(yè)基準。


二、10EFLOPS萬卡集群已落地,下游任務評測得分優(yōu)于H100

基于S5000構建的夸娥萬卡集群已經(jīng)落地,其浮點運算能力達到10EFLOPS,在Dense模型訓練中MFU達60%,在MoE模型中維持在40%左右,有效訓練時間占比超過90%,訓練線性擴展效率達95%


依托原生FP8能力,它能夠完整復現(xiàn)頂尖大模型的訓練流程,其中Flash Attention算力利用率超過95%,多項關鍵指標均達到國際主流水平。

在集群通信層面,S5000采用獨創(chuàng)的ACE技術,將復雜通信任務從計算核心卸載,實現(xiàn)計算與通信的零沖突并行,大幅提升MFU。

實測顯示,從64卡擴展至1024卡,其系統(tǒng)保持90%以上的線性擴展效率,訓練速度隨算力增加幾乎同步倍增。

第三方驗證方面,2026年1月,智源研究院基于S5000千卡集群,完成了前沿具身大腦模型RoboBrain 2.5的端到端訓練與對齊驗證。

結果顯示,與英偉達H100集群的訓練結果高度重合,訓練損失值(loss)差異僅為0.62%

根據(jù)摩爾線程官網(wǎng),在S5000集群上訓練DeepSeek-236B,前3萬步訓練過程中,Loss曲線與H100集群的相對精度誤差僅為0.6%。同等數(shù)據(jù)量下,其下游任務評測得分優(yōu)于H100,驗證了萬卡集群的高精度。


GPU集群的可靠性、可用性和可維護性(RAS)是支撐大規(guī)模AI訓練任務持續(xù)穩(wěn)定運行的核心基礎設施能力。

S5000從芯片級到系統(tǒng)級構建了完整的RAS體系,支持故障感知、上報與錯誤隔離,可快速定位并替換故障節(jié)點、慢節(jié)點及靜默數(shù)據(jù)損壞節(jié)點,并具備主動檢測與修復功能,長期守護集群健康,確保性能穩(wěn)定與結果正確。

三、刷新國產(chǎn)GPU大模型推理紀錄,科學計算性能完勝H100

S5000在推理場景同樣表現(xiàn)優(yōu)異。2025年12月,摩爾線程聯(lián)合硅基流動,基于S5000完成對DeepSeek-V3 671B滿血版的深度適配與性能測試,實測單卡Prefill吞吐超4000tokens/s,Decode吞吐超1000tokens/s,刷新了國產(chǎn)GPU的推理紀錄。


針對Agent間的高頻通訊與復雜代碼塊的瞬時生成需求,S5000在DeepSeek等前沿模型的推理實測中,實現(xiàn)了遠超行業(yè)基準的token生成速率

S5000針對文生視頻模型進行了深度優(yōu)化,基于原生FP8硬件加速能力,在大幅提升推理速度的同時,確保生成內容精度無損,單機性能達到H100的64%-79%,兼顧高性能輸出與高投入產(chǎn)出比(ROI)。


同時,S5000憑借原生FP64雙精度計算能力,通過與國家級實驗室的深度合作與調優(yōu),在關鍵科學計算領域實現(xiàn)性能提升。在SPONGE模擬引擎中,其性能達到H100的1.7倍;在分子對接工具DSDP的實測中,其計算效能展現(xiàn)出壓倒性優(yōu)勢,性能達到H100的8.1倍。


此外,作為一款全功能GPU,S5000集成了高性能的多媒體編解碼引擎,硬件原生支持H264、H265、VP9、AV1、AVS2、AVS+、VP8等格式。


結語:國產(chǎn)GPU已經(jīng)扛起大模型訓練的重任

根據(jù)摩爾線程官網(wǎng)披露信息,無論是構建萬卡級超大規(guī)模訓練集群,還是部署高并發(fā)、低延遲的在線推理服務,MTT S5000均展現(xiàn)出對標國際主流旗艦產(chǎn)品的卓越性能與穩(wěn)定性。

作為目前國內少數(shù)具備完整大模型訓練能力的AI計算卡之一,MTT S5000提供了一套可行的國產(chǎn)算力替代方案,從FP8精度支持、單卡1000EFLOPS算力等參數(shù)到經(jīng)過萬卡集群實訓、第三方機構驗證的實戰(zhàn)成績,都證明了國產(chǎn)GPU不僅能做好推理,而且已經(jīng)能支撐起大規(guī)模模型訓練的計算需求。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

混沌錄
2026-04-20 17:10:08
世體:巴薩將在國家德比穿奧利維亞聯(lián)名球衣,她也將現(xiàn)場觀戰(zhàn)

世體:巴薩將在國家德比穿奧利維亞聯(lián)名球衣,她也將現(xiàn)場觀戰(zhàn)

懂球帝
2026-04-21 16:45:04
續(xù)約!!他確定留隊勇士!

續(xù)約!!他確定留隊勇士!

柚子說球
2026-04-22 09:11:46
相親20多人,30多歲姑娘被一句爹味發(fā)言整破防:我親爹都不說這話

相親20多人,30多歲姑娘被一句爹味發(fā)言整破防:我親爹都不說這話

半島晨報
2026-04-22 11:09:27
聯(lián)合國秘書長發(fā)言人在記者會上用中文問好 并表示希望聯(lián)合國的多語種服務越來越好

聯(lián)合國秘書長發(fā)言人在記者會上用中文問好 并表示希望聯(lián)合國的多語種服務越來越好

每日經(jīng)濟新聞
2026-04-21 14:32:56
乾隆賜劉墉跳河自盡,劉墉接旨后卻回家洗了個澡,事后才知真高明

乾隆賜劉墉跳河自盡,劉墉接旨后卻回家洗了個澡,事后才知真高明

芳芳歷史燴
2026-04-21 19:06:57
44歲奧運冠軍杜麗韻味十足,從滿臉痘變女神,今是射擊協(xié)會副主席

44歲奧運冠軍杜麗韻味十足,從滿臉痘變女神,今是射擊協(xié)會副主席

以茶帶書
2026-04-21 17:17:30
距離起飛不到24小時,賴清德專機被“閉門謝客”,吳釗燮破防

距離起飛不到24小時,賴清德專機被“閉門謝客”,吳釗燮破防

子桑說
2026-04-22 10:50:22
女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
太扎心了!上海男子年薪百萬失業(yè)引不滿,新婚3個月女子就想離婚

太扎心了!上海男子年薪百萬失業(yè)引不滿,新婚3個月女子就想離婚

火山詩話
2026-04-20 06:12:18
騰訊推出“QQ音樂暢聽耳機”:提供會員曲庫10年暢聽,399元

騰訊推出“QQ音樂暢聽耳機”:提供會員曲庫10年暢聽,399元

IT之家
2026-04-20 16:02:11
美國頂尖科學家密集死亡,真相撲朔迷離

美國頂尖科學家密集死亡,真相撲朔迷離

史政先鋒
2026-04-20 22:00:23
文班亞馬腦震蕩傷退!進入腦震蕩程序平均缺7-10天

文班亞馬腦震蕩傷退!進入腦震蕩程序平均缺7-10天

體壇周報
2026-04-22 09:34:11
112名“中國留學生”,被調查

112名“中國留學生”,被調查

中國新聞周刊
2026-04-22 07:35:10
北京樓市:西直門臨水豪宅,跌幅26%

北京樓市:西直門臨水豪宅,跌幅26%

跟著拆哥看房
2026-04-21 20:11:31
勸退!“去客廳化”火了5年,為什么70%家庭最后都偷偷把沙發(fā)搬了回來?

勸退!“去客廳化”火了5年,為什么70%家庭最后都偷偷把沙發(fā)搬了回來?

繪本家居
2026-04-10 11:13:39
索尼PS5最新第一方獨占大作預載開始!高達83GB

索尼PS5最新第一方獨占大作預載開始!高達83GB

游民星空
2026-04-22 10:22:45
全程瞪眼原形畢露,演技被丁勇岱吊打,這位演員不紅是有原因的

全程瞪眼原形畢露,演技被丁勇岱吊打,這位演員不紅是有原因的

冷紫葉
2026-04-20 19:25:48
軍費90億卻砸120億?美印看懵,巴鐵清空中國武器,背后金主攤牌

軍費90億卻砸120億?美印看懵,巴鐵清空中國武器,背后金主攤牌

小蘭聊歷史
2026-04-18 15:27:37
原來他11年前就已離世!患病3年女兒不愿照看,死后為爭遺產(chǎn)現(xiàn)身

原來他11年前就已離世!患病3年女兒不愿照看,死后為爭遺產(chǎn)現(xiàn)身

以茶帶書
2026-03-25 19:34:47
2026-04-22 11:47:00
芯東西 incentive-icons
芯東西
專注AI芯片、半導體產(chǎn)業(yè)媒體
2290文章數(shù) 8153關注度
往期回顧 全部

數(shù)碼要聞

OPPO Find X9 Ultra體驗:這就是滿級Ultra該有的樣子

頭條要聞

柬埔寨國王在京手術 洪森攜子看望:感謝中方

頭條要聞

柬埔寨國王在京手術 洪森攜子看望:感謝中方

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長停火期限

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

汽車要聞

四款全球首秀+AI落地 大眾汽車集團在華轉型全面提速

態(tài)度原創(chuàng)

本地
健康
親子
家居
公開課

本地新聞

春色滿城關不?。座N梅浪漫盛放,吳山藏了一片四月雪

干細胞抗衰4大誤區(qū),90%的人都中招

親子要聞

影響心理健康的兩種快樂因素:一旦失衡,孩子將會厭學抑郁

家居要聞

極簡繪夢 克制和諧

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版