国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

摩爾線程的野心,不藏了

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

上市后的僅15天,摩爾線程

在這次首屆、也是國內(nèi)首個聚焦全功能GPU的開發(fā)者大會中,圍繞著MUSA這個關(guān)鍵詞,新品可謂是目接不暇:

  • 一個全新GPU架構(gòu):花港,密度提升50%,效能提升10倍。
  • 三款新芯片:華山、廬山、長江,分別聚焦AI訓推一體、圖形渲染和智能SoC。
  • 一個智算集群:夸娥萬卡集群(KUAE2.0),定位國產(chǎn)自主研發(fā)的AI Foundry。
  • 兩款硬件產(chǎn)品:專為開發(fā)者打造的AIBOOK和AICube。

這并非零散的產(chǎn)品更新,而是摩爾線程用一套從云到端、從算力到生態(tài)的組合拳。



在長達2個多小時的發(fā)布中,最直觀的感受就是,摩爾線程,已經(jīng)把國產(chǎn)GPU推向了下一個level。

接下來,我們就從最最最核心的全新GPU架構(gòu)花港為起點,對此次開發(fā)者大會一探究竟。

MUSA,已經(jīng)成了全功能GPU架構(gòu)的代名詞

什么是MUSA?

它的全名叫做Meta-computing Unified System Architecture,是摩爾線程自主研發(fā)的元計算統(tǒng)一計算架構(gòu)。

該怎么理解?可以說,從芯片架構(gòu)、指令集、編程模型,到軟件運行庫及驅(qū)動程序框架,都屬于MUSA的范疇。



歷經(jīng)五年的發(fā)展,MUSA已經(jīng)完整定義了全功能GPU從芯片設(shè)計到軟件生態(tài)的統(tǒng)一技術(shù)標準,并且支持AI計算、圖形渲染、物理仿真和科學計算、超高清視頻編解碼等全場景高性能計算。

若是縱觀MUSA硬件架構(gòu)這幾年的迭代,從蘇堤、春曉、曲院,再到平湖,每一次的升級都是在探索著GPU算力的邊界。



最新發(fā)布的第五代全功能GPU架構(gòu)花港,亦是如此:

  • 算力密度提升50%:在同等芯片面積下,可部署更多計算單元;
  • 計算能效提升10倍:單位瓦特性能大幅優(yōu)化,為大規(guī)模智算集群提供綠色底座;
  • 新增FP4計算:從FP4、FP6、FP8到FP16、BF16乃至FP64,實現(xiàn)全精度端到端計算,覆蓋AI、HPC、圖形等全場景需求;
  • 支持十萬卡集群:通過MTLink高速互聯(lián),為超大規(guī)模模型訓練鋪平道路。

尤為值得關(guān)注的是,花港在低精度計算上的深度優(yōu)化。架構(gòu)新增了MTFP6/MTFP4及混合低精度端到端加速技術(shù),專為未來AI主流場景——低比特訓練與推理而生。

在Attention機制的關(guān)鍵路徑上,花港原生支持矩陣rowmax計算,大幅提升混合精度SIMT吞吐量,并內(nèi)置在線量化/反量化、隨機舍入等硬件加速能力,為下一代Transformer引擎(如MT Transformer Engine)提供底層支撐。



如果說硬件架構(gòu)是能力的基石,那么軟件棧,就是將這些能力交到開發(fā)者手中的具體路徑。

除了架構(gòu)本身之外,摩爾線程這次還同步推出了MUSA軟件棧5.0,構(gòu)建從編譯器、算子庫到AI框架的全棧工具鏈:

  • AI框架廣泛適配:除PyTorch、PaddlePaddle外,新增對JAX、TensorFlow的支持;
  • 訓練生態(tài)擴展:在Megatron、DeepSpeed基礎(chǔ)上,新增強化學習訓練框架MT VeRL;
  • 推理引擎豐富:深度優(yōu)化自研MTT推理引擎與TensorX,同時適配SGLang、vLLM、Ollama等新興推理框架;
  • 核心庫極致優(yōu)化:muDNN實現(xiàn)GEMM/FlashAttention效率超98%,通信效率達97%,編譯器性能提升3倍;
  • 編程語言創(chuàng)新:推出面向AI+渲染融合的muLang,兼容TileLang、Triton,原生支持MUSA C,并發(fā)布GPU中間表示語言MTX 1.0,提升開發(fā)者調(diào)優(yōu)自由度。

更關(guān)鍵的是,摩爾線程宣布將逐步開源MATE算子庫、MUTLASS、MT DeepEP通信庫、KUAE云原生工具包等核心組件,向開發(fā)者社區(qū)開放底層能力,加速生態(tài)構(gòu)建。

不難看出,MUSA并未將自身定位為單純的AI加速器,而是以“全功能 GPU”為錨點,將 AI 能力深度嵌入圖形渲染、物理仿真、量子計算等高價值垂直場景。

這種從通用底座向產(chǎn)業(yè)縱深延伸的架構(gòu)哲學,使其區(qū)別于純粹的大模型訓練卡,而更接近英偉達 CUDA 生態(tài)早期“以通用可編程性撬動多元應用”的戰(zhàn)略路徑。

可以說,MUSA 不僅是中國首個全功能GPU架構(gòu),更是對“下一代 AI 基礎(chǔ)設(shè)施應長什么樣”的一次系統(tǒng)性回答——

它不再只是算力的提供者,而是多模態(tài)智能、具身智能乃至物理AI時代的關(guān)鍵使能平臺。在這一意義上,摩爾線程的架構(gòu)創(chuàng)新,已不僅是技術(shù)突破,更是對未來 AI 產(chǎn)業(yè)格局的一次主動定義。

而圍繞著新升級的MUSA,摩爾線程這次還祭出了更多重磅產(chǎn)品。

三個新芯片,兩個新硬件,一個萬卡集群

首先基于花港架構(gòu),摩爾線程發(fā)布了兩款芯片路線。

第一個便是聚焦在AI訓推一體及高性能計算的GPU——華山



它的核心亮點可以總結(jié)為:

  • 全精度支持:從 FP4 到 FP64,覆蓋低精度訓練與高精度科學計算;
  • MTFP4/MTFP6 混合低精度加速:Attention 計算從 BF16 向 FP8 甚至 FP6 演進,大幅提升 Transformer 吞吐;
  • 硬件級優(yōu)化:原生支持矩陣 rowmax 計算、在線量化/反量化、隨機舍入等算法,專為大模型訓練定制;
  • 新一代異步編程模型:支持常駐核函數(shù)、線程束特化,極大提升并行效率。

并且從浮點算力、訪存寬帶、訪存容量和高速互聯(lián)寬帶等維度來看,華山正在追趕英偉達的系列產(chǎn)品。



華山的推出,標志著摩爾線程正式具備支撐萬億參數(shù)大模型訓練的能力,為國產(chǎn)AI基礎(chǔ)設(shè)施補上關(guān)鍵一環(huán)。

如果說華山主攻A 算力,那么接下來的GPU——廬山,則專為圖形計算而生。



相比上一代產(chǎn)品,其AI計算性能提升了驚人的64倍,3A游戲渲染性能提升15倍。

廬山引入了AI生成式渲染架構(gòu)(AGR)和硬件光追引擎,支持DirectX 12 Ultimate。這意味著,國產(chǎn)顯卡正式邁入“光追+AI渲染”的新范式,不僅僅是“算”畫面,更是“生成”畫面。

除此之外,在端側(cè),摩爾線程還首次推出了智能SoC芯片——長江



據(jù)了解,長江芯片不局限于傳統(tǒng)PC或服務(wù)器,而是面向具身智能、車載、AI計算終端等端側(cè)場景,提供50 TOPS的異構(gòu)AI算力。

有了芯片,自然要有承載的載體。

基于長江芯片,摩爾線程這次還發(fā)布了兩個非常亮眼的硬件產(chǎn)品。

首先就是MTT AIBOOK

這個算力本是專門為AI學習與開發(fā)者打造的個人智算平臺,運行基于Linux內(nèi)核的MT AIOS操作系統(tǒng),具備多系統(tǒng)兼容能力,并預置完整AI開發(fā)環(huán)境與工具鏈,通過虛擬化和安卓容器,可無縫運行Windows與安卓應用。

如此一來,你就可以直接在上面跑大模型、搞Agent開發(fā)。



MTT AIBOOK內(nèi)置的智能體小麥,還支持2K高清渲染、本地大模型(如 MUSAChat-72B)、端側(cè) ASR/TTS,這就讓它從工具變成了超級個體助手。



并且MTT AIBOOK還預裝了智源悟界Emu3.5多模態(tài)模型,開箱即可文本生圖、編輯圖像。

除此之外,針對端側(cè)場景,摩爾線程還推出了桌面上的AI小鋼炮——AICube

它更像是一個高性能的AI計算魔方,讓開發(fā)者在桌面上就能輕松獲取算力支持,處理復雜的推理任務(wù)。



最后,也是最重磅的——夸娥(KUAE 2.0)萬卡智算集群;畢竟在大模型領(lǐng)域,萬卡集群是公認的入場券。

摩爾線程此次宣布,其萬卡集群在Dense大模型上的算力利用率(MFU)達60%,在MOE大模型上達40%,有效訓練時間占比超過90%。

最硬核的消息是:摩爾線程已完整復現(xiàn)了DeepSeek V3的FP8訓練。 依靠S5000對低精度算子的優(yōu)化,其自研FP8 GEMM算力利用率高達90%。



在這次大會上,摩爾線程還前瞻性地披露了下一代高密硬件基石——MTT C256超節(jié)點。

這款產(chǎn)品采用了計算與交換一體化的高密設(shè)計。它的出現(xiàn),是為了系統(tǒng)性地提升萬卡集群在超大規(guī)模智算中心里的能效比和訓練效能。



這個量級的表現(xiàn),意味著它已經(jīng)具備了正面硬剛國際主流Hopper架構(gòu)AI GPU的底氣,是未來超大規(guī)模大模型訓練和實時推理的國產(chǎn)標準答案

并且就在最近,摩爾線程還和硅基流動(SiliconFlow)聯(lián)合宣布:

基于硅基流動高性能推理引擎,雙方已在摩爾線程MTT S5000 GPU上成功完成對DeepSeek V3 671B滿血版大模型的深度適配與性能驗證。

在FP8低精度推理技術(shù)加持下,MTT S5000單卡實測Prefill吞吐突破4000 tokens/s,Decode吞吐超1000 tokens/s,創(chuàng)下當前國產(chǎn)GPU在大模型推理場景下的新高。

這一成果不僅刷新了國產(chǎn)GPU的推理性能基準,更傳遞出一個關(guān)鍵信號:

在成熟軟件工程體系(如MUSA架構(gòu)與硅基流動推理引擎)的協(xié)同優(yōu)化下,國產(chǎn)算力硬件正從“能跑”邁向“跑得快、跑得穩(wěn)、跑得值”。

換句話說:單位算力的有效利用率,正在成為國產(chǎn)AI芯片真正落地的關(guān)鍵指標——而摩爾線程,這次交出了一份高分答卷。

生態(tài),生態(tài),還得看生態(tài)

在全球算力競爭日益白熱化的今天,單一芯片的性能優(yōu)勢已不足以構(gòu)建護城河。

真正的壁壘,在于軟件生態(tài)、硬件協(xié)同、場景落地與開發(fā)者信任的綜合能力。

摩爾線程深諳此道,它的選擇也非常清晰:不走局部替代路線,而是以“MUSA架構(gòu)+國產(chǎn)GPU+全場景產(chǎn)品”三位一體,打造一個從底層指令集到上層應用的完整生態(tài)閉環(huán)。

這不僅包括人才生態(tài),更涵蓋繁榮的軟件開發(fā)生態(tài)——從自研編譯器、高性能算子庫,到對主流AI框架的廣泛適配,摩爾線程提供了釋放算力所需的全套軟件工具鏈;同時,通過AIBOOK等面向開發(fā)者的硬件入口產(chǎn)品,讓開發(fā)者能夠隨時隨地接入并高效使用MUSA算力,真正實現(xiàn)軟硬協(xié)同、端云一體的全場景覆蓋。

但除此之外,開發(fā)者和開發(fā)生態(tài),亦是其中非常關(guān)鍵的一環(huán)。

這便是摩爾線程打造摩爾學院(MUSA開發(fā)者的成長平臺)的原因了。



截止2025年12月,摩爾學院已經(jīng)匯聚了20萬名開發(fā)者。摩爾線程的目標更宏大:培育百萬規(guī)模的MUSA開發(fā)者社群。

為此,他們不僅提供了從入門到大師的專業(yè)課程,還把根扎到了人才源頭——走進全國200所高校。通過產(chǎn)教融合、聯(lián)合實驗室以及“繁星計劃”等競賽,摩爾線程正在從象牙塔開始,培養(yǎng)屬于自己的、懂國產(chǎn)架構(gòu)的原生代開發(fā)者。

這也印證了中國工程院院士、清華大學計算機系教授鄭偉民的觀點:“國產(chǎn)GPU的關(guān)鍵,在于要從能跑到愿意用?!?/strong>

整體來看,當別人還在爭論“國產(chǎn) GPU 能不能用”時,摩爾線程已經(jīng)通過從軟件棧工具、硬件入口到人才培育的全鏈路布局,讓開發(fā)者問出另一個問題:“我的下一個項目,能不能全在 MUSA 生態(tài)里完成?”

這,或許才是真正的突破。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
谷歌黑魔法,沒人能看懂的Gemini 3 Flash

谷歌黑魔法,沒人能看懂的Gemini 3 Flash

新智元
2025-12-23 13:14:03
諾蘭新作《奧德賽》首發(fā)中文預告,全程以IMAX攝影機拍攝

諾蘭新作《奧德賽》首發(fā)中文預告,全程以IMAX攝影機拍攝

南方都市報
2025-12-23 13:28:21
徐向前晚年對西路軍失敗的原因作出總結(jié),提煉出三個關(guān)鍵因素,感嘆:若當初換一種作戰(zhàn)策略與打法,最終結(jié)局必然會大不一樣

徐向前晚年對西路軍失敗的原因作出總結(jié),提煉出三個關(guān)鍵因素,感嘆:若當初換一種作戰(zhàn)策略與打法,最終結(jié)局必然會大不一樣

寄史言志
2025-12-23 14:12:19
原來郭京飛年輕時這么帥!《老舅》他又火了,20歲顏值帥上熱搜

原來郭京飛年輕時這么帥!《老舅》他又火了,20歲顏值帥上熱搜

娛君墜星河
2025-12-22 13:28:01
全紅嬋重返國家隊,身高接近170,笑容滿面留起長發(fā),瘦了不少

全紅嬋重返國家隊,身高接近170,笑容滿面留起長發(fā),瘦了不少

青梅侃史啊
2025-12-23 08:59:57
歐洲郵輪上失聯(lián)中國女子的媽媽發(fā)聲,32歲生日當天上船未告知家人

歐洲郵輪上失聯(lián)中國女子的媽媽發(fā)聲,32歲生日當天上船未告知家人

九方魚論
2025-12-23 07:11:58
美軍公海強扣中國油船,警告非經(jīng)美同意不得買油,外交部直接回應

美軍公海強扣中國油船,警告非經(jīng)美同意不得買油,外交部直接回應

十三級臺階
2025-12-23 09:28:43
中方不見高市,代表已提前離席,日本請求派人來華,中國已讀不回

中方不見高市,代表已提前離席,日本請求派人來華,中國已讀不回

娛樂圈的筆娛君
2025-12-23 15:34:51
南博事件再升級!1997年藏品調(diào)撥單申請人凌波,2008年已位居要職

南博事件再升級!1997年藏品調(diào)撥單申請人凌波,2008年已位居要職

戶外阿嶄
2025-12-23 05:58:22
追夢回應情緒失控!科爾明言勇士仍需要他,但替補有很多人都能打

追夢回應情緒失控!科爾明言勇士仍需要他,但替補有很多人都能打

顏小白的籃球夢
2025-12-23 15:22:38
武漢市中小學期末考試、放寒假時間確定!

武漢市中小學期末考試、放寒假時間確定!

越喬
2025-12-23 12:27:00
日本真牛,悄無聲息幫了中國一個大忙,解決了中國多年的難題

日本真牛,悄無聲息幫了中國一個大忙,解決了中國多年的難題

扶蘇聊歷史
2025-12-23 16:04:44
僅3個多月,德媒對樊振東的稱呼又變了,6字之差背后:風向再變

僅3個多月,德媒對樊振東的稱呼又變了,6字之差背后:風向再變

生活新鮮市
2025-12-23 15:21:04
雞飛蛋打!中國男籃首位歸化球員失敗,李凱爾變?yōu)槊绹笠β淠?>
    </a>
        <h3>
      <a href=曹說體育
2025-12-23 16:08:00
法庭對峙6小時,美國女法官還是栽了,年薪百萬的工作說沒就沒

法庭對峙6小時,美國女法官還是栽了,年薪百萬的工作說沒就沒

溫讀史
2025-12-21 18:49:36
小洛熙父母哭謝法醫(yī)劉良:你讓黑暗散去,我的天空星星都亮了!

小洛熙父母哭謝法醫(yī)劉良:你讓黑暗散去,我的天空星星都亮了!

苗苗情感說
2025-12-22 12:28:30
福建女商人林惠榮今日再審宣判無罪,此前被認定職務(wù)侵占判刑七年

福建女商人林惠榮今日再審宣判無罪,此前被認定職務(wù)侵占判刑七年

澎湃新聞
2025-12-23 11:10:35
落后3分傳籃下?高詩巖現(xiàn)身評論區(qū):不傳5秒了,還要怎么樣?

落后3分傳籃下?高詩巖現(xiàn)身評論區(qū):不傳5秒了,還要怎么樣?

懂球帝
2025-12-23 00:05:36
寧毀10億,不給印度摸一下,王牌戰(zhàn)機變釘子戶,英國腸子都悔青了

寧毀10億,不給印度摸一下,王牌戰(zhàn)機變釘子戶,英國腸子都悔青了

瞻史
2025-12-23 07:21:07
賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

古書記史
2025-12-12 11:21:38
2025-12-23 16:59:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11903文章數(shù) 176341關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強黑產(chǎn)攻擊

頭條要聞

媒體:對一度沒國際賽可踢的國足 "亞國聯(lián)"是雪中送炭

頭條要聞

媒體:對一度沒國際賽可踢的國足 "亞國聯(lián)"是雪中送炭

體育要聞

楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

娛樂要聞

阿信發(fā)聲報平安,曬演唱會向F3索吻畫面

財經(jīng)要聞

祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

汽車要聞

四款新車集中發(fā)布 星途正式走進3.0時代

態(tài)度原創(chuàng)

時尚
游戲
數(shù)碼
房產(chǎn)
公開課

推廣|| 用完立馬復購!百元get大牌膚感

《神界》系列老牌配音演員盛贊新作預告 暗示期待回歸

數(shù)碼要聞

LG將在CES 2026亮相全球首款RGB條紋像素4K 240Hz OLED面板

房產(chǎn)要聞

獨家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版