国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

告別“硬堆料”時(shí)代:摩爾線程全功能GPU的技術(shù)路線圖與生態(tài)突圍樣本

0
分享至


“全功能GPU的創(chuàng)新,就是一部算力進(jìn)化史?!?/strong>

在近日摩爾線程首屆MUSA開(kāi)發(fā)者大會(huì)(MDC 2025)的開(kāi)場(chǎng)演講中,摩爾線程創(chuàng)始人、董事長(zhǎng)兼CEO張建中用這樣一句話(huà)定義了過(guò)去幾十年的GPU技術(shù)變革。這句話(huà)的潛臺(tái)詞是清晰的:在國(guó)產(chǎn)GPU賽道上,單純比拼硬件參數(shù)的“硬堆料”時(shí)代正在過(guò)去,架構(gòu)的通用性與軟件生態(tài)的成熟度,正成為衡量技術(shù)護(hù)城河的新標(biāo)尺。

從地下的盾構(gòu)機(jī)大腦到指尖的眼科手術(shù)機(jī)器人,從氣象大模型的云端推演到挖掘機(jī)的邊緣計(jì)算,大會(huì)現(xiàn)場(chǎng)覆蓋AI大模型&Agent、具身智能、科學(xué)計(jì)算、空間智能等前沿技術(shù)領(lǐng)域,延伸至工業(yè)智造、數(shù)字孿生、數(shù)字文娛、智慧醫(yī)療等領(lǐng)域的幾十款創(chuàng)新應(yīng)用,外加20+場(chǎng)專(zhuān)題論壇,將“軟件生態(tài)”這個(gè)略顯抽象的概念,具象化為可觸摸的實(shí)體。


大會(huì)上,摩爾線程不僅展示了萬(wàn)卡集群的肌肉,更系統(tǒng)性地披露了其底層技術(shù)底座的演進(jìn)邏輯——從MUSA架構(gòu)的持續(xù)迭代到全新“花港”架構(gòu)的亮相。這不僅是一次產(chǎn)品的更新,更是一次對(duì)國(guó)產(chǎn)GPU技術(shù)路線的“實(shí)地驗(yàn)證”:摩爾線程正試圖通過(guò)架構(gòu)層面的軟硬協(xié)同,讓國(guó)產(chǎn)算力從“可用”變?yōu)椤昂糜玫纳a(chǎn)力”。


“花港”架構(gòu)與“華山”芯片:以指令集重塑算力密度

在摩爾線程的技術(shù)路線圖中,“花港”被定義為新一代全功能GPU架構(gòu)。與以往單純追求制程紅利不同,“花港”架構(gòu)的核心突破在于通過(guò)微架構(gòu)設(shè)計(jì)來(lái)“榨取”性能


據(jù)大會(huì)披露的數(shù)據(jù),基于新一代指令集架構(gòu),“花港”在同等工藝下實(shí)現(xiàn)了算力密度提升50%,能效提升10倍。這種設(shè)計(jì)并非空中樓閣,而是為了承載即將面世的AI訓(xùn)推一體芯片——“華山”。

計(jì)算精度方面,“華山”芯片展現(xiàn)了對(duì)大模型時(shí)代需求的精準(zhǔn)響應(yīng)。它不僅支持從FP4到FP64的全精度端到端計(jì)算,還新增了MTFP6和MTFP4及混合低精度計(jì)算技術(shù)。這直接回應(yīng)了當(dāng)前大模型量化推理的主流趨勢(shì)——通過(guò)降低精度損耗來(lái)?yè)Q取更高的吞吐量。


架構(gòu)層面的另一大革新在于互聯(lián)與調(diào)度。面對(duì)萬(wàn)卡乃至十萬(wàn)卡集群的擴(kuò)展需求,“華山”集成了自研的MTLink高速互聯(lián)技術(shù)和新一代異步編程模型。


對(duì)于這一復(fù)雜的底層技術(shù),張建中在演講中給出了一個(gè)極具開(kāi)發(fā)者視角的解釋?zhuān)?/p>

“我們希望利用異步編程模型,讓開(kāi)發(fā)者無(wú)感去操作芯片,讓芯片自動(dòng)為你服務(wù)?!?/strong>

這種“無(wú)感”的背后,是硬件級(jí)對(duì)任務(wù)與資源調(diào)度機(jī)制的重構(gòu),旨在減少流水線中的“氣泡”,提升并行執(zhí)行效率。

架構(gòu)的先進(jìn)性最終需要通過(guò)集群來(lái)驗(yàn)證?;凇叭A山”的前序技術(shù)積累,摩爾線程發(fā)布的夸娥(KUAE)萬(wàn)卡智算集群已經(jīng)交出了工程化的答卷:在Dense大模型上MFU(模型算力利用率)達(dá)到60%,訓(xùn)練線性擴(kuò)展效率達(dá)95%。特別是在DeepSeek V3模型的復(fù)現(xiàn)中,摩爾線程通過(guò)自研FP8 GEMM的精細(xì)化優(yōu)化,不僅突破了FP8累加精度的瓶頸,更實(shí)現(xiàn)了算力利用率高達(dá)90%的成績(jī)。這證明了其架構(gòu)在大規(guī)模工程實(shí)踐中的可靠性。


MUSA 5.0軟件棧:生態(tài)是核心護(hù)城河

如果說(shuō)架構(gòu)是骨架,軟件棧則是靈魂。長(zhǎng)期以來(lái),CUDA生態(tài)的壁壘是國(guó)產(chǎn)GPU難以逾越的高墻。

“生態(tài)體系是GPU行業(yè)的核心護(hù)城河與價(jià)值所在?!睆埥ㄖ性诖髸?huì)上強(qiáng)調(diào),摩爾線程致力于攻克從硬件到軟件的核心技術(shù)挑戰(zhàn),目的就是“共同構(gòu)建自立自強(qiáng)的國(guó)產(chǎn)計(jì)算產(chǎn)業(yè)生態(tài)”。

發(fā)布的MUSA 5.0軟件棧,采取了一條“兼容主流+原生創(chuàng)新”的雙軌策略。

兼容性方面,MUSA 5.0不僅原生支持MUSA C,還深度兼容TileLang、Triton等新興編程語(yǔ)言。這種廣泛的兼容性旨在降低開(kāi)發(fā)者的遷移成本。

性能優(yōu)化方面,為了解決兼容帶來(lái)的性能折損,MUSA 5.0在底層計(jì)算庫(kù)上進(jìn)行了極致優(yōu)化。數(shù)據(jù)顯示,其核心計(jì)算庫(kù)muDNN在HGEMM和FlashAttention等關(guān)鍵算子上的效率超過(guò)98%,通信效率達(dá)到97%。

軟件棧的成熟度,最終要看它能否跑通真實(shí)的業(yè)務(wù)邏輯。在MDC 2025的展區(qū),MUSA軟件棧支撐下的多元化圖景變得鮮活:

  • 在大模型推理端,摩爾線程與硅基流動(dòng)的合作就是一個(gè)典型樣本。通過(guò)深度適配MUSA軟件棧,雙方在DeepSeek R1 671B全量模型上實(shí)現(xiàn)了性能突破:S5000單卡Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s。這一數(shù)據(jù)不僅樹(shù)立了國(guó)產(chǎn)推理性能的新標(biāo)桿,也驗(yàn)證了MUSA軟件棧在處理復(fù)雜大模型時(shí)的從容。


  • 在硬核工業(yè)端,雪浪云展示的盾構(gòu)機(jī)大腦,利用全功能GPU的算力打通了盾構(gòu)機(jī)七大控制系統(tǒng);柳工的CLG922E挖掘機(jī)則通過(guò)板載的GPU模組實(shí)現(xiàn)了邊緣側(cè)的故障診斷與自動(dòng)駕駛模型運(yùn)行。

  • 在精準(zhǔn)醫(yī)療端,微眸醫(yī)療的眼科手術(shù)機(jī)器人,依托端側(cè)算力實(shí)現(xiàn)了毫秒級(jí)的RGBD圖像處理與微米級(jí)的手術(shù)操作。

  • 在科學(xué)計(jì)算端,摩爾線程聯(lián)合北京大學(xué)高毅勤課題組,基于國(guó)產(chǎn)SPONGE軟件,摩爾線程的全功能GPU正在加速分子動(dòng)力學(xué)模擬,推動(dòng)生命科學(xué)的底層突破。

這些橫跨千行百業(yè)的實(shí)體展示,證明了摩爾線程已經(jīng)把生態(tài)落實(shí)到一行行代碼和一臺(tái)臺(tái)設(shè)備。

此外,針對(duì)特定領(lǐng)域的痛點(diǎn),MUSA 5.0還推出了差異化的工具鏈,如聯(lián)合量子領(lǐng)域生態(tài)伙伴打造“QPU+GPU”智算融合平臺(tái),以及攜手51SIM利用“圖形+計(jì)算”能力加速自動(dòng)駕駛世界模型的生成。

而隨著AI計(jì)算的個(gè)人化,摩爾線程也在企業(yè)級(jí)市場(chǎng)之外完成了個(gè)人智算平臺(tái)的關(guān)鍵拼圖——MTT AIBOOK。與傳統(tǒng)筆記本電腦不同,MTT AIBOOK針對(duì)開(kāi)發(fā)者群體,在50TOPS異構(gòu)算力基礎(chǔ)上提供了開(kāi)源計(jì)算加速庫(kù)、通信庫(kù)等核心組件的底層支撐,預(yù)置了VS Code、PyTorch、vLLM等全套開(kāi)發(fā)環(huán)境,支持Linux/Windows/Android多環(huán)境切換,實(shí)現(xiàn)了AI學(xué)習(xí)與開(kāi)發(fā)的開(kāi)箱即用。配合摩爾學(xué)院20萬(wàn)開(kāi)發(fā)者學(xué)習(xí)資源,AIBOOK或許可成為個(gè)人開(kāi)發(fā)者接入國(guó)產(chǎn)AI生態(tài)的“入口級(jí)”載體。


談及未來(lái)規(guī)劃時(shí),張建中表示,摩爾線程將在明年上半年開(kāi)放中間語(yǔ)言MTX 1.0,并逐步開(kāi)源計(jì)算加速庫(kù)(MATE)、通信庫(kù)(MT DeepEP)及系統(tǒng)管理框架。前者類(lèi)似于CUDA的PTX,允許高階開(kāi)發(fā)者繞過(guò)上層封裝,直接對(duì)GPU硬件資源進(jìn)行細(xì)粒度的調(diào)度和優(yōu)化,后者則有助于構(gòu)建一個(gè)更具活力的開(kāi)發(fā)者社區(qū),驅(qū)動(dòng)生態(tài)體系從“可用”向“好用”進(jìn)化。


全功能GPU的“物理AI”拼圖

在AI計(jì)算之外,“花港”架構(gòu)并未放棄圖形能力,反而通過(guò)“廬山”芯片強(qiáng)化了“圖形+AI”的物理融合。

“廬山”芯片專(zhuān)注于高性能圖形渲染,AI性能提升64倍,光線追蹤性能提升50倍,并完整支持DirectX 12 Ultimate。這種設(shè)計(jì)思路試圖利用AI算力來(lái)加速圖形渲染流水線,從而實(shí)現(xiàn)從傳統(tǒng)的“計(jì)算渲染”向“生成式渲染”的范式轉(zhuǎn)變。這對(duì)于數(shù)字孿生、具身智能等“物理AI”場(chǎng)景至關(guān)重要。


正如張建中所預(yù)判的,未來(lái)的AI將從數(shù)字世界走向物理世界。無(wú)論是51SIM的自動(dòng)駕駛仿真,還是光輪智能的具身智能數(shù)據(jù)合成,都需要一顆既懂AI又懂圖形的“全功能GPU”。


結(jié)語(yǔ)

回顧摩爾線程過(guò)去五年的發(fā)展歷程,從累計(jì)投入43億元研發(fā)費(fèi)用,到獲批500多項(xiàng)授權(quán)專(zhuān)利,這家公司正在用實(shí)際行動(dòng)構(gòu)建一條完整的國(guó)產(chǎn)技術(shù)棧。展區(qū)那些正在運(yùn)行的實(shí)體設(shè)備則證明,這個(gè)技術(shù)棧已經(jīng)具備了解決實(shí)際問(wèn)題的能力。

然而摩爾線程并不滿(mǎn)足于此,大會(huì)發(fā)布的架構(gòu)路線圖,固然是一份面向未來(lái)的“預(yù)告”,但它更多是向全體開(kāi)發(fā)者發(fā)出的一份“協(xié)同邀請(qǐng)函”,一起為國(guó)產(chǎn)GPU“好用”添加柴火。

“中國(guó)科技的自立自強(qiáng)應(yīng)該會(huì)走得更快、走得更好,我們也希望摩爾線程持續(xù)為美好世界加速。”

張建中結(jié)束演講的話(huà)語(yǔ),既是對(duì)摩爾線程未來(lái)的期許,也是對(duì)中國(guó)計(jì)算產(chǎn)業(yè)的信心。MDC 2025展示的不僅僅是“花港”架構(gòu)或MUSA 5.0軟件棧的技術(shù)細(xì)節(jié),更是一種構(gòu)建自主計(jì)算生態(tài)的決心。在全功能GPU這條擁擠且艱難的賽道上,摩爾線程正試圖通過(guò)架構(gòu)的底層創(chuàng)新和軟件生態(tài)的開(kāi)放共建,為中國(guó)計(jì)算產(chǎn)業(yè)提供一個(gè)可行的、具備技術(shù)深度與演進(jìn)潛力的替代方案。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
哈爾濱一棟荒廢的別墅降價(jià)拍賣(mài),拍出1715萬(wàn)元高價(jià)

哈爾濱一棟荒廢的別墅降價(jià)拍賣(mài),拍出1715萬(wàn)元高價(jià)

天天話(huà)事
2026-01-04 15:38:08
用了20+年的Windows激活方式,被一夜作廢!Win11/Win10電話(huà)激活突然失效,微軟沒(méi)公告、沒(méi)通知

用了20+年的Windows激活方式,被一夜作廢!Win11/Win10電話(huà)激活突然失效,微軟沒(méi)公告、沒(méi)通知

CSDN
2026-01-04 18:51:29
真揪心了!一醫(yī)學(xué)生哭訴剛?cè)肼毘ノ咫U(xiǎn)一金,到手工資不足2000元

真揪心了!一醫(yī)學(xué)生哭訴剛?cè)肼毘ノ咫U(xiǎn)一金,到手工資不足2000元

火山詩(shī)話(huà)
2026-01-04 19:05:50
委內(nèi)瑞拉副總統(tǒng)任“代總統(tǒng)”,分析人士:她是政府內(nèi)部一位“極具分量”的人物

委內(nèi)瑞拉副總統(tǒng)任“代總統(tǒng)”,分析人士:她是政府內(nèi)部一位“極具分量”的人物

紅星新聞
2026-01-04 17:57:14
進(jìn)口車(chē)?yán)遄觾r(jià)格跳水,40元一斤劃算嗎?有商家預(yù)測(cè)過(guò)年前還要降

進(jìn)口車(chē)?yán)遄觾r(jià)格跳水,40元一斤劃算嗎?有商家預(yù)測(cè)過(guò)年前還要降

齊魯壹點(diǎn)
2026-01-04 07:36:37
12瓶砍半到6瓶,平價(jià)茅臺(tái)上線先斬黃牛

12瓶砍半到6瓶,平價(jià)茅臺(tái)上線先斬黃牛

觀察者網(wǎng)
2026-01-04 13:46:08
時(shí)也命也,馬杜羅距離安全僅差數(shù)秒,關(guān)上鋼門(mén)后,美軍將被全殲?

時(shí)也命也,馬杜羅距離安全僅差數(shù)秒,關(guān)上鋼門(mén)后,美軍將被全殲?

王鶔吃吃喝喝
2026-01-04 23:24:52
商場(chǎng)的B1、B2層,“B”是什么意思?一個(gè)字母測(cè)試你的英文水平!

商場(chǎng)的B1、B2層,“B”是什么意思?一個(gè)字母測(cè)試你的英文水平!

鎮(zhèn)江風(fēng)情
2026-01-04 14:45:14
54歲瓜帥仰天長(zhǎng)嘆:曼城4失良機(jī)放生藍(lán)軍!金球先生暴怒:本該4-0

54歲瓜帥仰天長(zhǎng)嘆:曼城4失良機(jī)放生藍(lán)軍!金球先生暴怒:本該4-0

我愛(ài)英超
2026-01-05 07:17:55
一路走好!2026年剛過(guò)3天,5位名人接連去世,最年輕的僅25歲

一路走好!2026年剛過(guò)3天,5位名人接連去世,最年輕的僅25歲

徐徐道史
2026-01-04 15:49:05
未來(lái)10年,大量丁克將陷入新型破產(chǎn):有房有存款,但和你沒(méi)關(guān)系了

未來(lái)10年,大量丁克將陷入新型破產(chǎn):有房有存款,但和你沒(méi)關(guān)系了

深度報(bào)
2026-01-02 22:42:31
放棄爭(zhēng)奪數(shù)百億遺產(chǎn),帶著女兒遠(yuǎn)遁美國(guó),如今才知道她有多清醒

放棄爭(zhēng)奪數(shù)百億遺產(chǎn),帶著女兒遠(yuǎn)遁美國(guó),如今才知道她有多清醒

夢(mèng)史
2025-12-16 11:07:49
你知道的有錢(qián)人的生活是啥樣?網(wǎng)友:有些人一出生就在羅馬

你知道的有錢(qián)人的生活是啥樣?網(wǎng)友:有些人一出生就在羅馬

帶你感受人間冷暖
2026-01-03 00:05:14
午評(píng):滬指漲超1%重回4000點(diǎn) 腦機(jī)接口概念集體爆發(fā)

午評(píng):滬指漲超1%重回4000點(diǎn) 腦機(jī)接口概念集體爆發(fā)

財(cái)聯(lián)社
2026-01-05 11:32:47
德邦物流獨(dú)享整車(chē)運(yùn)單中途變拼車(chē) 客戶(hù)設(shè)備受損價(jià)值50萬(wàn)生意被毀

德邦物流獨(dú)享整車(chē)運(yùn)單中途變拼車(chē) 客戶(hù)設(shè)備受損價(jià)值50萬(wàn)生意被毀

信網(wǎng)
2026-01-03 13:58:53
唐嫣在國(guó)外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

唐嫣在國(guó)外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

蓓小西
2026-01-05 09:12:05
中俄先進(jìn)武器為何失靈?委內(nèi)瑞拉事件揭開(kāi)現(xiàn)代戰(zhàn)爭(zhēng)核心邏輯

中俄先進(jìn)武器為何失靈?委內(nèi)瑞拉事件揭開(kāi)現(xiàn)代戰(zhàn)爭(zhēng)核心邏輯

創(chuàng)作者_(dá)b3jm
2026-01-03 22:47:03
長(zhǎng)沙同學(xué)聚會(huì)15秒親吻視頻:涉事男的妻子和女的丈夫,表示抗議

長(zhǎng)沙同學(xué)聚會(huì)15秒親吻視頻:涉事男的妻子和女的丈夫,表示抗議

江山揮筆
2026-01-04 16:28:59
鐵飯碗碎了!遼寧公立二甲醫(yī)院正式歇業(yè),行業(yè)凜冬

鐵飯碗碎了!遼寧公立二甲醫(yī)院正式歇業(yè),行業(yè)凜冬

王曉愛(ài)體彩
2026-01-05 07:29:03
平臺(tái)的“1分鐘”為何只有42秒?網(wǎng)友怒懟:不僅偷時(shí)間,還偷距離

平臺(tái)的“1分鐘”為何只有42秒?網(wǎng)友怒懟:不僅偷時(shí)間,還偷距離

數(shù)讀網(wǎng)約車(chē)
2026-01-04 12:25:26
2026-01-05 12:16:49
CSDN incentive-icons
CSDN
成就一億技術(shù)人
26230文章數(shù) 242208關(guān)注度
往期回顧 全部

科技要聞

雷軍新年首播:確認(rèn)汽車(chē)業(yè)務(wù)降速

頭條要聞

委內(nèi)瑞拉代總統(tǒng)致信:誠(chéng)邀美國(guó)政府共同制定合作議程

頭條要聞

委內(nèi)瑞拉代總統(tǒng)致信:誠(chéng)邀美國(guó)政府共同制定合作議程

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂(lè)要聞

黃宗澤奪雙料視帝,淚灑頒獎(jiǎng)臺(tái)憶往昔

財(cái)經(jīng)要聞

李迅雷:擴(kuò)內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車(chē)要聞

不是9S是8X!極氪全新高性能旗艦SUV命名官宣

態(tài)度原創(chuàng)

時(shí)尚
手機(jī)
房產(chǎn)
家居
公開(kāi)課

今年冬天最流行的4雙鞋,配闊腿褲時(shí)髦又高級(jí)!

手機(jī)要聞

盧偉冰:我有信心,REDMI Turbo 5 Max將是今年2.5K價(jià)位最佳選擇

房產(chǎn)要聞

再次登頂海南樓市!超越阿那亞的,只有阿那亞!

家居要聞

白色大理石 奢華現(xiàn)代

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版