国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

全網首測!首款國產GPU「AI算力本」現場上手

0
分享至


新智元報道

編輯:艾倫 好困

【新智元導讀】除了英特爾和AMD,現在我們終于可以選擇國產筆記本電腦顯卡了!這款顯卡的背后,飽含著中國工程師們日夜攻堅的汗水與淚水。

等等,是不是起猛了?

我們好像真的見證了歷史:市面上第一臺真正基于國產GPU的AI筆記本,誕生了!


它叫MTT AIBOOK。

除了搭載首款國產全功能顯卡,它最大的必殺技在于——這是一臺徹頭徹尾為AI而生的便攜式AI PC。

搞過AI開發(fā)的都知道,環(huán)境配置是「勸退第一關」。

MTT AIBOOK主打一個開箱即用:Python、VS Code、Jupyter、PyTorch全家桶全部預裝到位。

這種「保姆級」服務,徹底終結了「環(huán)境沒配好,頭發(fā)先掉光」的玄學。

不管是技術小白還是專業(yè)大牛,都能將精力全花在創(chuàng)意與算法上,而不是浪費在解決command not found這種瑣事上。


更硬核的是,它還打破了系統(tǒng)壁壘——Linux、Windows、安卓三大生態(tài)全部奉上:

  • 原生Linux:基于Linux底層的MT AIOS,為AI開發(fā)提供最純粹、高效的環(huán)境。


  • GPU虛擬化(Windows桌面):利用GPU虛擬化技術,無需重啟即可流暢運行Windows系統(tǒng)。碼代碼、寫PPT,順便打開Steam開一局,無縫切換。



  • 安卓容器:通過安卓容器,甚至連移動端生態(tài)也一并「吞」下。掛個手游、刷個短視頻,電腦上全搞定。


AI+游戲+辦公,這一臺就夠了!

它的背后,正是摩爾線程全棧自研的MUSA統(tǒng)一系統(tǒng)架構。

MUSA:全棧自研的統(tǒng)一系統(tǒng)架構

算力之爭,軟硬同等重要。

英偉達之所以難以撼動,核心在于其深耕二十年的CUDA生態(tài)。

對此,摩爾線程給出的答案就是——MUSA

全名Meta-computing Unified System Architecture,元計算統(tǒng)一系統(tǒng)架構。


這絕非對CUDA的簡單模仿,而是從指令集、編程模型到運行庫的全棧自研。

MUSA不僅僅是芯片,而是一個從底層硬件到上層生態(tài)的完整系統(tǒng),主要包含三個層級:

  • 最底層:摩爾線程全功能GPU(Universal GPU),內置四大引擎,能夠處理各種行業(yè)、不同精度和類型的數據。

  • 中間層:夸娥智算集群?;谌δ蹽PU搭建的硬件系統(tǒng),支持從單機到萬卡、甚至十萬卡超大規(guī)模集群。

  • 最上層:MUSA全套軟件棧。包含加速庫、調試工具、應用案例以及AI訓練和推理的整體系統(tǒng)框架。


MUSA軟件

開放、兼容與極致性能

MUSA 5.0軟件棧在本次大會上全面升級,它涵蓋了AI計算、圖形渲染、物理仿真、超高清視頻編解碼等全場景的開發(fā)工具。


在AI框架層面,MUSA深度適配了PyTorch、PaddlePaddle,并新增了對Jax、TensorFlow以及TileLang的支持。


MUSA 5.0在性能層面實現了極致優(yōu)化。

在計算方面,芯片設計的集成效率極大提升,HGEMM(半精度通用矩陣乘法)算子效率達到98%;

在通訊方面,效率發(fā)揮至97%。這些提升讓開發(fā)者能更充分地利用MUSA GPU的算力。


MUSIFY:打破CUDA壁壘的「翻譯官」

對后來者而言,橫亙在面前的不僅是算力高墻,更是英偉達構筑二十載的軟件護城河。

全球數百萬開發(fā)者早已習慣了CUDA的語言體系,海量的存量代碼不僅是技術資產,更是牢不可破的生態(tài)閉環(huán)。

為了在這塊鐵板上撕開缺口,摩爾線程祭出了關鍵的戰(zhàn)略棋子——MUSIFY。

在業(yè)界,它被形象地稱為「跨界翻譯官」。

其核心邏輯簡單而直接:通過自動化移植工具,將原本綁定在國際主流平臺上的C++源代碼,轉化為MUSA架構的C++源代碼,讓開發(fā)者以最小成本將國際主流GPU平臺應用移植至MUSA GPU,最終運行在全功能GPU上。

這是一場效率與成本的賽跑。

MUSIFY的出現,試圖讓開發(fā)者以近乎「零成本」的代價實現應用遷移。

它不僅將開發(fā)者從枯燥的底層代碼重寫中解放出來,更在國產GPU生態(tài)的荒原上,迅速平整出一條通往商業(yè)落地的快車道。

MUSIFY能實現代碼「一鍵搬家」,根源在于MUSA架構在設計之初就選擇了與CUDA底層邏輯兼容。

它不僅是個翻譯工具,更是MUSA架構兼容能力的具體體現。

這種「原生適配」讓開發(fā)者幾乎不用重寫代碼,就能順滑地換上國產GPU,把遷移門檻降到了最低。

靠著這種極低的切換成本,摩爾線程精準接住了英偉達溢出的生態(tài)紅利,成了打破封鎖、搶占市場的利刃。

面向未來的探索:融合與量子

為了滿足更廣泛和前沿的開發(fā)需求,MUSA 5.0推出了面向AI和渲染融合的全功能編程語言——muLang。

它讓開發(fā)者通過一套指令集即可完成3D圖形和AI計算場景的編程。

此外,面向未來的量子計算領域,摩爾線程推出了MUSA-Q框架,讓經典計算框架與量子框架結合,更好賦能量子計算應用。

同時,為了滿足高端開發(fā)者對精細化控制的需求,摩爾線程還將在明年開放MTX,允許開發(fā)者利用匯編語言精準操控GPU資源。

力推開源

MUSA的理念是統(tǒng)一性、開放性與完整性。

中國工程院院士鄭緯民在演講中指出:「真正決定主權AI成敗的,在于是否有足夠多的開發(fā)者愿意長期在這套棧上寫代碼。」

摩爾線程顯然深諳此道。

大會上,摩爾線程宣布了一項龐大的開源計劃:逐步開源計算加速庫(MATE、MUTLASS)、通信庫(MT DeepEP)以及系統(tǒng)管理框架。

這意味著,摩爾線程正在將底層的核心能力開放給社區(qū),邀請全球開發(fā)者共同打磨MUSA生態(tài)。

MUSA硬件

第五代「花港」架構

如果說芯片是算力的心臟,那么架構就是芯片的靈魂。

英偉達之所以強大,在于其Hopper、Blackwell等架構的持續(xù)演進。

摩爾線程深知,要想在牌桌上擁有話語權,必須擁有自主可控且具備持續(xù)迭代能力的底層架構。

摩爾線程保持著一年一代架構的迭代速度:


摩爾線程架構演進歷程

如今,摩爾線程正式揭曉了其第五代全功能GPU架構——「花港」。

這是一次從指令集到計算單元的深度重構。

根據官方披露的數據,基于新一代指令集架構及MUSA處理器架構,「花港」在算力密度上實現了50%的提升,而計算能效更是實現了驚人的10倍躍升。


在半導體工藝制程逼近物理極限的當下,單純依賴工藝紅利已難以為繼,架構的優(yōu)化成為了提升性能的關鍵。

摩爾線程的技術團隊通過對計算單元的精細化設計,在單位面積內塞進了更多的算力,這直接回應了數據中心對于高密度算力的渴求。

· 精度革命:從FP64到FP4的全棧支持

在AI大模型時代,計算精度的選擇至關重要。

英偉達在Blackwell架構中引入了FP4精度,而摩爾線程的「花港」架構同樣敏銳地捕捉到了這一趨勢。

「花港」實現了從FP4到FP64的全精度端到端計算支持。

特別是在低精度計算方面,新增了MTFP6、MTFP4以及混合低精度加速技術。

這已深入到了微架構層面。

在「華山」芯片的研發(fā)中,摩爾線程針對Attention算子中的SIMT(單指令多線程)部分進行了革新性升級,原生支持矩陣Rowmax計算,大幅提升了混合精度下的吞吐量。

更值得一提的是TCE-PAIR技術,在Tensor Core(張量核心)的設計中,創(chuàng)造性地讓兩個TCE(張量計算引擎)共享數據,減少了數據的重復調用,極大地提升了內部引擎的效率。

· 異步編程:榨干每一滴算力

在高性能計算中,最大的浪費往往來自于「等待」。

「花港」架構引入了新一代異步編程模型。

通過全面優(yōu)化任務與資源調度機制,新的模型支持高效線程同步、線程束特化以及常駐核函數。

簡單來說,這就像是一個經驗豐富的交通指揮官,能夠實時感知每一個計算單元的狀態(tài),將任務無縫地填入每一個空閑的間隙。

圖形與AI的終極融合

與那些只做GPGPU(通用計算GPU)的廠商不同,摩爾線程始終堅持「全功能」路線。

在張建中看來,未來的數字世界是物理與虛擬的深度融合。

因此,「花港」架構在圖形渲染方面也進行了大刀闊斧的革新。

它集成了一種全新的AI生成式渲染架構(AGR),這是摩爾線程首創(chuàng)的技術,利用AI技術來加速圖形渲染流水線。

同時,新二代的硬件光線追蹤加速引擎被引入,使其能夠完美支持DirectX 12 Ultimate標準。

這意味著,基于「花港」架構的GPU,不僅能跑大模型,還能流暢運行《黑神話:悟空》這樣的3A大作。

· 華山:為「AI工廠」而生

AI旗艦GPU「華山」芯片,性能已介乎英偉達Hopper架構GPU(以H200為代表)和Blackwell架構GPU(以B200為代表)之間!


「華山」芯片專注于AI訓推一體及高性能計算。

如果說「花港」是藍圖,那么「華山」就是摩爾線程為建設「AI工廠」打造的基石。

它的核心使命是解決大模型訓練中的算力與通信瓶頸。

在算力層面,「華山」集成了新一代Tensor Core,支持FP4至FP64的全精度計算,特別是在低精度訓練推理場景下,利用MTFP8和MTFP4的優(yōu)勢,加速Transformer模型中的Attention計算。

在通信層面,「華山」集成了ACE 2.0(異步通信引擎)。

這是一個摩爾線程的獨創(chuàng)技術,旨在讓通信與計算完全并行處理。

在ACE 2.0中,每一個計算單元內部都設計了一個小型的ACE,使得通信的顆粒度更細,效率更高。

此外,配合新一代Scale-up系統(tǒng),單個超節(jié)點可以支持高達1024個GPU的直接互聯,這為構建萬卡甚至十萬卡集群提供了強大的物理基礎。

· 廬山:重塑國產圖形巔峰

「廬山」芯片則主攻高性能圖形渲染。


它的出現,是對「國產GPU性能羸弱」這一刻板印象的有力回擊。

根據官方數據,「廬山」的圖形性能實現了全面跨越:AI計算性能較前代S80提升64倍,幾何處理性能提升16倍,光線追蹤性能提升50倍,運行3A游戲的性能提升了15倍。

而S80的3A游戲性能已不容小覷:


「廬山」不僅是一張顯卡,更是一個生產力工具。

它集成了AI生成式渲染、UniTE統(tǒng)一渲染架構及全新硬件光追引擎。

在工業(yè)軟件國產化的大潮中,CAD、CAE等專業(yè)軟件對GPU的幾何處理能力和穩(wěn)定性有著極高要求。

「廬山」的出現,填補了國產高性能專業(yè)顯卡的空白,為建筑設計、影視后期、工業(yè)仿真等領域提供了自主可控的選擇。

翻越「萬卡」群山:夸娥計算集群

單卡性能的提升固然重要,但在大模型時代,真正的決勝點在于集群。

如何讓成千上萬張顯卡像一個大腦一樣協同工作,是擺在所有GPU廠商面前的一道天塹。

摩爾線程給出的答案是——「夸娥」(KUAE)萬卡智算集群。


「夸娥」取自中國神話「愚公移山」中背負太行、王屋二山的大力神,寓意著摩爾線程要背負起中國算力的重任。

這是一個全棧式的智算解決方案,單集群可部署超過1000個計算節(jié)點,每節(jié)點集成8顆自研OAM模組化GPU。

發(fā)布會上披露的數據顯示,「夸娥」集群在工程化能力上已經達到了國際主流水平:

  • 浮點運算能力:達到10 Exa-Flops。

  • 訓練效率:在Dense大模型上,訓練算力利用率(MFU)達到60%;在MoE(混合專家)模型上達到40%。

  • 擴展性:訓練線性擴展效率達95%。


這些數字的背后,是摩爾線程對網絡拓撲、存儲系統(tǒng)、散熱供電以及調度軟件的極致優(yōu)化。

在萬卡規(guī)模下,任何一個微小的延遲或故障都會被無限放大。

摩爾線程通過3D全互聯拓撲,實現了亞微秒級的通信延遲,確保了數據在數萬個計算核心之間的高速流轉。

· 零中斷容錯:給訓練裝上「保險絲」

在大模型訓練中,最令人崩潰的莫過于訓練中斷。

為了解決這一痛點,摩爾線程推出了「夸娥萬卡訓練容錯系統(tǒng)」。

這套系統(tǒng)的目標是將ETTR(有效訓練時間比率)提升至99%。

它支持訓練異常的在線診斷,能夠實時捕捉無響應、慢節(jié)點等問題。

更具創(chuàng)新性的是其「零中斷」能力:當發(fā)生故障時,系統(tǒng)通過DP(數據并行)組級故障隔離機制,僅隔離受影響節(jié)點所在的組,其余組別繼續(xù)訓練。備機接入后,僅需重建對應鏈路,全程無需整體訓練中斷。

這就像是在高速行駛的列車上更換輪胎,保證了列車始終全速前進。

千行百業(yè)的「摩爾」時刻:行業(yè)應用全景圖

算力的價值在于應用。

在MDC 2025的展區(qū)里,我們看到了全功能GPU在各個行業(yè)的真實落地。這不再是PPT上的愿景,而是正在發(fā)生的產業(yè)變革。


摩爾線程全功能GPU行業(yè)應用案例全景

· DeepSeek實戰(zhàn):國產算力的試金石

任何技術指標都不如實戰(zhàn)數據來得有說服力。

摩爾線程聯合硅基流動,在當前最火熱的開源大模型DeepSeek上進行了驗證。

在訓練側,摩爾線程完整復現了DeepSeek V3的FP8訓練流程。自研的FP8 GEMM算力利用率高達90%,并突破了FP8累加精度不足的業(yè)界難題。

在推理側,基于摩爾線程MTT S5000智算卡,運行DeepSeek R1 671B全量模型,實現了單卡Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s。


這一成績樹立了國產GPU推理性能的新標桿,證明了國產芯片完全有能力承載最前沿、最復雜的AI模型。

· 具身智能:從云端到指尖

在具身智能領域,摩爾線程展示了「云-邊-端」的全棧布局。

在端側,發(fā)布的「長江」智能SoC芯片集成了CPU、GPU、NPU等多種核心,提供50 TOPS的異構算力。


搭載「長江」芯片的MTT E300模組,被植入到機器狗、物流無人機中,使其具備了邊緣側的智能感知與決策能力。

摩爾線程還推出了MT Lambda具身智能仿真訓練平臺,整合了物理引擎(AlphaCore)、渲染引擎和AI引擎。


這使得機器人可以在虛擬世界中進行大規(guī)模的強化學習訓練,極大地縮短了Sim-to-Real(從仿真到現實)的差距。

為美好世界加速

從「蘇堤」的楊柳依依,到「花港」的魚翔淺底,摩爾線程用一個個充滿中國式浪漫的名字,書寫了一段硬核的科技突圍史。

這注定是一條孤獨而艱難的道路。

在英偉達萬億市值的陰影下,摩爾線程像是一個無畏的攀登者,在懸崖峭壁間開辟出一條屬于中國自己的路。

他們面對的,不僅僅是技術上的難題,更是生態(tài)的荒漠、市場的質疑以及地緣政治的寒風。

但他們堅持下來了。

因為他們深知,在智能時代,算力就是國力,芯片就是疆土。

MDC 2025不僅展示了技術,更展示了一種決心,一種不甘受制于人、敢于在核心領域亮劍的決心。

摩爾線程的萬卡集群,就像是在比特的洪流中筑起的一座大壩,它不僅蓄積了中國AI產業(yè)發(fā)展的勢能,更將源源不斷地輸出智能的電力,點亮千行百業(yè)的未來。

在這場關乎國運的科技長征中,沒有捷徑可走。

摩爾線程的每一步,都是在為中國科技的自立自強夯實地基。

正如張建中在演講最后所說的那樣,他們的愿景是「為美好世界加速」。

正在加速的,不僅是計算的速度,更是中國邁向科技強國的步伐。

參考資料:

MDC 2025|摩爾線程CEO主題演講全解析,發(fā)布多項關鍵技術進展

秒追ASI

?點贊、轉發(fā)、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
陳潔如臨終前的一封信,讓蔣介石淚流滿面,蔣介石坦言未曾忘記她

陳潔如臨終前的一封信,讓蔣介石淚流滿面,蔣介石坦言未曾忘記她

歷史甄有趣
2026-01-08 08:55:08
2026監(jiān)管利刃出鞘!外賣平臺“燒錢搶存量市場”迎來終局?

2026監(jiān)管利刃出鞘!外賣平臺“燒錢搶存量市場”迎來終局?

野馬財經
2026-01-10 22:29:05
塞梅尼奧6250萬英鎊轉會曼城,買下整版報紙致謝伯恩茅斯球迷

塞梅尼奧6250萬英鎊轉會曼城,買下整版報紙致謝伯恩茅斯球迷

星耀國際足壇
2026-01-10 23:33:32
亞朵大戰(zhàn)全季,傳統(tǒng)五星級酒店輸麻了

亞朵大戰(zhàn)全季,傳統(tǒng)五星級酒店輸麻了

IC實驗室
2025-11-13 15:50:52
分手8年,自曝私密事的Coco,沒給謝賢留體面,原來謝霆鋒沒說謊

分手8年,自曝私密事的Coco,沒給謝賢留體面,原來謝霆鋒沒說謊

娛說瑜悅
2026-01-06 17:28:42
景德鎮(zhèn)兇手家屬大鬧法庭,受害家屬:賠80億也不要,只要他死!

景德鎮(zhèn)兇手家屬大鬧法庭,受害家屬:賠80億也不要,只要他死!

未曾青梅
2026-01-10 21:43:18
回村建房7個月,前后被鄰居投訴4次,第四次讓我斷了農村養(yǎng)老的夢

回村建房7個月,前后被鄰居投訴4次,第四次讓我斷了農村養(yǎng)老的夢

人間百態(tài)大全
2026-01-11 06:45:03
2026春晚彩排曝光。揚言不上春晚的岳云鵬,印證曹云金沒說錯

2026春晚彩排曝光。揚言不上春晚的岳云鵬,印證曹云金沒說錯

粵語經典歌單
2026-01-11 16:37:39
戲劇反轉!哈里王子再遇挫折,查爾斯國王拒絕給予安保資格

戲劇反轉!哈里王子再遇挫折,查爾斯國王拒絕給予安保資格

落雪聽梅a
2026-01-11 16:25:33
痛心!致敬!遼寧13人因公犧牲

痛心!致敬!遼寧13人因公犧牲

本賬號停運
2026-01-10 21:46:50
醫(yī)生發(fā)現:堅持用鹽水漱口的人,咽喉可能正在發(fā)生這5個積極變化

醫(yī)生發(fā)現:堅持用鹽水漱口的人,咽喉可能正在發(fā)生這5個積極變化

健康科普365
2026-01-04 09:41:09
2026年吉星庇佑!夫妻有一人屬這三個生肖,聚財聚福感情甜

2026年吉星庇佑!夫妻有一人屬這三個生肖,聚財聚福感情甜

人閒情事
2026-01-11 15:17:47
張水華對辭職仍難釋懷,那些抱怨過她的同事,工作真變輕松了嗎?

張水華對辭職仍難釋懷,那些抱怨過她的同事,工作真變輕松了嗎?

削桐作琴
2026-01-10 12:54:38
他是道德上的小人,卻是政治上的巨人

他是道德上的小人,卻是政治上的巨人

小豫講故事
2026-01-10 06:00:08
越南武元甲口述:黎筍固執(zhí)己見,中越錯失攜手良機,無奈兵戎相見

越南武元甲口述:黎筍固執(zhí)己見,中越錯失攜手良機,無奈兵戎相見

磊子講史
2025-12-29 18:05:22
他是學歷最高的央視主持,被倪萍區(qū)別對待,如今事業(yè)穩(wěn)定婚姻幸福

他是學歷最高的央視主持,被倪萍區(qū)別對待,如今事業(yè)穩(wěn)定婚姻幸福

青史樓蘭
2026-01-11 09:25:55
從美國槍擊案看川粉們的魔癥

從美國槍擊案看川粉們的魔癥

近距離
2026-01-11 14:30:42
淚目!超萬名切爾西球迷6天3次高唱阿布名字:53億鎊已被凍結3年

淚目!超萬名切爾西球迷6天3次高唱阿布名字:53億鎊已被凍結3年

風過鄉(xiāng)
2026-01-11 09:30:21
日本華人威脅:如果中國不撤銷制裁,日企將全部撤出中國!

日本華人威脅:如果中國不撤銷制裁,日企將全部撤出中國!

達文西看世界
2026-01-10 10:12:20
故事:吉林高空拋物案周奇被注射死刑,臨刑前,向母親道出真相

故事:吉林高空拋物案周奇被注射死刑,臨刑前,向母親道出真相

飛云如水
2025-02-16 22:43:21
2026-01-11 17:20:49
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
14311文章數 66452關注度
往期回顧 全部

數碼要聞

ECS精英推出Liva Z系列迷你主機,多CPU可選

頭條要聞

西安小伙騎小黃車抵達三亞:29天騎行3500公里瘦20斤

頭條要聞

西安小伙騎小黃車抵達三亞:29天騎行3500公里瘦20斤

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

網友偶遇賈玲張小斐崇禮滑雪

財經要聞

外賣平臺"燒錢搶存量市場"迎來終局?

科技要聞

“我們與美國的差距也許還在拉大”

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

本地
手機
健康
旅游
公開課

本地新聞

云游內蒙|“包”你再來?一座在硬核里釀出詩意的城

手機要聞

恭喜!恭喜!華為登頂,成為2025品牌聲量之王,實至名歸

這些新療法,讓化療不再那么痛苦

旅游要聞

昆侖有什么好,讓神仙都搶著落戶大西北?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版