国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

微軟甩出3nm自研AI芯片!算力超10PFLOPS,干翻AWS谷歌

0
分享至


芯東西(公眾號(hào):aichip001)
作者 ZeR0
編輯 漠影

芯東西1月27日?qǐng)?bào)道,今日,微軟宣布推出自研AI推理芯片Maia 200,并稱該芯片是“目前所有超大規(guī)模數(shù)據(jù)中心中性能最高的自研芯片”,旨在顯著提升AI token生成的經(jīng)濟(jì)效益。

Maia 200采用臺(tái)積電3nm工藝制造,擁有超過1400億顆晶體管,配備原生FP8/FP4張量核心,重新設(shè)計(jì)的內(nèi)存子系統(tǒng)包含216GB HBM3e(讀寫速度高達(dá)7TB/s)和272MB片上SRAM,以及能確保海量模型快速高效運(yùn)行的數(shù)據(jù)傳輸引擎。

Maia 200專為使用低精度計(jì)算的最新模型而設(shè)計(jì),每塊芯片在FP4精度下可提供超過10PFLOPS的性能,在FP8精度下可提供超過5PFLOPS的性能,所有這些都控制在750W的SoC TDP范圍內(nèi)。

其FP4性能是亞馬遜自研AI芯片AWS Trainium3的3倍多,F(xiàn)P8性能超過了谷歌TPU v7。


▲Azure Maia 200、AWS Trainium3、谷歌TPU v7的峰值規(guī)格對(duì)比

Maia 200重新設(shè)計(jì)的內(nèi)存子系統(tǒng)以窄精度數(shù)據(jù)類型、專用DMA引擎、片上SRAM和用于高帶寬數(shù)據(jù)傳輸?shù)膶S闷暇W(wǎng)絡(luò)(NoC)架構(gòu)為核心,從而提高token吞吐量。

互連方面,Maia 200提供2.8TB/s雙向?qū)S脭U(kuò)展帶寬,高于AWS Trainium3的2.56TB/s和谷歌TPU v7的1.2TB/s。

Maia 200也是微軟迄今為止部署的最高效推理系統(tǒng),每美元性能比微軟目前部署的最新一代硬件提升了30%

一、能運(yùn)行當(dāng)前最大模型,將支持GPT-5.2

根據(jù)微軟博客文章,Maia 200可輕松運(yùn)行當(dāng)今最大的模型,并為未來更大的模型預(yù)留了充足的性能空間。

作為微軟異構(gòu)AI基礎(chǔ)設(shè)施的一部分,Maia 200將支持多種模型,包括OpenAI最新的GPT-5.2模型,從而為Microsoft Foundry和Microsoft 365 Copilot帶來更高的性價(jià)比。


▲Maia 200芯片

Maia 200與微軟Azure無縫集成。微軟正在預(yù)覽Maia軟件開發(fā)工具包(SDK),其中包含一套完整的工具,用于構(gòu)建和優(yōu)化Maia 200模型。

它包含全套功能,包括PyTorch集成、Triton編譯器和優(yōu)化的內(nèi)核庫,以及對(duì)Maia底層編程語言的訪問。這使開發(fā)者能夠在需要時(shí)進(jìn)行細(xì)粒度控制,同時(shí)實(shí)現(xiàn)跨異構(gòu)硬件加速器的輕松模型移植。

微軟超級(jí)智能團(tuán)隊(duì)將利用Maia 200進(jìn)行合成數(shù)據(jù)生成強(qiáng)化學(xué)習(xí),以改進(jìn)下一代內(nèi)部模型。

在合成數(shù)據(jù)管道用例方面,Maia 200的獨(dú)特設(shè)計(jì)有助于加快高質(zhì)量、特定領(lǐng)域數(shù)據(jù)的生成和篩選速度,為下游訓(xùn)練提供更新、更具針對(duì)性的信號(hào)。

Maia 200已部署在微軟位于愛荷華州得梅因附近的美國中部數(shù)據(jù)中心區(qū)域,接下來將部署位于亞利桑那州鳳凰城附近的美國西部3數(shù)據(jù)中心區(qū)域,未來還將部署更多區(qū)域。

二、支持2.8TB/s雙向帶寬、6144塊芯片互連

在系統(tǒng)層面,Maia 200引入了一種基于標(biāo)準(zhǔn)以太網(wǎng)的新型雙層可擴(kuò)展網(wǎng)絡(luò)設(shè)計(jì)。定制的傳輸層和緊密集成的網(wǎng)卡無需依賴專有架構(gòu),即可實(shí)現(xiàn)卓越的性能、強(qiáng)大的可靠性和顯著的成本優(yōu)勢。

每塊芯片提供2.8TB/s雙向?qū)S脭U(kuò)展帶寬,以及在多達(dá)6144塊芯片的集群上公開可預(yù)測的高性能集體操作。


▲Maia 200刀片服務(wù)器的俯視圖

每個(gè)托架內(nèi),4塊Maia芯片通過直接的非交換鏈路完全連接,實(shí)現(xiàn)高帶寬的本地通信,以獲得最佳推理效率。

機(jī)架內(nèi)和機(jī)架間聯(lián)網(wǎng)均采用相同的通信協(xié)議,即Maia AI傳輸協(xié)議,能夠以最小的網(wǎng)絡(luò)跳數(shù)實(shí)現(xiàn)跨節(jié)點(diǎn)、機(jī)架和加速器集群的無縫擴(kuò)展。

這種統(tǒng)一的架構(gòu)簡化了編程,提高了工作負(fù)載的靈活性,并減少了閑置容量,同時(shí)在云規(guī)模下保持了一致的性能和成本效益。

該架構(gòu)可為密集推理集群提供可擴(kuò)展的性能,同時(shí)降低Azure全球集群的功耗和總擁有成本。

三、將芯片部署時(shí)間縮短一半,提升每美元和每瓦性能

Maia 200芯片首批封裝件到貨后數(shù)日內(nèi),AI模型就能在其上運(yùn)行,從首批芯片到首個(gè)數(shù)據(jù)中心機(jī)架部署的時(shí)間可縮短至同類AI基礎(chǔ)設(shè)施項(xiàng)目的一半以上。

這種從芯片到軟件再到數(shù)據(jù)中心的端到端解決方案,直接轉(zhuǎn)化為更高的資源利用率、更快的生產(chǎn)交付速度,以及在云規(guī)模下持續(xù)提升的每美元和每瓦性能。


▲Maia 200機(jī)架和HXU冷卻單元的視圖

這歸因于,微軟芯片開發(fā)計(jì)劃的核心原則是在最終芯片上市之前,盡可能多地驗(yàn)證端到端系統(tǒng)。

從架構(gòu)的早期階段開始,一套精密的芯片前開發(fā)環(huán)境就指導(dǎo)著Maia 200的開發(fā),它能夠高保真地模擬大語言模型的計(jì)算和通信模式。

這種早期協(xié)同開發(fā)環(huán)境使微軟能夠在首塊芯片問世之前,將芯片、網(wǎng)絡(luò)和系統(tǒng)軟件作為一個(gè)整體進(jìn)行優(yōu)化。

微軟從設(shè)計(jì)之初就將Maia 200定位為數(shù)據(jù)中心內(nèi)快速、無縫的可用性解決方案,并對(duì)包括后端網(wǎng)絡(luò)和第二代閉環(huán)液冷熱交換器單元在內(nèi)的一些最復(fù)雜的系統(tǒng)組件進(jìn)行了早期驗(yàn)證。

與Azure控制平面的原生集成,可在芯片和機(jī)架級(jí)別提供安全、遙測、診斷和管理功能,從而最大限度地提高生產(chǎn)關(guān)鍵型AI工作負(fù)載的可靠性和正常運(yùn)行時(shí)間。

結(jié)語:在全球基礎(chǔ)設(shè)施部署,為未來幾代AI系統(tǒng)托舉

大規(guī)模AI時(shí)代才剛剛開始,基礎(chǔ)設(shè)施將決定其發(fā)展的可能性。

隨著微軟在全球基礎(chǔ)設(shè)施中部署Maia 200,微軟已在為未來幾代AI系統(tǒng)進(jìn)行設(shè)計(jì),并期望每一代系統(tǒng)都能不斷樹立新的標(biāo)桿,為重要的AI工作負(fù)載帶來更出色的性能和效率。

微軟誠邀開發(fā)者、AI創(chuàng)企和學(xué)術(shù)界人士使用全新Maia 200 SDK開始探索早期模型和工作負(fù)載優(yōu)化。

該SDK包含Triton編譯器、PyTorch支持、NPL底層編程以及Maia模擬器和成本計(jì)算器,可在代碼生命周期的早期階段優(yōu)化效率。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
3月3日人民幣對(duì)美元中間價(jià)調(diào)升148個(gè)基點(diǎn)

3月3日人民幣對(duì)美元中間價(jià)調(diào)升148個(gè)基點(diǎn)

證券時(shí)報(bào)
2026-03-03 09:31:33
苦走10年投資路,李斌熱淚盈眶:今天,我們終于贏了!

苦走10年投資路,李斌熱淚盈眶:今天,我們終于贏了!

少數(shù)派報(bào)告Report
2026-01-12 17:41:03
突發(fā)!韓國股市暴跌觸發(fā)熔斷機(jī)制

突發(fā)!韓國股市暴跌觸發(fā)熔斷機(jī)制

都市快報(bào)橙柿互動(dòng)
2026-03-03 11:42:05
再見開拓者!22.7分5.6籃板新星被裁!楊瀚森呀楊瀚森!說你啥呢

再見開拓者!22.7分5.6籃板新星被裁!楊瀚森呀楊瀚森!說你啥呢

現(xiàn)代小青青慕慕
2026-03-03 10:57:39
確診怪。∮率恐袖h倒下!2換1交易成了笑話

確診怪病!勇士中鋒倒下!2換1交易成了笑話

籃球教學(xué)論壇
2026-03-03 12:03:21
伊朗已徹底認(rèn)慫

伊朗已徹底認(rèn)慫

仰望星空的一粒沙子
2026-03-02 09:55:15
網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評(píng)論區(qū)炸鍋,輿論撕裂

網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評(píng)論區(qū)炸鍋,輿論撕裂

眼光很亮
2026-03-01 16:12:51
菲律賓和廣東同為1億多人口,菲律賓創(chuàng)造3.3萬億,廣東是多少?

菲律賓和廣東同為1億多人口,菲律賓創(chuàng)造3.3萬億,廣東是多少?

傲傲講歷史
2025-09-27 16:59:25
奇葩!贛州一女子進(jìn)店蹭網(wǎng)20分鐘后找老板強(qiáng)借100元,遭拒后砸店

奇葩!贛州一女子進(jìn)店蹭網(wǎng)20分鐘后找老板強(qiáng)借100元,遭拒后砸店

火山詩話
2026-03-03 09:45:17
特朗普承認(rèn)與伊朗沖突中傷亡人數(shù)或“大幅增加”,民主黨猛烈抨擊

特朗普承認(rèn)與伊朗沖突中傷亡人數(shù)或“大幅增加”,民主黨猛烈抨擊

阿芒娛樂說
2026-03-03 11:24:03
伊朗反擊太快,只給以2小時(shí),導(dǎo)彈從天而降,以色列民眾抱頭鼠竄

伊朗反擊太快,只給以2小時(shí),導(dǎo)彈從天而降,以色列民眾抱頭鼠竄

書紀(jì)文譚
2026-03-02 17:24:46
伊朗導(dǎo)彈“連過三彈”擊中美軍基地;特約評(píng)論員:“法塔赫”高超音速導(dǎo)彈,落向目標(biāo)的飛行速度比捕捉目標(biāo)雷達(dá)系統(tǒng)的跟蹤速度快

伊朗導(dǎo)彈“連過三彈”擊中美軍基地;特約評(píng)論員:“法塔赫”高超音速導(dǎo)彈,落向目標(biāo)的飛行速度比捕捉目標(biāo)雷達(dá)系統(tǒng)的跟蹤速度快

瀟湘晨報(bào)
2026-03-03 09:48:13
迪馬利亞:不會(huì)回歸阿根廷隊(duì),現(xiàn)在有非常優(yōu)秀的球員涌現(xiàn)出來

迪馬利亞:不會(huì)回歸阿根廷隊(duì),現(xiàn)在有非常優(yōu)秀的球員涌現(xiàn)出來

懂球帝
2026-03-03 10:04:06
27座基地被炸,美民眾要求特朗普下臺(tái),苑舉正:中國贏得20年時(shí)間

27座基地被炸,美民眾要求特朗普下臺(tái),苑舉正:中國贏得20年時(shí)間

古史青云啊
2026-03-02 16:56:40
92歲臺(tái)灣老兵回重慶尋親,下飛機(jī)后卻怒斥子女:這不還是臺(tái)北

92歲臺(tái)灣老兵回重慶尋親,下飛機(jī)后卻怒斥子女:這不還是臺(tái)北

海佑講史
2026-02-28 21:19:37
哈梅內(nèi)伊的繼任者們沒有顯示任何投降跡象,甚至可能更激進(jìn)

哈梅內(nèi)伊的繼任者們沒有顯示任何投降跡象,甚至可能更激進(jìn)

Nee看
2026-03-02 18:16:41
2292 萬臺(tái) 賣爆!中國超高端市場 iPhone 17 一騎絕塵!

2292 萬臺(tái) 賣爆!中國超高端市場 iPhone 17 一騎絕塵!

EETOP半導(dǎo)體社區(qū)
2026-03-02 12:16:51
被炸死的內(nèi)賈德突然現(xiàn)身,特朗普放出了魔鬼

被炸死的內(nèi)賈德突然現(xiàn)身,特朗普放出了魔鬼

生活魔術(shù)專家
2026-03-03 01:37:43
暴走團(tuán)老人路上訓(xùn)練,交警勸不聽,貨車司機(jī)“不想走那就別走了”

暴走團(tuán)老人路上訓(xùn)練,交警勸不聽,貨車司機(jī)“不想走那就別走了”

源遠(yuǎn)講堂
2025-07-31 18:13:50
特朗普稱將很快宣布報(bào)復(fù)措施

特朗普稱將很快宣布報(bào)復(fù)措施

財(cái)聯(lián)社
2026-03-03 09:19:23
2026-03-03 12:39:00
芯東西 incentive-icons
芯東西
專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
2217文章數(shù) 8151關(guān)注度
往期回顧 全部

科技要聞

手機(jī)AI在MWC上卷出了新高度

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個(gè)非常奇怪的地方

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個(gè)非常奇怪的地方

體育要聞

35輪后積分-7,他們?cè)庥鍪飞献钤绲慕导?jí)

娛樂要聞

謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

財(cái)經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

態(tài)度原創(chuàng)

手機(jī)
游戲
房產(chǎn)
教育
本地

手機(jī)要聞

一加15T新機(jī)正面形象公開,采用1.xx mm物理極窄四等邊設(shè)計(jì)

《三角洲》主播毀號(hào)事件后續(xù)!當(dāng)事人征集聯(lián)名控告

房產(chǎn)要聞

方案突然曝光!?诒睅煷蟾叫,又有書包大盤殺出!

教育要聞

娃娃秧歌扭起來 非遺傳承潤童心

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

無障礙瀏覽 進(jìn)入關(guān)懷版