国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

MoE大模型迎來(lái)“原生戰(zhàn)友”:昇騰超節(jié)點(diǎn)重構(gòu)AI基礎(chǔ)設(shè)施

0
分享至

對(duì)AI比較關(guān)注的話,大概率會(huì)聽到下面兩個(gè)“時(shí)髦”的概念:

一個(gè)是Scaling Law,通常被翻譯為“規(guī)模定律”,得出了一個(gè)通俗易懂的結(jié)論——“模型越大,性能越好?!?/p>

另一個(gè)是MoE架構(gòu),中文名稱是混合專家模型,相對(duì)應(yīng)的概念是稠密(Dense)模型。如果說(shuō)稠密模型一個(gè)“通才”,由一個(gè)“專家”處理多種不同的任務(wù),MoE則是將任務(wù)分門別類,分給多個(gè)“專家”進(jìn)行解決。

Scaling Law和MoE的出鏡率越來(lái)越高,意味著大模型的參數(shù)量將越來(lái)越大,同時(shí)開始提升“能力密度”。直接相關(guān)的就是大模型的訓(xùn)練和推理,正在從粗放燒錢到精細(xì)調(diào)優(yōu),從堆算力轉(zhuǎn)向算力利用率最大化。

站在大模型工程化創(chuàng)新的十字路口,恰逢鯤鵬昇騰開發(fā)者大會(huì)2025前夕,“昇騰超節(jié)點(diǎn)”迅速成為技術(shù)圈的熱門話題。

由此產(chǎn)生的一個(gè)問(wèn)題是:MoE架構(gòu)大模型的訓(xùn)練都遇到了哪些挑戰(zhàn),昇騰給出了什么新解法?

01 MoE架構(gòu)成主流,大模型訓(xùn)練遇到“三座大山”

Mixtral、DeepSeek R1、Llama 4、Qwen3……近一年現(xiàn)象級(jí)刷屏的大模型,清一色地采用了MoE架構(gòu)。

原因離不開MoE的架構(gòu)創(chuàng)新。

每個(gè)專家負(fù)責(zé)任務(wù)的一部分,極大地提升了模型的可擴(kuò)展性;每個(gè)專家都能針對(duì)整個(gè)問(wèn)題的特定方面進(jìn)行微調(diào),進(jìn)一步提升了模型的專業(yè)化和準(zhǔn)確性;每次請(qǐng)求只激活部分專家,顯著減少了每次推理的計(jì)算負(fù)荷……

當(dāng)MoE架構(gòu)演變?yōu)榇竽P偷闹髁鞣妒剑煞?wù)器、存儲(chǔ)、網(wǎng)絡(luò)等設(shè)備堆疊而成的傳統(tǒng)集群,在大模型訓(xùn)練上遇到了“三座大山”。

一是資源利用率低。

MoE架構(gòu)對(duì)負(fù)載均衡非常敏感,路由機(jī)制如果分布不均,某些專家會(huì)頻繁被調(diào)用,而其他專家?guī)缀蹰e置。

傳統(tǒng)AI集群部署MoE模型時(shí),每臺(tái)服務(wù)器只部署部分專家,缺乏全局調(diào)度能力。由于路由機(jī)制無(wú)法感知底層資源狀態(tài),可能導(dǎo)致部分服務(wù)器的使用率大于90%,部分服務(wù)器幾乎不參與計(jì)算。結(jié)果就是,GPU的利用率遠(yuǎn)低于理論峰值,直接拉長(zhǎng)了模型的訓(xùn)練周期,提升了能耗與成本。

二是系統(tǒng)穩(wěn)定性差。

MoE架構(gòu)依賴動(dòng)態(tài)路由+專家選擇,對(duì)系統(tǒng)的持續(xù)穩(wěn)定性要求遠(yuǎn)高于傳統(tǒng)Dense模型,讓工程的復(fù)雜度陡升。

在傳統(tǒng)AI集群上訓(xùn)練MoE模型,任何一個(gè)節(jié)點(diǎn)的故障,都可能導(dǎo)致整個(gè)訓(xùn)練任務(wù)失敗。比如某MoE大模型的訓(xùn)練過(guò)程,由于集群規(guī)模超過(guò)1000張加速卡,平均無(wú)故障運(yùn)行時(shí)間不足6小時(shí),每24小時(shí)需重新調(diào)度兩次以上,單次訓(xùn)練需要數(shù)天乃至數(shù)周,運(yùn)維人員長(zhǎng)期處于高強(qiáng)度監(jiān)控狀態(tài)。

三是通信帶寬瓶頸。

MoE架構(gòu)的“小專家”,理論上可以節(jié)省計(jì)算資源,前提是能靈活高效地選擇和調(diào)度,對(duì)通信帶寬提出了極高要求。

在傳統(tǒng)AI集群中,GPU之間通過(guò)PCle或InfiniBand通信,激活路由涉及大量跨卡、跨節(jié)點(diǎn)訪問(wèn),導(dǎo)致在All-to-All通信模式下,MoE架構(gòu)的通信壓力遠(yuǎn)大于Dense架構(gòu),訓(xùn)練速度甚至比Dense更慢。當(dāng)GPU資源被通信“拖死”,哪怕是業(yè)界主流的高帶寬GPU,訓(xùn)練效率也難以線性提升。

以上還只是大模型訓(xùn)練時(shí)的常見(jiàn)痛點(diǎn)。

倘若推理階段依然部署在傳統(tǒng)AI集群上,在不支持高頻動(dòng)態(tài)路由和異構(gòu)推理請(qǐng)求的環(huán)境下,用戶請(qǐng)求要觸發(fā)不同專家組合,再加上請(qǐng)求跳轉(zhuǎn)至跨節(jié)點(diǎn)專家時(shí)時(shí)延大,有些請(qǐng)求的延遲高達(dá)200ms以上。

訓(xùn)練系統(tǒng)的可用性,決定著智能化的速度。無(wú)法解決資源利用率低、系統(tǒng)穩(wěn)定性差、通信帶寬瓶頸的傳統(tǒng)AI集群,已經(jīng)不符合大模型的創(chuàng)新趨勢(shì)。

02 更親和MoE架構(gòu),“昇騰超節(jié)點(diǎn)”有何不同?

傳統(tǒng)AI集群的本質(zhì)是做加法,即通過(guò)硬件堆疊的方式提升算力,在大模型早期確實(shí)奏效,短板也很明顯。

被技術(shù)圈追捧的昇騰超節(jié)點(diǎn),可以看作是算力集群走向“乘法”式增長(zhǎng)的標(biāo)志,不僅僅是計(jì)算,進(jìn)一步結(jié)合了存儲(chǔ)、通信等能力,計(jì)算性能倍增的同時(shí),實(shí)現(xiàn)了時(shí)延、吞吐、負(fù)載均衡等能力的整體躍遷。

用一句話總結(jié)的話,昇騰超節(jié)點(diǎn)實(shí)現(xiàn)了讓384張卡像一臺(tái)計(jì)算機(jī)一樣工作,更親和MoE架構(gòu)。

根源是昇騰的四個(gè)針對(duì)性創(chuàng)新。

第一個(gè)是自研高速互聯(lián)協(xié)議,能夠?qū)⒊砂偕锨€(gè)NPU以TB級(jí)帶寬超高速互聯(lián),大幅提升了并行計(jì)算的通信效率。

相較于傳統(tǒng)集群,實(shí)現(xiàn)超低延遲、高帶寬通信的昇騰超節(jié)點(diǎn),大模型訓(xùn)練的All-to-All通信性能可提升5倍,send/recv集合通信性能可提升7倍,進(jìn)而大幅降低了整體通信占比,讓計(jì)算少等待、不等待。打破了通信上存在的瓶頸,整體訓(xùn)練效率提升了3倍、推理吞吐提升了6倍。

第二個(gè)是軟硬件協(xié)同調(diào)度,通過(guò)異構(gòu)計(jì)算平臺(tái)CANN的協(xié)同,支持專家調(diào)度感知訓(xùn)練負(fù)載與NPU負(fù)載實(shí)時(shí)狀態(tài)。

針對(duì)MoE模型訓(xùn)練中專家熱點(diǎn)分布造成部分計(jì)算節(jié)點(diǎn)過(guò)載的問(wèn)題,昇騰“超節(jié)點(diǎn)架構(gòu)”能夠依據(jù)MoE結(jié)構(gòu)中專家分布以及每層的計(jì)算需求,精細(xì)地將個(gè)模型切分至不同節(jié)點(diǎn),更合理分配資源,提高整體資源利用率,同時(shí)可運(yùn)行多種并行策略并動(dòng)態(tài)調(diào)整,針對(duì)實(shí)時(shí)的負(fù)載情況精準(zhǔn)分配計(jì)算資源。

第三個(gè)是全局內(nèi)存統(tǒng)一編址,所有的節(jié)點(diǎn)共享一套全局內(nèi)存體系,數(shù)據(jù)無(wú)需頻繁搬移,以此來(lái)提高訓(xùn)練的效率。

DeepSeek R1已經(jīng)有288個(gè)專家,不排除大模型專家數(shù)量越來(lái)越多的可能。支持全局內(nèi)存統(tǒng)一編址的昇騰超節(jié)點(diǎn),具備更高效的內(nèi)存語(yǔ)義通信能力,通過(guò)更低時(shí)延指令級(jí)內(nèi)存語(yǔ)義通信,可滿足大模型訓(xùn)練/推理中的小包通信需求,提升專家網(wǎng)絡(luò)小包數(shù)據(jù)傳輸及離散隨機(jī)訪存通信效率。

第四個(gè)是系統(tǒng)穩(wěn)定性的提升,保證訓(xùn)練不中斷、推理更可靠,大幅降低了MoE大模型的部署和運(yùn)維門檻。

比如MoE訓(xùn)練過(guò)程一旦某專家節(jié)點(diǎn)異常,可能導(dǎo)致全局失敗的問(wèn)題。昇騰超節(jié)點(diǎn)采用了多平面的鏈路設(shè)計(jì)、鏈路故障秒級(jí)切換、算子級(jí)重傳等可靠性能力,確保大模型訓(xùn)練不中斷,平均無(wú)故障運(yùn)行時(shí)長(zhǎng)從幾小時(shí)提升到幾天。同時(shí)支持更敏捷的斷點(diǎn)續(xù)訓(xùn),故障恢復(fù)時(shí)長(zhǎng)從小時(shí)級(jí)降低至30分鐘。

可以佐證的是,基于超節(jié)點(diǎn)設(shè)計(jì)的AI集群Atlas 900 A3 SuperCluster,在測(cè)試中突破了Scale Up物理節(jié)點(diǎn)計(jì)算瓶頸,平均無(wú)故障運(yùn)行時(shí)長(zhǎng)達(dá)到數(shù)天,訓(xùn)練效率提升了2.7倍;由于所有專家集中部署在一個(gè)超節(jié)點(diǎn),在推理過(guò)程中實(shí)現(xiàn)了15ms超低延遲和高吞吐能力,對(duì)推薦系統(tǒng)、搜索排序、智能客服等對(duì)延遲極敏感的應(yīng)用場(chǎng)景更加友好。

03 算力創(chuàng)新蝶變:從“硬件堆疊”到“系統(tǒng)級(jí)協(xié)同”

除了性能上的提升,MoE架構(gòu)創(chuàng)新的另一個(gè)深遠(yuǎn)影響,在于降低了推理階段的綜合成本。

過(guò)去,大模型的強(qiáng)大性能往往伴隨著極高的算力消耗,導(dǎo)致部署門檻極高。MoE通過(guò)“按需激活”的專家機(jī)制,在保證精度的同時(shí)大幅節(jié)省了計(jì)算資源,為企業(yè)級(jí)、行業(yè)級(jí)AI應(yīng)用的落地打通了路徑。

昇騰在算力底層架構(gòu)上的實(shí)干式創(chuàng)新,向外界揭示了一個(gè)新的趨勢(shì):當(dāng)大模型走出實(shí)驗(yàn)室,走向生產(chǎn)一線,走向規(guī)模化應(yīng)用,為AI提供源動(dòng)力的基礎(chǔ)設(shè)施,不再是“硬件堆疊”,而是計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)的“系統(tǒng)級(jí)協(xié)同”。

不單單是親和MoE模型,搬走了大模型訓(xùn)練的“三座大山”,還預(yù)示著AI基礎(chǔ)設(shè)施的“工程可控性”和“業(yè)務(wù)適配性”,更好地支持大模型在工業(yè)、能源、交通、金融等領(lǐng)域的規(guī)?;渴稹?/p>

如果你也對(duì)昇騰超節(jié)點(diǎn)感興趣,想要了解更多技術(shù)細(xì)節(jié)和創(chuàng)新方案,推薦關(guān)注5月19日的鯤鵬昇騰創(chuàng)享周直播活動(dòng),技術(shù)直播的第一場(chǎng)就將深度講解基于昇騰的超節(jié)點(diǎn)架構(gòu),如何助力MoE模型的訓(xùn)練和推理,帶來(lái)15ms超低時(shí)延和高吞吐量。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
31歲王霜攤手一臉疑惑!精彩頭球被吹掉 主裁解釋:邵子欽越位了

31歲王霜攤手一臉疑惑!精彩頭球被吹掉 主裁解釋:邵子欽越位了

風(fēng)過(guò)鄉(xiāng)
2026-03-14 14:06:32
當(dāng)場(chǎng)翻臉,澤連斯基怒懟特朗普,別再逼烏克蘭,要施壓就去找普京

當(dāng)場(chǎng)翻臉,澤連斯基怒懟特朗普,別再逼烏克蘭,要施壓就去找普京

策略述
2026-03-14 14:18:58
外地人去301醫(yī)院看病,水太深!這份避坑指南能幫你省下一半時(shí)間

外地人去301醫(yī)院看病,水太深!這份避坑指南能幫你省下一半時(shí)間

牛鍋巴小釩
2026-03-14 09:52:49
1984年,張宗遜之子張又俠8個(gè)多小時(shí)拿下松毛嶺:預(yù)備隊(duì)還沒(méi)上呢

1984年,張宗遜之子張又俠8個(gè)多小時(shí)拿下松毛嶺:預(yù)備隊(duì)還沒(méi)上呢

歷史甄有趣
2026-03-13 12:45:14
【何平平】中國(guó)小矮人國(guó)外演出,洋妞襠下喝尿聞騷、辱沒(méi)了國(guó)格?

【何平平】中國(guó)小矮人國(guó)外演出,洋妞襠下喝尿聞騷、辱沒(méi)了國(guó)格?

年之父
2026-03-13 08:10:06
云南省農(nóng)業(yè)農(nóng)村廳通報(bào):成立調(diào)查組核查凍干草莓產(chǎn)業(yè)鏈,如發(fā)現(xiàn)違法違規(guī)行為將依法依規(guī)嚴(yán)肅處理

云南省農(nóng)業(yè)農(nóng)村廳通報(bào):成立調(diào)查組核查凍干草莓產(chǎn)業(yè)鏈,如發(fā)現(xiàn)違法違規(guī)行為將依法依規(guī)嚴(yán)肅處理

環(huán)球網(wǎng)資訊
2026-03-14 06:31:27
第六波反制來(lái)了,巴拿馬呼吁中方冷靜,巴政府想要的,中方給不了

第六波反制來(lái)了,巴拿馬呼吁中方冷靜,巴政府想要的,中方給不了

鐵錘簡(jiǎn)科
2026-03-13 18:10:20
1-0變0-0!王霜進(jìn)球又被吹掉,細(xì)節(jié)曝光,亞足聯(lián)裁判惹引爭(zhēng)議

1-0變0-0!王霜進(jìn)球又被吹掉,細(xì)節(jié)曝光,亞足聯(lián)裁判惹引爭(zhēng)議

何老師呀
2026-03-14 14:09:04
蘋果官方上架大量低價(jià)二手產(chǎn)品,這價(jià)格真意外??!

XCiOS俱樂(lè)部
2026-03-14 14:10:56

古巴總統(tǒng)宣布:與美國(guó)達(dá)成協(xié)議

古巴總統(tǒng)宣布:與美國(guó)達(dá)成協(xié)議

跟著老李看世界
2026-03-14 09:15:36
伊朗30枚超重導(dǎo)彈襲擊以色列,“摧毀以方空天監(jiān)控系統(tǒng)”!美國(guó)被曝增派5000名海軍陸戰(zhàn)隊(duì);伊朗總統(tǒng)走上街頭,與民眾親切握手、合影

伊朗30枚超重導(dǎo)彈襲擊以色列,“摧毀以方空天監(jiān)控系統(tǒng)”!美國(guó)被曝增派5000名海軍陸戰(zhàn)隊(duì);伊朗總統(tǒng)走上街頭,與民眾親切握手、合影

每日經(jīng)濟(jì)新聞
2026-03-14 01:15:27
農(nóng)民養(yǎng)老金迎好消息,基礎(chǔ)養(yǎng)老金可能提高,但有條件限制

農(nóng)民養(yǎng)老金迎好消息,基礎(chǔ)養(yǎng)老金可能提高,但有條件限制

北緯的咖啡豆
2026-03-12 19:30:19
孫穎莎不敵蒯曼,林昀儒擊敗張本智和,都很有把握

孫穎莎不敵蒯曼,林昀儒擊敗張本智和,都很有把握

子水體娛
2026-03-14 12:22:34
香積寺之戰(zhàn):“史盲的鑒別神器”,別再被網(wǎng)上騙了

香積寺之戰(zhàn):“史盲的鑒別神器”,別再被網(wǎng)上騙了

小豫講故事
2026-03-14 06:00:10
剛火3個(gè)月,第一批餛飩酒館已經(jīng)開始關(guān)店了?

剛火3個(gè)月,第一批餛飩酒館已經(jīng)開始關(guān)店了?

藍(lán)鯨新聞
2026-03-13 16:32:44
伊朗新任最高領(lǐng)袖,傷情有多重?

伊朗新任最高領(lǐng)袖,傷情有多重?

中國(guó)新聞周刊
2026-03-13 20:21:03
打破禁忌、空襲小島!美軍終于對(duì)伊朗石油命根子動(dòng)手了!

打破禁忌、空襲小島!美軍終于對(duì)伊朗石油命根子動(dòng)手了!

中國(guó)能源網(wǎng)
2026-03-14 10:06:16
阻孫穎莎三連冠!蒯曼4-2復(fù)仇晉級(jí)四強(qiáng) 女單世界前四均早早出局

阻孫穎莎三連冠!蒯曼4-2復(fù)仇晉級(jí)四強(qiáng) 女單世界前四均早早出局

顏小白的籃球夢(mèng)
2026-03-14 14:15:35
“伊朗想放部分油輪過(guò)海峽,前提是石油以人民幣結(jié)算”

“伊朗想放部分油輪過(guò)海峽,前提是石油以人民幣結(jié)算”

觀察者網(wǎng)
2026-03-14 08:19:04
楊振寧離世5個(gè)月,翁帆遠(yuǎn)赴英國(guó)真相曝光,藏21年的秘密瞞不住了

楊振寧離世5個(gè)月,翁帆遠(yuǎn)赴英國(guó)真相曝光,藏21年的秘密瞞不住了

離離言幾許
2026-03-13 22:38:05
2026-03-14 15:52:49
Alter聊科技 incentive-icons
Alter聊科技
探究產(chǎn)業(yè)興衰,專注商業(yè)解讀。
1489文章數(shù) 168115關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

伊朗:30枚超重導(dǎo)彈襲擊以色列 摧毀以方空天監(jiān)控系統(tǒng)

頭條要聞

伊朗:30枚超重導(dǎo)彈襲擊以色列 摧毀以方空天監(jiān)控系統(tǒng)

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂(lè)要聞

張藝興,犯了大忌

財(cái)經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實(shí)力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

本地
親子
藝術(shù)
房產(chǎn)
公開課

本地新聞

坐標(biāo)北京,過(guò)敏季反向遷徒

親子要聞

孩子很小脾氣暴躁,動(dòng)不動(dòng)就用頭撞墻,父母究竟做錯(cuò)了什么?

藝術(shù)要聞

院士設(shè)計(jì)!前海博物館10月亮相,深圳人沸騰,家門口看國(guó)寶!

房產(chǎn)要聞

不容易??!??诮K于又要賣地了!

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版