不拼GPU！中興扔出AI超節(jié)點(diǎn)，把token價(jià)格打下來

2026-03-27 21:37:17　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子

【新智元導(dǎo)讀】在萬億級大模型橫行的時(shí)代，單純靠「堆芯片」已經(jīng)玩不動了。中興交出了一份不一樣的答卷：跳出單一芯片的性能內(nèi)卷，靠「系統(tǒng)級協(xié)同」重構(gòu)智算底座。

當(dāng)前AI大模型參數(shù)規(guī)模已突破萬億量級，單GPU芯片的物理功耗密度、互連帶寬與內(nèi)存容量瓶頸，成為制約算力發(fā)展的核心問題，傳統(tǒng)「芯片堆砌」的算力建設(shè)模式，正面臨通信開銷劇增、算力利用率驟降的行業(yè)共性痛點(diǎn)。

隨著技術(shù)的快速演進(jìn)和迭代，當(dāng)前已經(jīng)不是「一顆芯片決定算力」的時(shí)代，AI基礎(chǔ)設(shè)施的競爭正在由「單一芯片」轉(zhuǎn)向以「整機(jī)系統(tǒng)」為核心的競爭。

在各大GPU廠商聚焦芯片研發(fā)競賽的背景下，中興通訊從系統(tǒng)級協(xié)同架構(gòu)出發(fā)，推出超節(jié)點(diǎn)技術(shù)，通過重構(gòu)算力互聯(lián)體系，將數(shù)十至數(shù)百顆多廠家GPU邏輯整合為統(tǒng)一計(jì)算單元，實(shí)現(xiàn)了算力的系統(tǒng)級優(yōu)化。

近期中興通訊發(fā)布的《中興通訊超節(jié)點(diǎn)白皮書》，不僅為突破單GPU芯片瓶頸提供了全新解決方案，更重塑了AI算力基礎(chǔ)設(shè)施的構(gòu)建邏輯，其背后的技術(shù)創(chuàng)新與設(shè)計(jì)思路，對整個(gè)智算行業(yè)的發(fā)展都具有重要的參考意義。

核心底層邏輯

跳出GPU競賽，錨定系統(tǒng)級算力協(xié)同

面對單GPU芯片的性能瓶頸，行業(yè)內(nèi)早已形成共識，即通過高速無損互聯(lián)技術(shù)將多顆GPU整合為邏輯上的「超級計(jì)算機(jī)」，是突破單芯片性能上限的核心技術(shù)路徑，中興超節(jié)點(diǎn)的底層設(shè)計(jì)邏輯，正是深度契合這一行業(yè)趨勢，跳出單芯片性能競賽的傳統(tǒng)思路，將核心發(fā)力點(diǎn)放在系統(tǒng)級的算力協(xié)同上。

從第三方視角來看，這一選擇既避開了GPU芯片研發(fā)的高壁壘、長周期競爭，又精準(zhǔn)切中了當(dāng)前算力建設(shè)的核心痛點(diǎn)——傳統(tǒng)模式的問題并非單芯片性能不足，而是多芯片協(xié)同的效率過低。

中興超節(jié)點(diǎn)并非GPU的簡單物理堆砌，而是融合多芯片、整機(jī)硬件、高速互聯(lián)與配套軟件的集成系統(tǒng)，其構(gòu)建嚴(yán)格遵循四大核心前提，為系統(tǒng)級算力協(xié)同筑牢基礎(chǔ)：

一是芯片能力的均衡性，要求GPU的算力、顯存、互聯(lián)帶寬三者匹配，避免資源浪費(fèi)；

二是互聯(lián)架構(gòu)的有效性，超節(jié)點(diǎn)內(nèi)任意GPU間的互聯(lián)帶寬達(dá)到機(jī)間互聯(lián)的8倍左右，兼顧通信效率、擴(kuò)展性與場景適配性；

三是內(nèi)存訪問的便捷性，所有GPU支持統(tǒng)一內(nèi)存編址，兼容內(nèi)存語義和消息語義，保障編程易用性與數(shù)據(jù)訪問效率；

四是架構(gòu)擴(kuò)展的原生性，且集群擴(kuò)展后仍屬于高帶寬域，滿足算力按需配置的需求。

這四大前提的設(shè)計(jì)，讓中興超節(jié)點(diǎn)從底層就確立了「系統(tǒng)級算力最優(yōu)」的目標(biāo)，所有后續(xù)技術(shù)創(chuàng)新均圍繞這一核心展開。

硬件架構(gòu)創(chuàng)新

OEX正交無背板互聯(lián)，重構(gòu)GPU物理協(xié)同基礎(chǔ)

傳統(tǒng)GPU集群依賴Cable Tray線纜架構(gòu)，存在信號損耗大、算力密度低、運(yùn)維難度高、組網(wǎng)成本高的明顯短板，這也是制約多GPU協(xié)同效率的物理層關(guān)鍵問題。

中興超節(jié)點(diǎn)在硬件架構(gòu)上的核心創(chuàng)新，就是推出了Orthogonal Electrical eXchange（OEX）正交無背板互聯(lián)交換架構(gòu)，這一架構(gòu)也于2025年成功入選ODCC「年度重大技術(shù)突破」案例，從第三方視角來看，這一創(chuàng)新實(shí)現(xiàn)了GPU物理互聯(lián)體系的底層重構(gòu)，為高密度、高可靠性的GPU協(xié)同奠定了物理基礎(chǔ)。

圖1 OEX互聯(lián)示意圖

OEX架構(gòu)的核心設(shè)計(jì)，是讓計(jì)算托盤與交換托盤實(shí)現(xiàn)垂直交叉物理直連，徹底摒棄傳統(tǒng)的高速線纜，通過正交連接器與單級交換拓?fù)錁?gòu)建無線纜的互聯(lián)體系，這一設(shè)計(jì)帶來的實(shí)際價(jià)值可通過白皮書的核心數(shù)據(jù)直觀體現(xiàn)：

在112G高速信號場景下，SerDes鏈路長度縮短30%以上，直接消除了線纜引入的6.5dB插損，讓端到端鏈路插損余量大于3dB，大幅降低了誤碼率，為TB級互聯(lián)帶寬提供了穩(wěn)定的物理支撐；

無線纜設(shè)計(jì)直接釋放了機(jī)柜內(nèi)部的寶貴空間，讓標(biāo)準(zhǔn)機(jī)柜可集成64/128卡甚至更多GPU，實(shí)現(xiàn)了單位空間算力密度的跨越式提升；

同時(shí)從根源上減少了線纜松動、老化導(dǎo)致的宕機(jī)風(fēng)險(xiǎn)，將系統(tǒng)故障修復(fù)時(shí)間MTTR從傳統(tǒng)的小時(shí)級縮短至分鐘級，完美適配AI大模型7×24小時(shí)不間斷訓(xùn)練的高可靠性需求；

此外，交換板內(nèi)集成參數(shù)面leaf交換，省去了傳統(tǒng)組網(wǎng)所需的leaf層級交換機(jī)、光模塊和光纖，在簡化系統(tǒng)架構(gòu)的同時(shí)，顯著降低了組網(wǎng)的硬件成本與復(fù)雜度。

相較于行業(yè)內(nèi)其他正交架構(gòu)方案，中興OEX架構(gòu)的無集中式背板設(shè)計(jì)，進(jìn)一步降低了層間損耗與硬件復(fù)雜度，成為當(dāng)前高密度GPU互聯(lián)的優(yōu)質(zhì)物理架構(gòu)選擇。

圖2 OEX與Cable Tray方案對比

高速互聯(lián)技術(shù)創(chuàng)新

自研芯片+全維度優(yōu)化，打通算力協(xié)同通信瓶頸

GPU間的高效互聯(lián)是系統(tǒng)級算力協(xié)同的核心支撐，傳統(tǒng)GPU集群的「通信卡脖子」問題，本質(zhì)是互聯(lián)帶寬、時(shí)延、協(xié)議兼容性的多重限制，而中興通訊依托其在通信領(lǐng)域數(shù)十年的技術(shù)積累，從芯片、物理層、協(xié)議層、計(jì)算卸載、擴(kuò)展性五個(gè)維度實(shí)現(xiàn)了高速互聯(lián)技術(shù)的全面創(chuàng)新，打造出適配AI算力需求的TB級通信通道，從第三方視角來看，這一系列創(chuàng)新將通信領(lǐng)域的技術(shù)優(yōu)勢與智算需求深度結(jié)合，真正解決了多GPU協(xié)同通信的核心痛點(diǎn)。

在核心硬件上，中興自研大容量交換芯片，成為高速互聯(lián)的基石，該芯片實(shí)現(xiàn)了三大突破：

帶寬與時(shí)延躍升至TB級、百納秒級，滿足海量AI數(shù)據(jù)的高速傳輸；

拓?fù)浼軜?gòu)從點(diǎn)對點(diǎn)升級為大規(guī)模全對等互聯(lián)，適配數(shù)十到數(shù)百顆GPU的協(xié)同計(jì)算；

全面兼容RDMA、CLink、OISA、Ethlink、SUE、UEC等國內(nèi)外主流互聯(lián)協(xié)議，為后續(xù)多廠家GPU兼容埋下伏筆。

在物理層選型上，中興放棄了傳統(tǒng)PCIe總線，選擇以太網(wǎng)物理層，白皮書數(shù)據(jù)顯示，PCIe 5.0 x16雙向帶寬僅約128GB/s，而以太網(wǎng)SerDes主流速率已達(dá)112Gbps，224Gbps產(chǎn)品已進(jìn)入商用階段，支持多通道靈活綁定，可輕松實(shí)現(xiàn)TB/s級端口帶寬，完美契合AI訓(xùn)練對超高帶寬的需求。

在協(xié)議層，中興立足開放架構(gòu)，既支持UALink、ESUN等國際主流開放協(xié)議，又積極參與工信部牽頭的CLink協(xié)議制定，推動國內(nèi)算力互聯(lián)協(xié)議的統(tǒng)一，打破私有協(xié)議的生態(tài)壁壘。

同時(shí)，中興將在網(wǎng)計(jì)算技術(shù)深度集成至交換芯片，將GPU的高負(fù)載通信操作卸載至交換芯片完成，讓GPU專注核心計(jì)算，這一設(shè)計(jì)的優(yōu)化效果十分顯著：

在傳統(tǒng)稠密模型訓(xùn)練中，All-Reduce操作復(fù)雜度從O(logN)降至O(C)，大幅減少節(jié)點(diǎn)間消息傳遞次數(shù)；

在MoE混合專家模型訓(xùn)練中，Dispatch Multicast和Combine Reduce操作的分發(fā)時(shí)延下降20%-50%，歸約時(shí)延下降40%-60%以上，干線流量減少超30%，徹底解決了MoE模型通信開銷大的行業(yè)難題。

此外，中興從互聯(lián)協(xié)議、拓?fù)?、物理形態(tài)、介質(zhì)四個(gè)維度做Scale-Up可擴(kuò)展性設(shè)計(jì)，預(yù)留GPU ID標(biāo)識bit位滿足未來十萬級GPU集群尋址需求，采用線性無收斂擴(kuò)展拓?fù)浔苊馔ㄐ牌款i，以機(jī)柜為單元做模塊化設(shè)計(jì)實(shí)現(xiàn)「即插即用」擴(kuò)容，遵循「能銅盡銅，距遠(yuǎn)用光」原則兼顧傳輸效率與成本，為算力的無限擴(kuò)展提供了技術(shù)支撐。

功耗管理創(chuàng)新

液冷+高壓直流，適配高密度算力的能源需求

超節(jié)點(diǎn)的高密度GPU集成，必然帶來功耗的指數(shù)級增長，白皮書援引英偉達(dá)的數(shù)據(jù)顯示，GPU超節(jié)點(diǎn)機(jī)柜功耗已從2022年H100的50kW，提升至2025年GB300 NVL72的120-150kW，未來更將向600kW乃至兆瓦級演進(jìn)，功耗與散熱問題成為高密度算力建設(shè)的必解難題。

從第三方視角來看，中興超節(jié)點(diǎn)并未簡單采用常規(guī)的散熱與供電方案，而是結(jié)合算力發(fā)展趨勢，打造了一套「前瞻布局、全維度適配」的功耗管理體系，從散熱和供電兩大維度實(shí)現(xiàn)創(chuàng)新，確保算力高效釋放的同時(shí)，實(shí)現(xiàn)能效最優(yōu)。

在散熱方面，中興構(gòu)建了全維度的液冷散熱體系，兼顧當(dāng)前需求與未來趨勢：

當(dāng)前階段采用單相冷板式液冷，這一方案是目前應(yīng)用最廣泛、工程化最成熟的液冷技術(shù)，市場占有率超過70%-80%，可有效支撐百千瓦級機(jī)柜的散熱需求；

針對未來單芯片功耗突破2000W的趨勢，未來規(guī)劃硅基微通道冷板和兩相冷板液冷技術(shù)，硅基微通道冷板適配HBM堆疊、Chiplet等先進(jìn)封裝的高熱流密度需求，兩相冷板液冷可在低流量下實(shí)現(xiàn)超高散熱效率；

同時(shí)兼容浸沒式液冷技術(shù)，為未來兆瓦級機(jī)柜的散熱需求提供解決方案。

液冷技術(shù)的全面應(yīng)用，不僅解決了高密度算力的散熱問題，更推動數(shù)據(jù)中心從「算力導(dǎo)向」向「能效導(dǎo)向」轉(zhuǎn)型，契合綠色智算的行業(yè)發(fā)展趨勢。

在供電方面，中興突破傳統(tǒng)48V/54V供電體系的物理極限，采用HVDC高壓直流供電架構(gòu)，主流演進(jìn)方向?yàn)椤?00V DC和800V DC，這一設(shè)計(jì)帶來的優(yōu)勢十分突出：同等功率下，電流可降低8-16倍，銅材用量減少40%-50%，為機(jī)柜內(nèi)的計(jì)算與冷卻組件釋放關(guān)鍵空間；有效抑制傳輸熱損，整體端到端供電效率提升3%-5%，在電力成本占比30%-50%的智算中心，這一提升能帶來顯著的運(yùn)營成本節(jié)約；可輕松支撐從當(dāng)前100-150kW向250kW乃至1MW+級機(jī)柜的演進(jìn)需求；減少中間能量變換層級，從根本上緩解功率因數(shù)校正與無功功率管理壓力。

該架構(gòu)與OCP Diablo 400、英偉達(dá)800VDC等行業(yè)主流趨勢接軌，確保了供電體系的前瞻性與兼容性。

集群擴(kuò)展創(chuàng)新：Nebula Matrix集群超節(jié)點(diǎn)，實(shí)現(xiàn)算力規(guī)模化平滑升級

單臺單體超節(jié)點(diǎn)的算力終究有限，面對萬億乃至十萬億參數(shù)大模型的訓(xùn)練需求，算力的規(guī)?；瘮U(kuò)展成為必然要求，而傳統(tǒng)算力集群的擴(kuò)展往往面臨性能下降、成本激增、組網(wǎng)復(fù)雜等問題。

從第三方視角來看，中興超節(jié)點(diǎn)的一大亮點(diǎn)，就是構(gòu)建了「單體超節(jié)點(diǎn)-集群超節(jié)點(diǎn)」的完整擴(kuò)展體系，通過Nebula Matrix集群超節(jié)點(diǎn)實(shí)現(xiàn)算力從百卡到萬卡的平滑擴(kuò)展，既滿足了超大規(guī)模算力需求，又實(shí)現(xiàn)了性能與成本的最優(yōu)平衡。

中興Matrix集群超節(jié)點(diǎn)采用業(yè)界主流的「電交換+光互聯(lián)」技術(shù)路線，通過高性能電交換機(jī)實(shí)現(xiàn)機(jī)柜內(nèi)GPU間的互聯(lián)，受銅纜傳輸距離限制，跨機(jī)柜場景則采用光纖介質(zhì)完成互聯(lián)，這一路線依托電交換技術(shù)的高成熟度、高業(yè)務(wù)普適性，規(guī)避了全光交換技術(shù)門檻高、生態(tài)不完善、對業(yè)務(wù)適配要求高的問題，成為當(dāng)前大規(guī)模集群超節(jié)點(diǎn)建設(shè)的最優(yōu)選擇。

基于這一路線，中興現(xiàn)有Nebula X32單體超節(jié)點(diǎn)可靈活擴(kuò)展為Nebula Matrix X256/800集群超節(jié)點(diǎn)，面向未來，依托更高密度的Nebula X128單體超節(jié)點(diǎn)，更可進(jìn)一步擴(kuò)展至X8192/16384的超大規(guī)模集群，充分滿足超大規(guī)模模型訓(xùn)練的算力需求。

同時(shí)，中興創(chuàng)新提出Scale-Up與Scale-Out網(wǎng)絡(luò)融合設(shè)計(jì)，打破了傳統(tǒng)兩類網(wǎng)絡(luò)獨(dú)立組網(wǎng)的模式，Scale-Up網(wǎng)絡(luò)承載張量并行、專家并行等對帶寬和時(shí)延要求極高的通信流量，Scale-Out網(wǎng)絡(luò)承載數(shù)據(jù)并行、流水并行等對網(wǎng)絡(luò)性能要求相對較低的通信流量，融合后構(gòu)建統(tǒng)一的超節(jié)點(diǎn)互聯(lián)網(wǎng)絡(luò)，既滿足了集群超節(jié)點(diǎn)內(nèi)部的高性能互聯(lián)需求，又適配了集群間的常規(guī)互聯(lián)需求。

白皮書的模型測算顯示，這一融合架構(gòu)相比獨(dú)立組網(wǎng)模式，能顯著降低總擁有成本（TCO），同時(shí)保障了集群部署和擴(kuò)容的平滑性，讓用戶可根據(jù)算力需求按需擴(kuò)展，真正實(shí)現(xiàn)了「算力靈活選擇，性能與成本最佳平衡」。

軟件棧創(chuàng)新

打造超節(jié)點(diǎn)「操作系統(tǒng)」，充分釋放硬件算力潛能

硬件是算力的物理基礎(chǔ)，而軟件是釋放硬件算力的核心支撐，再好的硬件架構(gòu)，若缺乏適配的軟件體系，也無法將物理算力轉(zhuǎn)化為實(shí)際的有效算力。

從第三方視角來看，中興超節(jié)點(diǎn)的一大設(shè)計(jì)亮點(diǎn)，就是充分重視軟硬件的協(xié)同優(yōu)化，打造了一套深度協(xié)同、全棧優(yōu)化的軟件棧體系，將其定義為超節(jié)點(diǎn)的「操作系統(tǒng)」，實(shí)現(xiàn)了對硬件資源的統(tǒng)一調(diào)度、管理、優(yōu)化與監(jiān)控，確保物理層的所有創(chuàng)新都能轉(zhuǎn)化為實(shí)際的算力輸出。

這套軟件棧的創(chuàng)新體現(xiàn)在六大核心維度：

一是實(shí)現(xiàn)統(tǒng)一虛擬化資源池與智能編排，將超節(jié)點(diǎn)內(nèi)的算力、內(nèi)存、存儲資源抽象池化，根據(jù)AI訓(xùn)練、推理等不同工作負(fù)載需求，動態(tài)彈性分配和隔離資源，支持多任務(wù)、多租戶環(huán)境下的共享與安全隔離；

二是做到極致通信優(yōu)化與拓?fù)涓兄ㄟ^深度優(yōu)化的通信庫和運(yùn)行時(shí)系統(tǒng)，自動識別最優(yōu)數(shù)據(jù)傳輸路徑，結(jié)合計(jì)算與通信重疊、梯度壓縮等技術(shù)，將通信開銷隱藏于計(jì)算過程之中，提升系統(tǒng)整體效率；

三是支持異構(gòu)計(jì)算統(tǒng)一調(diào)度與編譯器優(yōu)化，實(shí)現(xiàn)CPU/GPU/DSA等異構(gòu)單元的統(tǒng)一調(diào)度，通過算子融合、內(nèi)核生成等方式提升單卡效率與跨芯片協(xié)同效率；

四是構(gòu)建全?？捎^測性與智能運(yùn)維體系，實(shí)現(xiàn)芯片-節(jié)點(diǎn)-集群的多級監(jiān)控，實(shí)時(shí)可視化功耗、溫度、性能等指標(biāo)，結(jié)合AI運(yùn)維實(shí)現(xiàn)故障預(yù)測、根因分析，將故障定位時(shí)間從小時(shí)級縮短至分鐘級；

五是設(shè)置高可靠冗余機(jī)制，通過冗余算力節(jié)點(diǎn)與故障切換機(jī)制，避免單點(diǎn)故障導(dǎo)致的大模型訓(xùn)練中斷，保障業(yè)務(wù)連續(xù)性；

六是引入「算力-電力」協(xié)同的綠色調(diào)度，結(jié)合任務(wù)優(yōu)先級、功耗模型與實(shí)時(shí)電價(jià)，動態(tài)調(diào)整算力調(diào)度與芯片頻率，在保障服務(wù)水平協(xié)議（SLA）的前提下，平滑功率波動，降低能耗與運(yùn)營成本。

此外，中興還打造了算力仿真平臺，為超節(jié)點(diǎn)的算力配置提供「數(shù)字孿生」推演能力，該平臺基于硬件參數(shù)、模型結(jié)構(gòu)、算子實(shí)測數(shù)據(jù)，可模擬不同超節(jié)點(diǎn)形態(tài)下的訓(xùn)練/推理性能，為用戶的硬件選型、并行策略設(shè)計(jì)提供科學(xué)依據(jù)。

白皮書以Qwen3-235B模型為例，通過算力仿真平臺得出結(jié)論：在2K卡的規(guī)模下，256卡超節(jié)點(diǎn)相比8卡服務(wù)器，訓(xùn)練性能提升15%，這一結(jié)果能有效幫助用戶規(guī)避試錯(cuò)成本，實(shí)現(xiàn)算力配置的最優(yōu)選擇。

圖3 Qwen3-235B不同超節(jié)點(diǎn)形態(tài)最優(yōu)切分下各部分耗時(shí)

多維度設(shè)計(jì)

實(shí)現(xiàn)多廠家GPU兼容，打破生態(tài)鎖定

在各大廠商紛紛構(gòu)建封閉算力生態(tài)的背景下，中興超節(jié)點(diǎn)將多廠家GPU兼容作為核心創(chuàng)新點(diǎn)之一，這一設(shè)計(jì)不僅是其「繞開GPU瓶頸、另辟蹊徑」的重要體現(xiàn)，更契合了行業(yè)開放、融合、創(chuàng)新的發(fā)展趨勢。

從第三方視角來看，中興超節(jié)點(diǎn)并非簡單實(shí)現(xiàn)多廠家GPU的「接入」，而是通過硬件、芯片、協(xié)議、生態(tài)、集群五個(gè)維度的系統(tǒng)化設(shè)計(jì)，真正打破了單一GPU廠商的生態(tài)鎖定，為用戶提供了靈活的算力選擇，也推動了國產(chǎn)GPU生態(tài)的繁榮發(fā)展。

在硬件層，中興Nebula單體超節(jié)點(diǎn)的OEX正交架構(gòu)采用高度組件化設(shè)計(jì)，將GPU適配的核心模塊獨(dú)立為UBB模組，針對不同廠家的GPU，用戶僅需更換UBB模組，無需對超節(jié)點(diǎn)的整體架構(gòu)、交換托盤、供電散熱等核心部件做任何改動，即可實(shí)現(xiàn)「即插即用」的適配，大幅降低了多廠家GPU的集成門檻。

在芯片層，自研的大容量交換芯片成為多廠家GPU兼容的硬件核心，該芯片全面兼容國內(nèi)外主流的GPU互聯(lián)協(xié)議，而目前國內(nèi)外主流GPU廠商的產(chǎn)品均已適配這些通用協(xié)議，從底層解決了多廠家GPU的通信兼容問題，打造了「一次設(shè)計(jì)，多卡兼容」的通用互聯(lián)底座。

在協(xié)議層，中興不僅是現(xiàn)有互聯(lián)協(xié)議的適配者，更是行業(yè)標(biāo)準(zhǔn)的制定者，積極參與工信部牽頭的CLink協(xié)議制定，推動形成統(tǒng)一的國內(nèi)算力互聯(lián)標(biāo)準(zhǔn)，同時(shí)其自研的OLink協(xié)議采用開放標(biāo)準(zhǔn)設(shè)計(jì)，向行業(yè)開放協(xié)議規(guī)范，讓各GPU廠商可輕松適配。

在生態(tài)層，中興秉持「開放解耦」的理念，全面開放OEX正交架構(gòu)的機(jī)械與電氣接口規(guī)范，第三方GPU廠商只需按照該規(guī)范設(shè)計(jì)計(jì)算/交換托盤，即可實(shí)現(xiàn)與中興超節(jié)點(diǎn)的標(biāo)準(zhǔn)化接入，無需單獨(dú)定制；同時(shí)，中興已于2025年6月在ODCC網(wǎng)絡(luò)工作組成功立項(xiàng)《基于正交架構(gòu)的超節(jié)點(diǎn)硬件系統(tǒng)》，推動超節(jié)點(diǎn)硬件的行業(yè)標(biāo)準(zhǔn)化，讓多廠家GPU的兼容從企業(yè)設(shè)計(jì)升級為行業(yè)規(guī)范。

在集群層，多廠家GPU的兼容能力更延伸至Nebula Matrix集群超節(jié)點(diǎn)，其Scale-Up/Scale-Out融合組網(wǎng)架構(gòu)繼承了單體超節(jié)點(diǎn)的協(xié)議兼容和組件化適配能力，無論組成集群的各單體超節(jié)點(diǎn)搭載不同廠家GPU，還是同一超節(jié)點(diǎn)內(nèi)混布多品牌GPU，都能通過自研大容量交換芯片的多協(xié)議支持、融合網(wǎng)絡(luò)的統(tǒng)一調(diào)度，實(shí)現(xiàn)跨機(jī)柜、跨品牌GPU的高帶寬、低時(shí)延協(xié)同，讓多廠家GPU的規(guī)?；M網(wǎng)成為現(xiàn)實(shí)。

小結(jié)

從第三方視角對中興超節(jié)點(diǎn)技術(shù)進(jìn)行全面解讀后可以發(fā)現(xiàn)，中興通訊始終圍繞「做TCO最優(yōu)算力系統(tǒng)級整合者」這一核心定位，跳出傳統(tǒng)的芯片研發(fā)競賽，從系統(tǒng)級協(xié)同架構(gòu)出發(fā)，通過硬件架構(gòu)、高速互聯(lián)、功耗管理、集群擴(kuò)展、軟件棧、多廠家GPU兼容六大維度的全方位創(chuàng)新，成功繞開了單GPU芯片的性能瓶頸，拼出了AI算力的系統(tǒng)級最優(yōu)解。

這份創(chuàng)新的價(jià)值，不僅體現(xiàn)在具體的技術(shù)指標(biāo)提升上——白皮書數(shù)據(jù)顯示，MoE模型分發(fā)時(shí)延下降20%-50%、歸約時(shí)延下降40%-60%以上，更體現(xiàn)在對算力建設(shè)模式的重構(gòu)上：中興超節(jié)點(diǎn)讓算力建設(shè)從「芯片堆疊」走向「協(xié)同釋放」，從「單一硬件性能競爭」走向「全棧系統(tǒng)優(yōu)化」，并以此為核心打造了「AI工廠」，將AI開發(fā)從傳統(tǒng)的「手工作坊」升級為標(biāo)準(zhǔn)化、規(guī)?；?、自動化的「現(xiàn)代化流水線」，為AI大模型的訓(xùn)練與推理提供了高效的算力底座。

更重要的是，中興超節(jié)點(diǎn)的開放兼容設(shè)計(jì)，打破了單一廠商的生態(tài)鎖定，為用戶提供了靈活的GPU選擇，推動了智算行業(yè)的開放與融合。

正如中興超節(jié)點(diǎn)技術(shù)白皮書中所言，未來算力的競爭不再是「每秒浮點(diǎn)運(yùn)算次數(shù)（FLOPS）」的競爭，而是「每瓦Token數(shù)」的競爭，中興超節(jié)點(diǎn)通過系統(tǒng)級的創(chuàng)新設(shè)計(jì)，實(shí)現(xiàn)了算力效率、擴(kuò)展能力、生態(tài)兼容性的多重最優(yōu)，不僅為自身在智算行業(yè)占據(jù)了一席之地，更為整個(gè)智算行業(yè)的發(fā)展提供了全新的思路與方向。

在AI大模型持續(xù)發(fā)展的背景下，中興超節(jié)點(diǎn)技術(shù)的落地與推廣，必將為千行百業(yè)的智能化升級提供堅(jiān)實(shí)的算力支撐，推動智算基礎(chǔ)設(shè)施向更高效率、更綠色、更開放的方向演進(jìn)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.