国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不拼GPU!中興扔出AI超節(jié)點(diǎn),把token價(jià)格打下來

0
分享至


新智元報(bào)道

編輯:桃子

【新智元導(dǎo)讀】在萬億級大模型橫行的時(shí)代,單純靠「堆芯片」已經(jīng)玩不動了。中興交出了一份不一樣的答卷:跳出單一芯片的性能內(nèi)卷,靠「系統(tǒng)級協(xié)同」重構(gòu)智算底座。

當(dāng)前AI大模型參數(shù)規(guī)模已突破萬億量級,單GPU芯片的物理功耗密度、互連帶寬與內(nèi)存容量瓶頸,成為制約算力發(fā)展的核心問題,傳統(tǒng)「芯片堆砌」的算力建設(shè)模式,正面臨通信開銷劇增、算力利用率驟降的行業(yè)共性痛點(diǎn)。

隨著技術(shù)的快速演進(jìn)和迭代,當(dāng)前已經(jīng)不是「一顆芯片決定算力」的時(shí)代,AI基礎(chǔ)設(shè)施的競爭正在由「單一芯片」轉(zhuǎn)向以「整機(jī)系統(tǒng)」為核心的競爭。

在各大GPU廠商聚焦芯片研發(fā)競賽的背景下,中興通訊從系統(tǒng)級協(xié)同架構(gòu)出發(fā),推出超節(jié)點(diǎn)技術(shù),通過重構(gòu)算力互聯(lián)體系,將數(shù)十至數(shù)百顆多廠家GPU邏輯整合為統(tǒng)一計(jì)算單元,實(shí)現(xiàn)了算力的系統(tǒng)級優(yōu)化。

近期中興通訊發(fā)布的《中興通訊超節(jié)點(diǎn)白皮書》,不僅為突破單GPU芯片瓶頸提供了全新解決方案,更重塑了AI算力基礎(chǔ)設(shè)施的構(gòu)建邏輯,其背后的技術(shù)創(chuàng)新與設(shè)計(jì)思路,對整個(gè)智算行業(yè)的發(fā)展都具有重要的參考意義。

核心底層邏輯

跳出GPU競賽,錨定系統(tǒng)級算力協(xié)同

面對單GPU芯片的性能瓶頸,行業(yè)內(nèi)早已形成共識,即通過高速無損互聯(lián)技術(shù)將多顆GPU整合為邏輯上的「超級計(jì)算機(jī)」,是突破單芯片性能上限的核心技術(shù)路徑,中興超節(jié)點(diǎn)的底層設(shè)計(jì)邏輯,正是深度契合這一行業(yè)趨勢,跳出單芯片性能競賽的傳統(tǒng)思路,將核心發(fā)力點(diǎn)放在系統(tǒng)級的算力協(xié)同上。

從第三方視角來看,這一選擇既避開了GPU芯片研發(fā)的高壁壘、長周期競爭,又精準(zhǔn)切中了當(dāng)前算力建設(shè)的核心痛點(diǎn)——傳統(tǒng)模式的問題并非單芯片性能不足,而是多芯片協(xié)同的效率過低。

中興超節(jié)點(diǎn)并非GPU的簡單物理堆砌,而是融合多芯片、整機(jī)硬件、高速互聯(lián)與配套軟件的集成系統(tǒng),其構(gòu)建嚴(yán)格遵循四大核心前提,為系統(tǒng)級算力協(xié)同筑牢基礎(chǔ):

一是芯片能力的均衡性,要求GPU的算力、顯存、互聯(lián)帶寬三者匹配,避免資源浪費(fèi);

二是互聯(lián)架構(gòu)的有效性,超節(jié)點(diǎn)內(nèi)任意GPU間的互聯(lián)帶寬達(dá)到機(jī)間互聯(lián)的8倍左右,兼顧通信效率、擴(kuò)展性與場景適配性;

三是內(nèi)存訪問的便捷性,所有GPU支持統(tǒng)一內(nèi)存編址,兼容內(nèi)存語義和消息語義,保障編程易用性與數(shù)據(jù)訪問效率;

四是架構(gòu)擴(kuò)展的原生性,且集群擴(kuò)展后仍屬于高帶寬域,滿足算力按需配置的需求。

這四大前提的設(shè)計(jì),讓中興超節(jié)點(diǎn)從底層就確立了「系統(tǒng)級算力最優(yōu)」的目標(biāo),所有后續(xù)技術(shù)創(chuàng)新均圍繞這一核心展開。

硬件架構(gòu)創(chuàng)新

OEX正交無背板互聯(lián),重構(gòu)GPU物理協(xié)同基礎(chǔ)

傳統(tǒng)GPU集群依賴Cable Tray線纜架構(gòu),存在信號損耗大、算力密度低、運(yùn)維難度高、組網(wǎng)成本高的明顯短板,這也是制約多GPU協(xié)同效率的物理層關(guān)鍵問題。

中興超節(jié)點(diǎn)在硬件架構(gòu)上的核心創(chuàng)新,就是推出了Orthogonal Electrical eXchange(OEX)正交無背板互聯(lián)交換架構(gòu),這一架構(gòu)也于2025年成功入選ODCC「年度重大技術(shù)突破」案例,從第三方視角來看,這一創(chuàng)新實(shí)現(xiàn)了GPU物理互聯(lián)體系的底層重構(gòu),為高密度、高可靠性的GPU協(xié)同奠定了物理基礎(chǔ)。


圖1 OEX互聯(lián)示意圖

OEX架構(gòu)的核心設(shè)計(jì),是讓計(jì)算托盤與交換托盤實(shí)現(xiàn)垂直交叉物理直連,徹底摒棄傳統(tǒng)的高速線纜,通過正交連接器與單級交換拓?fù)錁?gòu)建無線纜的互聯(lián)體系,這一設(shè)計(jì)帶來的實(shí)際價(jià)值可通過白皮書的核心數(shù)據(jù)直觀體現(xiàn):

在112G高速信號場景下,SerDes鏈路長度縮短30%以上,直接消除了線纜引入的6.5dB插損,讓端到端鏈路插損余量大于3dB,大幅降低了誤碼率,為TB級互聯(lián)帶寬提供了穩(wěn)定的物理支撐;

無線纜設(shè)計(jì)直接釋放了機(jī)柜內(nèi)部的寶貴空間,讓標(biāo)準(zhǔn)機(jī)柜可集成64/128卡甚至更多GPU,實(shí)現(xiàn)了單位空間算力密度的跨越式提升;

同時(shí)從根源上減少了線纜松動、老化導(dǎo)致的宕機(jī)風(fēng)險(xiǎn),將系統(tǒng)故障修復(fù)時(shí)間MTTR從傳統(tǒng)的小時(shí)級縮短至分鐘級,完美適配AI大模型7×24小時(shí)不間斷訓(xùn)練的高可靠性需求;

此外,交換板內(nèi)集成參數(shù)面leaf交換,省去了傳統(tǒng)組網(wǎng)所需的leaf層級交換機(jī)、光模塊和光纖,在簡化系統(tǒng)架構(gòu)的同時(shí),顯著降低了組網(wǎng)的硬件成本與復(fù)雜度。

相較于行業(yè)內(nèi)其他正交架構(gòu)方案,中興OEX架構(gòu)的無集中式背板設(shè)計(jì),進(jìn)一步降低了層間損耗與硬件復(fù)雜度,成為當(dāng)前高密度GPU互聯(lián)的優(yōu)質(zhì)物理架構(gòu)選擇。


圖2 OEX與Cable Tray方案對比

高速互聯(lián)技術(shù)創(chuàng)新

自研芯片+全維度優(yōu)化,打通算力協(xié)同通信瓶頸

GPU間的高效互聯(lián)是系統(tǒng)級算力協(xié)同的核心支撐,傳統(tǒng)GPU集群的「通信卡脖子」問題,本質(zhì)是互聯(lián)帶寬、時(shí)延、協(xié)議兼容性的多重限制,而中興通訊依托其在通信領(lǐng)域數(shù)十年的技術(shù)積累,從芯片、物理層、協(xié)議層、計(jì)算卸載、擴(kuò)展性五個(gè)維度實(shí)現(xiàn)了高速互聯(lián)技術(shù)的全面創(chuàng)新,打造出適配AI算力需求的TB級通信通道,從第三方視角來看,這一系列創(chuàng)新將通信領(lǐng)域的技術(shù)優(yōu)勢與智算需求深度結(jié)合,真正解決了多GPU協(xié)同通信的核心痛點(diǎn)。

在核心硬件上,中興自研大容量交換芯片,成為高速互聯(lián)的基石,該芯片實(shí)現(xiàn)了三大突破

帶寬與時(shí)延躍升至TB級、百納秒級,滿足海量AI數(shù)據(jù)的高速傳輸;

拓?fù)浼軜?gòu)從點(diǎn)對點(diǎn)升級為大規(guī)模全對等互聯(lián),適配數(shù)十到數(shù)百顆GPU的協(xié)同計(jì)算;

全面兼容RDMA、CLink、OISA、Ethlink、SUE、UEC等國內(nèi)外主流互聯(lián)協(xié)議,為后續(xù)多廠家GPU兼容埋下伏筆。

在物理層選型上,中興放棄了傳統(tǒng)PCIe總線,選擇以太網(wǎng)物理層,白皮書數(shù)據(jù)顯示,PCIe 5.0 x16雙向帶寬僅約128GB/s,而以太網(wǎng)SerDes主流速率已達(dá)112Gbps,224Gbps產(chǎn)品已進(jìn)入商用階段,支持多通道靈活綁定,可輕松實(shí)現(xiàn)TB/s級端口帶寬,完美契合AI訓(xùn)練對超高帶寬的需求。

在協(xié)議層,中興立足開放架構(gòu),既支持UALink、ESUN等國際主流開放協(xié)議,又積極參與工信部牽頭的CLink協(xié)議制定,推動國內(nèi)算力互聯(lián)協(xié)議的統(tǒng)一,打破私有協(xié)議的生態(tài)壁壘。

同時(shí),中興將在網(wǎng)計(jì)算技術(shù)深度集成至交換芯片,將GPU的高負(fù)載通信操作卸載至交換芯片完成,讓GPU專注核心計(jì)算,這一設(shè)計(jì)的優(yōu)化效果十分顯著:

在傳統(tǒng)稠密模型訓(xùn)練中,All-Reduce操作復(fù)雜度從O(logN)降至O(C),大幅減少節(jié)點(diǎn)間消息傳遞次數(shù);

在MoE混合專家模型訓(xùn)練中,Dispatch Multicast和Combine Reduce操作的分發(fā)時(shí)延下降20%-50%,歸約時(shí)延下降40%-60%以上,干線流量減少超30%,徹底解決了MoE模型通信開銷大的行業(yè)難題。

此外,中興從互聯(lián)協(xié)議、拓?fù)?、物理形態(tài)、介質(zhì)四個(gè)維度做Scale-Up可擴(kuò)展性設(shè)計(jì),預(yù)留GPU ID標(biāo)識bit位滿足未來十萬級GPU集群尋址需求,采用線性無收斂擴(kuò)展拓?fù)浔苊馔ㄐ牌款i,以機(jī)柜為單元做模塊化設(shè)計(jì)實(shí)現(xiàn)「即插即用」擴(kuò)容,遵循「能銅盡銅,距遠(yuǎn)用光」原則兼顧傳輸效率與成本,為算力的無限擴(kuò)展提供了技術(shù)支撐。

功耗管理創(chuàng)新

液冷+高壓直流,適配高密度算力的能源需求

超節(jié)點(diǎn)的高密度GPU集成,必然帶來功耗的指數(shù)級增長,白皮書援引英偉達(dá)的數(shù)據(jù)顯示,GPU超節(jié)點(diǎn)機(jī)柜功耗已從2022年H100的50kW,提升至2025年GB300 NVL72的120-150kW,未來更將向600kW乃至兆瓦級演進(jìn),功耗與散熱問題成為高密度算力建設(shè)的必解難題。

從第三方視角來看,中興超節(jié)點(diǎn)并未簡單采用常規(guī)的散熱與供電方案,而是結(jié)合算力發(fā)展趨勢,打造了一套「前瞻布局、全維度適配」的功耗管理體系,從散熱和供電兩大維度實(shí)現(xiàn)創(chuàng)新,確保算力高效釋放的同時(shí),實(shí)現(xiàn)能效最優(yōu)。

在散熱方面,中興構(gòu)建了全維度的液冷散熱體系,兼顧當(dāng)前需求與未來趨勢:

當(dāng)前階段采用單相冷板式液冷,這一方案是目前應(yīng)用最廣泛、工程化最成熟的液冷技術(shù),市場占有率超過70%-80%,可有效支撐百千瓦級機(jī)柜的散熱需求;

針對未來單芯片功耗突破2000W的趨勢,未來規(guī)劃硅基微通道冷板和兩相冷板液冷技術(shù),硅基微通道冷板適配HBM堆疊、Chiplet等先進(jìn)封裝的高熱流密度需求,兩相冷板液冷可在低流量下實(shí)現(xiàn)超高散熱效率;

同時(shí)兼容浸沒式液冷技術(shù),為未來兆瓦級機(jī)柜的散熱需求提供解決方案。

液冷技術(shù)的全面應(yīng)用,不僅解決了高密度算力的散熱問題,更推動數(shù)據(jù)中心從「算力導(dǎo)向」向「能效導(dǎo)向」轉(zhuǎn)型,契合綠色智算的行業(yè)發(fā)展趨勢。

在供電方面,中興突破傳統(tǒng)48V/54V供電體系的物理極限,采用HVDC高壓直流供電架構(gòu),主流演進(jìn)方向?yàn)椤?00V DC和800V DC,這一設(shè)計(jì)帶來的優(yōu)勢十分突出:同等功率下,電流可降低8-16倍,銅材用量減少40%-50%,為機(jī)柜內(nèi)的計(jì)算與冷卻組件釋放關(guān)鍵空間;有效抑制傳輸熱損,整體端到端供電效率提升3%-5%,在電力成本占比30%-50%的智算中心,這一提升能帶來顯著的運(yùn)營成本節(jié)約;可輕松支撐從當(dāng)前100-150kW向250kW乃至1MW+級機(jī)柜的演進(jìn)需求;減少中間能量變換層級,從根本上緩解功率因數(shù)校正與無功功率管理壓力。

該架構(gòu)與OCP Diablo 400、英偉達(dá)800VDC等行業(yè)主流趨勢接軌,確保了供電體系的前瞻性與兼容性。

集群擴(kuò)展創(chuàng)新:Nebula Matrix集群超節(jié)點(diǎn),實(shí)現(xiàn)算力規(guī)模化平滑升級

單臺單體超節(jié)點(diǎn)的算力終究有限,面對萬億乃至十萬億參數(shù)大模型的訓(xùn)練需求,算力的規(guī)?;瘮U(kuò)展成為必然要求,而傳統(tǒng)算力集群的擴(kuò)展往往面臨性能下降、成本激增、組網(wǎng)復(fù)雜等問題。

從第三方視角來看,中興超節(jié)點(diǎn)的一大亮點(diǎn),就是構(gòu)建了「單體超節(jié)點(diǎn)-集群超節(jié)點(diǎn)」的完整擴(kuò)展體系,通過Nebula Matrix集群超節(jié)點(diǎn)實(shí)現(xiàn)算力從百卡到萬卡的平滑擴(kuò)展,既滿足了超大規(guī)模算力需求,又實(shí)現(xiàn)了性能與成本的最優(yōu)平衡。

中興Matrix集群超節(jié)點(diǎn)采用業(yè)界主流的「電交換+光互聯(lián)」技術(shù)路線,通過高性能電交換機(jī)實(shí)現(xiàn)機(jī)柜內(nèi)GPU間的互聯(lián),受銅纜傳輸距離限制,跨機(jī)柜場景則采用光纖介質(zhì)完成互聯(lián),這一路線依托電交換技術(shù)的高成熟度、高業(yè)務(wù)普適性,規(guī)避了全光交換技術(shù)門檻高、生態(tài)不完善、對業(yè)務(wù)適配要求高的問題,成為當(dāng)前大規(guī)模集群超節(jié)點(diǎn)建設(shè)的最優(yōu)選擇。

基于這一路線,中興現(xiàn)有Nebula X32單體超節(jié)點(diǎn)可靈活擴(kuò)展為Nebula Matrix X256/800集群超節(jié)點(diǎn),面向未來,依托更高密度的Nebula X128單體超節(jié)點(diǎn),更可進(jìn)一步擴(kuò)展至X8192/16384的超大規(guī)模集群,充分滿足超大規(guī)模模型訓(xùn)練的算力需求。

同時(shí),中興創(chuàng)新提出Scale-Up與Scale-Out網(wǎng)絡(luò)融合設(shè)計(jì),打破了傳統(tǒng)兩類網(wǎng)絡(luò)獨(dú)立組網(wǎng)的模式,Scale-Up網(wǎng)絡(luò)承載張量并行、專家并行等對帶寬和時(shí)延要求極高的通信流量,Scale-Out網(wǎng)絡(luò)承載數(shù)據(jù)并行、流水并行等對網(wǎng)絡(luò)性能要求相對較低的通信流量,融合后構(gòu)建統(tǒng)一的超節(jié)點(diǎn)互聯(lián)網(wǎng)絡(luò),既滿足了集群超節(jié)點(diǎn)內(nèi)部的高性能互聯(lián)需求,又適配了集群間的常規(guī)互聯(lián)需求。

白皮書的模型測算顯示,這一融合架構(gòu)相比獨(dú)立組網(wǎng)模式,能顯著降低總擁有成本(TCO),同時(shí)保障了集群部署和擴(kuò)容的平滑性,讓用戶可根據(jù)算力需求按需擴(kuò)展,真正實(shí)現(xiàn)了「算力靈活選擇,性能與成本最佳平衡」。

軟件棧創(chuàng)新

打造超節(jié)點(diǎn)「操作系統(tǒng)」,充分釋放硬件算力潛能

硬件是算力的物理基礎(chǔ),而軟件是釋放硬件算力的核心支撐,再好的硬件架構(gòu),若缺乏適配的軟件體系,也無法將物理算力轉(zhuǎn)化為實(shí)際的有效算力。

從第三方視角來看,中興超節(jié)點(diǎn)的一大設(shè)計(jì)亮點(diǎn),就是充分重視軟硬件的協(xié)同優(yōu)化,打造了一套深度協(xié)同、全棧優(yōu)化的軟件棧體系,將其定義為超節(jié)點(diǎn)的「操作系統(tǒng)」,實(shí)現(xiàn)了對硬件資源的統(tǒng)一調(diào)度、管理、優(yōu)化與監(jiān)控,確保物理層的所有創(chuàng)新都能轉(zhuǎn)化為實(shí)際的算力輸出。

這套軟件棧的創(chuàng)新體現(xiàn)在六大核心維度

一是實(shí)現(xiàn)統(tǒng)一虛擬化資源池與智能編排,將超節(jié)點(diǎn)內(nèi)的算力、內(nèi)存、存儲資源抽象池化,根據(jù)AI訓(xùn)練、推理等不同工作負(fù)載需求,動態(tài)彈性分配和隔離資源,支持多任務(wù)、多租戶環(huán)境下的共享與安全隔離;

二是做到極致通信優(yōu)化與拓?fù)涓兄ㄟ^深度優(yōu)化的通信庫和運(yùn)行時(shí)系統(tǒng),自動識別最優(yōu)數(shù)據(jù)傳輸路徑,結(jié)合計(jì)算與通信重疊、梯度壓縮等技術(shù),將通信開銷隱藏于計(jì)算過程之中,提升系統(tǒng)整體效率;

三是支持異構(gòu)計(jì)算統(tǒng)一調(diào)度與編譯器優(yōu)化,實(shí)現(xiàn)CPU/GPU/DSA等異構(gòu)單元的統(tǒng)一調(diào)度,通過算子融合、內(nèi)核生成等方式提升單卡效率與跨芯片協(xié)同效率;

四是構(gòu)建全??捎^測性與智能運(yùn)維體系,實(shí)現(xiàn)芯片-節(jié)點(diǎn)-集群的多級監(jiān)控,實(shí)時(shí)可視化功耗、溫度、性能等指標(biāo),結(jié)合AI運(yùn)維實(shí)現(xiàn)故障預(yù)測、根因分析,將故障定位時(shí)間從小時(shí)級縮短至分鐘級;

五是設(shè)置高可靠冗余機(jī)制,通過冗余算力節(jié)點(diǎn)與故障切換機(jī)制,避免單點(diǎn)故障導(dǎo)致的大模型訓(xùn)練中斷,保障業(yè)務(wù)連續(xù)性;

六是引入「算力-電力」協(xié)同的綠色調(diào)度,結(jié)合任務(wù)優(yōu)先級、功耗模型與實(shí)時(shí)電價(jià),動態(tài)調(diào)整算力調(diào)度與芯片頻率,在保障服務(wù)水平協(xié)議(SLA)的前提下,平滑功率波動,降低能耗與運(yùn)營成本。

此外,中興還打造了算力仿真平臺,為超節(jié)點(diǎn)的算力配置提供「數(shù)字孿生」推演能力,該平臺基于硬件參數(shù)、模型結(jié)構(gòu)、算子實(shí)測數(shù)據(jù),可模擬不同超節(jié)點(diǎn)形態(tài)下的訓(xùn)練/推理性能,為用戶的硬件選型、并行策略設(shè)計(jì)提供科學(xué)依據(jù)。

白皮書以Qwen3-235B模型為例,通過算力仿真平臺得出結(jié)論:在2K卡的規(guī)模下,256卡超節(jié)點(diǎn)相比8卡服務(wù)器,訓(xùn)練性能提升15%,這一結(jié)果能有效幫助用戶規(guī)避試錯(cuò)成本,實(shí)現(xiàn)算力配置的最優(yōu)選擇。


圖3 Qwen3-235B不同超節(jié)點(diǎn)形態(tài)最優(yōu)切分下各部分耗時(shí)

多維度設(shè)計(jì)

實(shí)現(xiàn)多廠家GPU兼容,打破生態(tài)鎖定

在各大廠商紛紛構(gòu)建封閉算力生態(tài)的背景下,中興超節(jié)點(diǎn)將多廠家GPU兼容作為核心創(chuàng)新點(diǎn)之一,這一設(shè)計(jì)不僅是其「繞開GPU瓶頸、另辟蹊徑」的重要體現(xiàn),更契合了行業(yè)開放、融合、創(chuàng)新的發(fā)展趨勢。

從第三方視角來看,中興超節(jié)點(diǎn)并非簡單實(shí)現(xiàn)多廠家GPU的「接入」,而是通過硬件、芯片、協(xié)議、生態(tài)、集群五個(gè)維度的系統(tǒng)化設(shè)計(jì),真正打破了單一GPU廠商的生態(tài)鎖定,為用戶提供了靈活的算力選擇,也推動了國產(chǎn)GPU生態(tài)的繁榮發(fā)展。

在硬件層,中興Nebula單體超節(jié)點(diǎn)的OEX正交架構(gòu)采用高度組件化設(shè)計(jì),將GPU適配的核心模塊獨(dú)立為UBB模組,針對不同廠家的GPU,用戶僅需更換UBB模組,無需對超節(jié)點(diǎn)的整體架構(gòu)、交換托盤、供電散熱等核心部件做任何改動,即可實(shí)現(xiàn)「即插即用」的適配,大幅降低了多廠家GPU的集成門檻。

在芯片層,自研的大容量交換芯片成為多廠家GPU兼容的硬件核心,該芯片全面兼容國內(nèi)外主流的GPU互聯(lián)協(xié)議,而目前國內(nèi)外主流GPU廠商的產(chǎn)品均已適配這些通用協(xié)議,從底層解決了多廠家GPU的通信兼容問題,打造了「一次設(shè)計(jì),多卡兼容」的通用互聯(lián)底座。

在協(xié)議層,中興不僅是現(xiàn)有互聯(lián)協(xié)議的適配者,更是行業(yè)標(biāo)準(zhǔn)的制定者,積極參與工信部牽頭的CLink協(xié)議制定,推動形成統(tǒng)一的國內(nèi)算力互聯(lián)標(biāo)準(zhǔn),同時(shí)其自研的OLink協(xié)議采用開放標(biāo)準(zhǔn)設(shè)計(jì),向行業(yè)開放協(xié)議規(guī)范,讓各GPU廠商可輕松適配。

在生態(tài)層,中興秉持「開放解耦」的理念,全面開放OEX正交架構(gòu)的機(jī)械與電氣接口規(guī)范,第三方GPU廠商只需按照該規(guī)范設(shè)計(jì)計(jì)算/交換托盤,即可實(shí)現(xiàn)與中興超節(jié)點(diǎn)的標(biāo)準(zhǔn)化接入,無需單獨(dú)定制;同時(shí),中興已于2025年6月在ODCC網(wǎng)絡(luò)工作組成功立項(xiàng)《基于正交架構(gòu)的超節(jié)點(diǎn)硬件系統(tǒng)》,推動超節(jié)點(diǎn)硬件的行業(yè)標(biāo)準(zhǔn)化,讓多廠家GPU的兼容從企業(yè)設(shè)計(jì)升級為行業(yè)規(guī)范。

在集群層,多廠家GPU的兼容能力更延伸至Nebula Matrix集群超節(jié)點(diǎn),其Scale-Up/Scale-Out融合組網(wǎng)架構(gòu)繼承了單體超節(jié)點(diǎn)的協(xié)議兼容和組件化適配能力,無論組成集群的各單體超節(jié)點(diǎn)搭載不同廠家GPU,還是同一超節(jié)點(diǎn)內(nèi)混布多品牌GPU,都能通過自研大容量交換芯片的多協(xié)議支持、融合網(wǎng)絡(luò)的統(tǒng)一調(diào)度,實(shí)現(xiàn)跨機(jī)柜、跨品牌GPU的高帶寬、低時(shí)延協(xié)同,讓多廠家GPU的規(guī)?;M網(wǎng)成為現(xiàn)實(shí)。

小結(jié)

從第三方視角對中興超節(jié)點(diǎn)技術(shù)進(jìn)行全面解讀后可以發(fā)現(xiàn),中興通訊始終圍繞「做TCO最優(yōu)算力系統(tǒng)級整合者」這一核心定位,跳出傳統(tǒng)的芯片研發(fā)競賽,從系統(tǒng)級協(xié)同架構(gòu)出發(fā),通過硬件架構(gòu)、高速互聯(lián)、功耗管理、集群擴(kuò)展、軟件棧、多廠家GPU兼容六大維度的全方位創(chuàng)新,成功繞開了單GPU芯片的性能瓶頸,拼出了AI算力的系統(tǒng)級最優(yōu)解。

這份創(chuàng)新的價(jià)值,不僅體現(xiàn)在具體的技術(shù)指標(biāo)提升上——白皮書數(shù)據(jù)顯示,MoE模型分發(fā)時(shí)延下降20%-50%、歸約時(shí)延下降40%-60%以上,更體現(xiàn)在對算力建設(shè)模式的重構(gòu)上:中興超節(jié)點(diǎn)讓算力建設(shè)從「芯片堆疊」走向「協(xié)同釋放」,從「單一硬件性能競爭」走向「全棧系統(tǒng)優(yōu)化」,并以此為核心打造了「AI工廠」,將AI開發(fā)從傳統(tǒng)的「手工作坊」升級為標(biāo)準(zhǔn)化、規(guī)?;?、自動化的「現(xiàn)代化流水線」,為AI大模型的訓(xùn)練與推理提供了高效的算力底座。

更重要的是,中興超節(jié)點(diǎn)的開放兼容設(shè)計(jì),打破了單一廠商的生態(tài)鎖定,為用戶提供了靈活的GPU選擇,推動了智算行業(yè)的開放與融合。

正如中興超節(jié)點(diǎn)技術(shù)白皮書中所言,未來算力的競爭不再是「每秒浮點(diǎn)運(yùn)算次數(shù)(FLOPS)」的競爭,而是「每瓦Token數(shù)」的競爭,中興超節(jié)點(diǎn)通過系統(tǒng)級的創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)了算力效率、擴(kuò)展能力、生態(tài)兼容性的多重最優(yōu),不僅為自身在智算行業(yè)占據(jù)了一席之地,更為整個(gè)智算行業(yè)的發(fā)展提供了全新的思路與方向。

在AI大模型持續(xù)發(fā)展的背景下,中興超節(jié)點(diǎn)技術(shù)的落地與推廣,必將為千行百業(yè)的智能化升級提供堅(jiān)實(shí)的算力支撐,推動智算基礎(chǔ)設(shè)施向更高效率、更綠色、更開放的方向演進(jìn)。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
斯諾克大冷門!世界第2出局,白雨露吳安儀進(jìn)4強(qiáng),會師決賽爭冠?

斯諾克大冷門!世界第2出局,白雨露吳安儀進(jìn)4強(qiáng),會師決賽爭冠?

劉姚堯的文字城堡
2026-03-29 19:30:55
留給伊爾汗·奧馬爾的時(shí)間不多了

留給伊爾汗·奧馬爾的時(shí)間不多了

南文視界
2026-03-29 17:35:38
斬首!伊朗高超音速導(dǎo)彈突襲迪拜:21名烏克蘭軍事專家被一鍋端

斬首!伊朗高超音速導(dǎo)彈突襲迪拜:21名烏克蘭軍事專家被一鍋端

影孖看世界
2026-03-29 20:34:28
汽柴油即將下調(diào)!3月29日92/95號汽油最新價(jià),4月7日調(diào)價(jià)窗口開啟

汽柴油即將下調(diào)!3月29日92/95號汽油最新價(jià),4月7日調(diào)價(jià)窗口開啟

沙雕小琳琳
2026-03-29 10:28:54
移動老用戶套餐變更指南:不換號也能辦理高性價(jià)比套餐

移動老用戶套餐變更指南:不換號也能辦理高性價(jià)比套餐

Thurman在昆明
2026-03-29 03:32:01
殲20總設(shè)計(jì)師被除名:頂頭上司受賄7億判死緩,事發(fā)全過程被還原

殲20總設(shè)計(jì)師被除名:頂頭上司受賄7億判死緩,事發(fā)全過程被還原

博士觀察
2026-03-28 21:02:35
躺平是不可能了!四川網(wǎng)友曬157萬存單,一年利息2.2萬,日均60元

躺平是不可能了!四川網(wǎng)友曬157萬存單,一年利息2.2萬,日均60元

火山詩話
2026-03-29 10:18:39
一位“90后”網(wǎng)約車司機(jī)之死:找工作被人設(shè)局貸款買車,為還車貸多次網(wǎng)貸,自殺身亡后家人仍接到催款電話,辱罵“把他骨灰盒寄給你”

一位“90后”網(wǎng)約車司機(jī)之死:找工作被人設(shè)局貸款買車,為還車貸多次網(wǎng)貸,自殺身亡后家人仍接到催款電話,辱罵“把他骨灰盒寄給你”

大風(fēng)新聞
2026-03-29 15:14:03
痞幼因網(wǎng)紅身份,在別墅區(qū)被鄰居集體“抵制”

痞幼因網(wǎng)紅身份,在別墅區(qū)被鄰居集體“抵制”

笑飲孤鴻非
2026-03-29 06:41:39
10萬億窟窿!比恒大更坑的民企來了,曾力壓許家印,位居第一

10萬億窟窿!比恒大更坑的民企來了,曾力壓許家印,位居第一

孤單是寂寞的毒
2026-03-04 15:38:03
佟麗婭回老家放飛自我,啃羊排沾滿臉肉汁,露虎牙一笑顏值絕美

佟麗婭回老家放飛自我,啃羊排沾滿臉肉汁,露虎牙一笑顏值絕美

看盡落塵花q
2026-03-29 17:34:43
公司不敢明說:45歲以上的員工,其實(shí)是最難辭退的

公司不敢明說:45歲以上的員工,其實(shí)是最難辭退的

中國民航人
2026-03-28 19:46:35
克雷桑聚餐遭質(zhì)疑!京媒:職業(yè)球員能喝這個(gè)?澤卡、馬德魯加在列

克雷桑聚餐遭質(zhì)疑!京媒:職業(yè)球員能喝這個(gè)?澤卡、馬德魯加在列

建哥說體育
2026-03-29 18:58:38
《逐玉》收官,演技評分出爐:張凌赫5.5分墊底,第1名毋庸置疑

《逐玉》收官,演技評分出爐:張凌赫5.5分墊底,第1名毋庸置疑

阿纂看事
2026-03-28 12:44:19
跌得最慘的五大專業(yè):從熱門王牌到天坑,名校光環(huán)都不管用!

跌得最慘的五大專業(yè):從熱門王牌到天坑,名校光環(huán)都不管用!

黯泉
2026-03-29 21:20:42
“居家打金”,這個(gè)熱鬧不湊為好 | 新京報(bào)快評

“居家打金”,這個(gè)熱鬧不湊為好 | 新京報(bào)快評

新京報(bào)
2026-03-28 21:45:03
中國游客到朝鮮游玩,朝鮮人充滿疑問:為什么中國人是這樣的?

中國游客到朝鮮游玩,朝鮮人充滿疑問:為什么中國人是這樣的?

蜉蝣說
2026-03-28 18:26:48
一人睡遍整個(gè)娛樂圈?司曉迪打響了2026年第一炮

一人睡遍整個(gè)娛樂圈?司曉迪打響了2026年第一炮

閱毒君
2026-01-05 07:05:06
突發(fā)!維斯塔潘親口承認(rèn):不等了,考慮今年就退役

突發(fā)!維斯塔潘親口承認(rèn):不等了,考慮今年就退役

體育妞世界
2026-03-29 21:46:22
不服就干!比利時(shí)打響反華第一槍,通告全球,斷的就是中方退路

不服就干!比利時(shí)打響反華第一槍,通告全球,斷的就是中方退路

夢總會實(shí)現(xiàn)的呢
2026-03-29 20:24:50
2026-03-30 00:08:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14845文章數(shù) 66720關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

中國警告美國:勿將"沖突戰(zhàn)亂"引入亞太地區(qū)

頭條要聞

中國警告美國:勿將"沖突戰(zhàn)亂"引入亞太地區(qū)

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂要聞

汪峰定律再現(xiàn)!李榮浩喊話單依純侵權(quán)

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

手機(jī)
親子
健康
公開課
軍事航空

手機(jī)要聞

蘋果重返第一,華為微弱差距屈居第二,OPPO穩(wěn)居第三!

親子要聞

夏天來了,如何給小寶寶洗澡?具體步驟如下

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美兩棲攻擊艦載3500名增援到達(dá)

無障礙瀏覽 進(jìn)入關(guān)懷版