国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

從炫技到務(wù)實(shí),超節(jié)點(diǎn)的祛魅時(shí)刻

0
分享至



DeepSeek、通義千問(wèn)、Kimi-K2等深度思考的大模型,大家應(yīng)該都用過(guò)。用戶對(duì)AI越來(lái)越上頭,企業(yè)IT對(duì)算力保障的焦慮也在加劇。過(guò)去跑個(gè)小模型,8張GPU的服務(wù)器還能應(yīng)付,可帶不動(dòng)DeepSeek這種上百個(gè)專家、毫秒級(jí)響應(yīng)的MoE架構(gòu)推理模型。

超節(jié)點(diǎn),就是在這一背景下,火起來(lái)的。

傳統(tǒng)單臺(tái)8卡服務(wù)器,無(wú)法滿足當(dāng)下大模型訓(xùn)推的算力需求。由英偉達(dá)率先提出的超節(jié)點(diǎn)技術(shù),通過(guò)內(nèi)部高速互聯(lián),把數(shù)十甚至上百個(gè)AI計(jì)算芯片,集中整合到一個(gè)架構(gòu)內(nèi),打造出基于Scale-up的新型架構(gòu),以此實(shí)現(xiàn)算力的量級(jí)躍升。核心優(yōu)勢(shì)可以用一個(gè)字概括:省。



省錢,超節(jié)點(diǎn)通過(guò)內(nèi)部高速互聯(lián),每張卡都能滿負(fù)荷運(yùn)行,避免傳統(tǒng)多機(jī)柜間的算力閑置空轉(zhuǎn),GPU卡和電費(fèi)就不會(huì)浪費(fèi)了;

省地,以前跑大模型得把多個(gè)機(jī)柜拼起來(lái),占滿半個(gè)機(jī)房,現(xiàn)在一臺(tái)超節(jié)點(diǎn)就能扛起AI訓(xùn)推任務(wù),物理空間占用更小了;

省事,超節(jié)點(diǎn)把硬件、互聯(lián)、管理系統(tǒng)全集成好了,企業(yè)接入就能跑大模型,AI部署更快,而傳統(tǒng)多臺(tái)服務(wù)器要單獨(dú)調(diào)試、搭建網(wǎng)絡(luò)、解決散熱,一套流程下來(lái),沒(méi)半年搞不定……

有不少CIO或IT從業(yè)者十分困惑,超節(jié)點(diǎn)能幫我們用AI更省,可怎么還是買不著、用不起呢?有一種“出發(fā)點(diǎn)很好,但就是出發(fā)不了”的無(wú)力感。



的確,目前真正用得上、用得起超節(jié)點(diǎn)的行業(yè)和企業(yè),并不是很多。

原因比較復(fù)雜,比如高端N卡斷供,國(guó)產(chǎn)GPU規(guī)模出貨量受限等。其中,有一個(gè)因素容易被忽視,那就是超節(jié)點(diǎn)讓AI更省的核心邏輯,似乎正在跑偏。

在超節(jié)點(diǎn)的新聞里,常能看到千卡、單柜X百卡等參數(shù)互相碾壓,媒體追捧超節(jié)點(diǎn)的新紀(jì)錄,圍觀群眾也默認(rèn),規(guī)模越大卡越多的超節(jié)點(diǎn)就越先進(jìn)。

但對(duì)大多數(shù)企業(yè)來(lái)說(shuō),真的需要這么大的算力巨獸嗎?斥巨資買回?cái)?shù)百卡的超節(jié)點(diǎn),能靠AI賺回本嗎?這些問(wèn)題,已經(jīng)到了必須回答的時(shí)刻。



不可否認(rèn),數(shù)百卡,甚至上千卡的超節(jié)點(diǎn),是國(guó)產(chǎn)智算技術(shù)進(jìn)步的證明。但大家有沒(méi)有想過(guò),我們給手機(jī)充電,會(huì)關(guān)心發(fā)電廠的規(guī)模有多大,是核電廠還是水電廠嗎?只會(huì)在乎插上有沒(méi)有電,電壓是否適配,電流是否穩(wěn)定,會(huì)不會(huì)把手機(jī)燒壞,這些實(shí)用層面的問(wèn)題。

同樣的道理,企業(yè)部署超節(jié)點(diǎn),除了集成多少卡,也要考慮到實(shí)際應(yīng)用中的隱性成本:

一是故障率升高帶來(lái)的中斷損失。

超節(jié)點(diǎn)規(guī)模越大,內(nèi)部光模塊、交換機(jī)、電源節(jié)點(diǎn)就越多,比如某300多卡的超節(jié)點(diǎn)架構(gòu),就涉及近6900個(gè)光模塊和100臺(tái)左右交換機(jī)。而在高密度部署場(chǎng)景中,任一環(huán)節(jié)故障,都可能導(dǎo)致整個(gè)訓(xùn)練任務(wù)中斷。對(duì)AI大模型訓(xùn)練來(lái)說(shuō),故障意味著要從checkpoint檢查點(diǎn)重新加載模型、重啟訓(xùn)練,浪費(fèi)數(shù)天時(shí)間和高額電費(fèi)。

對(duì)企業(yè)來(lái)說(shuō),不中斷、不重訓(xùn),比多幾張卡更加重要。



二是GPU閑置導(dǎo)致的每Token成本過(guò)高。

業(yè)內(nèi)已有共識(shí),超節(jié)點(diǎn)規(guī)模存在“甜點(diǎn)”,超過(guò)甜點(diǎn)后,繼續(xù)增加超節(jié)點(diǎn)規(guī)模,性能提升有限但成本顯著上升。有模擬數(shù)據(jù)顯示,十萬(wàn)億參數(shù)模型,甜點(diǎn)大概在32-64卡。也就是說(shuō),盲目追求上百?gòu)埧ǖ某笠?guī)模,算力利用率也許并不高,GPU大部分時(shí)間是在閑置。比如說(shuō),DeepSeek官方論文給的參考方案,Decode階段需用144張H800,如果超節(jié)點(diǎn)使用的國(guó)產(chǎn)卡算力是H800的1/3,那么在PD分離場(chǎng)景下,48卡甚至32卡才是更優(yōu)選擇。

三是運(yùn)維復(fù)雜度提升導(dǎo)致的總體TCO成本增加。

高集成度的超節(jié)點(diǎn)產(chǎn)品,對(duì)運(yùn)維團(tuán)隊(duì)的專業(yè)能力要求極高,一旦規(guī)模增大,內(nèi)部故障點(diǎn)也會(huì)隨之增多,小團(tuán)隊(duì)很難靠自己處理。比如英偉達(dá)早期就曾嘗試過(guò)二層架構(gòu)超節(jié)點(diǎn),將交換機(jī)集成到單機(jī)內(nèi)以擴(kuò)大規(guī)模,但企業(yè)客戶更傾向于選擇單層架構(gòu),核心就是為了降低故障點(diǎn)、減少運(yùn)維難度。英偉達(dá)256卡超節(jié)點(diǎn)也由于TCO總擁有成本太高,而互聯(lián)網(wǎng)企業(yè)客戶對(duì)TCO很重視,未能成功商業(yè)化。

所以,超節(jié)點(diǎn)并不是規(guī)模越大卡越多就越好。企業(yè)需要的是能解決算力問(wèn)題,且ROI投資回報(bào)率最優(yōu)的IT基礎(chǔ)設(shè)施。超節(jié)點(diǎn)技術(shù)的發(fā)展,要回歸讓企業(yè)用AI更省的出發(fā)點(diǎn),與企業(yè)AI業(yè)務(wù)相適配的方案才是最優(yōu)解。



既然堆卡不是出路,那么如何才能讓超節(jié)點(diǎn)真正成為企業(yè)的省錢利器?產(chǎn)業(yè)界已經(jīng)給出了答案:回歸理性,追求規(guī)模與需求的適配,并通過(guò)開(kāi)放生態(tài)降低綜合成本。

一方面,越來(lái)越多的廠商將目光投向32卡、64卡這樣的更合身的規(guī)模。

如前所說(shuō),超過(guò)性能-成本甜點(diǎn)區(qū)之后,超節(jié)點(diǎn)的邊際效益就會(huì)遞減。因此,大量國(guó)產(chǎn)廠商聚焦在32-64卡的實(shí)用化設(shè)計(jì),推出貼合企業(yè)需求的產(chǎn)品。比如新華三UniPoD S80000,實(shí)現(xiàn)了單機(jī)柜32/64卡高密部署等,讓多數(shù)企業(yè)能夠負(fù)擔(dān)得起大模型訓(xùn)推開(kāi)銷。而且,新華三UniPoD S80000采用單層全互聯(lián)架構(gòu),大幅降低了通信延遲和故障點(diǎn),在MoE等主流模型場(chǎng)景下,更有助于保障業(yè)務(wù)連續(xù)性。剛好的規(guī)模與更高的可靠性,成為AI算力降本增效的關(guān)鍵。



(新華三超節(jié)點(diǎn)H3C UniPoD S80000)

另一方面,開(kāi)放的硬件生態(tài)正在成為降低成本的新引擎。

隨著國(guó)產(chǎn)芯片生態(tài)成熟,開(kāi)放式架構(gòu)支持多品牌國(guó)產(chǎn)加速卡,打破海外高端卡壟斷,為用戶提供了更多選擇,從而降低企業(yè)的算力成本。這類開(kāi)放式超節(jié)點(diǎn),也成為算力普惠的關(guān)鍵。比如新華三超節(jié)點(diǎn)支持多品牌國(guó)產(chǎn)加速卡,兼容CUDA等主流軟件生態(tài),降低企業(yè)的供應(yīng)鏈成本。

上述實(shí)踐,有望助力超節(jié)點(diǎn)的普及,從頭部企業(yè)的專屬品,成為千行百業(yè)的普惠基礎(chǔ)設(shè)施。



需要說(shuō)明的是,數(shù)百卡、千卡超節(jié)點(diǎn)的研發(fā),有其戰(zhàn)略意義。這一技術(shù)路線,推動(dòng)了光互聯(lián)、液冷、高密度布線等底層技術(shù)的極限突破,是中國(guó)算力產(chǎn)業(yè)仰望星空的沖頂之路。

AI發(fā)展的速度總是超出預(yù)期,可能今天覺(jué)得32卡就夠了,但明天DeepSeek的新模型,也許內(nèi)含更多專家,超大規(guī)模的超節(jié)點(diǎn)或許可以帶來(lái)更低的每token成本。所以,適當(dāng)超前,把超節(jié)點(diǎn)規(guī)模進(jìn)一步做大,可以給后續(xù)技術(shù)迭代留下一定的冗余。

但對(duì)于更廣大的99%普通企業(yè)而言,需要的是腳踏實(shí)地的普惠之路。他們更迫切地希望,使用成本可控、穩(wěn)定可靠的超節(jié)點(diǎn)產(chǎn)品,解決當(dāng)下大模型落地的算力焦渴,支撐AI在生產(chǎn)力場(chǎng)景中落地。



所以堆卡炫技之外,這條更合身的普惠之路,同樣勢(shì)在必行,不可偏廢。

未來(lái)行業(yè)發(fā)展的理想狀態(tài),是這兩條路并行不悖。既有震撼世界的算力巨無(wú)霸,也有服務(wù)千行百業(yè)的普惠產(chǎn)品。企業(yè)無(wú)需關(guān)心超節(jié)點(diǎn)內(nèi)部有多少卡,只要插上電,AI就能跑起來(lái),也不用擔(dān)心基礎(chǔ)設(shè)施的賬單出現(xiàn)天文數(shù)字。

實(shí)現(xiàn)這一目標(biāo),只能靠智算廠商急企業(yè)之所急,將可靠性、每token成本、TCO等指標(biāo),同步納入超節(jié)點(diǎn)的研發(fā)技術(shù)路線圖。別忘了,讓企業(yè)用AI更省,才是超節(jié)點(diǎn)技術(shù)的核心價(jià)值,也是商業(yè)成功的前提。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗用血淚換來(lái)的教訓(xùn):一旦中美開(kāi)戰(zhàn),中國(guó)必須首先鎖定這一點(diǎn)

伊朗用血淚換來(lái)的教訓(xùn):一旦中美開(kāi)戰(zhàn),中國(guó)必須首先鎖定這一點(diǎn)

冷峻視角下的世界
2026-02-20 07:45:35
當(dāng)不成總統(tǒng)了?27座美軍基地被炸,美國(guó)爆發(fā)抗議,特朗普或被彈劾

當(dāng)不成總統(tǒng)了?27座美軍基地被炸,美國(guó)爆發(fā)抗議,特朗普或被彈劾

王哈哈的等風(fēng)來(lái)
2026-03-02 17:20:29
48小時(shí)送走哈梅內(nèi)伊:令人恐怖的技術(shù)代差,現(xiàn)代戰(zhàn)爭(zhēng)的形態(tài)變了

48小時(shí)送走哈梅內(nèi)伊:令人恐怖的技術(shù)代差,現(xiàn)代戰(zhàn)爭(zhēng)的形態(tài)變了

黑企鵝觀察
2026-03-01 14:40:34
外媒:美官員首次證實(shí)美海軍陸戰(zhàn)隊(duì)士兵在美駐巴基斯坦領(lǐng)事館外的抗議活動(dòng)中開(kāi)火

外媒:美官員首次證實(shí)美海軍陸戰(zhàn)隊(duì)士兵在美駐巴基斯坦領(lǐng)事館外的抗議活動(dòng)中開(kāi)火

環(huán)球網(wǎng)資訊
2026-03-03 12:01:22
你是怎么發(fā)現(xiàn)親戚見(jiàn)不得你過(guò)得好的?網(wǎng)友:我混的好他暴跳如雷

你是怎么發(fā)現(xiàn)親戚見(jiàn)不得你過(guò)得好的?網(wǎng)友:我混的好他暴跳如雷

另子維愛(ài)讀史
2026-03-01 20:08:16
華國(guó)鋒擔(dān)任中央主席時(shí),中央先后任命了15位開(kāi)國(guó)將帥輔佐他

華國(guó)鋒擔(dān)任中央主席時(shí),中央先后任命了15位開(kāi)國(guó)將帥輔佐他

雍親王府
2026-03-02 15:55:03
7月1日起,全國(guó)統(tǒng)一死亡證明!在家死亡的到哪開(kāi)?看完別跑冤枉路

7月1日起,全國(guó)統(tǒng)一死亡證明!在家死亡的到哪開(kāi)?看完別跑冤枉路

阿訊說(shuō)天下
2026-03-03 14:07:58
張紫妍被潛規(guī)則后自殺!曾同時(shí)“接待”4位客人,被玩到無(wú)法走路

張紫妍被潛規(guī)則后自殺!曾同時(shí)“接待”4位客人,被玩到無(wú)法走路

小徐講八卦
2026-02-27 14:46:01
中國(guó)幫布隆迪種水稻,沒(méi)想到種得太好,撕毀了西方國(guó)家的偽善

中國(guó)幫布隆迪種水稻,沒(méi)想到種得太好,撕毀了西方國(guó)家的偽善

民智
2026-03-03 13:38:27
馬斯克稱第二代星鏈衛(wèi)星將提供5G速度的太空互聯(lián)網(wǎng)服務(wù)

馬斯克稱第二代星鏈衛(wèi)星將提供5G速度的太空互聯(lián)網(wǎng)服務(wù)

新浪財(cái)經(jīng)
2026-03-02 13:01:49
神壇徹底崩塌!李莉被中情局盯上的謊言,該徹底戳穿了

神壇徹底崩塌!李莉被中情局盯上的謊言,該徹底戳穿了

老馬拉車莫少裝
2026-03-01 17:23:52
羅永浩不知要卸妝一年沒(méi)卸 結(jié)果長(zhǎng)了黃褐斑 現(xiàn)狀已失控

羅永浩不知要卸妝一年沒(méi)卸 結(jié)果長(zhǎng)了黃褐斑 現(xiàn)狀已失控

快科技
2026-03-02 09:27:07
靠100個(gè)車位的“睡后收入”?巴黎男子提前退休!

靠100個(gè)車位的“睡后收入”?巴黎男子提前退休!

新歐洲
2026-02-17 19:38:49
胡塞武裝、黎巴嫩真主黨和哈馬斯就哈梅內(nèi)伊遇害發(fā)聲

胡塞武裝、黎巴嫩真主黨和哈馬斯就哈梅內(nèi)伊遇害發(fā)聲

參考消息
2026-03-01 20:06:21
擺滿院子的東風(fēng)快遞,美國(guó)人看后心里踏實(shí)了:原來(lái)是這么造的

擺滿院子的東風(fēng)快遞,美國(guó)人看后心里踏實(shí)了:原來(lái)是這么造的

趣生活
2026-01-12 21:36:45
美國(guó)對(duì)中國(guó)滲透沒(méi)白費(fèi),扶持的“內(nèi)鬼”,終于開(kāi)始在中國(guó)露頭了

美國(guó)對(duì)中國(guó)滲透沒(méi)白費(fèi),扶持的“內(nèi)鬼”,終于開(kāi)始在中國(guó)露頭了

歷史求知所
2025-12-01 11:30:06
稀土是我們的,憑什么賣給臺(tái)積電,然后臺(tái)積電造好芯片賣給日本?

稀土是我們的,憑什么賣給臺(tái)積電,然后臺(tái)積電造好芯片賣給日本?

曉肂愛(ài)八卦
2026-02-27 19:10:14
迪拜機(jī)場(chǎng)再次被炸!被困女星已失聯(lián),工作室一言不發(fā),后果不敢想

迪拜機(jī)場(chǎng)再次被炸!被困女星已失聯(lián),工作室一言不發(fā),后果不敢想

樂(lè)悠悠娛樂(lè)
2026-03-03 12:50:05
成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒(méi)給他留一絲體面

成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒(méi)給他留一絲體面

星星沒(méi)有你亮
2026-02-28 20:40:21
哈登一戰(zhàn)獨(dú)創(chuàng)兩大里程碑,歷史第一神跡在望

哈登一戰(zhàn)獨(dú)創(chuàng)兩大里程碑,歷史第一神跡在望

大眼瞄世界
2026-03-02 22:57:56
2026-03-03 18:24:50
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3606文章數(shù) 167336關(guān)注度
往期回顧 全部

科技要聞

擁抱AI的"牛馬":邊提效邊自嘲"自費(fèi)"上班

頭條要聞

襲擊伊朗后 特朗普首次發(fā)表白宮講話:將不惜一切代價(jià)

頭條要聞

襲擊伊朗后 特朗普首次發(fā)表白宮講話:將不惜一切代價(jià)

體育要聞

35輪后積分-7,他們?cè)庥鍪飞献钤绲慕导?jí)

娛樂(lè)要聞

謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

財(cái)經(jīng)要聞

特朗普“不惜一切”!全球股債齊崩

汽車要聞

第一梯隊(duì)輔助駕駛加持 iCAR V27定檔3月13日上市

態(tài)度原創(chuàng)

親子
游戲
房產(chǎn)
家居
軍事航空

親子要聞

萌娃竟想當(dāng)爸爸?童言童語(yǔ)惹爸爸媽媽爆笑

KONAMI Digital Entertainment確認(rèn)成為 2026 年世界棒球經(jīng)典賽?贊助商

房產(chǎn)要聞

突發(fā)!綠城接手海南440畝閑置大盤!

家居要聞

萬(wàn)物互聯(lián) 享科技福祉

軍事要聞

伊朗:擊中美空軍基地大樓

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版