国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

從炫技到務實,超節(jié)點的祛魅時刻

0
分享至



DeepSeek、通義千問、Kimi-K2等深度思考的大模型,大家應該都用過。用戶對AI越來越上頭,企業(yè)IT對算力保障的焦慮也在加劇。過去跑個小模型,8張GPU的服務器還能應付,可帶不動DeepSeek這種上百個專家、毫秒級響應的MoE架構推理模型。

超節(jié)點,就是在這一背景下,火起來的。

傳統(tǒng)單臺8卡服務器,無法滿足當下大模型訓推的算力需求。由英偉達率先提出的超節(jié)點技術,通過內部高速互聯,把數十甚至上百個AI計算芯片,集中整合到一個架構內,打造出基于Scale-up的新型架構,以此實現算力的量級躍升。核心優(yōu)勢可以用一個字概括:省。



省錢,超節(jié)點通過內部高速互聯,每張卡都能滿負荷運行,避免傳統(tǒng)多機柜間的算力閑置空轉,GPU卡和電費就不會浪費了;

省地,以前跑大模型得把多個機柜拼起來,占滿半個機房,現在一臺超節(jié)點就能扛起AI訓推任務,物理空間占用更小了;

省事,超節(jié)點把硬件、互聯、管理系統(tǒng)全集成好了,企業(yè)接入就能跑大模型,AI部署更快,而傳統(tǒng)多臺服務器要單獨調試、搭建網絡、解決散熱,一套流程下來,沒半年搞不定……

有不少CIO或IT從業(yè)者十分困惑,超節(jié)點能幫我們用AI更省,可怎么還是買不著、用不起呢?有一種“出發(fā)點很好,但就是出發(fā)不了”的無力感。



的確,目前真正用得上、用得起超節(jié)點的行業(yè)和企業(yè),并不是很多。

原因比較復雜,比如高端N卡斷供,國產GPU規(guī)模出貨量受限等。其中,有一個因素容易被忽視,那就是超節(jié)點讓AI更省的核心邏輯,似乎正在跑偏。

在超節(jié)點的新聞里,常能看到千卡、單柜X百卡等參數互相碾壓,媒體追捧超節(jié)點的新紀錄,圍觀群眾也默認,規(guī)模越大卡越多的超節(jié)點就越先進。

但對大多數企業(yè)來說,真的需要這么大的算力巨獸嗎?斥巨資買回數百卡的超節(jié)點,能靠AI賺回本嗎?這些問題,已經到了必須回答的時刻。



不可否認,數百卡,甚至上千卡的超節(jié)點,是國產智算技術進步的證明。但大家有沒有想過,我們給手機充電,會關心發(fā)電廠的規(guī)模有多大,是核電廠還是水電廠嗎?只會在乎插上有沒有電,電壓是否適配,電流是否穩(wěn)定,會不會把手機燒壞,這些實用層面的問題。

同樣的道理,企業(yè)部署超節(jié)點,除了集成多少卡,也要考慮到實際應用中的隱性成本:

一是故障率升高帶來的中斷損失。

超節(jié)點規(guī)模越大,內部光模塊、交換機、電源節(jié)點就越多,比如某300多卡的超節(jié)點架構,就涉及近6900個光模塊和100臺左右交換機。而在高密度部署場景中,任一環(huán)節(jié)故障,都可能導致整個訓練任務中斷。對AI大模型訓練來說,故障意味著要從checkpoint檢查點重新加載模型、重啟訓練,浪費數天時間和高額電費。

對企業(yè)來說,不中斷、不重訓,比多幾張卡更加重要。



二是GPU閑置導致的每Token成本過高。

業(yè)內已有共識,超節(jié)點規(guī)模存在“甜點”,超過甜點后,繼續(xù)增加超節(jié)點規(guī)模,性能提升有限但成本顯著上升。有模擬數據顯示,十萬億參數模型,甜點大概在32-64卡。也就是說,盲目追求上百張卡的超大規(guī)模,算力利用率也許并不高,GPU大部分時間是在閑置。比如說,DeepSeek官方論文給的參考方案,Decode階段需用144張H800,如果超節(jié)點使用的國產卡算力是H800的1/3,那么在PD分離場景下,48卡甚至32卡才是更優(yōu)選擇。

三是運維復雜度提升導致的總體TCO成本增加。

高集成度的超節(jié)點產品,對運維團隊的專業(yè)能力要求極高,一旦規(guī)模增大,內部故障點也會隨之增多,小團隊很難靠自己處理。比如英偉達早期就曾嘗試過二層架構超節(jié)點,將交換機集成到單機內以擴大規(guī)模,但企業(yè)客戶更傾向于選擇單層架構,核心就是為了降低故障點、減少運維難度。英偉達256卡超節(jié)點也由于TCO總擁有成本太高,而互聯網企業(yè)客戶對TCO很重視,未能成功商業(yè)化。

所以,超節(jié)點并不是規(guī)模越大卡越多就越好。企業(yè)需要的是能解決算力問題,且ROI投資回報率最優(yōu)的IT基礎設施。超節(jié)點技術的發(fā)展,要回歸讓企業(yè)用AI更省的出發(fā)點,與企業(yè)AI業(yè)務相適配的方案才是最優(yōu)解。



既然堆卡不是出路,那么如何才能讓超節(jié)點真正成為企業(yè)的省錢利器?產業(yè)界已經給出了答案:回歸理性,追求規(guī)模與需求的適配,并通過開放生態(tài)降低綜合成本。

一方面,越來越多的廠商將目光投向32卡、64卡這樣的更合身的規(guī)模。

如前所說,超過性能-成本甜點區(qū)之后,超節(jié)點的邊際效益就會遞減。因此,大量國產廠商聚焦在32-64卡的實用化設計,推出貼合企業(yè)需求的產品。比如新華三UniPoD S80000,實現了單機柜32/64卡高密部署等,讓多數企業(yè)能夠負擔得起大模型訓推開銷。而且,新華三UniPoD S80000采用單層全互聯架構,大幅降低了通信延遲和故障點,在MoE等主流模型場景下,更有助于保障業(yè)務連續(xù)性。剛好的規(guī)模與更高的可靠性,成為AI算力降本增效的關鍵。



(新華三超節(jié)點H3C UniPoD S80000)

另一方面,開放的硬件生態(tài)正在成為降低成本的新引擎。

隨著國產芯片生態(tài)成熟,開放式架構支持多品牌國產加速卡,打破海外高端卡壟斷,為用戶提供了更多選擇,從而降低企業(yè)的算力成本。這類開放式超節(jié)點,也成為算力普惠的關鍵。比如新華三超節(jié)點支持多品牌國產加速卡,兼容CUDA等主流軟件生態(tài),降低企業(yè)的供應鏈成本。

上述實踐,有望助力超節(jié)點的普及,從頭部企業(yè)的專屬品,成為千行百業(yè)的普惠基礎設施。



需要說明的是,數百卡、千卡超節(jié)點的研發(fā),有其戰(zhàn)略意義。這一技術路線,推動了光互聯、液冷、高密度布線等底層技術的極限突破,是中國算力產業(yè)仰望星空的沖頂之路。

AI發(fā)展的速度總是超出預期,可能今天覺得32卡就夠了,但明天DeepSeek的新模型,也許內含更多專家,超大規(guī)模的超節(jié)點或許可以帶來更低的每token成本。所以,適當超前,把超節(jié)點規(guī)模進一步做大,可以給后續(xù)技術迭代留下一定的冗余。

但對于更廣大的99%普通企業(yè)而言,需要的是腳踏實地的普惠之路。他們更迫切地希望,使用成本可控、穩(wěn)定可靠的超節(jié)點產品,解決當下大模型落地的算力焦渴,支撐AI在生產力場景中落地。



所以堆卡炫技之外,這條更合身的普惠之路,同樣勢在必行,不可偏廢。

未來行業(yè)發(fā)展的理想狀態(tài),是這兩條路并行不悖。既有震撼世界的算力巨無霸,也有服務千行百業(yè)的普惠產品。企業(yè)無需關心超節(jié)點內部有多少卡,只要插上電,AI就能跑起來,也不用擔心基礎設施的賬單出現天文數字。

實現這一目標,只能靠智算廠商急企業(yè)之所急,將可靠性、每token成本、TCO等指標,同步納入超節(jié)點的研發(fā)技術路線圖。別忘了,讓企業(yè)用AI更省,才是超節(jié)點技術的核心價值,也是商業(yè)成功的前提。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
擔憂!美軍3小時生擒馬杜羅,中國620億投資恐清零,能源安全告急

擔憂!美軍3小時生擒馬杜羅,中國620億投資恐清零,能源安全告急

社會日日鮮
2026-01-04 06:49:52
中方可效仿美國進臺島抓捕賴清德?可分三步走!性質有根本區(qū)別

中方可效仿美國進臺島抓捕賴清德?可分三步走!性質有根本區(qū)別

歷史有些冷
2026-01-04 18:40:03
廣州這件新聞,不該讓最底層的人承擔代價!

廣州這件新聞,不該讓最底層的人承擔代價!

胖胖說他不胖
2026-01-05 09:55:08
高市早苗被批用“空話”回應美方襲擊委內瑞拉,日本政府“雙標”受政界輿論痛批

高市早苗被批用“空話”回應美方襲擊委內瑞拉,日本政府“雙標”受政界輿論痛批

環(huán)球網資訊
2026-01-05 16:37:34
韓國又開始用半導體來訛詐全世界了,將HBM4價格上調逾50%

韓國又開始用半導體來訛詐全世界了,將HBM4價格上調逾50%

爆角追蹤
2026-01-05 17:47:54
美委兩國曾秘密談判 美抓捕馬杜羅可能事與愿違

美委兩國曾秘密談判 美抓捕馬杜羅可能事與愿違

紅星新聞
2026-01-05 19:11:25
中國是否會繼續(xù)進口委內瑞拉石油?外交部回應

中國是否會繼續(xù)進口委內瑞拉石油?外交部回應

澎湃新聞
2026-01-05 16:06:45
司曉迪瘋狂開大!自曝睡過鹿晗、林更新、檀健次,關曉彤受牽連

司曉迪瘋狂開大!自曝睡過鹿晗、林更新、檀健次,關曉彤受牽連

葉公子
2026-01-03 13:00:17
王石的體面,被田樸珺扯得干干凈凈

王石的體面,被田樸珺扯得干干凈凈

言叔財經視角
2026-01-05 13:50:10
2026年煙草新規(guī)來了!10元香煙停售,漲價對煙民影響有多大?

2026年煙草新規(guī)來了!10元香煙停售,漲價對煙民影響有多大?

復轉這些年
2026-01-05 15:24:02
別墅搜出23件國寶,全家集體失聯!徐湖平案落幕,17年舉報有結果

別墅搜出23件國寶,全家集體失聯!徐湖平案落幕,17年舉報有結果

詩意世界
2026-01-03 15:19:25
格陵蘭島總理回應特朗普:“夠了”

格陵蘭島總理回應特朗普:“夠了”

新華社
2026-01-05 18:45:04
1-0!中國隊絕殺贏球,國產C羅65米吊射絕殺,對手耍賴輸球丟臉

1-0!中國隊絕殺贏球,國產C羅65米吊射絕殺,對手耍賴輸球丟臉

籃球看比賽
2026-01-05 11:19:17
西班牙為何與拉美多國聯合聲討美國?這個歐洲國家頻頻對美國說“不”,多次硬剛特朗普

西班牙為何與拉美多國聯合聲討美國?這個歐洲國家頻頻對美國說“不”,多次硬剛特朗普

極目新聞
2026-01-05 11:28:53
滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

查爾菲的筆記
2026-01-04 13:13:57
控制馬杜羅后,特朗普與馬斯克共進晚餐 馬斯克:2026將是精彩的一年

控制馬杜羅后,特朗普與馬斯克共進晚餐 馬斯克:2026將是精彩的一年

紅星新聞
2026-01-05 18:18:14
馬杜羅被抓全過程披露:8名線人,包括總統(tǒng)衛(wèi)隊中校

馬杜羅被抓全過程披露:8名線人,包括總統(tǒng)衛(wèi)隊中校

貿易夜航
2026-01-04 10:18:58
女子柜臺取到15萬假鈔,柜員矢口否認,女子一句話讓柜員原地認錯

女子柜臺取到15萬假鈔,柜員矢口否認,女子一句話讓柜員原地認錯

紙鳶奇譚
2025-12-08 13:52:38
馬杜羅之子號召支持者上街抗議美國入侵行徑

馬杜羅之子號召支持者上街抗議美國入侵行徑

新華社
2026-01-05 13:39:44
沉默13小時,中方通告美政府,不準羈押馬杜羅,鄭麗文道破玄機

沉默13小時,中方通告美政府,不準羈押馬杜羅,鄭麗文道破玄機

博覽歷史
2026-01-04 18:45:01
2026-01-05 21:04:49
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3561文章數 167258關注度
往期回顧 全部

科技要聞

4100家科技企業(yè)集結賭城,CES揭開AI新戰(zhàn)場

頭條要聞

美對委動手致歐盟立場分裂 兩元首先后發(fā)文內容南轅北轍

頭條要聞

美對委動手致歐盟立場分裂 兩元首先后發(fā)文內容南轅北轍

體育要聞

41歲詹皇26+10+6又迎里程碑 湖媒贊GOAT

娛樂要聞

《探索新境2》王一博挑戰(zhàn)酋長巖

財經要聞

丁一凡:中美進入相對穩(wěn)定的競爭共存期

汽車要聞

海獅06EV冬季續(xù)航挑戰(zhàn) "電"這事比亞迪絕對玩明白了

態(tài)度原創(chuàng)

教育
藝術
健康
房產
家居

教育要聞

富養(yǎng)孩子的最好方式:藏

藝術要聞

19幅 列賓美院學生優(yōu)秀畢業(yè)作品

這些新療法,讓化療不再那么痛苦

房產要聞

再次登頂海南樓市!超越阿那亞的,只有阿那亞!

家居要聞

白色大理石 奢華現代

無障礙瀏覽 進入關懷版