国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Rubin CPX引出的產(chǎn)業(yè)真相:Scale Out網(wǎng)絡(luò)是AI集群不可或缺底座

0
分享至

文/黃海峰的通信生活

當下在AI領(lǐng)域,大規(guī)模輸入數(shù)據(jù)進行高效、低成本處理的問題,成為關(guān)注熱點。AI大模型處理百萬行代碼、生成小時級視頻等長上下文任務(wù)時,算力需求與成本壓力呈指數(shù)級增長。這導致計算基礎(chǔ)設(shè)施面臨性能瓶頸與性價比失衡的雙重挑戰(zhàn)。

行業(yè)如何應(yīng)對挑戰(zhàn)?網(wǎng)絡(luò)作為連接計算節(jié)點的關(guān)鍵紐帶,是解決該挑戰(zhàn)的關(guān)鍵,且正站在Scale Out(橫向擴展,指增加服務(wù)器節(jié)點,構(gòu)成分布式架構(gòu))與Scale Up(縱向擴展,指增強單個服務(wù)器系統(tǒng)資源)兩條路線的十字路口。

然而,我們看到AI基礎(chǔ)設(shè)施巨頭給出了不一樣的答案。近日,英偉達Rubin CPX系列GPU以“百萬級令牌上下文處理”和“30至50倍投資回報”的亮眼數(shù)據(jù)亮相,宣告專為長上下文推理優(yōu)化的新路徑:它果斷取消Scale Up設(shè)計,直言行業(yè)已從“唯性能論”轉(zhuǎn)向“性價比最優(yōu)解”。

這讓不少人好奇,當下不是有觀點認為,超節(jié)點發(fā)展迅猛,Scale Up依靠提升單節(jié)點硬件性能(如增加顯存、算力),可以應(yīng)對長上下文任務(wù),或成發(fā)展方向,甚至將替代Scale Out。

英偉達這是反其道而行之,還是說行業(yè)走向異構(gòu)集群時Scale Up已無價值?Scale Out與Scale Up難道注定就是“非此即彼”的關(guān)系?



撥開技術(shù)迷霧,我們不難發(fā)現(xiàn),隨著異構(gòu)集群逐漸成為未來AI基礎(chǔ)設(shè)施的主流形態(tài),Scale Out網(wǎng)絡(luò)絕非可被替代的“備選方案”,而是支撐整個AI集群運轉(zhuǎn)的“通信底座”,與Scale Up網(wǎng)絡(luò)更將形成相輔相成的協(xié)同關(guān)系,與Scale Up攜手發(fā)展才是正確方向。

從性能崇拜到性價比為王:Rubin CPX折射智算產(chǎn)業(yè)新趨勢

縱觀AI智算產(chǎn)業(yè)的發(fā)展歷程,其本質(zhì)上是計算資源從集中到分布式,再到精準分工的演進史。早期AI任務(wù)依賴單卡單服務(wù)器即可完成,網(wǎng)絡(luò)僅需承擔基礎(chǔ)的數(shù)據(jù)傳輸功能。



隨著深度學習模型參數(shù)從百萬級躍升至萬億級,單節(jié)點算力捉襟見肘,服務(wù)器集群成為主流。此時,網(wǎng)絡(luò)開始需要支撐多節(jié)點間的協(xié)同計算。

而超節(jié)點架構(gòu)的出現(xiàn),通過在單一機架內(nèi)集成數(shù)十甚至上百塊GPU,將計算密度推向新高度。比如英偉達推出的GB200 NVL72超節(jié)點,由72張英偉達GB200 GPU互聯(lián)組成。在采用同樣GPU的情況下,相比于把8卡服務(wù)器通過網(wǎng)絡(luò)互連的傳統(tǒng)方式,NVL72這個超節(jié)點的吞吐量可以比非超節(jié)點提升3倍以上。

但隨著超節(jié)點內(nèi)GPU數(shù)量激增,節(jié)點內(nèi)部的互聯(lián)網(wǎng)絡(luò)帶寬與時延性能,成為制約單節(jié)點計算效率的關(guān)鍵瓶頸。

英偉達Rubin CPX系列的發(fā)布,標志著產(chǎn)業(yè)進入“精準優(yōu)化”的新階段。與追求全能性能的傳統(tǒng)GPU不同,Rubin CPX采用成本高效的單片晶圓設(shè)計,集成128GB GDDR7顯存與專用視頻編解碼硬件,在長上下文推理場景中實現(xiàn)3倍于GB300 NVL72的注意力機制加速,單機架即可提供8 exaFLOPS的NVFP4計算能力。

更關(guān)鍵的是,Rubin CPX通過“分解式基礎(chǔ)設(shè)施”理念,將計算與內(nèi)存資源高效分配,其1億美元資本支出可帶來高達50億美元收入,徹底打破了“高性能必然高成本”的固有認知。

這種變革背后,折射出產(chǎn)業(yè)對AI全生命周期成本的深刻反思。訓練階段需要處理PB級數(shù)據(jù)與萬億次參數(shù)更新,推理階段則面臨高并發(fā)、低延遲的實時響應(yīng)需求,單一架構(gòu)難以適配全場景需求。

筆者認為,Rubin CPX的出現(xiàn),不僅以“分解式基礎(chǔ)設(shè)施”理念和場景化硬件設(shè)計,直觀證明行業(yè)已跳出“一味追求高性能”的誤區(qū),更印證了“聚焦最優(yōu)性價比”的發(fā)展新趨勢。

這一變化表明,通過硬件專業(yè)化分工與資源精準匹配,實現(xiàn)性價比最優(yōu)已成為行業(yè)共識。這種異構(gòu)化、分工化的架構(gòu)趨勢,正從根本上重塑網(wǎng)絡(luò)的角色定位。

網(wǎng)絡(luò)演進的雙軌制:Scale Out與Scale Up是協(xié)同而非替代

計算側(cè)的架構(gòu)變革必然驅(qū)動網(wǎng)絡(luò)技術(shù)同步演進。早期,AI訓練需要“十萬級GPU一起干活”,計算任務(wù)像城市里分散在各個區(qū)域的人流,對網(wǎng)絡(luò)的“覆蓋廣度”和“節(jié)點連接能力”要求陡增。

此時,Scale Out網(wǎng)絡(luò)以“集團軍”模式登場。它就像城市里的普通交通路網(wǎng),不依賴單條“主干道”,而是通過增加道路條數(shù)(即網(wǎng)絡(luò)設(shè)備數(shù)量)來提升整體通行能力,就算某幾條路臨時擁堵,整個交通系統(tǒng)依然能正常運轉(zhuǎn)。

在AI訓練中,Scale Out網(wǎng)絡(luò)依靠優(yōu)化,將數(shù)據(jù)并行(DP)、模型并行(TP)等技術(shù)所需的“十萬級GPU大軍”連接起來,確保All-Reduce等關(guān)鍵指令高效傳達。

這種網(wǎng)絡(luò)的核心優(yōu)勢很明顯,就像不斷拓寬路網(wǎng)一樣,加幾臺中低端設(shè)備就能讓集群規(guī)?!熬€性擴張”,成本不高還靈活,完美適配訓練階段“人多力量大”“規(guī)模決定效率”的需求。

可隨著AI技術(shù)深入,推理等場景對網(wǎng)絡(luò)的要求變了,需要數(shù)據(jù)“分秒必達”。這就對帶寬和時延的要求嚴苛到“微秒級”。這時,Scale Up 網(wǎng)絡(luò)以“特種部隊”模式橫空出世。

它不像 Scale Out那樣的“人海戰(zhàn)術(shù)”,而是專注升級“單個精英設(shè)備”的能力。這就好比為城市打造專屬“快車道”,不僅把車道從“雙向兩車道”(10G 帶寬)拓寬到“雙向十車道”(100G、400G 帶寬),還優(yōu)化信號系統(tǒng)(硬件加速技術(shù)),讓車輛(數(shù)據(jù))通行時延降到微秒級。

筆者認為,兩者的本質(zhì)差異決定了其適配場景的互補性。從技術(shù)特性看,Scale Out以“廣度”取勝,可擴展性強、成本低。Scale Up以“深度”見長,性能突出、架構(gòu)簡單但擴展受限且成本高昂。

從應(yīng)用場景看,Scale up是訓練階段及推理decode階段的重要支撐,負責連接海量GPU 節(jié)點完成大規(guī)模并行計算;Scale Out則更適合推理prefill階段的高性價比需求。英偉達本次發(fā)布的CPX系列就是針對推理prefill階段的高性價比,取消scale up。這種針對特定場景的取舍,并不能印證兩者誰更有價值。

當談及兩種網(wǎng)絡(luò)模式,我們就不得不提業(yè)界廣為流傳的“Scale Up會取代Scale Out”的觀點。

在筆者看來,這種觀點如同在談及“城市交通”時,只認為城市需要快車道,不需要普通路網(wǎng)。這顯然不全面。

從技術(shù)特性看,Scale Out是“廣度選手”,像普通路網(wǎng)一樣覆蓋廣、能容下大量節(jié)點;Scale Up是“深度選手”,像快車道一樣速度快、性能強,但能覆蓋的范圍有限,成本也高。

此時再看兩者關(guān)系,大家自然很容易發(fā)現(xiàn)二者根本不是“替代關(guān)系”,而是“搭檔關(guān)系”。



比如英偉達Vera Rubin NVL144 Rubin CPX機架,就像一座規(guī)劃合理的“交通樞紐”,用Scale Out鋪好“普通路網(wǎng)”,讓大量服務(wù)器能順暢連接,再靠Scale Up建“快車道”,讓核心節(jié)點的數(shù)據(jù)能高速傳輸,兩者缺一不可。

未來,隨著計算側(cè)需求越來越精細,這兩種網(wǎng)絡(luò)會繼續(xù)各司其職,Scale Out當“大管家”,管好AI訓練的“大規(guī)模連接”;Scale Up當“急先鋒”,滿足AI推理對數(shù)據(jù)低時延的需求。

所以,我們可以肯定的是,兩種網(wǎng)絡(luò)攜手,可以將網(wǎng)絡(luò)架構(gòu)打造成更高效的“交通系統(tǒng)”,而不是走向“非此即彼”的死胡同。

產(chǎn)業(yè)共識下的底座價值:Scale Out網(wǎng)絡(luò)不可替代

隨著異構(gòu)集群成為AI基礎(chǔ)設(shè)施的主流形態(tài),Scale Out網(wǎng)絡(luò)的底座地位愈發(fā)穩(wěn)固。無論是技術(shù)特性與架構(gòu)需求的匹配度,還是全球廠商的戰(zhàn)略布局,都印證了其無法被Scale Up網(wǎng)絡(luò)替代的核心價值。

首先,從技術(shù)本質(zhì)看,異構(gòu)集群的分布式特性與Scale Out網(wǎng)絡(luò)天然契合。異構(gòu)集群通過CPU、GPU、DPU等不同硬件的分工協(xié)作實現(xiàn)效率最優(yōu),這種架構(gòu)要求網(wǎng)絡(luò)必須具備靈活連接、負載均衡與故障冗余能力。

Scale Out網(wǎng)絡(luò)的分布式架構(gòu)恰好滿足這些需求。其通過動態(tài)路由技術(shù)可實現(xiàn)計算節(jié)點的靈活組網(wǎng),通過負載分擔機制避免單點壓力過大,通過多路徑冗余確保某一設(shè)備故障時業(yè)務(wù)不中斷。

相比之下,Scale Up網(wǎng)絡(luò)依賴單節(jié)點性能提升,一旦核心設(shè)備出現(xiàn)故障,可能導致整個子集群癱瘓,難以適配異構(gòu)集群的可靠性要求。

其次,從廠商實踐看,全球主流玩家均將Scale Out網(wǎng)絡(luò)作為戰(zhàn)略核心。英偉達在推廣Rubin CPX的同時,同步強化Spectrum-X以太網(wǎng)的Scale Out能力,通過ConnectX-9 SuperNIC與Dynamo平臺編排,實現(xiàn)百萬級GPU集群的高效互聯(lián)。

Mellanox的InfiniBand網(wǎng)絡(luò)雖以高性能著稱,但仍通過Fat-Tree等拓撲結(jié)構(gòu)強化Scale Out擴展能力。

再將視線轉(zhuǎn)回國內(nèi),華為推出CloudEngine XH系列交換機,通過iMaster NCE智能管理系統(tǒng)實現(xiàn)萬級節(jié)點的Scale Out部署。

我們不難發(fā)現(xiàn),這些布局共同印證了一個結(jié)論,Scale Out網(wǎng)絡(luò)是構(gòu)建大規(guī)模AI集群的基礎(chǔ)前提。

最后,從成本效益看,Scale Out網(wǎng)絡(luò)是平衡性能與成本的最優(yōu)解。AI產(chǎn)業(yè)的爆發(fā)式增長帶來算力需求的指數(shù)級提升,單純依賴Scale Up網(wǎng)絡(luò)的高端設(shè)備升級,將導致成本隨規(guī)模呈幾何級增長 。

Scale Out網(wǎng)絡(luò)通過標準化以太網(wǎng)設(shè)備與分布式架構(gòu),實現(xiàn)“按需擴展、線性成本”,在支撐集群規(guī)模從千級向萬級跨越的同時,將單位算力的網(wǎng)絡(luò)成本降低60%以上。對于追求性價比的AI企業(yè)而言,Scale Out網(wǎng)絡(luò)的成本優(yōu)勢使其成為無法替代的選擇。

筆者觀察:攜手同行,才能把握AI時代新機遇

如今,AI智算產(chǎn)業(yè)正站在從“規(guī)模擴張”向“質(zhì)量提升”轉(zhuǎn)型的關(guān)鍵節(jié)點,英偉達Rubin CPX的發(fā)布只是這場變革的縮影。

在異構(gòu)集群成為主流的未來,Scale Out網(wǎng)絡(luò)將如同城市的基礎(chǔ)設(shè)施路網(wǎng),支撐起整個AI生態(tài)的高效運轉(zhuǎn),而Scale Up網(wǎng)絡(luò)則如同專屬快車道,為關(guān)鍵場景提供性能加速。兩者的協(xié)同共存將是網(wǎng)絡(luò)架構(gòu)的必然選擇。

產(chǎn)業(yè)需要明確的是,Scale Out網(wǎng)絡(luò)作為通信底座的核心地位,始終不可或缺。對于AI從業(yè)者而言,認清這一趨勢,才能在基礎(chǔ)設(shè)施建設(shè)中實現(xiàn)性能與成本的最優(yōu)平衡,把握AI產(chǎn)業(yè)的下一波機遇。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
臺灣公開蔣介石親筆手令,均為電報原稿,全是“對日不抵抗”命令

臺灣公開蔣介石親筆手令,均為電報原稿,全是“對日不抵抗”命令

老簿尾聲體育解說
2025-12-30 08:23:29
能插存儲卡、帶耳機口、可拆后蓋,剛公布這新機有點意思!

能插存儲卡、帶耳機口、可拆后蓋,剛公布這新機有點意思!

劉奔跑
2026-01-03 14:26:40
烏軍傳奇少將再立戰(zhàn)功!從馬里烏波爾到庫皮揚斯克的堅守與反擊

烏軍傳奇少將再立戰(zhàn)功!從馬里烏波爾到庫皮揚斯克的堅守與反擊

老馬拉車莫少裝
2025-12-13 11:31:31
中國科學院院士警告稱,中國論文熱潮可能是一場“虛假繁榮”

中國科學院院士警告稱,中國論文熱潮可能是一場“虛假繁榮”

心中的麥田
2026-01-04 18:32:28
曼聯(lián)新帥5大候選曝光 哈維主動請纓 水晶宮主帥今夏或攜3愛將來投

曼聯(lián)新帥5大候選曝光 哈維主動請纓 水晶宮主帥今夏或攜3愛將來投

我愛英超
2026-01-05 22:27:26
神了!劉慈欣在《三體》準確預言美國入侵委內(nèi)瑞拉,比實際發(fā)生早了18年

神了!劉慈欣在《三體》準確預言美國入侵委內(nèi)瑞拉,比實際發(fā)生早了18年

三言四拍
2026-01-05 10:56:24
這和“真空”有啥區(qū)別,章子怡大膽穿衣,卻沒贏過保守的蔣勤勤

這和“真空”有啥區(qū)別,章子怡大膽穿衣,卻沒贏過保守的蔣勤勤

黃小仙的搞笑視頻
2025-12-27 16:10:37
國乒重組風云:王勵勤改革大膽,馬琳接棒主帥,李隼退位背后玄機

國乒重組風云:王勵勤改革大膽,馬琳接棒主帥,李隼退位背后玄機

卿子書
2026-01-06 11:26:11
1月6日人民幣對美元中間價調(diào)升57個基點

1月6日人民幣對美元中間價調(diào)升57個基點

證券時報
2026-01-06 09:43:04
一人來滿盤活?坎塞洛回巴薩兩全其美 只有國米受傷的世界達成了

一人來滿盤活?坎塞洛回巴薩兩全其美 只有國米受傷的世界達成了

雪狼侃體育
2026-01-06 12:35:35
鬧大了,公司員工集體大罷工!

鬧大了,公司員工集體大罷工!

黯泉
2026-01-05 22:05:37
腳是心梗的放大鏡?忠告:腳部出現(xiàn)這幾種表現(xiàn),要盡快就醫(yī)!

腳是心梗的放大鏡?忠告:腳部出現(xiàn)這幾種表現(xiàn),要盡快就醫(yī)!

岐黃傳人孫大夫
2025-12-25 09:56:07
江蘇大一女生開養(yǎng)老院,無人入住卻有近400名客戶,員工全是60后

江蘇大一女生開養(yǎng)老院,無人入住卻有近400名客戶,員工全是60后

好笑娛樂君每一天
2026-01-05 16:38:50
銅價一噸超10萬!“鋁代銅”,一臺空調(diào)成本省300多元,董明珠、雷軍為何不用?

銅價一噸超10萬!“鋁代銅”,一臺空調(diào)成本省300多元,董明珠、雷軍為何不用?

時代周報
2026-01-05 18:02:13
1分鐘了解委內(nèi)瑞拉

1分鐘了解委內(nèi)瑞拉

混知
2026-01-06 12:09:14
網(wǎng)傳2.0T大眾新邁騰,只要12.99萬了?

網(wǎng)傳2.0T大眾新邁騰,只要12.99萬了?

米粒說車唯一呀
2026-01-05 14:32:17
27歲王鶴棣素顏出鏡頭頂一大片白頭發(fā),比黃曉明嚴重,仍不愿休息

27歲王鶴棣素顏出鏡頭頂一大片白頭發(fā),比黃曉明嚴重,仍不愿休息

心靜物娛
2026-01-05 10:31:38
土葬火葬別再吵!2026 年殯葬改革新規(guī)落地,農(nóng)民到底買不買賬?

土葬火葬別再吵!2026 年殯葬改革新規(guī)落地,農(nóng)民到底買不買賬?

老特有話說
2026-01-05 18:18:59
敢運就沒收!中國海警出擊,實戰(zhàn)登船臨檢,徹底切斷美臺軍售?

敢運就沒收!中國海警出擊,實戰(zhàn)登船臨檢,徹底切斷美臺軍售?

東方點兵
2026-01-04 14:15:54
不少老人寧愿挨凍也不敢開暖氣,讓人痛心!河北農(nóng)村取暖問題,不能再耽擱了

不少老人寧愿挨凍也不敢開暖氣,讓人痛心!河北農(nóng)村取暖問題,不能再耽擱了

每日經(jīng)濟新聞
2026-01-06 00:38:46
2026-01-06 12:52:49
黃海峰 incentive-icons
黃海峰
關(guān)注通信、終端、IT
2248文章數(shù) 990關(guān)注度
往期回顧 全部

科技要聞

速看!黃仁勛萬字實錄:甩出"物理AI"王牌

頭條要聞

鄧紫棋的科幻小說"入圍"銀河獎引熱議 其副業(yè)不只寫作

頭條要聞

鄧紫棋的科幻小說"入圍"銀河獎引熱議 其副業(yè)不只寫作

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強喬治

娛樂要聞

朱媛媛遺作《小城大事》定檔1月10日

財經(jīng)要聞

丁一凡:中美進入相對穩(wěn)定的競爭共存期

汽車要聞

讓智駕能看懂真實世界 英偉達發(fā)布開源Alpamayo平臺

態(tài)度原創(chuàng)

教育
家居
手機
旅游
公開課

教育要聞

學霸題:求陰影部分的面積,真六啊

家居要聞

引光之宅 地下室也有生機

手機要聞

年度第一水落石出,vivo五連冠,小米屈居第二

旅游要聞

“小聯(lián)票”激活京津冀文旅大市場 298元暢享三地熱門景區(qū)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版