国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI算力擴容的新瓶頸竟是銅纜,英偉達押注光互連

0
分享至

如果打開 Nvidia NVL72 機柜的后蓋,你最先注意到的,可能不是那 72 顆 GPU,而是那超過 5,000 根同軸銅纜編織成的密網(wǎng)。這些銅纜總長超過 3.2 公里,是整臺機柜 1.36 噸自重的主要來源。

而在機柜正中央是 9 塊 NVSwitch 托盤,被上下各 9 塊計算托盤夾在中間。之所以這樣排列,是因為銅纜信號在 1.8 TB/s 的帶寬下跑不了幾英尺就開始衰減,NVSwitch 必須離每顆 GPU 盡可能近,居中是距離最短的布局。


(來源:ServeTheHome)

這臺機柜濃縮了英偉達過去兩年面對的核心問題:銅纜確實好用,但它給系統(tǒng)規(guī)模畫了一條硬上限。2026 年 3 月的 GTC 上,黃仁勛宣布要用光互連把 GPU 系統(tǒng)從 72 顆擴展到 576 顆乃至 1,152 顆,并在一個月內(nèi)向三家光學(xué)公司投了 60 億美元。

而在兩年前,他還說光互連太耗電。

銅纜的黃金時代,和它的極限

2024 年 GTC,Nvidia 第一次展示 NVL72 機柜(代號 Oberon)時,銅纜是理所當然的選擇。Nvidia 網(wǎng)絡(luò)高級副總裁 Gilad Shainer 向媒體表示:“銅是最好的連接方式,如果你能用的話。它非常便宜,功耗為零,沒有任何有源組件。”


圖丨NVL72(來源:Nvidia)

銅纜省下的功耗確實可觀。黃仁勛在同年 GTC 主題演講中算過一筆賬:如果 NVL72 用 pluggable optics(可插拔光模塊)替代銅纜,每顆 Blackwell GPU 需要配 18 個 800 Gbps 光模塊,加速器端 9 個,交換機端 9 個,整套系統(tǒng)要多消耗約 20,000 瓦。對一臺已經(jīng)吃掉 120 千瓦的機柜來說,再加 20 千瓦不太切實。

銅纜還有一個不常被提及的優(yōu)勢:可靠性。在接近百萬條鏈路的大規(guī)模 AI 集群里,可插拔的光模塊每天可能出現(xiàn)數(shù)十次鏈路中斷。銅纜是無源器件,沒有激光器會老化,也沒有信號處理芯片會發(fā)熱,故障率低得多。

所以英偉達選銅是經(jīng)過權(quán)衡的。72 顆 GPU 通過銅背板全互連,整臺機柜就是一個巨大的加速器,萬億參數(shù)模型的推理速度比上一代 H100 快 30 倍。2024 年,這已經(jīng)是行業(yè)能造出的最大一臺機器。

但 AI 模型對 GPU 數(shù)量的需求沒有停在 72 顆。

訓(xùn)練 ChatGPT 級別的模型需要數(shù)千顆 GPU 協(xié)同工作。NVL72 內(nèi)部有 NVLink 高速互連,但多臺 NVL72 之間仍然只能靠 InfiniBand 或以太網(wǎng)連接,帶寬和延遲都差了一個量級。如果能把 500 顆甚至 1,000 顆 GPU 放進同一個 NVLink 域,讓它們像一顆芯片一樣通信,訓(xùn)練效率會大幅提升。

而銅纜擋住了這條路。信號在銅中的衰減隨頻率和距離急劇上升,1.8 TB/s 帶寬下有效傳輸距離不到一米。單個機柜塞不下更多 GPU,跨機柜用銅纜又夠不著。NVL72 已經(jīng)把銅纜的工程做到了物理極限,再往前一步,需要換介質(zhì)。最明顯的替代方案就是光,但兩年前黃仁勛親手否掉了這個選項。

光從“太貴”變成“可以用”

光互連本身不是新技術(shù),數(shù)據(jù)中心的機柜之間早就在用光纖通信。但把光互連用在 GPU 之間的 scale-up 網(wǎng)絡(luò)上,也就是讓一組 GPU 構(gòu)成單一計算單元的內(nèi)部互連,工程難度完全不同。

Scale-up 網(wǎng)絡(luò)對帶寬、延遲和功耗的要求遠比 scale-out(機柜之間的外部網(wǎng)絡(luò))苛刻。2024 年英偉達評估過在 NVL72 上使用可插拔光模塊的方案:單個模塊功耗 10-15 瓦,看起來不多,但 72 顆 GPU 需要幾百個模塊,總功耗多出 20 千瓦。體積也是問題,每個模塊約一包口香糖大小,幾百個要占掉可觀的機柜空間和散熱余量。

改變這個局面的是 co-packaged optics(共封裝光學(xué),CPO)。CPO 把光引擎直接集成到交換芯片的封裝里,省掉了可插拔模塊的外殼、連接器和大部分信號處理電路,功耗和體積都大幅縮減。

2025 年,Nvidia 在自家的 Spectrum 以太網(wǎng)交換機和 Quantum InfiniBand 交換機上率先量產(chǎn)了 CPO,這是英偉達第一次在自己的產(chǎn)品線上規(guī)模驗證光學(xué)互連。這次在 scale-out 網(wǎng)絡(luò)上的部署,也為下一步把 CPO 引入 NVLink scale-up 網(wǎng)絡(luò)積累了經(jīng)驗。

不過 CPO 目前仍處于早期階段。TrendForce 的數(shù)據(jù)顯示,2026 年 CPO 在 AI 數(shù)據(jù)中心光模塊中的占比僅約 0.5%,但到 2030 年可能達到 35%。而英偉達選在滲透曲線剛起步的時候大舉押注,所錨定的就是能定義規(guī)則的先發(fā)位置。

從 72 到 1152:銅光混合的路線圖

2026 年 GTC 上,黃仁勛發(fā)布了兩款新系統(tǒng):Vera Rubin NVL576 和 Rosa Feynman NVL1152。前者把 8 個 NVL72 機柜用光互連組成一個 576 GPU 的計算域,后者進一步擴展到 1,152 顆。


圖丨Vera Rubin NVL576(來源:DataCenterDynamics)

“有很多討論說英偉達到底要走銅纜 scale-up 還是光學(xué) scale-up,答案是兩個都做?!秉S仁勛在主題演講中說。

具體方案分兩層。據(jù)英偉達超大規(guī)模與高性能計算副總裁 Ian Buck 介紹,NVL576 的第一層網(wǎng)絡(luò)(機柜內(nèi)部 GPU 到交換機的連接)將繼續(xù)使用銅纜,GPU 本身不需要改動;第二層 spine 網(wǎng)絡(luò)(機柜與機柜之間)會換成光模塊。銅纜在短距離上的低成本和高可靠繼續(xù)發(fā)揮作用,光只負責(zé)銅纜物理上夠不著的那段距離。

到 Feynman 一代(預(yù)計 2028 年中后期出貨),Nvidia 打算走得更遠。這代系統(tǒng)將提供 CPO 版本的 NVLink 互連,目前有兩條可能的路徑:一種是只在 NVSwitch 交換芯片上集成 CPO,機柜內(nèi)仍用銅,代價是需要兩層交換網(wǎng)絡(luò);另一種是在 GPU 封裝上也集成 CPO,整個 NVLink 域只需一層交換網(wǎng)絡(luò),延遲更低。

Shainer 在 GTC 期間接受采訪時拒絕透露英偉達會走哪條路,但暗示了自己的偏好:“Scale-up 網(wǎng)絡(luò)如果不是必須,你不會想建多層的,因為你要盡量降低計算引擎之間的延遲?!眴螌泳W(wǎng)絡(luò)意味著需要一顆端口數(shù)極高的交換芯片來直連上千顆 GPU,這在當前工藝下還做不到,但距離 Feynman 出貨還有兩年多時間。

另一個有意思的取舍是:Nvidia 在 Vera Rubin 這一代只對 NVL72 Oberon 機柜做光學(xué)擴展,但沒有動 NVL144 Kyber 機柜。一個合理的推測是,既然光互連可以跨機柜擴展,就不需要在單機柜里硬塞 144 顆 GPU 了。把 8 個 72-GPU 機柜用光連起來,散熱和供電壓力都分散了。換句話說,光互連打開的不只是帶寬上限,還有機柜設(shè)計上的空間。

60 億美元鎖供應(yīng)鏈

技術(shù)路線定了,接下來的問題是誰來供貨。CPO 省掉了傳統(tǒng)光模塊的大部分組件,但有一樣?xùn)|西省不掉:激光器。出于可靠性和可維護性的考慮,激光器通常和交換芯片分開放置,作為外部光源單獨供應(yīng)。誰能控制激光器的產(chǎn)能,誰就卡住了 CPO 大規(guī)模部署的咽喉。

2026 年 3 月,Nvidia 向 Coherent 和 Lumentum 各投資 20 億美元,同時簽下多年采購協(xié)議,鎖定了優(yōu)先供應(yīng)權(quán)。Coherent 隨后宣布將在 2026 年把磷化銦(InP)晶圓產(chǎn)能翻倍,擴產(chǎn)資金的主要來源正是英偉達的這筆投資。Lumentum 在高功率連續(xù)波激光芯片領(lǐng)域處于領(lǐng)先地位,是 CPO 外部光源的關(guān)鍵供應(yīng)商。兩筆投資瞄準的都是光學(xué)供應(yīng)鏈上最稀缺的環(huán)節(jié)。

到了月底,Nvidia 又向 Marvell 投了 20 億美元。這筆交易掛在 NVLink Fusion(允許第三方芯片接入 NVLink 生態(tài)的平臺)名下,但聯(lián)合聲明里明確提到雙方將合作開發(fā)硅光子技術(shù)。

Marvell 在 2026 年初剛以 32.5 億美元收購了 Celestial AI,后者擁有一種叫做 Photonic Fabric 的光子互連技術(shù),可以用來構(gòu)建跨機柜的一致性內(nèi)存網(wǎng)絡(luò)。Nvidia 把 Marvell 拉進 NVLink Fusion 生態(tài),Celestial AI 的光子技術(shù)大概率將在英偉達體系內(nèi)落地,而不會流向競爭對手。


圖丨傳統(tǒng) CPO 與 Photonic Fabric 的對比(來源:Celestial AI)

三筆投資合計 60 億美元,一個月內(nèi)密集完成。節(jié)奏一如英偉達過去在 HBM(高帶寬內(nèi)存)和 CoWoS(臺積電先進封裝)上的做法,趁技術(shù)拐點到來之前提前鎖定稀缺產(chǎn)能,讓競爭對手在供應(yīng)端慢一拍。Futurum 的分析師把光學(xué)稱為 AI 基礎(chǔ)設(shè)施擴展的下一個瓶頸環(huán)節(jié),而英偉達正趕在瓶頸形成之前卡住上游。

對 UALink 陣營來說,這個時間差相當不利。UALink 是 AMD、Intel、Broadcom 等公司聯(lián)手推動的開放互連標準,目標是打破 NVLink 的封閉生態(tài)。但 UALink 硬件最早也要到 2026 年底才能出貨,規(guī)模部署可能得等到 2027 年甚至更晚。而英偉達這邊,光學(xué)供應(yīng)鏈已經(jīng)在簽約、擴產(chǎn)、集成。等到開放標準的硬件終于量產(chǎn),關(guān)鍵光學(xué)元件的產(chǎn)能可能已經(jīng)被英偉達的長期協(xié)議占去了相當一部分。

不過 Shainer 至今仍然說銅是最好的連接方式。當然,前提是“如果你能用的話”。在機柜內(nèi)部 GPU 到交換機的短距離連接上,銅纜依然是最經(jīng)濟、最可靠的方案,Vera Rubin 和 Feynman 都會繼續(xù)使用銅背板。銅沒有被淘汰,只是它能覆蓋的范圍不再夠用了。

兩年前黃仁勛拒絕光互連的時候,72 顆 GPU 還裝得下英偉達最大的野心,但現(xiàn)在已經(jīng)裝不下了。

參考資料:

https://developer.nvidia.com/blog/nvidia-contributes-nvidia-gb200-nvl72-designs-to-open-compute-project/

https://www.theregister.com/2026/04/05/nvidia_optical_scale_up/

https://www.trendforce.com/presscenter/news/20260311-12962.html

https://newsletter.semianalysis.com/p/co-packaged-optics-cpo-book-scaling

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為啥不能讓父母參與自己生意?網(wǎng)友:讓你媽別去了,省得生意變差

為啥不能讓父母參與自己生意?網(wǎng)友:讓你媽別去了,省得生意變差

解讀熱點事件
2026-03-31 00:05:08
為啥情侶容易懷孕,夫妻反導(dǎo)不孕不育,生殖科醫(yī)生:真相有點扎心

為啥情侶容易懷孕,夫妻反導(dǎo)不孕不育,生殖科醫(yī)生:真相有點扎心

菁媽育兒
2026-04-06 13:25:44
理發(fā)店陷入倒閉潮,不是沒客人,也不是電商沖擊,是被自己弄垮了

理發(fā)店陷入倒閉潮,不是沒客人,也不是電商沖擊,是被自己弄垮了

平說財經(jīng)
2026-04-04 22:52:59
民政局最新提醒:戶口分開不算一家人,這3種證明走遍全國都認

民政局最新提醒:戶口分開不算一家人,這3種證明走遍全國都認

李博世財經(jīng)
2026-04-05 17:20:59
買一贈一也清不掉庫存,中國人的牛奶喝到“天花板”了嗎?

買一贈一也清不掉庫存,中國人的牛奶喝到“天花板”了嗎?

臨云史策
2026-04-06 12:05:24
脊柱斷裂、前夫已死,62歲"亞洲天后"韋唯,現(xiàn)狀曝光讓人唏噓不已

脊柱斷裂、前夫已死,62歲"亞洲天后"韋唯,現(xiàn)狀曝光讓人唏噓不已

丹妮觀
2026-04-02 14:43:02
別再被催收嚇住了!網(wǎng)貸逾期最可怕的后果,只有內(nèi)行知道

別再被催收嚇住了!網(wǎng)貸逾期最可怕的后果,只有內(nèi)行知道

小虎新車推薦員
2026-04-06 18:55:43
賠光2億后,冉瑩穎獨自搬家30箱未給鄒市明留體面

賠光2億后,冉瑩穎獨自搬家30箱未給鄒市明留體面

春之韻
2026-03-18 09:32:52
內(nèi)存市場為何迅速崩盤?實在是個人市場變化太快,美韓芯片失敗了

內(nèi)存市場為何迅速崩盤?實在是個人市場變化太快,美韓芯片失敗了

柏銘銳談
2026-04-05 11:28:40
43歲蔣欣澳門逛商場被偶遇,171大高個又瘦又美,比電視上好看

43歲蔣欣澳門逛商場被偶遇,171大高個又瘦又美,比電視上好看

韓小娛
2026-04-04 16:32:36
波黑球童承認偷走唐納魯馬小抄:這都是為了波黑

波黑球童承認偷走唐納魯馬小抄:這都是為了波黑

體壇周報
2026-04-06 10:41:36
哈蘭德太低調(diào)!帽子戲法后就獎勵自己吃個英國“餐飲界蜜雪冰城”

哈蘭德太低調(diào)!帽子戲法后就獎勵自己吃個英國“餐飲界蜜雪冰城”

茜子足球
2026-04-06 18:48:01
iPhone 17 Pro Max拍回1.2億公里外的地球

iPhone 17 Pro Max拍回1.2億公里外的地球

Ping值焦慮
2026-04-06 00:00:12
41歲女子有性癮,每天要求37歲男友睡她,一年后男友受不了殺了她

41歲女子有性癮,每天要求37歲男友睡她,一年后男友受不了殺了她

胖胖侃咖
2025-05-10 08:00:08
日韓股市率先上漲,A股清明節(jié)后要布局這些機會

日韓股市率先上漲,A股清明節(jié)后要布局這些機會

上觀新聞
2026-04-06 22:20:07
伊朗有重大發(fā)現(xiàn):美營救飛行員是假,真正目的是偷濃縮鈾

伊朗有重大發(fā)現(xiàn):美營救飛行員是假,真正目的是偷濃縮鈾

觀察者小海風(fēng)
2026-04-06 22:46:19
美媒:2028年參選民主黨人與2020年立場劃清界限

美媒:2028年參選民主黨人與2020年立場劃清界限

透視到底
2026-04-06 10:47:15
1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

阿校談史
2026-03-20 11:03:27
王思聰舅舅林友涉連殺兩任妻子+雇兇殺害肢解鄰居,為啥還能逍遙法外21年?

王思聰舅舅林友涉連殺兩任妻子+雇兇殺害肢解鄰居,為啥還能逍遙法外21年?

不二表姐
2026-03-30 23:30:07
51分6板3斷!45分8板9助!弗拉格創(chuàng)神級紀錄,最佳新秀又有懸念了

51分6板3斷!45分8板9助!弗拉格創(chuàng)神級紀錄,最佳新秀又有懸念了

世界體育圈
2026-04-06 17:22:39
2026-04-07 01:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16545文章數(shù) 514845關(guān)注度
往期回顧 全部

科技要聞

折疊屏iPhone要來了,富士康已在試產(chǎn)!

頭條要聞

外媒:美國副總統(tǒng)萬斯和伊朗外長等人徹夜交流

頭條要聞

外媒:美國副總統(tǒng)萬斯和伊朗外長等人徹夜交流

體育要聞

官方:中國女足球員邵子欽加盟本菲卡

娛樂要聞

唐嫣羅晉新加坡遛娃,6歲女兒身高搶鏡

財經(jīng)要聞

史詩級暴跌"一周年" A股接下來如何走?

汽車要聞

阿維塔06T快上市了 旅行車還能這么玩?

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
親子
本地
公開課

數(shù)碼要聞

玄派玄機16 2026筆記本上架:銳龍AI Max+ 395,128GB + 2TB

藝術(shù)要聞

張雪機車logo陷抄襲爭議?商標還被人搶先注冊了!

親子要聞

哪款兒童祛疤膏好用又不刺激?2026溫和修護祛疤好物分析:舒緩疤痕不適

本地新聞

跟著歌聲游安徽,聽古村回響

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版