国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達 CES 2026:六款芯片,一臺 AI 超算

0
分享至

英偉達在 CES 2026 發(fā)布了下一代 AI 計算平臺 Rubin

六款新芯片同時發(fā)布,整個機架當(dāng)一臺電腦來設(shè)計

這六款芯片分別是:

  • ? Vera CPU :英偉達自研 CPU, 88 個定制 Olympus 核心

  • ? Rubin GPU :下一代 GPU, 3360 億晶體管

  • ? NVLink 6 Switch :機架內(nèi) GPU 互聯(lián),每 GPU 3.6 TB/s 帶寬

  • ? ConnectX-9 SuperNIC :網(wǎng)卡, 800 Gb/s

  • ? BlueField-4 DPU :數(shù)據(jù)處理單元,負責(zé)安全和存儲

  • ? Spectrum-6 Ethernet Switch :機架間互聯(lián), 102.4 Tb/s

英偉達管這叫「極端協(xié)同設(shè)計」(Extreme Codesign)

黃仁勛原話
Rubin 來得正是時候,AI 計算需求正在爆炸


Rubin 平臺六款芯片 性能提升多少

和 Blackwell 比:

  • ? 推理 token 成本降到 十分之一

  • ? 訓(xùn)練同樣的 MoE 模型,GPU 數(shù)量降到 四分之一

  • ? 網(wǎng)絡(luò)功耗效率提升 5 倍

具體場景:訓(xùn)一個 10 萬億參數(shù)的 MoE 模型,Blackwell 需要 64000 張 GPU,Rubin 只要 16000


訓(xùn)練 10T MoE 模型所需 GPU 數(shù)量對比 Vera CPU

英偉達之前用的是 Grace CPU,這次換成了全新的 Vera

名字來自天文學(xué)家 Vera Rubin,發(fā)現(xiàn)暗物質(zhì)存在證據(jù)的那位

核心規(guī)格:

  • ? 88 個定制 Olympus 核心, 176 線程

  • ? 1.5 TB LPDDR5X 內(nèi)存,帶寬 1.2 TB/s

  • ? 2270 億晶體管

  • ? 支持 Arm v9.2 架構(gòu)

和 Grace 比,內(nèi)存帶寬翻了 2.4 倍,內(nèi)存容量翻了 3 倍,NVLink-C2C 帶寬翻倍到 1.8TB/s

英偉達說這顆 CPU 專門為 AI 工廠設(shè)計,核心任務(wù)是喂數(shù)據(jù)給 GPU


Vera CPU

Grace vs Vera 對比

規(guī)格

Grace

Vera

核心數(shù)

72 Neoverse V2

88 Olympus

線程數(shù)

72

176

L3 緩存

114MB

162MB

內(nèi)存帶寬

512GB/s

1.2TB/s

內(nèi)存容量

480GB

1.5TB

NVLink-C2C

900GB/s

1.8TB/s


Rubin GPU

單顆 GPU 規(guī)格:

  • ? 3360 億晶體管(Blackwell 是 2080 億)

  • ? 288 GB HBM4 顯存

  • ? 顯存帶寬 22 TB/s(Blackwell 是 8 TB/s)

  • ? NVFP4 推理算力 50 PFLOPS

  • ? 224 個 SM,第六代 Tensor Core

第三代 Transformer Engine,硬件級自適應(yīng)壓縮,專門針對 FP4 精度優(yōu)化

NVLink 帶寬翻倍,每 GPU 3.6TB/s(Blackwell 是 1.8TB/s)


Rubin GPU 規(guī)格

Blackwell vs Rubin 對比

規(guī)格

Blackwell

Rubin

晶體管

2080 億

3360 億

NVFP4 推理

10 PFLOPS

50 PFLOPS

FP8 訓(xùn)練

5 PFLOPS

17.5 PFLOPS

HBM 帶寬

8 TB/s

22 TB/s

NVLink 帶寬

1.8 TB/s

3.6 TB/s


HBM 帶寬代際提升 Vera Rubin NVL72

這是 Rubin 平臺的旗艦配置,72 張 GPU 組成一臺機器

一個機架里塞了:

  • ? 72 張 Rubin GPU

  • ? 36 顆 Vera CPU

  • ? NVLink 6 互聯(lián)

  • ? ConnectX-9 網(wǎng)卡

  • ? BlueField-4 DPU

整機規(guī)格:

  • ? NVFP4 推理算力 3.6 EFLOPS

  • ? HBM4 總量 20.7 TB

  • ? 系統(tǒng)內(nèi)存 54 TB

  • ? 機架內(nèi)互聯(lián)帶寬 260 TB/s

英偉達說這個帶寬比整個互聯(lián)網(wǎng)還大

全液冷設(shè)計,45 度溫水直接冷卻,比 Blackwell 流量提升近一倍

無線纜設(shè)計,組裝速度比上一代快 18


Vera Rubin NVL72 計算托盤 NVLink 6

第六代 NVLink,負責(zé) 72 張 GPU 之間的通信


72 GPU 全互聯(lián)拓撲

核心升級:

  • ? 每 GPU 帶寬 3.6 TB/s,翻倍

  • ? 全互聯(lián)拓撲,任意兩張 GPU 之間延遲一致

  • ? 內(nèi)置 SHARP 網(wǎng)絡(luò)計算,F(xiàn)P8 算力 14.4 TFLOPS

  • ? 每個 Switch Tray 帶寬 28.8 TB/s

MoE 模型的 all-to-all 通信吞吐提升 2

支持熱插拔、部分填充運行、動態(tài)流量重路由


NVLink 6 Switch BlueField-4 DPU

這是一顆 DPU,專門處理網(wǎng)絡(luò)、存儲、安全這些基礎(chǔ)設(shè)施任務(wù)

內(nèi)部集成了 64 核 Grace CPU 和 ConnectX-9 網(wǎng)卡

和 BlueField-3 比:

規(guī)格

BlueField-3

BlueField-4

帶寬

400 Gb/s

800 Gb/s

CPU 核心

16 A78

64 Neoverse V2

內(nèi)存帶寬

75 GB/s

250 GB/s

內(nèi)存容量

32GB

128GB

存儲 IOPS

10M

20M

新功能叫 ASTRA(Advanced Secure Trusted Resource Architecture),給裸金屬和多租戶環(huán)境提供硬件級隔離

還有個「推理上下文內(nèi)存存儲平臺」,專門存 KV Cache,長上下文推理的吞吐提升 5 倍,功耗效率也提升 5


BlueField-4 DPU ConnectX-9 SuperNIC

網(wǎng)卡,每 GPU 提供 1.6Tb/s 帶寬

主要升級:

  • ? 800 Gb/s 單端口帶寬

  • ? 200G PAM4 SerDes

  • ? 可編程擁塞控制

  • ? 硬件加密引擎,支持 IPsec 和 PSP

和 Spectrum-6 交換機配合,在端點就做流量整形,防止擁塞


ConnectX-9 和 BlueField-4 Spectrum-6 以太網(wǎng)交換機

Spectrum-X 以太網(wǎng)的新一代,負責(zé)機架間互聯(lián)

核心升級:

  • ? 單芯片帶寬 102.4 Tb/s,翻倍

  • ? 200G SerDes

  • ? 共封裝光學(xué)(Co-packaged Optics)

共封裝光學(xué)把光模塊直接做進芯片封裝里:

  • ? 功耗效率提升 5

  • ? 信號損耗從 22dB 降到 4dB,信號完整性提升 64

  • ? 可靠性提升 10

還有 Spectrum-XGS,支持跨地域數(shù)據(jù)中心組網(wǎng),幾百公里外的機房可以當(dāng)一個集群用


Spectrum-6 交換機 Spectrum-X 光學(xué)交換機 推理性能實測

英偉達用 Kimi-K2-Thinking(1T MoE 模型,32K 輸入 + 8K 輸出)做了測試

結(jié)果:

  • ? 同等交互性下,每瓦吞吐提升 10

  • ? 同等延遲下,每百萬 token 成本降到十分之一

推理吞吐對比 推理成本對比 誰在用

云廠商
AWS、Google Cloud、Microsoft Azure、Oracle Cloud、CoreWeave、Lambda、Nebius、Nscale

AI 公司
OpenAI、Anthropic、Meta、xAI、Mistral、Cohere、Perplexity、Black Forest Labs、Runway、Cursor、Harvey

硬件廠商
Dell、HPE、Lenovo、Supermicro、Cisco

微軟會在下一代 Fairwater AI 超算中心部署 Vera Rubin NVL72,規(guī)模到幾十萬張 GPU

CoreWeave 2026 下半年上線 Rubin 實例

各家 CEO 怎么說

Sam Altman(OpenAI)
Intelligence scales with compute. Rubin 讓我們能繼續(xù) scale

Dario Amodei(Anthropic)
Rubin 的效率提升能讓模型有更長的記憶、更好的推理、更可靠的輸出

Mark Zuckerberg(Meta)
Rubin 的性能和效率提升是把最先進模型部署給幾十億用戶的前提

Elon Musk(xAI)
Rubin 是 AI 的火箭引擎

Satya Nadella(Microsoft)
我們在建世界上最強的 AI 超算,Vera Rubin 加進來,開發(fā)者能以全新方式創(chuàng)造、推理、擴展

什么時候能用

Rubin 已經(jīng)在量產(chǎn)

2026 下半年開始出貨

AWS、Google Cloud、Microsoft、Oracle 會是第一批部署的云廠商


DGX SuperPOD

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上海電影院捉奸后續(xù),女子帶情夫公然出軌,視頻流出高清照片曝光

上海電影院捉奸后續(xù),女子帶情夫公然出軌,視頻流出高清照片曝光

壹月情感
2026-03-02 21:09:52
美軍新型彈道導(dǎo)彈首次投入實戰(zhàn)

美軍新型彈道導(dǎo)彈首次投入實戰(zhàn)

觀察者網(wǎng)
2026-03-02 16:42:09
銷量再跌,經(jīng)銷商庫存高企,外資車繼續(xù)降價,國產(chǎn)車不降價不行了

銷量再跌,經(jīng)銷商庫存高企,外資車繼續(xù)降價,國產(chǎn)車不降價不行了

柏銘銳談
2026-03-01 23:43:25
鞍鋼集團資本控股有限公司董事長、黨委書記賈文軍接受紀律審查和監(jiān)察調(diào)查

鞍鋼集團資本控股有限公司董事長、黨委書記賈文軍接受紀律審查和監(jiān)察調(diào)查

瀟湘晨報
2026-03-02 12:23:48
我國崩塌最徹底的專業(yè),從年薪20萬到找不到工作,畢業(yè)即失業(yè)!

我國崩塌最徹底的專業(yè),從年薪20萬到找不到工作,畢業(yè)即失業(yè)!

黯泉
2026-02-10 22:00:47
甘蔗立大功!醫(yī)生發(fā)現(xiàn):甘蔗可能對這4種慢性病有好處!可以試試

甘蔗立大功!醫(yī)生發(fā)現(xiàn):甘蔗可能對這4種慢性病有好處!可以試試

荊醫(yī)生科普
2026-03-02 17:05:04
票房128.6億,密鑰又一次延期,超過《哪吒2》只是時間問題

票房128.6億,密鑰又一次延期,超過《哪吒2》只是時間問題

白公子探劇
2026-03-02 15:26:41
偉偉道來 |美以伊戰(zhàn)爭會持續(xù)多長時間?有無談判止戰(zhàn)的機會和窗口?

偉偉道來 |美以伊戰(zhàn)爭會持續(xù)多長時間?有無談判止戰(zhàn)的機會和窗口?

經(jīng)濟觀察報
2026-03-02 11:30:41
知人知面不知心!回國就原形畢露!孫穎莎樊振東:緊急取關(guān)!

知人知面不知心!回國就原形畢露!孫穎莎樊振東:緊急取關(guān)!

阿廢冷眼觀察所
2026-03-03 00:31:38
張藝謀:第一次見她,我對她說,你等著我們來找你,不要亂演電影

張藝謀:第一次見她,我對她說,你等著我們來找你,不要亂演電影

秀語千尋
2026-02-22 19:28:42
哈佛研究揭示:高智商孩子常具兩種臉部特征不是迷信是腦科學(xué)真相

哈佛研究揭示:高智商孩子常具兩種臉部特征不是迷信是腦科學(xué)真相

一口娛樂
2026-02-27 12:42:23
56歲大媽心梗離世,醫(yī)生:吃他汀時除了牛奶,這6種食物盡量少碰

56歲大媽心梗離世,醫(yī)生:吃他汀時除了牛奶,這6種食物盡量少碰

岐黃傳人孫大夫
2026-02-28 22:15:03
10條驚人的父子定律:當(dāng)爸越“不正經(jīng)”,養(yǎng)出的孩子越優(yōu)秀

10條驚人的父子定律:當(dāng)爸越“不正經(jīng)”,養(yǎng)出的孩子越優(yōu)秀

戶外阿毽
2026-03-01 01:34:43
“天眼”24小時掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

“天眼”24小時掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

我心縱橫天地間
2026-03-02 14:05:07
歷史上首架F15被擊落,美軍飛行員一死一被俘!

歷史上首架F15被擊落,美軍飛行員一死一被俘!

勝研集
2026-03-02 14:06:57
明日正月十五是“絕日”,記得:1不去、2不賞、3要忌、4要吃

明日正月十五是“絕日”,記得:1不去、2不賞、3要忌、4要吃

愛下廚的阿釃
2026-03-02 20:28:38
“恨海情天仙品CP”售后預(yù)警!傳郭曉婷王天辰將合體拍雜志

“恨海情天仙品CP”售后預(yù)警!傳郭曉婷王天辰將合體拍雜志

手工制作阿殲
2026-03-02 19:49:02
歷史首次!中國石油、中國石化、中國海油全部漲停,滬指收漲0.47%丨A股收盤

歷史首次!中國石油、中國石化、中國海油全部漲停,滬指收漲0.47%丨A股收盤

每日經(jīng)濟新聞
2026-03-02 15:25:10
石榴立大功!國際期刊證實:4周可逆轉(zhuǎn)免疫衰老,壽命或?qū)⒀娱L45%

石榴立大功!國際期刊證實:4周可逆轉(zhuǎn)免疫衰老,壽命或?qū)⒀娱L45%

思思夜話
2026-03-02 22:10:13
卡塔爾首都多哈響起爆炸聲,滯留機場中國留學(xué)生目擊攔截導(dǎo)彈空中爆炸:機場鋼架都在振動,不時傳來哭聲,200多名同胞建群共享離境消息

卡塔爾首都多哈響起爆炸聲,滯留機場中國留學(xué)生目擊攔截導(dǎo)彈空中爆炸:機場鋼架都在振動,不時傳來哭聲,200多名同胞建群共享離境消息

極目新聞
2026-03-01 14:06:31
2026-03-03 02:51:00
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
309文章數(shù) 45關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

時尚
房產(chǎn)
本地
教育
公開課

今年春天一定要擁有的4件衣服,太好看了!

房產(chǎn)要聞

方案突然曝光!海口北師大附校,又有書包大盤殺出!

本地新聞

津南好·四時總相宜

教育要聞

特別猛,但在留學(xué)生心中存在感很低的英國大學(xué)!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版