国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

瞄準1萬億美元,黃仁勛把產(chǎn)品從芯片一路鋪到太空

0
分享至



黃仁勛又站上了圣何塞SAP中心的舞臺。這一次的GTC keynote,他用了將近兩個小時,把英偉達的野心從芯片一路鋪到外太空。

表面上看,這是一場產(chǎn)品發(fā)布會。



Vera Rubin平臺正式亮相,七顆芯片全部投產(chǎn);

收購Groq,其產(chǎn)品首次以“Groq 3 LPX”的身份嵌入英偉達的推理體系;

自研CPU Vera問世,專為agent而設(shè)計;

發(fā)布DLSS 5,把神經(jīng)渲染帶進游戲畫面;

基于爆火的OpenClaw,推出了英偉達自家的NemoClaw;

拉來Mistral、Perplexity、Cursor等一眾AI公司,組建Nemotron開源模型聯(lián)盟;

自動駕駛方面,比亞迪、吉利、日產(chǎn)、五十鈴接入英偉達的DRIVE Hyperion平臺,Uber宣布2028年前在28個城市部署英偉達全棧自動駕駛車隊;

機器人基礎(chǔ)模型GR00T N2亮相;

甚至還有太空計劃,英偉達也要把算力送上軌道。

但黃仁勛真正想傳達的信息,比任何一款產(chǎn)品都大。

他給出了一個數(shù)字:從2025年到2027年,AI芯片的營收將要超過1萬億美元。

黃仁勛說,在AI時代,token是新的貨幣,AI工廠是生產(chǎn)它們的基礎(chǔ)設(shè)施。

接下來,黃仁勛先講訓(xùn)練,再講推理,然后是智能體、物理 AI、機器人、自動駕駛,層層遞進。

每一層都對應(yīng)更大的基礎(chǔ)設(shè)施需求,而如今的英偉達,每一層都有產(chǎn)品可以賣。

這場keynote看下來不像是一份產(chǎn)品報告,更像一張帝國版圖。

01

Vera Rubin:七顆芯片,一臺超級計算機

Vera Rubin是這場發(fā)布會的核心硬件。它由七顆芯片組成:Vera CPU、Rubin GPU、NVLink 6交換芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太網(wǎng)交換芯片,以及新整合的Groq 3 LPU。

這七顆芯片全部投產(chǎn),設(shè)計目標是組成一臺協(xié)同工作的超級計算機,從大規(guī)模預(yù)訓(xùn)練、后訓(xùn)練、測試時推理擴展,到實時的agent推理,這一臺機器就可以覆蓋AI的所有流程。



核心產(chǎn)品是Vera Rubin NVL72機架,集成72顆Rubin GPU和36顆Vera CPU,通過NVLink 6互聯(lián)。

黃仁勛稱,相比上一代Blackwell平臺,NVL72訓(xùn)練大型混合專家模型所需的GPU數(shù)量減少到四分之一,推理吞吐量每瓦提升10倍,每token成本降至十分之一。

黃仁勛說,agent的拐點已經(jīng)到來,Vera Rubin正在開啟歷史上最大規(guī)模的基礎(chǔ)設(shè)施建設(shè)。

同時黃仁勛還預(yù)告了Vera Rubin之后的下一代架構(gòu)Kyber,采用垂直插入的計算托盤設(shè)計以提升密度和降低延遲,將搭載在2027年出貨的Vera Rubin Ultra上。

02

Groq LPU 登場

訓(xùn)練是英偉達發(fā)家之本,但推理才是接下來真正的戰(zhàn)場。

因為訓(xùn)練只是一次性的重活,推理才是永不停歇的日常。

每一次你向AI提問、每一次你讓AI幫你寫代碼,背后都是推理在運轉(zhuǎn)。

黃仁勛提出的方案是把推理拆成兩個階段,分別用不同的芯片來處理。

大語言模型的推理分為兩步:prefill(預(yù)填充)和decode(解碼)。prefill階段處理你輸入的提示詞,屬于計算密集型任務(wù),GPU擅長這個;decode階段則是逐個生成回答的token,屬于帶寬密集型任務(wù),需要極高的內(nèi)存讀取速度。

或者我們換一種方式來理解黃仁勛的話,prefill是“讀題”,decode是“寫答案”。讀題可以一目十行并行處理,寫答案只能一個字一個字往外蹦。

Groq 3 LPU就是為decode階段而生的。



LPU全稱Language Processing Unit(語言處理單元),由Groq公司開發(fā)。

這家公司由前谷歌TPU團隊成員創(chuàng)立,英偉達在2025年底以200億美元收購了其核心資產(chǎn)。

每顆Groq 3 LPU內(nèi)置了500MB的SRAM(靜態(tài)隨機存取存儲器),帶寬達到150TB/s,是Rubin GPU中HBM帶寬(22TB/s)的近7倍。

SRAM可以理解為芯片內(nèi)部的“超高速緩存”,容量小但速度極快,特別適合decode階段對帶寬的極端需求。

英偉達將256顆Groq 3 LPU裝進一個LPX機架,與Vera Rubin NVL72機架并排部署。Rubin GPU負責(zé)prefill的重計算,Groq LPU負責(zé)decode的高帶寬輸出。

黃仁勛說,這種組合在萬億參數(shù)模型上能實現(xiàn)每兆瓦推理吞吐量提升35倍。

03

NemoClaw

黃仁勛在臺上直接點名了Claude Code和OpenClaw,他說Claude Code和OpenClaw引起了agent的拐點。

黃仁勛夸贊OpenClaw,稱OpenClaw向所有人打開了AI的下一個前沿,成為歷史上增長最快的開源項目。Mac和Windows是個人電腦的操作系統(tǒng),OpenClaw是個人AI的操作系統(tǒng)。這是整個行業(yè)一直在等待的時刻。



英偉達為OpenClaw推出了NemoClaw。

NemoClaw是通過NVIDIA Agent Toolkit優(yōu)化過后的OpenClaw,一條命令即可完成安裝。它的核心組件是OpenShell,這是一個提供開源模型和隔離沙箱的環(huán)境,為agent加上基于策略的安全、網(wǎng)絡(luò)和隱私護欄。

黃仁勛說,OpenShell為OpenClaw提供了下面缺失的基礎(chǔ)設(shè)施層,讓agent在獲得執(zhí)行權(quán)限的同時受到安全約束。

NemoClaw的模型調(diào)度采用混合架構(gòu):本地運行Nemotron等開源模型處理隱私敏感任務(wù),通過隱私路由器(privacy router)調(diào)用云端前沿模型處理更復(fù)雜的請求。

NemoClaw可以運行在GeForce RTX的電腦和筆記本、RTX PRO工作站,以及DGX Station和DGX Spark AI超級計算機上,提供7×24小時本地計算支持。

04

Nemotron聯(lián)盟

英偉達也要在開源模型層上搞點動作。

Nemotron聯(lián)盟是一個全新的合作機制,首批成員包括Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Reflection AI、Sarvam和Thinking Machines Lab(由前 OpenAI CTO Mira Murati 創(chuàng)立)。

聯(lián)盟的第一個項目是由Mistral AI和英偉達聯(lián)合訓(xùn)練一個基礎(chǔ)模型,其他成員貢獻數(shù)據(jù)、評估框架和領(lǐng)域?qū)I(yè)知識。模型將在英偉達DGX Cloud上訓(xùn)練,開源發(fā)布,并成為即將推出的Nemotron 4模型家族的基礎(chǔ)。



黃仁勛的潛臺詞就是,英偉達希望開源模型生態(tài)繁榮,因為開源模型的用戶最終需要英偉達的硬件來訓(xùn)練和部署。

一個由多家AI公司共同參與的開源模型聯(lián)盟,既能對抗閉源巨頭的壟斷趨勢,也能確保英偉達的基礎(chǔ)設(shè)施在開源生態(tài)中保持核心地位。

05

自動駕駛

自動駕駛是英偉達近幾年的重點之一。

比亞迪、吉利、日產(chǎn)、五十鈴宣布采用英偉達DRIVE Hyperion平臺開發(fā)L4級自動駕駛車輛。

Uber宣布與英偉達擴大合作,計劃到2028年在28個城市、四個大陸部署全棧英偉達自動駕駛軟件驅(qū)動的自動駕駛車隊,首批城市是洛杉磯和舊金山灣區(qū),2027年上半年啟動。

Bolt、Grab、Lyft 也在接入 DRIVE Hyperion。



L4級自動駕駛意味著車輛在特定條件下可以完全自主駕駛,不需要人類隨時準備接管。

目前大多數(shù)量產(chǎn)車上的L2級輔助駕駛?cè)匀灰篑{駛員時刻保持注意力,AI只是“輔助”;L4則是AI真正在開車,人類可以不管。

黃仁勛還借此機會發(fā)布了Alpamayo 1.5,這是一個可交互、可引導(dǎo)的自動駕駛推理模型,能接受視頻、自車運動歷史、導(dǎo)航指引和自然語言提示作為輸入,輸出帶有推理鏈的駕駛軌跡。

開發(fā)者可以通過文本提示直接調(diào)整車輛行為。

06

AI 工廠的數(shù)字孿生

英偉達推出了DSX Air,一個用于在軟件中模擬AI工廠的SaaS平臺。

黃仁勛前幾年提出過一個叫“數(shù)字孿生”(Digital Twin)的概念,是指在虛擬環(huán)境中創(chuàng)建一個與真實物理系統(tǒng)完全對應(yīng)的數(shù)字副本。

工程師可以在這個虛擬副本上進行測試、優(yōu)化和故障排查,而不需要碰真實的硬件。

就像你搬新家之前,先在3D軟件里把家具擺一遍,看看哪里不合適。

只不過這里“搬”的是一整座超大規(guī)模AI數(shù)據(jù)中心。



DSX Air允許客戶在硬件到貨之前,就在模擬環(huán)境中搭建完整的 AI 工廠。

計算、網(wǎng)絡(luò)、存儲、編排、安全,全部按照實際部署方案配置。

CoreWeave已經(jīng)在使用DSX Air來模擬和驗證其AI工廠環(huán)境。

黃仁勛稱,這種方式可以將“從部署到產(chǎn)出第一個token”的時間從數(shù)周甚至數(shù)月縮短到幾天甚至幾小時。

配合DSX Air的是Vera Rubin DSX AI工廠參考設(shè)計和Omniverse DSX藍圖。

前者是一份關(guān)于如何設(shè)計、建造和運營 AI 工廠基礎(chǔ)設(shè)施的完整指南,后者則提供物理精確的數(shù)字孿生能力,用于大規(guī)模 AI 工廠的設(shè)計和仿真。

Cadence、達索系統(tǒng)、西門子、施耐德電氣等工業(yè)軟件巨頭都在接入這套體系。

黃仁勛還發(fā)布了DSX Max-Q動態(tài)功率分配技術(shù),稱可在固定電力的數(shù)據(jù)中心內(nèi)多部署30%的AI基礎(chǔ)設(shè)施。

DSX Flex軟件則讓AI工廠成為電網(wǎng)靈活資產(chǎn),黃仁勛說可以釋放100吉瓦的閑置電網(wǎng)容量。

07

存儲也要重新發(fā)明

BlueField-4 STX是英偉達為agent設(shè)計的新存儲架構(gòu)。

傳統(tǒng)數(shù)據(jù)中心的存儲系統(tǒng)提供大容量通用存儲,但缺乏agent所需的實時響應(yīng)能力。

agent在實際工作中,需要跨多個步驟、工具和會話保持上下文記憶,傳統(tǒng)存儲的延遲會拖慢推理速度、降低GPU利用率。

STX架構(gòu)的首個落地產(chǎn)品是CMX上下文記憶存儲平臺,它在GPU內(nèi)存之外擴展了一個高性能上下文層,用于可擴展的推理和智能體系統(tǒng)。

黃仁勛稱,與傳統(tǒng)存儲相比,CMX可提供5倍的每秒token吞吐量、4倍的能效提升和2倍的數(shù)據(jù)攝取速度。

CoreWeave、Crusoe、Lambda、Mistral AI、Nebius、Oracle等計劃采用STX用于上下文記憶存儲。Dell、HPE、IBM、NetApp、VAST Data等存儲廠商正在基于STX參考設(shè)計構(gòu)建下一代AI存儲基礎(chǔ)設(shè)施。

08

DLSS 5:游戲畫面的“GPT 時刻”

游戲才是英偉達的老本行。

黃仁勛在演講中提到,DLSS 5是自2018年推出實時光線追蹤以來最重大的圖形突破。

DLSS全稱Deep Learning Super Sampling(深度學(xué)習(xí)超級采樣),是英偉達用AI提升游戲畫面質(zhì)量和性能的技術(shù)。

此前的版本主要通過AI放大分辨率和生成中間幀來提升幀率。DLSS 5引入了一個實時神經(jīng)渲染模型,能夠為游戲畫面注入照片級真實的光照和材質(zhì)效果。



簡單來說,以前的DLSS是“讓畫面更流暢”,DLSS 5是“讓畫面更真實”。

它接收游戲每一幀的顏色和運動向量作為輸入,用AI模型理解場景中的角色、頭發(fā)、布料、半透明皮膚等復(fù)雜元素,以及正面光、逆光、陰天等環(huán)境光照條件,然后生成視覺上精確的增強圖像。

Bethesda的《星空》《上古卷軸》、CAPCOM的《生化危機》、育碧的《刺客信條:影)、騰訊、網(wǎng)易等廠商已確認支持。

DLSS 5將于今年秋季推出。

09

太空計算:最后的邊疆

最后,英偉達也宣布進軍太空計算。

黃仁勛說,太空計算是最后的邊疆,現(xiàn)如今已經(jīng)到來。

“隨著英偉達部署衛(wèi)星星座、向更深的太空探索,智能必須存在于數(shù)據(jù)產(chǎn)生的任何地方。太空與地面系統(tǒng)之間的AI處理實現(xiàn)了實時感知、決策和自主運行,將軌道數(shù)據(jù)中心變成發(fā)現(xiàn)的工具,將航天器變成自主導(dǎo)航的系統(tǒng)。與我們的合作伙伴一起,我們正在將英偉達延伸到地球之外——大膽地將智能帶到它從未到達的地方?!?/p>



于是黃仁勛拿出了Space-1 Vera Rubin Module,這是一個面向軌道數(shù)據(jù)中心的計算模塊。

采用緊密集成的CPU-GPU架構(gòu)和高帶寬互聯(lián),專為尺寸、重量和功耗(SWaP)受限的太空環(huán)境設(shè)計。

黃仁勛稱,相比H100,Space-1在太空推理場景下提供25倍的AI算力提升,能夠在軌道上直接運行大語言模型和高級基礎(chǔ)模型,處理來自太空儀器的海量實時數(shù)據(jù)流。

配合Space-1的還有兩款已經(jīng)可用的平臺:IGX Thor和Jetson Orin。

IGX Thor提供工業(yè)級耐久性和功能安全,適合任務(wù)關(guān)鍵型邊緣環(huán)境。

Jetson Orin則是超緊湊、高能效的AI推理模塊,已經(jīng)部署在衛(wèi)星上用于視覺、導(dǎo)航和傳感器數(shù)據(jù)的實時處理。

在地面端,RTX PRO 6000 Blackwell Server Edition GPU用于地理空間情報的大規(guī)模處理,英偉達稱其分析海量衛(wèi)星圖像檔案的速度是傳統(tǒng)CPU系統(tǒng)的100倍。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
梅開二度,德媒:諾伊爾和妻子安妮卡預(yù)計將迎來第二個孩子

梅開二度,德媒:諾伊爾和妻子安妮卡預(yù)計將迎來第二個孩子

懂球帝
2026-04-15 15:58:10
特朗普在伊朗戰(zhàn)爭中犯下的7個致命錯誤

特朗普在伊朗戰(zhàn)爭中犯下的7個致命錯誤

史政先鋒
2026-04-12 18:27:18
“只剩咱倆了,你也100了,都不容易”!查爾斯國王看望百歲保姆

“只剩咱倆了,你也100了,都不容易”!查爾斯國王看望百歲保姆

書醬瞄瞄
2026-03-20 15:37:53
受賄、行賄、洗錢,樊新中一審獲刑17年

受賄、行賄、洗錢,樊新中一審獲刑17年

新京報
2026-04-15 18:16:02
外媒名記:趙心童世錦賽大熱不值得押注,鋼鐵意志的塞爾比被低估

外媒名記:趙心童世錦賽大熱不值得押注,鋼鐵意志的塞爾比被低估

楊華評論
2026-04-16 02:52:39
騎士前鋒莫布里談哈登加蘭:節(jié)奏變慢擋拆戰(zhàn)術(shù)受青睞

騎士前鋒莫布里談哈登加蘭:節(jié)奏變慢擋拆戰(zhàn)術(shù)受青睞

李汪手工制作
2026-04-16 05:25:07
百億遺產(chǎn)說扔就扔?73歲遲重瑞現(xiàn)身寺廟,白巖松一語道破小心思

百億遺產(chǎn)說扔就扔?73歲遲重瑞現(xiàn)身寺廟,白巖松一語道破小心思

流云隨風(fēng)去遠方
2026-04-12 03:19:07
“我怕我畢業(yè)走了,他會挨餓”:山東高中生一句話,讓全網(wǎng)破防

“我怕我畢業(yè)走了,他會挨餓”:山東高中生一句話,讓全網(wǎng)破防

云景侃記
2026-04-15 19:52:33
浪姐史上翻車最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的!

浪姐史上翻車最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的!

兩只米老鼠
2026-04-14 03:27:12
皇馬不敵拜仁止步歐冠1-4決賽

皇馬不敵拜仁止步歐冠1-4決賽

劉笤說體壇
2026-04-16 05:39:30
局勢惡化,中方接到通知,美軍正做實戰(zhàn)準備,首個替死鬼已浮現(xiàn)?

局勢惡化,中方接到通知,美軍正做實戰(zhàn)準備,首個替死鬼已浮現(xiàn)?

面包夾知識
2026-04-15 15:46:10
美國海關(guān)4月20日將啟動關(guān)稅退款 將向進口商退還1660億美元的關(guān)稅

美國海關(guān)4月20日將啟動關(guān)稅退款 將向進口商退還1660億美元的關(guān)稅

每日經(jīng)濟新聞
2026-04-15 22:42:35
起風(fēng)了!蕭旭岑事件轉(zhuǎn)折,“三人小組”發(fā)出怒吼,馬辦回應(yīng)現(xiàn)端倪

起風(fēng)了!蕭旭岑事件轉(zhuǎn)折,“三人小組”發(fā)出怒吼,馬辦回應(yīng)現(xiàn)端倪

小陸搞笑日常
2026-04-15 19:27:57
3名領(lǐng)導(dǎo)干部因破壞營商環(huán)境被查處通報

3名領(lǐng)導(dǎo)干部因破壞營商環(huán)境被查處通報

吉刻新聞
2026-04-15 12:16:25
錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個醒

錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個醒

夏末moent
2026-03-21 20:01:15
張倫碩自曝不介意鐘麗緹將財產(chǎn)全留給3個女兒:我經(jīng)濟獨立,尊重妻子決定,父女的緣分不是血緣,是靈魂

張倫碩自曝不介意鐘麗緹將財產(chǎn)全留給3個女兒:我經(jīng)濟獨立,尊重妻子決定,父女的緣分不是血緣,是靈魂

極目新聞
2026-04-15 14:13:50
迪馬濟奧:國米今夏或許會迎來首個革命性、重建式的轉(zhuǎn)會窗

迪馬濟奧:國米今夏或許會迎來首個革命性、重建式的轉(zhuǎn)會窗

懂球帝
2026-04-16 02:37:14
上海胡曉陽團伙主犯被槍斃,陳云笑:老子要開明,兒子要管嚴一點

上海胡曉陽團伙主犯被槍斃,陳云笑:老子要開明,兒子要管嚴一點

史之銘
2026-04-16 01:09:36
沉穩(wěn)霸氣!原重慶市委書記王鴻舉,一手碑派大字太驚艷,功夫了得

沉穩(wěn)霸氣!原重慶市委書記王鴻舉,一手碑派大字太驚艷,功夫了得

曉踏就是我
2026-04-15 12:45:27
繳納20年五險一金,網(wǎng)友曬出:40萬公積金、33萬社保,職場差距令人心碎

繳納20年五險一金,網(wǎng)友曬出:40萬公積金、33萬社保,職場差距令人心碎

據(jù)說說娛樂
2026-04-15 13:21:32
2026-04-16 06:35:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2379文章數(shù) 8059關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

美國發(fā)布新一輪涉伊朗制裁措施

頭條要聞

美國發(fā)布新一輪涉伊朗制裁措施

體育要聞

三球準絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

旅游
手機
親子
教育
游戲

旅游要聞

拉豬車繞關(guān)闖禁區(qū):隱秘危險游該踩剎車了

手機要聞

一加Ace6至尊版再次被確認:魔改天璣9500+165Hz屏,本月發(fā)布!

親子要聞

孕婦200買水果被罵后續(xù):已終止妊娠,男方崩潰砸東西,網(wǎng)友炸鍋

教育要聞

小升初求陰影面積,等積變換,會者秒算

《GTA6》搶劫玩法泄露引熱議!NPC與警察全面升級

無障礙瀏覽 進入關(guān)懷版