国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛GTC演講全文:推理時(shí)代到來(lái),不想被淘汰,馬上行動(dòng)起來(lái)……

0
分享至


剛剛黃仁勛在GTC2026大會(huì)上兩個(gè)多小時(shí)的演講,刷屏了整個(gè)科技圈。

很多人看完,都在聊1萬(wàn)億美元的營(yíng)收預(yù)期,聊2年350倍性能躍升的Vera Rubin系統(tǒng)。

但我要告訴你:這些都不是這場(chǎng)演講里,最顛覆、最和你息息相關(guān)的內(nèi)容。

真正決定未來(lái)3年,你的企業(yè)能不能活下去、你的職場(chǎng)之路能不能往上走的,是黃仁勛花了近三分之一篇幅講的智能體革命,以及他那句石破天驚的判斷:智能體(Agent)會(huì)完全改變企業(yè)和每個(gè)人的工作方式。

在這場(chǎng)被視為“AI行業(yè)年度朝圣”的大會(huì)上,黃仁勛闡述了英偉達(dá)從一家“芯片公司”向“AI基礎(chǔ)設(shè)施和工廠(chǎng)公司”的蛻變。面對(duì)市場(chǎng)最關(guān)心的業(yè)績(jī)持續(xù)性與增長(zhǎng)空間問(wèn)題,黃仁勛詳細(xì)拆解了驅(qū)動(dòng)未來(lái)增長(zhǎng)的底層商業(yè)邏輯——“Token工廠(chǎng)經(jīng)濟(jì)學(xué)”。

01
業(yè)績(jī)指引極度樂(lè)觀(guān), “2027年至少1萬(wàn)億美元的需求”

過(guò)去兩年,全球AI計(jì)算需求呈指數(shù)級(jí)爆炸。隨著大模型從“感知”、“生成”進(jìn)化到“推理”與“行動(dòng)(執(zhí)行任務(wù))”,算力的消耗量急劇攀升。針對(duì)市場(chǎng)高度關(guān)注的訂單與營(yíng)收天花板,黃仁勛給出了極為強(qiáng)勁的預(yù)期。

黃仁勛在演講中直言:

去年這個(gè)時(shí)候,我說(shuō)過(guò),我們看到了5000億美元的高確信度需求,覆蓋Blackwell和Rubin直到2026年。現(xiàn)在,就在此時(shí)此地,我看到到2027年至少有1萬(wàn)億美元的需求(at least $1 trillion)。


黃仁勛的萬(wàn)億預(yù)期一度推動(dòng)英偉達(dá)股價(jià)漲超4.3%。


不僅如此,他更是對(duì)這一數(shù)字做出了補(bǔ)充:

這合理嗎?這就是我接下來(lái)要講的。事實(shí)上,我們甚至?xí)┎粦?yīng)求。我確定,實(shí)際的計(jì)算需求會(huì)比這高得多。

黃仁勛指出,如今的英偉達(dá)系統(tǒng)已經(jīng)證明了自己是全球“成本最低的基礎(chǔ)設(shè)施”。由于英偉達(dá)能運(yùn)行幾乎所有領(lǐng)域的AI模型,這種通用性使得客戶(hù)投入的這1萬(wàn)億美元能夠被充分利用并保持長(zhǎng)久的生命周期。

目前,英偉達(dá)60%的業(yè)務(wù)來(lái)自排名前五的超大型云服務(wù)商,而另外40%的業(yè)務(wù)則廣泛分布于主權(quán)云、企業(yè)、工業(yè)、機(jī)器人和邊緣計(jì)算等各個(gè)領(lǐng)域。

02

Token工廠(chǎng)經(jīng)濟(jì)學(xué), 每瓦性能決定商業(yè)命脈

為了解釋這1萬(wàn)億需求的合理性,黃仁勛向全球企業(yè)CEO展示了一套全新的商業(yè)思維。他指出,未來(lái)的數(shù)據(jù)中心不再是存儲(chǔ)文件的倉(cāng)庫(kù),而是生產(chǎn)Token(AI生成的基本單位)的“工廠(chǎng)”。


黃仁勛強(qiáng)調(diào):

每一座數(shù)據(jù)中心、每一座工廠(chǎng),從定義上來(lái)說(shuō)都是受電力限制的。一座1GW(吉瓦)的工廠(chǎng)永遠(yuǎn)不會(huì)變成2GW,這是物理和原子的定律。在固定的功率下,誰(shuí)的每瓦Token吞吐量最高,誰(shuí)的生產(chǎn)成本就最低。

黃仁勛將未來(lái)的AI服務(wù)分為以下商業(yè)層級(jí):

免費(fèi)層(高吞吐、低速度) 中級(jí)層(~每百萬(wàn)token 3美元) 高級(jí)層(~每百萬(wàn)token 6美元) 高速層(~每百萬(wàn)token 45美元) 超高速層(~每百萬(wàn)token 150美元)

他指出,隨著模型越來(lái)越大、上下文越來(lái)越長(zhǎng),AI會(huì)變得更聰明,但Token的生成速率會(huì)降低。黃仁勛表示:

在這個(gè)Token工廠(chǎng)里,你的吞吐量和Token生成速度,將直接轉(zhuǎn)化為你明年的精確收入。

黃仁勛強(qiáng)調(diào)英偉達(dá)的架構(gòu)能夠讓客戶(hù)在免費(fèi)層實(shí)現(xiàn)極高的吞吐量,同時(shí)在最高價(jià)值的推理層級(jí)上,將性能提升驚人的35倍。


03

Vera Rubin兩年實(shí)現(xiàn)350倍加速, Groq填補(bǔ)極速推理

在這個(gè)物理極限的約束下,英偉達(dá)介紹其有史以來(lái)最復(fù)雜的AI計(jì)算系統(tǒng),Vera Rubin。黃仁勛表示:

過(guò)去提到Hopper,我會(huì)舉起一塊芯片,那很可愛(ài)。但提到Vera Rubin,大家想到的是整個(gè)系統(tǒng)。在這個(gè)100%液冷、完全消滅了傳統(tǒng)線(xiàn)纜的系統(tǒng)中,過(guò)去需要兩天安裝的機(jī)架,現(xiàn)在只需兩小時(shí)。

黃仁勛指出,通過(guò)極致的端到端軟硬件協(xié)同設(shè)計(jì),Vera Rubin在同一座1GW數(shù)據(jù)中心里創(chuàng)造了驚人的數(shù)據(jù)跨越:

在短短兩年時(shí)間內(nèi),我們將Token的生成速率從2200萬(wàn)提升到了7億,實(shí)現(xiàn)了350倍的增長(zhǎng)。摩爾定律在同時(shí)期僅能帶來(lái)約1.5倍的提升。

為了解決極速推理(如1000 Tokens/秒)條件下的帶寬瓶頸,英偉達(dá)給出了整合被收購(gòu)公司Groq的最終方案:非對(duì)稱(chēng)式的分離推理。黃仁勛解釋?zhuān)?/p>

這兩款處理器的特點(diǎn)截然不同。Groq芯片擁有500MB的SRAM,而一顆Rubin芯片擁有288GB的內(nèi)存。


黃仁勛指出,英偉達(dá)通過(guò)Dynamo軟件系統(tǒng),將需要海量計(jì)算和顯存的“預(yù)填充(Pre-fill)”階段交給Vera Rubin,將對(duì)延遲極度敏感的“解碼”階段交給Groq。黃仁勛還對(duì)企業(yè)算力配置給出了建議:

如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價(jià)值的編程級(jí)別的Token生成需求,拿出25%的數(shù)據(jù)中心規(guī)模給Groq。

據(jù)透露,由三星代工的Groq LP30芯片已在量產(chǎn),預(yù)計(jì)第三季度出貨,而首個(gè)Vera Rubin機(jī)架已在微軟Azure云上運(yùn)行。

此外,針對(duì)光互聯(lián)技術(shù),黃仁勛展示了全球首款量產(chǎn)的共封裝光學(xué)(CPO)交換機(jī)Spectrum X,并平息了市場(chǎng)對(duì)于“銅退光進(jìn)”的路線(xiàn)之爭(zhēng):

我們需要更多的銅纜產(chǎn)能,更多的光芯片產(chǎn)能,更多的CPO產(chǎn)能。

04

Agent終結(jié)傳統(tǒng)SaaS, “年薪+Token”成硅谷標(biāo)配

除了硬件壁壘,黃仁勛把大量篇幅留給了AI軟件和生態(tài)的革命,特別是Agent(智能體)的爆發(fā)。

他將開(kāi)源項(xiàng)目OpenClaw形容為“人類(lèi)歷史上最受歡迎的開(kāi)源項(xiàng)目”,稱(chēng)其僅用幾周時(shí)間就超越了Linux在過(guò)去30年取得的成就。黃仁勛直言,OpenClaw本質(zhì)上就是Agent計(jì)算機(jī)的“操作系統(tǒng)”。

黃仁勛斷言:

每一個(gè)SaaS(軟件即服務(wù))公司都將變成AaaS(Agent-as-a-Service,智能體即服務(wù))公司。毫無(wú)疑問(wèn),為了讓這種具備訪(fǎng)問(wèn)敏感數(shù)據(jù)和執(zhí)行代碼能力的智能體安全落地,英偉達(dá)推出了企業(yè)級(jí)的NeMo Claw參考設(shè)計(jì),增加了策略引擎和隱私路由器。

對(duì)于普通職場(chǎng)人,這場(chǎng)變革同樣近在咫尺。黃仁勛描繪了未來(lái)的職場(chǎng)新形態(tài):

在未來(lái),我們公司的每一位工程師都需要一個(gè)年度Token預(yù)算。他們的基礎(chǔ)年薪可能是幾十萬(wàn)美元,我會(huì)在此基礎(chǔ)上再拿出大約一半的金額作為T(mén)oken額度給他們,讓他們實(shí)現(xiàn)10x的效率提升。這已經(jīng)是硅谷的新招聘籌碼了:你的offer里帶多少Token?

演講最后,黃仁勛還“劇透”了下一代計(jì)算架構(gòu)Feynman,它將首次實(shí)現(xiàn)銅線(xiàn)與CPO的共同水平擴(kuò)展。更引人遐想的是,英偉達(dá)正在研發(fā)部署在太空的數(shù)據(jù)中心計(jì)算機(jī)“Vera Rubin Space-1”,徹底打開(kāi)了AI算力向地球之外延伸的想象空間。

黃仁勛GTC 2026演講全文,全文翻譯如下(AI工具輔助):

主持人: 歡迎英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛上臺(tái)。

黃仁勛,創(chuàng)始人兼首席執(zhí)行官:

歡迎來(lái)到GTC。我想提醒大家,這是一場(chǎng)技術(shù)大會(huì)。能看到這么多人一大早排隊(duì)入場(chǎng),能看到在座的各位,我感到非常高興。

在GTC,我們將聚焦三大主題:技術(shù)、平臺(tái)和生態(tài)系統(tǒng)。英偉達(dá)目前擁有三大平臺(tái):CUDA-X平臺(tái)、系統(tǒng)平臺(tái),以及我們最新推出的AI工廠(chǎng)平臺(tái)。

在正式開(kāi)始之前,我要感謝我們的預(yù)熱環(huán)節(jié)主持人——Conviction的Sarah Guo、紅杉資本的Alfred Lin(英偉達(dá)的第一位風(fēng)險(xiǎn)投資人),以及英偉達(dá)的第一位主要機(jī)構(gòu)投資人Gavin Baker。這三位對(duì)技術(shù)有深刻的洞見(jiàn),在整個(gè)技術(shù)生態(tài)系統(tǒng)中擁有極廣的影響力。當(dāng)然,我還要感謝今天所有我親自邀請(qǐng)出席的貴賓們。感謝這支全明星團(tuán)隊(duì)。

我同樣要感謝今天到場(chǎng)的所有企業(yè)。英偉達(dá)是一家平臺(tái)公司,我們擁有技術(shù)、平臺(tái)和豐富的生態(tài)系統(tǒng)。今天到場(chǎng)的企業(yè)代表了價(jià)值100萬(wàn)億美元行業(yè)中幾乎全部的參與者,共有450家公司贊助了本次活動(dòng),在此深表感謝。

本次大會(huì)共設(shè)有1,000場(chǎng)技術(shù)論壇、2,000位演講嘉賓,將覆蓋人工智能"五層蛋糕"架構(gòu)的每一個(gè)層級(jí)——從土地、電力與機(jī)房等基礎(chǔ)設(shè)施,到芯片、平臺(tái)、模型,以及最終推動(dòng)整個(gè)行業(yè)騰飛的各類(lèi)應(yīng)用。

CUDA:二十年的技術(shù)積淀

一切的起點(diǎn),就在這里。今年是CUDA誕生二十周年。

二十年來(lái),我們始終致力于這一架構(gòu)的研發(fā)。CUDA是一項(xiàng)革命性的發(fā)明——SIMT(單指令多線(xiàn)程)技術(shù)允許開(kāi)發(fā)者以標(biāo)量代碼編寫(xiě)程序,并將其擴(kuò)展為多線(xiàn)程應(yīng)用,其編程難度遠(yuǎn)低于此前的SIMD架構(gòu)。我們最近還新增了Tiles功能,幫助開(kāi)發(fā)者更便捷地編程張量核心(Tensor Core),以及當(dāng)今人工智能所依賴(lài)的各類(lèi)數(shù)學(xué)運(yùn)算結(jié)構(gòu)。目前,CUDA已擁有數(shù)千種工具、編譯器、框架和庫(kù),在開(kāi)源社區(qū)中存在數(shù)十萬(wàn)個(gè)公開(kāi)項(xiàng)目,并已深度集成到每一個(gè)技術(shù)生態(tài)系統(tǒng)之中。

這張圖表揭示了英偉達(dá)100%的戰(zhàn)略邏輯,我從最初就一直在講這張幻燈片。其中最難實(shí)現(xiàn)、也是最核心的要素,是圖表底部的"裝機(jī)量"。歷經(jīng)二十年,我們已在全球范圍內(nèi)積累了數(shù)億塊運(yùn)行CUDA的GPU和計(jì)算系統(tǒng)。

我們的GPU覆蓋所有云平臺(tái),服務(wù)于幾乎所有計(jì)算機(jī)廠(chǎng)商和行業(yè)。CUDA龐大的裝機(jī)量,正是這個(gè)飛輪不斷加速的根本原因。裝機(jī)量吸引開(kāi)發(fā)者,開(kāi)發(fā)者創(chuàng)造新算法并取得突破,突破催生全新市場(chǎng),新市場(chǎng)形成新生態(tài)并吸引更多企業(yè)加入,進(jìn)而擴(kuò)大裝機(jī)量——這個(gè)飛輪正在持續(xù)加速。

英偉達(dá)庫(kù)的下載量正以驚人的速度增長(zhǎng),規(guī)模龐大且增速不斷提升。這個(gè)飛輪使我們的計(jì)算平臺(tái)能夠支撐海量應(yīng)用和層出不窮的新突破。

更重要的是,它還賦予了這些基礎(chǔ)設(shè)施極長(zhǎng)的使用壽命。原因顯而易見(jiàn):NVIDIA CUDA上可運(yùn)行的應(yīng)用極為豐富,涵蓋AI生命周期的每個(gè)階段、各類(lèi)數(shù)據(jù)處理平臺(tái),以及各種科學(xué)原理求解器。因此,一旦安裝了英偉達(dá)GPU,其實(shí)際使用價(jià)值極高。這也是為何我們六年前發(fā)布的Ampere架構(gòu)GPU,其云端價(jià)格反而在上漲。

這一切的根本原因在于:裝機(jī)量龐大,飛輪強(qiáng)勁,開(kāi)發(fā)者生態(tài)廣泛。當(dāng)這些因素共同發(fā)揮作用,加之我們持續(xù)更新軟件,計(jì)算成本便會(huì)不斷下降。加速計(jì)算在大幅提升應(yīng)用性能的同時(shí),隨著我們長(zhǎng)期維護(hù)和迭代軟件,用戶(hù)不僅能在初期獲得性能躍升,還能持續(xù)享受計(jì)算成本的下降。我們?cè)敢鉃槿蛎恳粔KGPU提供長(zhǎng)期支持,因?yàn)樗鼈冊(cè)诩軜?gòu)上完全兼容。

我們之所以愿意這樣做,是因?yàn)檠b機(jī)量如此龐大——每發(fā)布一次新的優(yōu)化,便能惠及數(shù)百萬(wàn)用戶(hù)。這種動(dòng)態(tài)組合,使得英偉達(dá)架構(gòu)在持續(xù)擴(kuò)大覆蓋范圍、加速自身成長(zhǎng)的同時(shí),不斷壓低計(jì)算成本,最終刺激新的增長(zhǎng)。CUDA是這一切的核心。

從GeForce到CUDA:二十五年的演進(jìn)之路

而我們與CUDA的旅程,實(shí)際上早在二十五年前就已開(kāi)始。

GeForce——相信在座有很多人是伴隨著GeForce長(zhǎng)大的。GeForce是英偉達(dá)最成功的市場(chǎng)推廣項(xiàng)目。我們從你們還買(mǎi)不起產(chǎn)品的時(shí)候就開(kāi)始培養(yǎng)未來(lái)的客戶(hù)——是你們的父母代替你們成為了英偉達(dá)最早的用戶(hù),年復(fù)一年地購(gòu)買(mǎi)我們的產(chǎn)品,直到有一天,你們成長(zhǎng)為優(yōu)秀的計(jì)算機(jī)科學(xué)家,成為真正意義上的客戶(hù)和開(kāi)發(fā)者。

這是二十五年前GeForce奠定的基業(yè)。二十五年前,我們發(fā)明了可編程著色器——這是讓加速器實(shí)現(xiàn)可編程化的一項(xiàng)顯而易見(jiàn)卻意義深遠(yuǎn)的發(fā)明,也是世界上第一款可編程加速器,即像素著色器。這五年后,我們創(chuàng)造了CUDA——這是我們有史以來(lái)最重要的投資之一。當(dāng)時(shí)公司財(cái)力有限,但我們將絕大部分利潤(rùn)押注于此,致力于將CUDA從GeForce延伸到每一臺(tái)計(jì)算機(jī)。我們之所以如此堅(jiān)定,是因?yàn)槲覀兩钚牌錆摿?。盡管初期歷經(jīng)艱辛,公司堅(jiān)守這一信念長(zhǎng)達(dá)13代、整整二十年,如今CUDA已無(wú)處不在。

正是像素著色器推動(dòng)了GeForce的革命。而大約八年前,我們推出了RTX——為現(xiàn)代計(jì)算機(jī)圖形時(shí)代對(duì)架構(gòu)進(jìn)行了全面革新。GeForce將CUDA帶給了全世界,也正因如此,讓Alex Krizhevsky、Ilya Sutskever、Geoffrey Hinton、Andrew Ng等眾多學(xué)者發(fā)現(xiàn),GPU可以成為加速深度學(xué)習(xí)的利器,由此點(diǎn)燃了十年前人工智能的大爆炸。

十年前,我們決定將可編程著色與兩個(gè)全新理念相融合:一是硬件光線(xiàn)追蹤(Ray Tracing),這在技術(shù)上極具挑戰(zhàn);二是一個(gè)當(dāng)時(shí)頗具前瞻性的想法——大約十年前,我們就預(yù)見(jiàn)到AI將徹底變革計(jì)算機(jī)圖形。正如GeForce將AI帶給了全世界,AI如今也將反過(guò)來(lái)重塑整個(gè)計(jì)算機(jī)圖形的實(shí)現(xiàn)方式。

今天,我要向大家展示未來(lái)。這是我們的下一代圖形技術(shù),我們稱(chēng)之為神經(jīng)渲染(Neural Rendering)——3D圖形與人工智能的深度融合。這就是DLSS 5,請(qǐng)看。

神經(jīng)渲染:結(jié)構(gòu)化數(shù)據(jù)與生成式AI的融合

這是不是令人嘆為觀(guān)止?計(jì)算機(jī)圖形就此煥發(fā)生機(jī)。

我們做了什么?我們將可控的3D圖形(虛擬世界的真實(shí)基礎(chǔ))與其結(jié)構(gòu)化數(shù)據(jù)相結(jié)合,再融入生成式AI和概率計(jì)算。一個(gè)完全確定性,另一個(gè)概率性卻高度逼真——我們將這兩種理念融為一體,通過(guò)結(jié)構(gòu)化數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)可控,同時(shí)進(jìn)行實(shí)時(shí)生成。最終,內(nèi)容既美觀(guān)驚艷,又完全可控。

結(jié)構(gòu)化信息與生成式AI融合這一理念,將在一個(gè)又一個(gè)行業(yè)中不斷復(fù)現(xiàn)。結(jié)構(gòu)化數(shù)據(jù)是可信AI的基石。

結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的加速平臺(tái)

現(xiàn)在我要帶大家看一張技術(shù)架構(gòu)圖。

結(jié)構(gòu)化數(shù)據(jù)——大家熟悉的SQL、Spark、Pandas、Velox,以及Snowflake、Databricks、Amazon EMR、Azure Fabric、Google BigQuery等重要平臺(tái),都在處理數(shù)據(jù)框(Data Frame)。這些數(shù)據(jù)框就像巨型電子表格,承載著商業(yè)世界的全部信息,是企業(yè)計(jì)算的基本事實(shí)(Ground Truth)。

在A(yíng)I時(shí)代,我們需要讓AI來(lái)使用結(jié)構(gòu)化數(shù)據(jù),并對(duì)其實(shí)現(xiàn)極致加速。過(guò)去,加速結(jié)構(gòu)化數(shù)據(jù)處理是為了讓企業(yè)更高效地運(yùn)轉(zhuǎn)。而未來(lái),AI將以遠(yuǎn)超人類(lèi)的速度使用這些數(shù)據(jù)結(jié)構(gòu),AI智能體也將大量調(diào)用結(jié)構(gòu)化數(shù)據(jù)庫(kù)。

非結(jié)構(gòu)化數(shù)據(jù)方面,向量數(shù)據(jù)庫(kù)、PDF、視頻、音頻等構(gòu)成了世界上絕大多數(shù)的數(shù)據(jù)形態(tài)——每年生成的數(shù)據(jù)中,約90%是非結(jié)構(gòu)化數(shù)據(jù)。過(guò)去,這些數(shù)據(jù)幾乎完全無(wú)法被利用:我們讀取它們,存入文件系統(tǒng),僅此而已。我們無(wú)法查詢(xún),也難以檢索,原因在于非結(jié)構(gòu)化數(shù)據(jù)缺乏簡(jiǎn)單的索引方式,必須理解其含義與語(yǔ)境。而現(xiàn)在,AI可以做到這一點(diǎn)——借助多模態(tài)感知與理解技術(shù),AI能夠讀取PDF文檔、理解其含義,并將其嵌入可供查詢(xún)的更大結(jié)構(gòu)之中。

英偉達(dá)為此創(chuàng)建了兩個(gè)基礎(chǔ)庫(kù):

cuDF:用于數(shù)據(jù)框、結(jié)構(gòu)化數(shù)據(jù)的加速處理

cuVS:用于向量存儲(chǔ)、語(yǔ)義數(shù)據(jù)和非結(jié)構(gòu)化AI數(shù)據(jù)的處理

這兩個(gè)平臺(tái)將成為未來(lái)最重要的基礎(chǔ)平臺(tái)之一。

今天,我們宣布與多家企業(yè)達(dá)成合作。IBM——SQL語(yǔ)言的發(fā)明者,將使用cuDF加速其WatsonX Data平臺(tái)。Dell與我們聯(lián)合打造了Dell AI數(shù)據(jù)平臺(tái),整合cuDF與cuVS,并在NTT Data的實(shí)際項(xiàng)目中實(shí)現(xiàn)了大幅性能提升。Google Cloud方面,我們現(xiàn)在不僅加速Vertex AI,還加速BigQuery,并與Snapchat合作將其計(jì)算成本降低了近80%。

加速計(jì)算帶來(lái)的好處是三位一體的:速度、規(guī)模、成本。這與摩爾定律的邏輯一脈相承——通過(guò)加速計(jì)算實(shí)現(xiàn)性能飛躍,同時(shí)持續(xù)優(yōu)化算法,讓所有人都能享受到持續(xù)下降的計(jì)算成本。

英偉達(dá)構(gòu)建了加速計(jì)算平臺(tái),其上匯聚了眾多庫(kù):RTX、cuDF、cuVS等等。這些庫(kù)整合進(jìn)全球云服務(wù)和OEM體系,共同觸達(dá)全球用戶(hù)。

與云服務(wù)商的深度合作

與主要云服務(wù)商的合作

Google Cloud:我們加速Vertex AI和BigQuery,與JAX/XLA深度集成,同時(shí)在PyTorch上表現(xiàn)卓越——英偉達(dá)是全球唯一一家在PyTorch和JAX/XLA上均表現(xiàn)出色的加速器。我們將Base10、CrowdStrike、Puma、Salesforce等客戶(hù)引入Google Cloud生態(tài)。

AWS:我們加速EMR、SageMaker和Bedrock,與AWS有著深度集成。今年令我格外興奮的是,我們將把OpenAI引入AWS,這將大幅推動(dòng)AWS云計(jì)算的消耗增長(zhǎng),幫助OpenAI擴(kuò)展區(qū)域部署和計(jì)算規(guī)模。

Microsoft Azure:英偉達(dá)100 PFLOPS超算是我們構(gòu)建的第一臺(tái)超級(jí)計(jì)算機(jī),也是第一臺(tái)部署在A(yíng)zure上的超算,這奠定了與OpenAI合作的重要基礎(chǔ)。我們加速Azure云服務(wù)和AI Foundry,合作推進(jìn)Azure區(qū)域擴(kuò)展,并在Bing搜索上深度協(xié)作。值得一提的是,我們的**保密計(jì)算(Confidential Computing)**能力——確保即便是運(yùn)營(yíng)商也無(wú)法查看用戶(hù)數(shù)據(jù)和模型——英偉達(dá)GPU是全球首批支持保密計(jì)算的GPU,可支持OpenAI和Anthropic模型在全球各地區(qū)云環(huán)境中的保密部署。以Synopsys為例,我們加速其全部EDA和CAD工作流,并部署于Microsoft Azure。

Oracle:我們是Oracle的第一個(gè)AI客戶(hù),我為能夠第一次向Oracle解釋AI云的概念感到自豪。此后他們發(fā)展迅猛,我們也為其引入了Cohere、Fireworks、OpenAI等眾多合作伙伴。

CoreWeave:全球第一家AI原生云,專(zhuān)為GPU托管和AI云服務(wù)而生,擁有出色的客戶(hù)群,增長(zhǎng)勢(shì)頭強(qiáng)勁。

Palantir + Dell:三方聯(lián)合打造了全新的AI平臺(tái),基于Palantir的本體論平臺(tái)(Ontology Platform)和AI平臺(tái),可在任何國(guó)家、任何氣隙隔離環(huán)境下、完全本地化地部署AI——從數(shù)據(jù)處理(向量化或結(jié)構(gòu)化)到AI的完整加速計(jì)算棧,無(wú)所不包。

英偉達(dá)與全球云服務(wù)商建立了這種特殊的合作關(guān)系——我們將客戶(hù)引入云端,這是一種互利共贏(yíng)的生態(tài)。

垂直整合,橫向開(kāi)放:英偉達(dá)的核心戰(zhàn)略

英偉達(dá)是全球第一家垂直整合、橫向開(kāi)放的公司。

這一模式的必要性非常簡(jiǎn)單:加速計(jì)算不是芯片問(wèn)題,也不是系統(tǒng)問(wèn)題,其完整表述應(yīng)為應(yīng)用加速。CPU可以讓計(jì)算機(jī)整體運(yùn)行得更快,但這條路已走到瓶頸。未來(lái),唯有通過(guò)應(yīng)用或領(lǐng)域特定的加速,才能持續(xù)帶來(lái)性能飛躍和成本下降。

這正是英偉達(dá)必須深耕一個(gè)又一個(gè)庫(kù)、一個(gè)又一個(gè)領(lǐng)域、一個(gè)又一個(gè)垂直行業(yè)的原因。我們是一家垂直整合的計(jì)算公司,沒(méi)有其他路可走。我們必須理解應(yīng)用,理解領(lǐng)域,深刻理解算法,并能夠?qū)⑵洳渴鹪谌魏螆?chǎng)景下——數(shù)據(jù)中心、云端、本地、邊緣乃至機(jī)器人系統(tǒng)。

同時(shí),英偉達(dá)保持橫向開(kāi)放,愿意將技術(shù)整合進(jìn)任何合作伙伴的平臺(tái),讓全世界都能享受到加速計(jì)算的紅利。

本屆GTC的參會(huì)者結(jié)構(gòu)充分體現(xiàn)了這一點(diǎn)。本次參會(huì)者中,金融服務(wù)行業(yè)的比例最高——希望來(lái)的是開(kāi)發(fā)者,不是交易員。我們的生態(tài)系統(tǒng)覆蓋了上游和下游供應(yīng)鏈。無(wú)論是成立50年、70年還是150年的企業(yè),去年都迎來(lái)了歷史最佳年份。我們正處于某件非常、非常重大的事情的起點(diǎn)。

CUDA-X:各行業(yè)的加速計(jì)算引擎

在各個(gè)垂直領(lǐng)域,英偉達(dá)均已深度布局:

自動(dòng)駕駛:覆蓋范圍廣泛,影響深遠(yuǎn)

金融服務(wù):量化投資正從人工特征工程轉(zhuǎn)向超級(jí)計(jì)算機(jī)驅(qū)動(dòng)的深度學(xué)習(xí),迎來(lái)其"Transformer時(shí)刻"

醫(yī)療健康:正在迎來(lái)屬于自己的"ChatGPT時(shí)刻",涵蓋AI輔助藥物發(fā)現(xiàn)、AI智能體支持診斷、醫(yī)療客服等方向

工業(yè):全球規(guī)模最大的建設(shè)浪潮正在展開(kāi),AI工廠(chǎng)、芯片廠(chǎng)、數(shù)據(jù)中心廠(chǎng)紛紛落地

娛樂(lè)與游戲:實(shí)時(shí)AI平臺(tái)支持翻譯、直播、游戲互動(dòng),以及智能購(gòu)物代理

機(jī)器人:深耕十余年,三大計(jì)算機(jī)架構(gòu)(訓(xùn)練計(jì)算機(jī)、仿真計(jì)算機(jī)、機(jī)載計(jì)算機(jī))齊備,本次展會(huì)共有110款機(jī)器人亮相

電信:約2萬(wàn)億美元規(guī)模的行業(yè),基站將從單一通信功能演進(jìn)為AI基礎(chǔ)設(shè)施平臺(tái),相關(guān)平臺(tái)名為Aerial,與諾基亞、T-Mobile等企業(yè)均有深度合作

以上所有領(lǐng)域的核心,正是我們的CUDA-X庫(kù)——這是英偉達(dá)作為算法公司的根本所在。這些庫(kù)是公司最核心的資產(chǎn),讓計(jì)算平臺(tái)得以在各個(gè)行業(yè)發(fā)揮實(shí)際價(jià)值。

其中最重要的庫(kù)之一,是cuDNN(CUDA深度神經(jīng)網(wǎng)絡(luò)庫(kù)),它徹底革新了人工智能,引發(fā)了現(xiàn)代AI的大爆炸。

大家剛才看到的一切都是仿真——包括基于物理原理的求解器、AI代理物理模型,以及物理AI機(jī)器人模型。一切均為仿真,沒(méi)有任何手工動(dòng)畫(huà)或關(guān)節(jié)綁定。這正是英偉達(dá)的核心能力所在:通過(guò)對(duì)算法的深刻理解與計(jì)算平臺(tái)的有機(jī)結(jié)合,解鎖這些機(jī)遇。

AI原生企業(yè)與新計(jì)算時(shí)代

你們剛才看到了沃爾瑪、歐萊雅、摩根大通、羅氏、豐田等定義當(dāng)今社會(huì)的行業(yè)巨頭,也有一大批大家從未聽(tīng)說(shuō)過(guò)的公司——我們稱(chēng)之為AI原生企業(yè)。這份名單極為龐大,里面有OpenAI、Anthropic,以及眾多服務(wù)于不同垂直領(lǐng)域的新興企業(yè)。

過(guò)去兩年,這一行業(yè)經(jīng)歷了驚人的騰飛。風(fēng)險(xiǎn)投資流入初創(chuàng)企業(yè)的資金規(guī)模達(dá)到1,500億美元,創(chuàng)人類(lèi)歷史之最。更重要的是,單筆投資規(guī)模首次從數(shù)百萬(wàn)美元躍升至數(shù)億乃至數(shù)十億美元。原因只有一個(gè):這是史上第一次,每一家此類(lèi)公司都需要大量計(jì)算資源和大量token。這個(gè)行業(yè)正在創(chuàng)造、生成token,或者為來(lái)自Anthropic、OpenAI等機(jī)構(gòu)的token增值。

正如PC革命、互聯(lián)網(wǎng)革命、移動(dòng)云革命各自孕育出一批劃時(shí)代的企業(yè),這一代計(jì)算平臺(tái)變革同樣將誕生一批極具影響力的公司,成為未來(lái)世界的重要力量。

推動(dòng)這一切的三大歷史性突破

過(guò)去兩年究竟發(fā)生了什么?三件大事。

第一:ChatGPT,開(kāi)啟生成式AI時(shí)代(2022年底至2023年)

它不僅能感知和理解,還能生成獨(dú)特內(nèi)容。我展示了生成式AI與計(jì)算機(jī)圖形的融合。生成式AI從根本上改變了計(jì)算的方式——計(jì)算從檢索式轉(zhuǎn)變?yōu)樯墒?,這深刻影響著計(jì)算機(jī)架構(gòu)、部署方式和整體意義。

第二:推理AI(Reasoning AI),以o1為代表

推理能力使AI能夠自我反思、規(guī)劃、分解問(wèn)題——將它無(wú)法直接理解的問(wèn)題拆解為可處理的步驟。o1讓生成式AI變得可信,能夠依據(jù)真實(shí)信息進(jìn)行推理。為此,輸入context的token量和用于思考的輸出token量大幅增加,計(jì)算量隨之顯著提升。

第三:Claude Code,首個(gè)智能體模型

它能讀取文件、編寫(xiě)代碼、編譯、測(cè)試、評(píng)估并迭代。Claude Code徹底革新了軟件工程——英偉達(dá)100%的工程師都在使用Claude Code、Codex和Cursor中的一種或多種,沒(méi)有一位軟件工程師不借助AI助力。

這是一個(gè)全新的拐點(diǎn)——你不再是詢(xún)問(wèn)AI"是什么、在哪里、怎么做",而是讓它"創(chuàng)建、執(zhí)行、構(gòu)建",讓它主動(dòng)使用工具、讀取文件、分解問(wèn)題、付諸行動(dòng)。AI從感知,到生成,到推理,再到如今真正能夠完成工作。

過(guò)去兩年,推理所需的計(jì)算量增長(zhǎng)了約10,000倍,使用量增長(zhǎng)了約100倍。我一直認(rèn)為,過(guò)去兩年計(jì)算需求增長(zhǎng)了100萬(wàn)倍——這是所有人的共同感受,是OpenAI的感受,是Anthropic的感受。如果能獲得更多算力,就能生成更多token,收入就會(huì)提升,AI就會(huì)變得更智能。推理拐點(diǎn)已然到來(lái)。

萬(wàn)億美元的AI基礎(chǔ)設(shè)施時(shí)代

去年此時(shí),我在這里表示,我們對(duì)Blackwell和Rubin在2026年之前的需求和采購(gòu)訂單有高度信心,規(guī)模約為5,000億美元。今天,在GTC一年之后,我站在這里告訴大家:展望到2027年,我看到的數(shù)字至少是1萬(wàn)億美元。而且我確信,實(shí)際的計(jì)算需求將遠(yuǎn)不止于此。

2025:英偉達(dá)推理年

2025年是英偉達(dá)的推理年(Year of Inference)。我們希望確保,在訓(xùn)練和后訓(xùn)練之外,也能在A(yíng)I生命周期的每個(gè)階段都保持卓越,使已投資的基礎(chǔ)設(shè)施能夠持續(xù)高效運(yùn)轉(zhuǎn),且有效使用壽命越長(zhǎng),單位成本越低。

與此同時(shí),Anthropic和Meta正式加入NVIDIA平臺(tái),與此共同代表了全球三分之一的AI算力需求。開(kāi)源模型已接近前沿水平,無(wú)處不在。

英偉達(dá)是目前全球唯一一個(gè)能夠運(yùn)行所有AI領(lǐng)域——語(yǔ)言、生物學(xué)、計(jì)算機(jī)圖形、計(jì)算機(jī)視覺(jué)、語(yǔ)音、蛋白質(zhì)與化學(xué)、機(jī)器人等——所有AI模型的平臺(tái),無(wú)論邊緣還是云端,無(wú)論何種語(yǔ)言。英偉達(dá)架構(gòu)對(duì)所有這些場(chǎng)景均具備通用性,這使我們成為成本最低、置信度最高的平臺(tái)。

目前,英偉達(dá)60%的業(yè)務(wù)來(lái)自全球前五大超大規(guī)模云服務(wù)商,剩余40%遍布區(qū)域云、主權(quán)云、企業(yè)、工業(yè)、機(jī)器人、邊緣計(jì)算等各個(gè)領(lǐng)域。AI的覆蓋廣度本身就是其韌性所在——這毫無(wú)疑問(wèn)是一次全新的計(jì)算平臺(tái)變革。

Grace Blackwell與NVLink 72:大膽的架構(gòu)革新

在Hopper架構(gòu)還處于鼎盛時(shí)期,我們就決定徹底重新架構(gòu)系統(tǒng),將NVLink從8路擴(kuò)展為NVLink 72,對(duì)計(jì)算系統(tǒng)進(jìn)行全面分解重構(gòu)。Grace Blackwell NVLink 72是一次巨大的技術(shù)押注,對(duì)所有合作伙伴而言都不容易,在此向所有人表示誠(chéng)摯感謝。

同時(shí),我們推出了NVFP4——不只是普通的FP4,而是一種全新類(lèi)型的張量核心和計(jì)算單元。我們已經(jīng)證明,NVFP4可以在無(wú)精度損失的情況下實(shí)現(xiàn)推理,同時(shí)帶來(lái)巨大的性能提升和能效提升,并且同樣適用于訓(xùn)練。此外,Dynamo和TensorRT-LLM等一系列新算法相繼問(wèn)世,我們甚至為優(yōu)化內(nèi)核而專(zhuān)門(mén)投入數(shù)十億美元建造了一臺(tái)超級(jí)計(jì)算機(jī),稱(chēng)之為DGX Cloud。

結(jié)果證明,我們的推理性能令人矚目。來(lái)自Semi Analysis的數(shù)據(jù)——這是迄今為止最全面的AI推理性能評(píng)測(cè)——顯示英偉達(dá)在每瓦token數(shù)和每token成本兩個(gè)維度上均遙遙領(lǐng)先。原本摩爾定律可能給H200帶來(lái)1.5倍的性能提升,但我們做到了35倍。Semi Analysis的Dylan Patel甚至說(shuō):"黃仁勛保守了,實(shí)際上是50倍。"他說(shuō)得沒(méi)錯(cuò)。

我在此援引他的話(huà):"Jensen sandbagged(黃仁勛保守報(bào)數(shù))。"

英偉達(dá)的每token成本是全球最低,目前無(wú)人能及。原因正在于極致協(xié)同設(shè)計(jì)(Extreme Co-design)。

以Fireworks為例,在英偉達(dá)更新全套軟件和算法之前,其平均token速度約為每秒700個(gè);更新后接近每秒5,000個(gè),提升約7倍。這就是極致協(xié)同設(shè)計(jì)的力量。

AI工廠(chǎng):從數(shù)據(jù)中心到token工廠(chǎng)

數(shù)據(jù)中心過(guò)去是存儲(chǔ)文件的地方,現(xiàn)在它是生產(chǎn)token的工廠(chǎng)。每一家云服務(wù)商、每一家AI公司,未來(lái)都將以"token工廠(chǎng)效率"作為核心經(jīng)營(yíng)指標(biāo)。

這是我的核心論點(diǎn):

縱軸:吞吐量(Throughput)——在固定功率下每秒生成的token數(shù)

橫軸:交互速度(Token Speed)——每次推理的響應(yīng)速度,速度越快,可使用的模型越大、context越長(zhǎng),AI越智能

token是新的大宗商品,一旦成熟,將分層定價(jià):

免費(fèi)層(高吞吐、低速度)

中級(jí)層(~每百萬(wàn)token 3美元)

高級(jí)層(~每百萬(wàn)token 6美元)

高速層(~每百萬(wàn)token 45美元)

超高速層(~每百萬(wàn)token 150美元)

與Hopper相比,Grace Blackwell在最高價(jià)值層提升了35倍吞吐量,并引入全新層級(jí)。以簡(jiǎn)化模型估算,將25%功率分別分配給四個(gè)層級(jí),Grace Blackwell可比Hopper多產(chǎn)生5倍的收入。

Vera Rubin:下一代AI計(jì)算系統(tǒng)

(播放Vera Rubin系統(tǒng)介紹視頻)

Vera Rubin是一個(gè)完整的、端到端優(yōu)化的系統(tǒng),專(zhuān)為智能體(Agentic)工作負(fù)載設(shè)計(jì):

大型語(yǔ)言模型計(jì)算核心:NVLink 72 GPU集群,處理前填充(Prefill)和KV Cache

全新Vera CPU:專(zhuān)為極高單線(xiàn)程性能設(shè)計(jì),采用LPDDR5內(nèi)存,兼具卓越能效,是全球唯一使用LPDDR5的數(shù)據(jù)中心CPU,適合AI智能體工具調(diào)用

存儲(chǔ)系統(tǒng):BlueField 4 + CX 9,面向AI時(shí)代的全新存儲(chǔ)平臺(tái),全球存儲(chǔ)行業(yè)100%加入

CPO Spectrum X交換機(jī):全球首款共封裝光學(xué)以太網(wǎng)交換機(jī),已全面量產(chǎn)

Kyber機(jī)架:全新機(jī)架系統(tǒng),支持144塊GPU組成單一NVLink域,前端計(jì)算、后端NVLink交換,形成一臺(tái)巨型計(jì)算機(jī)

Rubin Ultra:下一代超算節(jié)點(diǎn),豎插式設(shè)計(jì),配合Kyber機(jī)架,支持更大規(guī)模NVLink互聯(lián)

Vera Rubin已100%液冷,安裝時(shí)間從兩天縮短至兩小時(shí),采用45°C熱水冷卻,大幅降低數(shù)據(jù)中心冷卻壓力。這次Satya(納德拉)已發(fā)文確認(rèn),首臺(tái)Vera Rubin機(jī)架已在微軟Azure上線(xiàn)運(yùn)行,我為此深感振奮。

Groq整合:推理性能的極致延伸

我們收購(gòu)了Groq團(tuán)隊(duì)并獲得其技術(shù)授權(quán)。Groq是一種確定性數(shù)據(jù)流處理器(Deterministic Dataflow Processor),采用靜態(tài)編譯和編譯器調(diào)度,擁有大量SRAM,專(zhuān)為推理單一工作負(fù)載優(yōu)化,具備極低延遲和極高token生成速度。

然而,Groq的內(nèi)存容量有限(500MB片上SRAM),難以獨(dú)立承載大模型的參數(shù)和KV Cache,限制了其大規(guī)模應(yīng)用。

解決方案正是Dynamo——一套推理調(diào)度軟件。我們通過(guò)Dynamo將推理管線(xiàn)解聚(Disaggregate):

**前填充(Prefill)及注意力機(jī)制的解碼(Decode)**在Vera Rubin上完成(需要大量算力和KV Cache存儲(chǔ))

**前饋網(wǎng)絡(luò)解碼(Feed-Forward Network Decode)**即token生成部分,在Groq上完成(需要極高帶寬和低延遲)

兩者通過(guò)以太網(wǎng)緊密耦合,借助特殊模式將延遲減少約一半。在Dynamo這一"AI工廠(chǎng)操作系統(tǒng)"的統(tǒng)一調(diào)度下,整體性能提升35倍,并開(kāi)辟了NVLink 72此前無(wú)法觸及的全新推理性能層級(jí)。

Groq與Vera Rubin的組合建議:

若工作負(fù)載以高吞吐為主,使用100% Vera Rubin

若大量工作負(fù)載為代碼生成等高價(jià)值token生成,可引入Groq,建議比例約為25% Groq + 75% Vera Rubin

Groq LP30由三星代工,目前已進(jìn)入量產(chǎn),預(yù)計(jì)Q3開(kāi)始出貨。感謝三星的全力配合。

推理性能的歷史性飛躍

將此前技術(shù)進(jìn)步量化:在2年時(shí)間內(nèi),1吉瓦AI工廠(chǎng)的token生成速率將從2,200萬(wàn)token/秒提升至7億token/秒,提升350倍。這就是極致協(xié)同設(shè)計(jì)的力量。

技術(shù)路線(xiàn)圖

Blackwell:當(dāng)前在產(chǎn),Oberon標(biāo)準(zhǔn)機(jī)架系統(tǒng),銅纜擴(kuò)展至NVLink 72,可選光學(xué)擴(kuò)展至NVLink 576

Vera Rubin(當(dāng)前):Kyber機(jī)架,NVLink 144(銅纜);Oberon機(jī)架,NVLink 72 + 光學(xué),擴(kuò)展至NVLink 576;Spectrum 6,全球首款CPO交換機(jī)

Vera Rubin Ultra(即將推出):新一代Rubin Ultra GPU,LP35芯片(首次集成NVFP4),進(jìn)一步提升數(shù)倍性能

Feynman(下一代):全新GPU,LP40芯片(由英偉達(dá)與Groq團(tuán)隊(duì)聯(lián)合打造,集成NVFP4);全新CPU——Rosa(Rosalyn);BlueField 5;CX 10;同時(shí)支持銅纜和CPO兩種擴(kuò)展方式的Kyber機(jī)架

路線(xiàn)圖明確:銅纜擴(kuò)展、光學(xué)擴(kuò)展(Scale-Up)、光學(xué)擴(kuò)展(Scale-Out)三條路線(xiàn)并行推進(jìn),我們需要所有合作伙伴在銅纜、光纖和CPO方面持續(xù)擴(kuò)產(chǎn)。

NVIDIA DSX:AI工廠(chǎng)的數(shù)字孿生平臺(tái)

AI工廠(chǎng)越來(lái)越復(fù)雜,但組成它的各類(lèi)技術(shù)供應(yīng)商過(guò)去從未在設(shè)計(jì)階段相互協(xié)作,直到在數(shù)據(jù)中心才"相遇"——這顯然不夠。

為此,我們創(chuàng)建了Omniverse,以及基于其上的NVIDIA DSX平臺(tái)——一個(gè)供所有合作伙伴在虛擬世界中共同設(shè)計(jì)和運(yùn)營(yíng)吉瓦級(jí)AI工廠(chǎng)的平臺(tái)。DSX提供:

機(jī)架級(jí)機(jī)械、熱學(xué)、電氣、網(wǎng)絡(luò)仿真系統(tǒng)

與電網(wǎng)的連接,實(shí)現(xiàn)協(xié)同節(jié)能調(diào)度

數(shù)據(jù)中心內(nèi)基于Max-Q的動(dòng)態(tài)功耗和冷卻優(yōu)化

保守估計(jì),這套系統(tǒng)可將能源利用效率提升約2倍,在我們談?wù)摰囊?guī)模上,這是非??捎^(guān)的收益。Omniverse從數(shù)字地球開(kāi)始,將承載各種規(guī)模的數(shù)字孿生,我們正與全球合作伙伴共同構(gòu)建人類(lèi)歷史上最大的計(jì)算機(jī)。

此外,英偉達(dá)正在進(jìn)軍太空。Thor芯片已通過(guò)輻射認(rèn)證,正在衛(wèi)星中運(yùn)行。我們正與合作伙伴開(kāi)發(fā)Vera Rubin Space-1,用于建設(shè)太空數(shù)據(jù)中心。在太空中只能依靠輻射散熱,熱管理是核心挑戰(zhàn),我們正集結(jié)頂尖工程師攻關(guān)。

OpenClaw:智能體時(shí)代的操作系統(tǒng)

Peter Steinberger開(kāi)發(fā)了一款名為OpenClaw的軟件。這是人類(lèi)歷史上最受歡迎的開(kāi)源項(xiàng)目,在短短幾周內(nèi)便超越了Linux三十年的成就。

OpenClaw本質(zhì)上是一個(gè)智能體系統(tǒng)(Agentic System),能夠:

管理資源,訪(fǎng)問(wèn)工具、文件系統(tǒng)和大型語(yǔ)言模型;執(zhí)行調(diào)度、定時(shí)任務(wù);將問(wèn)題逐步分解,并調(diào)用子智能體;支持任意模態(tài)的輸入輸出(語(yǔ)音、視頻、文字、郵件等)。

用操作系統(tǒng)的語(yǔ)法來(lái)描述,它確實(shí)就是一個(gè)操作系統(tǒng)——智能體計(jì)算機(jī)的操作系統(tǒng)。Windows讓個(gè)人計(jì)算機(jī)成為可能,OpenClaw讓個(gè)人智能體成為可能。

每一家企業(yè)都需要制定自己的OpenClaw戰(zhàn)略,正如我們都需要Linux策略、HTML策略、Kubernetes策略一樣。

企業(yè)IT的全面重塑

OpenClaw之前的企業(yè)IT:數(shù)據(jù)和文件進(jìn)入系統(tǒng),流經(jīng)工具和工作流,最終變成供人類(lèi)使用的工具。軟件公司創(chuàng)建工具,系統(tǒng)集成商(GSI)和咨詢(xún)公司幫助企業(yè)使用這些工具。

OpenClaw之后的企業(yè)IT:每一家SaaS公司都將轉(zhuǎn)變?yōu)锳aaS(Agentic as a Service,智能體即服務(wù))公司——不只是提供工具,而是提供專(zhuān)精特定領(lǐng)域的AI智能體。

但這里有一個(gè)關(guān)鍵挑戰(zhàn):企業(yè)內(nèi)部的智能體可以訪(fǎng)問(wèn)敏感數(shù)據(jù)、執(zhí)行代碼、與外部通信。這在企業(yè)環(huán)境中必須得到嚴(yán)格管控。

為此,我們與Peter合作,將安全性融入企業(yè)級(jí)版本,推出了:

NeMo Claw(參考設(shè)計(jì)):基于OpenClaw的企業(yè)級(jí)參考框架,集成NVIDIA的全套智能體AI工具包

Open Shield(安全層):已集成至OpenClaw,提供策略引擎、網(wǎng)絡(luò)護(hù)欄、隱私路由,確保企業(yè)數(shù)據(jù)安全

NeMo Cloud:可下載使用,并與所有SaaS企業(yè)的策略引擎對(duì)接

這是企業(yè)IT的文藝復(fù)興,一個(gè)原本2萬(wàn)億美元規(guī)模的產(chǎn)業(yè),即將成長(zhǎng)為數(shù)萬(wàn)億美元規(guī)模,從提供工具轉(zhuǎn)向提供專(zhuān)業(yè)化的AI智能體服務(wù)。

我完全可以預(yù)見(jiàn):未來(lái),公司里的每一位工程師都將擁有年度token預(yù)算。他們年薪可能是幾十萬(wàn)美元,我會(huì)額外給他們相當(dāng)于薪資一半的token配額,讓他們的產(chǎn)出放大10倍。"入職附帶多少token配額"已經(jīng)成為硅谷的新晉招聘話(huà)題。

每一家企業(yè)未來(lái)都將既是token的使用者(供工程師使用),也是token的生產(chǎn)者(為其客戶(hù)提供服務(wù))。OpenClaw的意義不可低估,它和HTML、Linux一樣重要。

NVIDIA開(kāi)放模型倡議

在自定義智能體(Custom Claw)方面,我們提供了NVIDIA自研的前沿模型:

模型領(lǐng)域Nemotron大型語(yǔ)言模型Cosmos世界基礎(chǔ)模型(World Foundation Model)GROOT通用人形機(jī)器人模型Alpamayo自動(dòng)駕駛BioNeMo數(shù)字生物學(xué)Phys-AIAI物理

我們?cè)诿恳粋€(gè)領(lǐng)域都處于技術(shù)前沿,并承諾持續(xù)迭代——Nemotron 3之后有Nemotron 4,Cosmos 1之后有Cosmos 2,Groq也將迭代到第二代。

Nemotron 3在OpenClaw中名列全球三大最佳模型之列,處于前沿水平。Nemotron 3 Ultra將成為有史以來(lái)最強(qiáng)的基礎(chǔ)模型,支持各國(guó)構(gòu)建主權(quán)AI。

今天,我們宣布成立Nemotron聯(lián)盟,投資數(shù)十億美元推進(jìn)AI基礎(chǔ)模型研發(fā)。聯(lián)盟成員包括:BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam(印度)、Thinking Machines(Mira Murati的實(shí)驗(yàn)室)等。一個(gè)又一個(gè)企業(yè)軟件公司加入,將NeMo Claw參考設(shè)計(jì)和NVIDIA智能體AI工具包整合到自身產(chǎn)品中。

物理AI與機(jī)器人

數(shù)字智能體在數(shù)字世界中行動(dòng)——撰寫(xiě)代碼、分析數(shù)據(jù);而物理AI則是具身化的智能體,也就是機(jī)器人。

本次GTC共有110款機(jī)器人亮相,幾乎囊括了全球所有機(jī)器人研發(fā)企業(yè)。英偉達(dá)提供三臺(tái)計(jì)算機(jī)(訓(xùn)練計(jì)算機(jī)、仿真計(jì)算機(jī)、機(jī)載計(jì)算機(jī))和完整的軟件棧及AI模型。

自動(dòng)駕駛方面,自動(dòng)駕駛的"ChatGPT時(shí)刻"已經(jīng)到來(lái)。今天,我們宣布四家新合作伙伴加入英偉達(dá)RoboTaxi Ready平臺(tái):比亞迪、現(xiàn)代、日產(chǎn)、吉利,合計(jì)年產(chǎn)量1,800萬(wàn)輛。加上此前的奔馳、豐田、通用,陣容進(jìn)一步壯大。我們同時(shí)宣布與Uber達(dá)成重大合作,將在多個(gè)城市部署并接入RoboTaxi Ready車(chē)輛。

工業(yè)機(jī)器人方面,ABB、Universal Robotics、KUKA等眾多機(jī)器人企業(yè)與我們合作,將物理AI模型與仿真系統(tǒng)相結(jié)合,推動(dòng)機(jī)器人在全球制造產(chǎn)線(xiàn)的落地。

電信方面,卡特彼勒(Caterpillar)和T-Mobile也在其列。未來(lái),無(wú)線(xiàn)基站將不再只是一個(gè)通信節(jié)點(diǎn),而是一個(gè)NVIDIA Aerial AI RAN——能夠?qū)崟r(shí)感知流量、調(diào)整波束成形,實(shí)現(xiàn)節(jié)能增效的智能化邊緣計(jì)算平臺(tái)。

特別環(huán)節(jié):Olaf機(jī)器人亮相

(播放Disney Olaf機(jī)器人演示視頻)

黃仁勛: 雪人登場(chǎng)!Newton運(yùn)行正常!Omniverse也運(yùn)行正常!Olaf,你好嗎?

Olaf: 見(jiàn)到你我真的太開(kāi)心了。

黃仁勛: 是的,因?yàn)槭俏医o了你計(jì)算機(jī)——Jetson!

Olaf: 那是什么?

黃仁勛: 就在你的肚子里。

Olaf: 太神奇了。

黃仁勛: 你是在Omniverse里學(xué)會(huì)走路的。

Olaf: 我喜歡走路。這比騎馴鹿仰望美麗的天空好多了。

黃仁勛: 這正是因?yàn)槲锢矸抡妗贜VIDIA Warp運(yùn)行的Newton求解器,這是我們與Disney和DeepMind聯(lián)合開(kāi)發(fā)的,讓你能夠適應(yīng)真實(shí)的物理世界。

Olaf: 我正想說(shuō)這個(gè)。

黃仁勛: 這就是你聰明的地方。我是雪人,不是雪球。

黃仁勛: 你能想象嗎?未來(lái)的迪士尼樂(lè)園——所有這些機(jī)器人角色在園區(qū)里自由漫步。不過(guò)說(shuō)實(shí)話(huà),我以為你會(huì)更高一些。我從沒(méi)見(jiàn)過(guò)這么矮的雪人。

Olaf: (不置可否)

黃仁勛: 來(lái)幫我結(jié)束今天的演講好嗎?

Olaf: 太棒啦!

主題演講總結(jié)

黃仁勛:今天,我們共同探討了以下核心主題:

推理拐點(diǎn)的到來(lái):推理已成為AI最核心的工作負(fù)載,token是新的大宗商品,推理性能直接決定收入

AI工廠(chǎng)時(shí)代:數(shù)據(jù)中心已從文件存儲(chǔ)設(shè)施演變?yōu)閠oken生產(chǎn)工廠(chǎng),未來(lái)每家公司都將以"AI工廠(chǎng)效率"來(lái)衡量自身競(jìng)爭(zhēng)力

OpenClaw智能體革命:OpenClaw開(kāi)啟了智能體計(jì)算時(shí)代,企業(yè)IT正在從工具時(shí)代走向智能體時(shí)代,每家企業(yè)都需要制定OpenClaw戰(zhàn)略

物理AI與機(jī)器人:具身智能正在規(guī)?;涞?,自動(dòng)駕駛、工業(yè)機(jī)器人、人形機(jī)器人共同構(gòu)成物理AI的下一個(gè)重大機(jī)遇

感謝大家,GTC愉快!

杰克?韋爾奇說(shuō):“你可以拒絕學(xué)習(xí),但你的競(jìng)爭(zhēng)對(duì)手不會(huì)!”

2026年,我們一起走進(jìn)知名企業(yè)參訪(fǎng)交流學(xué)習(xí)。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
歐冠一夜變天:巴黎大勝巴薩險(xiǎn)造奇跡,四強(qiáng)出爐

歐冠一夜變天:巴黎大勝巴薩險(xiǎn)造奇跡,四強(qiáng)出爐

老牛體育解說(shuō)
2026-04-15 07:04:54
董卿罕見(jiàn)現(xiàn)身!上海餐廳素面朝天穿白衫,五十歲美得超自然

董卿罕見(jiàn)現(xiàn)身!上海餐廳素面朝天穿白衫,五十歲美得超自然

南方城市網(wǎng)
2026-04-14 19:14:54
狐貍尾巴藏不?。∫詾槟堋皻У簟比t嬋,不料自己先被扒個(gè)底朝天

狐貍尾巴藏不??!以為能“毀掉”全紅嬋,不料自己先被扒個(gè)底朝天

讓生活充滿(mǎn)溫暖
2026-04-14 16:34:45
韓國(guó)與江蘇對(duì)比:面積同為10多萬(wàn),韓國(guó)高速4848公里,江蘇多長(zhǎng)?

韓國(guó)與江蘇對(duì)比:面積同為10多萬(wàn),韓國(guó)高速4848公里,江蘇多長(zhǎng)?

小蘭聊歷史
2026-04-14 23:50:08
西蒙尼:我們所做的一切都是為了帶領(lǐng)馬競(jìng)走向歐洲足壇的巔峰

西蒙尼:我們所做的一切都是為了帶領(lǐng)馬競(jìng)走向歐洲足壇的巔峰

懂球帝
2026-04-15 07:16:17
不打了!MVP附加賽報(bào)銷(xiāo)!全聯(lián)盟最貴的毒藥合同

不打了!MVP附加賽報(bào)銷(xiāo)!全聯(lián)盟最貴的毒藥合同

籃球?qū)崙?zhàn)寶典
2026-04-14 15:30:22
滿(mǎn)屏荷爾蒙!悉尼妹這一脫,又引發(fā)爭(zhēng)議了

滿(mǎn)屏荷爾蒙!悉尼妹這一脫,又引發(fā)爭(zhēng)議了

來(lái)看美劇
2026-04-14 21:11:02
字字扎心!王曉晨發(fā)文內(nèi)涵俞灝明,五年付出全都白費(fèi),壓根沒(méi)看上

字字扎心!王曉晨發(fā)文內(nèi)涵俞灝明,五年付出全都白費(fèi),壓根沒(méi)看上

仙味少女心
2026-04-14 12:57:06
山姆會(huì)員商店順德店4月25日開(kāi)業(yè) 為佛山首家

山姆會(huì)員商店順德店4月25日開(kāi)業(yè) 為佛山首家

觀(guān)點(diǎn)機(jī)構(gòu)
2026-04-14 20:32:37
雷佩凡四連鞭不敵00后,10-9遭絕殺,末輪9強(qiáng)出爐

雷佩凡四連鞭不敵00后,10-9遭絕殺,末輪9強(qiáng)出爐

二爺臺(tái)球解說(shuō)
2026-04-15 00:06:14
勇士隊(duì)若想要在附加賽中擊敗快船隊(duì),波爾津吉斯必須拿出最佳表現(xiàn)

勇士隊(duì)若想要在附加賽中擊敗快船隊(duì),波爾津吉斯必須拿出最佳表現(xiàn)

好火子
2026-04-15 04:02:54
金融圈突發(fā)!涉嫌嚴(yán)重違紀(jì)違法,姚玉平被查

金融圈突發(fā)!涉嫌嚴(yán)重違紀(jì)違法,姚玉平被查

中國(guó)基金報(bào)
2026-04-14 19:05:24
大量驍龍8gen2新機(jī)流入閑魚(yú)!還是16+512定制版,來(lái)自知名車(chē)企

大量驍龍8gen2新機(jī)流入閑魚(yú)!還是16+512定制版,來(lái)自知名車(chē)企

科技海岸線(xiàn)
2026-04-13 18:31:50
演員王星回應(yīng)不結(jié)婚原因,至今無(wú)力還清女友借款!曾一天收入不到208元

演員王星回應(yīng)不結(jié)婚原因,至今無(wú)力還清女友借款!曾一天收入不到208元

極目新聞
2026-04-14 18:43:54
文章上海開(kāi)陜西面館凌晨仍爆火,網(wǎng)友玩梗周一不見(jiàn)

文章上海開(kāi)陜西面館凌晨仍爆火,網(wǎng)友玩梗周一不見(jiàn)

愛(ài)吃冰棍的小痞子
2026-04-14 23:50:25
家里若是有這7種“老物件”,好好保存,越放越值錢(qián),能當(dāng)傳家寶

家里若是有這7種“老物件”,好好保存,越放越值錢(qián),能當(dāng)傳家寶

Home范
2026-04-11 10:16:28
張玉寧現(xiàn)狀:兩鬢已斑白,離婚要兒子不要房,至今單身征戰(zhàn)蘇超

張玉寧現(xiàn)狀:兩鬢已斑白,離婚要兒子不要房,至今單身征戰(zhàn)蘇超

楠楠自語(yǔ)
2026-04-13 18:35:30
強(qiáng)制“一夫多妻”的南美小國(guó),老婆不能少于兩個(gè),少了就要坐牢?

強(qiáng)制“一夫多妻”的南美小國(guó),老婆不能少于兩個(gè),少了就要坐牢?

北緯的咖啡豆
2026-04-14 17:02:17
武漢一小區(qū)電梯發(fā)生沖頂事故,當(dāng)?shù)赝▓?bào):系維修人員操作不當(dāng)

武漢一小區(qū)電梯發(fā)生沖頂事故,當(dāng)?shù)赝▓?bào):系維修人員操作不當(dāng)

新京報(bào)
2026-04-14 21:52:14
特朗普在伊朗戰(zhàn)爭(zhēng)中犯下的7個(gè)致命錯(cuò)誤

特朗普在伊朗戰(zhàn)爭(zhēng)中犯下的7個(gè)致命錯(cuò)誤

史政先鋒
2026-04-12 18:27:18
2026-04-15 07:35:00
跨界標(biāo)桿研習(xí)社 incentive-icons
跨界標(biāo)桿研習(xí)社
傳播名企管理經(jīng)驗(yàn)走進(jìn)企業(yè)訪(fǎng)學(xué)
1828文章數(shù) 16477關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

霍爾木茲海峽恢復(fù)部分通航 美軍封鎖伊朗港口持續(xù)

頭條要聞

霍爾木茲海峽恢復(fù)部分通航 美軍封鎖伊朗港口持續(xù)

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊(duì)道歉”

娛樂(lè)要聞

網(wǎng)曝鐘麗緹代孕要了個(gè)男孩 備孕近10年

財(cái)經(jīng)要聞

許家印認(rèn)罪,他和恒大還有多少欠債?

汽車(chē)要聞

售12.99萬(wàn)起/續(xù)航2000km 風(fēng)云T9L上市

態(tài)度原創(chuàng)

教育
旅游
游戲
時(shí)尚
本地

教育要聞

2024屆女生就業(yè)量較大的前10個(gè)本科專(zhuān)業(yè)

旅游要聞

全球藝術(shù)博物館訪(fǎng)問(wèn)量排行出爐,上博東館入列前十 | 新民僑梁

系好安全帶!原作者確認(rèn)《地鐵2039》將比前作更黑暗

壞事做盡的瘋女人,集體翻紅了

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版