国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛GTC演講全文:推理時(shí)代到來(lái),2027營(yíng)收至少萬(wàn)億美元,龍蝦就是新操作系統(tǒng)

0
分享至


2026年3月16日,英偉達(dá)GTC 2026大會(huì)正式開(kāi)幕,英偉達(dá)創(chuàng)始人兼CEO黃仁勛發(fā)表了主題演講。

在這場(chǎng)被視為“AI行業(yè)年度朝圣”的大會(huì)上,黃仁勛闡述了英偉達(dá)從一家“芯片公司”向“AI基礎(chǔ)設(shè)施和工廠公司”的蛻變。面對(duì)市場(chǎng)最關(guān)心的業(yè)績(jī)持續(xù)性與增長(zhǎng)空間問(wèn)題,黃仁勛詳細(xì)拆解了驅(qū)動(dòng)未來(lái)增長(zhǎng)的底層商業(yè)邏輯——“Token工廠經(jīng)濟(jì)學(xué)”。

業(yè)績(jī)指引極度樂(lè)觀,“2027年至少1萬(wàn)億美元的需求”

過(guò)去兩年,全球AI計(jì)算需求呈指數(shù)級(jí)爆炸。隨著大模型從“感知”、“生成”進(jìn)化到“推理”與“行動(dòng)(執(zhí)行任務(wù))”,算力的消耗量急劇攀升。針對(duì)市場(chǎng)高度關(guān)注的訂單與營(yíng)收天花板,黃仁勛給出了極為強(qiáng)勁的預(yù)期。

黃仁勛在演講中直言:

去年這個(gè)時(shí)候,我說(shuō)過(guò),我們看到了5000億美元的高確信度需求,覆蓋Blackwell和Rubin直到2026年?,F(xiàn)在,就在此時(shí)此地,我看到到2027年至少有1萬(wàn)億美元的需求(at least $1 trillion)。


黃仁勛的萬(wàn)億預(yù)期一度推動(dòng)英偉達(dá)股價(jià)漲超4.3%。


不僅如此,他更是對(duì)這一數(shù)字做出了補(bǔ)充:

這合理嗎?這就是我接下來(lái)要講的。事實(shí)上,我們甚至?xí)┎粦?yīng)求。我確定,實(shí)際的計(jì)算需求會(huì)比這高得多。

黃仁勛指出,如今的英偉達(dá)系統(tǒng)已經(jīng)證明了自己是全球“成本最低的基礎(chǔ)設(shè)施”。由于英偉達(dá)能運(yùn)行幾乎所有領(lǐng)域的AI模型,這種通用性使得客戶投入的這1萬(wàn)億美元能夠被充分利用并保持長(zhǎng)久的生命周期。

目前,英偉達(dá)60%的業(yè)務(wù)來(lái)自排名前五的超大型云服務(wù)商,而另外40%的業(yè)務(wù)則廣泛分布于主權(quán)云、企業(yè)、工業(yè)、機(jī)器人和邊緣計(jì)算等各個(gè)領(lǐng)域。

Token工廠經(jīng)濟(jì)學(xué),每瓦性能決定商業(yè)命脈

為了解釋這1萬(wàn)億需求的合理性,黃仁勛向全球企業(yè)CEO展示了一套全新的商業(yè)思維。他指出,未來(lái)的數(shù)據(jù)中心不再是存儲(chǔ)文件的倉(cāng)庫(kù),而是生產(chǎn)Token(AI生成的基本單位)的“工廠”。


黃仁勛強(qiáng)調(diào):

每一座數(shù)據(jù)中心、每一座工廠,從定義上來(lái)說(shuō)都是受電力限制的。一座1GW(吉瓦)的工廠永遠(yuǎn)不會(huì)變成2GW,這是物理和原子的定律。在固定的功率下,誰(shuí)的每瓦Token吞吐量最高,誰(shuí)的生產(chǎn)成本就最低。

黃仁勛將未來(lái)的AI服務(wù)分為四個(gè)商業(yè)層級(jí):

  • 免費(fèi)層(高吞吐、低速度)
  • 中級(jí)層(~每百萬(wàn)token 3美元)
  • 高級(jí)層(~每百萬(wàn)token 6美元)
  • 高速層(~每百萬(wàn)token 45美元)
  • 超高速層(~每百萬(wàn)token 150美元)

他指出,隨著模型越來(lái)越大、上下文越來(lái)越長(zhǎng),AI會(huì)變得更聰明,但Token的生成速率會(huì)降低。黃仁勛表示:

在這個(gè)Token工廠里,你的吞吐量和Token生成速度,將直接轉(zhuǎn)化為你明年的精確收入。

黃仁勛強(qiáng)調(diào)英偉達(dá)的架構(gòu)能夠讓客戶在免費(fèi)層實(shí)現(xiàn)極高的吞吐量,同時(shí)在最高價(jià)值的推理層級(jí)上,將性能提升驚人的35倍。


Vera Rubin兩年實(shí)現(xiàn)350倍加速,Groq填補(bǔ)極速推理

在這個(gè)物理極限的約束下,英偉達(dá)介紹其有史以來(lái)最復(fù)雜的AI計(jì)算系統(tǒng),Vera Rubin。黃仁勛表示:

過(guò)去提到Hopper,我會(huì)舉起一塊芯片,那很可愛(ài)。但提到Vera Rubin,大家想到的是整個(gè)系統(tǒng)。在這個(gè)100%液冷、完全消滅了傳統(tǒng)線纜的系統(tǒng)中,過(guò)去需要兩天安裝的機(jī)架,現(xiàn)在只需兩小時(shí)。

黃仁勛指出,通過(guò)極致的端到端軟硬件協(xié)同設(shè)計(jì),Vera Rubin在同一座1GW數(shù)據(jù)中心里創(chuàng)造了驚人的數(shù)據(jù)跨越:

在短短兩年時(shí)間內(nèi),我們將Token的生成速率從2200萬(wàn)提升到了7億,實(shí)現(xiàn)了350倍的增長(zhǎng)。摩爾定律在同時(shí)期僅能帶來(lái)約1.5倍的提升。

為了解決極速推理(如1000 Tokens/秒)條件下的帶寬瓶頸,英偉達(dá)給出了整合被收購(gòu)公司Groq的最終方案:非對(duì)稱式的分離推理。黃仁勛解釋:

這兩款處理器的特點(diǎn)截然不同。Groq芯片擁有500MB的SRAM,而一顆Rubin芯片擁有288GB的內(nèi)存。


黃仁勛指出,英偉達(dá)通過(guò)Dynamo軟件系統(tǒng),將需要海量計(jì)算和顯存的“預(yù)填充(Pre-fill)”階段交給Vera Rubin,將對(duì)延遲極度敏感的“解碼”階段交給Groq。黃仁勛還對(duì)企業(yè)算力配置給出了建議:

如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價(jià)值的編程級(jí)別的Token生成需求,拿出25%的數(shù)據(jù)中心規(guī)模給Groq。

據(jù)透露,由三星代工的Groq LP30芯片已在量產(chǎn),預(yù)計(jì)第三季度出貨,而首個(gè)Vera Rubin機(jī)架已在微軟Azure云上運(yùn)行。

此外,針對(duì)光互聯(lián)技術(shù),黃仁勛展示了全球首款量產(chǎn)的共封裝光學(xué)(CPO)交換機(jī)Spectrum X,并平息了市場(chǎng)對(duì)于“銅退光進(jìn)”的路線之爭(zhēng):

我們需要更多的銅纜產(chǎn)能,更多的光芯片產(chǎn)能,更多的CPO產(chǎn)能。
Agent終結(jié)傳統(tǒng)SaaS,“年薪+Token”成硅谷標(biāo)配

除了硬件壁壘,黃仁勛把大量篇幅留給了AI軟件和生態(tài)的革命,特別是Agent(智能體)的爆發(fā)。

他將開(kāi)源項(xiàng)目OpenClaw形容為“人類歷史上最受歡迎的開(kāi)源項(xiàng)目”,稱其僅用幾周時(shí)間就超越了Linux在過(guò)去30年取得的成就。黃仁勛直言,OpenClaw本質(zhì)上就是Agent計(jì)算機(jī)的“操作系統(tǒng)”。

黃仁勛斷言:

每一個(gè)SaaS(軟件即服務(wù))公司都將變成AaaS(Agent-as-a-Service,智能體即服務(wù))公司。毫無(wú)疑問(wèn),為了讓這種具備訪問(wèn)敏感數(shù)據(jù)和執(zhí)行代碼能力的智能體安全落地,英偉達(dá)推出了企業(yè)級(jí)的NeMo Claw參考設(shè)計(jì),增加了策略引擎和隱私路由器。

對(duì)于普通職場(chǎng)人,這場(chǎng)變革同樣近在咫尺。黃仁勛描繪了未來(lái)的職場(chǎng)新形態(tài):

在未來(lái),我們公司的每一位工程師都需要一個(gè)年度Token預(yù)算。他們的基礎(chǔ)年薪可能是幾十萬(wàn)美元,我會(huì)在此基礎(chǔ)上再拿出大約一半的金額作為T(mén)oken額度給他們,讓他們實(shí)現(xiàn)10x的效率提升。這已經(jīng)是硅谷的新招聘籌碼了:你的offer里帶多少Token?

演講最后,黃仁勛還“劇透”了下一代計(jì)算架構(gòu)Feynman,它將首次實(shí)現(xiàn)銅線與CPO的共同水平擴(kuò)展。更引人遐想的是,英偉達(dá)正在研發(fā)部署在太空的數(shù)據(jù)中心計(jì)算機(jī)“Vera Rubin Space-1”,徹底打開(kāi)了AI算力向地球之外延伸的想象空間。

黃仁勛GTC 2026演講全文,全文翻譯如下(AI工具輔助):

主持人:歡迎英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛上臺(tái)。
黃仁勛,創(chuàng)始人兼首席執(zhí)行官:
歡迎來(lái)到GTC。我想提醒大家,這是一場(chǎng)技術(shù)大會(huì)。能看到這么多人一大早排隊(duì)入場(chǎng),能看到在座的各位,我感到非常高興。
在GTC,我們將聚焦三大主題:技術(shù)、平臺(tái)和生態(tài)系統(tǒng)。英偉達(dá)目前擁有三大平臺(tái):CUDA-X平臺(tái)、系統(tǒng)平臺(tái),以及我們最新推出的AI工廠平臺(tái)。
在正式開(kāi)始之前,我要感謝我們的預(yù)熱環(huán)節(jié)主持人——Conviction的Sarah Guo、紅杉資本的Alfred Lin(英偉達(dá)的第一位風(fēng)險(xiǎn)投資人),以及英偉達(dá)的第一位主要機(jī)構(gòu)投資人Gavin Baker。這三位對(duì)技術(shù)有深刻的洞見(jiàn),在整個(gè)技術(shù)生態(tài)系統(tǒng)中擁有極廣的影響力。當(dāng)然,我還要感謝今天所有我親自邀請(qǐng)出席的貴賓們。感謝這支全明星團(tuán)隊(duì)。
我同樣要感謝今天到場(chǎng)的所有企業(yè)。英偉達(dá)是一家平臺(tái)公司,我們擁有技術(shù)、平臺(tái)和豐富的生態(tài)系統(tǒng)。今天到場(chǎng)的企業(yè)代表了價(jià)值100萬(wàn)億美元行業(yè)中幾乎全部的參與者,共有450家公司贊助了本次活動(dòng),在此深表感謝。
本次大會(huì)共設(shè)有1,000場(chǎng)技術(shù)論壇、2,000位演講嘉賓,將覆蓋人工智能"五層蛋糕"架構(gòu)的每一個(gè)層級(jí)——從土地、電力與機(jī)房等基礎(chǔ)設(shè)施,到芯片、平臺(tái)、模型,以及最終推動(dòng)整個(gè)行業(yè)騰飛的各類應(yīng)用。
CUDA:二十年的技術(shù)積淀
一切的起點(diǎn),就在這里。今年是CUDA誕生二十周年。
二十年來(lái),我們始終致力于這一架構(gòu)的研發(fā)。CUDA是一項(xiàng)革命性的發(fā)明——SIMT(單指令多線程)技術(shù)允許開(kāi)發(fā)者以標(biāo)量代碼編寫(xiě)程序,并將其擴(kuò)展為多線程應(yīng)用,其編程難度遠(yuǎn)低于此前的SIMD架構(gòu)。我們最近還新增了Tiles功能,幫助開(kāi)發(fā)者更便捷地編程張量核心(Tensor Core),以及當(dāng)今人工智能所依賴的各類數(shù)學(xué)運(yùn)算結(jié)構(gòu)。目前,CUDA已擁有數(shù)千種工具、編譯器、框架和庫(kù),在開(kāi)源社區(qū)中存在數(shù)十萬(wàn)個(gè)公開(kāi)項(xiàng)目,并已深度集成到每一個(gè)技術(shù)生態(tài)系統(tǒng)之中。
這張圖表揭示了英偉達(dá)100%的戰(zhàn)略邏輯,我從最初就一直在講這張幻燈片。其中最難實(shí)現(xiàn)、也是最核心的要素,是圖表底部的"裝機(jī)量"。歷經(jīng)二十年,我們已在全球范圍內(nèi)積累了數(shù)億塊運(yùn)行CUDA的GPU和計(jì)算系統(tǒng)。
我們的GPU覆蓋所有云平臺(tái),服務(wù)于幾乎所有計(jì)算機(jī)廠商和行業(yè)。CUDA龐大的裝機(jī)量,正是這個(gè)飛輪不斷加速的根本原因。裝機(jī)量吸引開(kāi)發(fā)者,開(kāi)發(fā)者創(chuàng)造新算法并取得突破,突破催生全新市場(chǎng),新市場(chǎng)形成新生態(tài)并吸引更多企業(yè)加入,進(jìn)而擴(kuò)大裝機(jī)量——這個(gè)飛輪正在持續(xù)加速。
英偉達(dá)庫(kù)的下載量正以驚人的速度增長(zhǎng),規(guī)模龐大且增速不斷提升。這個(gè)飛輪使我們的計(jì)算平臺(tái)能夠支撐海量應(yīng)用和層出不窮的新突破。
更重要的是,它還賦予了這些基礎(chǔ)設(shè)施極長(zhǎng)的使用壽命。原因顯而易見(jiàn):NVIDIA CUDA上可運(yùn)行的應(yīng)用極為豐富,涵蓋AI生命周期的每個(gè)階段、各類數(shù)據(jù)處理平臺(tái),以及各種科學(xué)原理求解器。因此,一旦安裝了英偉達(dá)GPU,其實(shí)際使用價(jià)值極高。這也是為何我們六年前發(fā)布的Ampere架構(gòu)GPU,其云端價(jià)格反而在上漲。
這一切的根本原因在于:裝機(jī)量龐大,飛輪強(qiáng)勁,開(kāi)發(fā)者生態(tài)廣泛。當(dāng)這些因素共同發(fā)揮作用,加之我們持續(xù)更新軟件,計(jì)算成本便會(huì)不斷下降。加速計(jì)算在大幅提升應(yīng)用性能的同時(shí),隨著我們長(zhǎng)期維護(hù)和迭代軟件,用戶不僅能在初期獲得性能躍升,還能持續(xù)享受計(jì)算成本的下降。我們?cè)敢鉃槿蛎恳粔KGPU提供長(zhǎng)期支持,因?yàn)樗鼈冊(cè)诩軜?gòu)上完全兼容。
我們之所以愿意這樣做,是因?yàn)檠b機(jī)量如此龐大——每發(fā)布一次新的優(yōu)化,便能惠及數(shù)百萬(wàn)用戶。這種動(dòng)態(tài)組合,使得英偉達(dá)架構(gòu)在持續(xù)擴(kuò)大覆蓋范圍、加速自身成長(zhǎng)的同時(shí),不斷壓低計(jì)算成本,最終刺激新的增長(zhǎng)。CUDA是這一切的核心。
從GeForce到CUDA:二十五年的演進(jìn)之路
而我們與CUDA的旅程,實(shí)際上早在二十五年前就已開(kāi)始。
GeForce——相信在座有很多人是伴隨著GeForce長(zhǎng)大的。GeForce是英偉達(dá)最成功的市場(chǎng)推廣項(xiàng)目。我們從你們還買(mǎi)不起產(chǎn)品的時(shí)候就開(kāi)始培養(yǎng)未來(lái)的客戶——是你們的父母代替你們成為了英偉達(dá)最早的用戶,年復(fù)一年地購(gòu)買(mǎi)我們的產(chǎn)品,直到有一天,你們成長(zhǎng)為優(yōu)秀的計(jì)算機(jī)科學(xué)家,成為真正意義上的客戶和開(kāi)發(fā)者。
這是二十五年前GeForce奠定的基業(yè)。二十五年前,我們發(fā)明了可編程著色器——這是讓加速器實(shí)現(xiàn)可編程化的一項(xiàng)顯而易見(jiàn)卻意義深遠(yuǎn)的發(fā)明,也是世界上第一款可編程加速器,即像素著色器。這五年后,我們創(chuàng)造了CUDA——這是我們有史以來(lái)最重要的投資之一。當(dāng)時(shí)公司財(cái)力有限,但我們將絕大部分利潤(rùn)押注于此,致力于將CUDA從GeForce延伸到每一臺(tái)計(jì)算機(jī)。我們之所以如此堅(jiān)定,是因?yàn)槲覀兩钚牌錆摿?。盡管初期歷經(jīng)艱辛,公司堅(jiān)守這一信念長(zhǎng)達(dá)13代、整整二十年,如今CUDA已無(wú)處不在。
正是像素著色器推動(dòng)了GeForce的革命。而大約八年前,我們推出了RTX——為現(xiàn)代計(jì)算機(jī)圖形時(shí)代對(duì)架構(gòu)進(jìn)行了全面革新。GeForce將CUDA帶給了全世界,也正因如此,讓Alex Krizhevsky、Ilya Sutskever、Geoffrey Hinton、Andrew Ng等眾多學(xué)者發(fā)現(xiàn),GPU可以成為加速深度學(xué)習(xí)的利器,由此點(diǎn)燃了十年前人工智能的大爆炸。
十年前,我們決定將可編程著色與兩個(gè)全新理念相融合:一是硬件光線追蹤(Ray Tracing),這在技術(shù)上極具挑戰(zhàn);二是一個(gè)當(dāng)時(shí)頗具前瞻性的想法——大約十年前,我們就預(yù)見(jiàn)到AI將徹底變革計(jì)算機(jī)圖形。正如GeForce將AI帶給了全世界,AI如今也將反過(guò)來(lái)重塑整個(gè)計(jì)算機(jī)圖形的實(shí)現(xiàn)方式。
今天,我要向大家展示未來(lái)。這是我們的下一代圖形技術(shù),我們稱之為神經(jīng)渲染(Neural Rendering)——3D圖形與人工智能的深度融合。這就是DLSS 5,請(qǐng)看。
神經(jīng)渲染:結(jié)構(gòu)化數(shù)據(jù)與生成式AI的融合
這是不是令人嘆為觀止?計(jì)算機(jī)圖形就此煥發(fā)生機(jī)。
我們做了什么?我們將可控的3D圖形(虛擬世界的真實(shí)基礎(chǔ))與其結(jié)構(gòu)化數(shù)據(jù)相結(jié)合,再融入生成式AI和概率計(jì)算。一個(gè)完全確定性,另一個(gè)概率性卻高度逼真——我們將這兩種理念融為一體,通過(guò)結(jié)構(gòu)化數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)可控,同時(shí)進(jìn)行實(shí)時(shí)生成。最終,內(nèi)容既美觀驚艷,又完全可控。
結(jié)構(gòu)化信息與生成式AI融合這一理念,將在一個(gè)又一個(gè)行業(yè)中不斷復(fù)現(xiàn)。結(jié)構(gòu)化數(shù)據(jù)是可信AI的基石。
結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的加速平臺(tái)
現(xiàn)在我要帶大家看一張技術(shù)架構(gòu)圖。
結(jié)構(gòu)化數(shù)據(jù)——大家熟悉的SQL、Spark、Pandas、Velox,以及Snowflake、Databricks、Amazon EMR、Azure Fabric、Google BigQuery等重要平臺(tái),都在處理數(shù)據(jù)框(Data Frame)。這些數(shù)據(jù)框就像巨型電子表格,承載著商業(yè)世界的全部信息,是企業(yè)計(jì)算的基本事實(shí)(Ground Truth)。
在AI時(shí)代,我們需要讓AI來(lái)使用結(jié)構(gòu)化數(shù)據(jù),并對(duì)其實(shí)現(xiàn)極致加速。過(guò)去,加速結(jié)構(gòu)化數(shù)據(jù)處理是為了讓企業(yè)更高效地運(yùn)轉(zhuǎn)。而未來(lái),AI將以遠(yuǎn)超人類的速度使用這些數(shù)據(jù)結(jié)構(gòu),AI智能體也將大量調(diào)用結(jié)構(gòu)化數(shù)據(jù)庫(kù)。
非結(jié)構(gòu)化數(shù)據(jù)方面,向量數(shù)據(jù)庫(kù)、PDF、視頻、音頻等構(gòu)成了世界上絕大多數(shù)的數(shù)據(jù)形態(tài)——每年生成的數(shù)據(jù)中,約90%是非結(jié)構(gòu)化數(shù)據(jù)。過(guò)去,這些數(shù)據(jù)幾乎完全無(wú)法被利用:我們讀取它們,存入文件系統(tǒng),僅此而已。我們無(wú)法查詢,也難以檢索,原因在于非結(jié)構(gòu)化數(shù)據(jù)缺乏簡(jiǎn)單的索引方式,必須理解其含義與語(yǔ)境。而現(xiàn)在,AI可以做到這一點(diǎn)——借助多模態(tài)感知與理解技術(shù),AI能夠讀取PDF文檔、理解其含義,并將其嵌入可供查詢的更大結(jié)構(gòu)之中。
英偉達(dá)為此創(chuàng)建了兩個(gè)基礎(chǔ)庫(kù):
  • cuDF:用于數(shù)據(jù)框、結(jié)構(gòu)化數(shù)據(jù)的加速處理
  • cuVS:用于向量存儲(chǔ)、語(yǔ)義數(shù)據(jù)和非結(jié)構(gòu)化AI數(shù)據(jù)的處理
這兩個(gè)平臺(tái)將成為未來(lái)最重要的基礎(chǔ)平臺(tái)之一。
今天,我們宣布與多家企業(yè)達(dá)成合作。IBM——SQL語(yǔ)言的發(fā)明者,將使用cuDF加速其WatsonX Data平臺(tái)。Dell與我們聯(lián)合打造了Dell AI數(shù)據(jù)平臺(tái),整合cuDF與cuVS,并在NTT Data的實(shí)際項(xiàng)目中實(shí)現(xiàn)了大幅性能提升。Google Cloud方面,我們現(xiàn)在不僅加速Vertex AI,還加速BigQuery,并與Snapchat合作將其計(jì)算成本降低了近80%。
加速計(jì)算帶來(lái)的好處是三位一體的:速度、規(guī)模、成本。這與摩爾定律的邏輯一脈相承——通過(guò)加速計(jì)算實(shí)現(xiàn)性能飛躍,同時(shí)持續(xù)優(yōu)化算法,讓所有人都能享受到持續(xù)下降的計(jì)算成本。
英偉達(dá)構(gòu)建了加速計(jì)算平臺(tái),其上匯聚了眾多庫(kù):RTX、cuDF、cuVS等等。這些庫(kù)整合進(jìn)全球云服務(wù)和OEM體系,共同觸達(dá)全球用戶。
與云服務(wù)商的深度合作
與主要云服務(wù)商的合作
Google Cloud:我們加速Vertex AI和BigQuery,與JAX/XLA深度集成,同時(shí)在PyTorch上表現(xiàn)卓越——英偉達(dá)是全球唯一一家在PyTorch和JAX/XLA上均表現(xiàn)出色的加速器。我們將Base10、CrowdStrike、Puma、Salesforce等客戶引入Google Cloud生態(tài)。
AWS:我們加速EMR、SageMaker和Bedrock,與AWS有著深度集成。今年令我格外興奮的是,我們將把OpenAI引入AWS,這將大幅推動(dòng)AWS云計(jì)算的消耗增長(zhǎng),幫助OpenAI擴(kuò)展區(qū)域部署和計(jì)算規(guī)模。
Microsoft Azure:英偉達(dá)100 PFLOPS超算是我們構(gòu)建的第一臺(tái)超級(jí)計(jì)算機(jī),也是第一臺(tái)部署在Azure上的超算,這奠定了與OpenAI合作的重要基礎(chǔ)。我們加速Azure云服務(wù)和AI Foundry,合作推進(jìn)Azure區(qū)域擴(kuò)展,并在Bing搜索上深度協(xié)作。值得一提的是,我們的**保密計(jì)算(Confidential Computing)**能力——確保即便是運(yùn)營(yíng)商也無(wú)法查看用戶數(shù)據(jù)和模型——英偉達(dá)GPU是全球首批支持保密計(jì)算的GPU,可支持OpenAI和Anthropic模型在全球各地區(qū)云環(huán)境中的保密部署。以Synopsys為例,我們加速其全部EDA和CAD工作流,并部署于Microsoft Azure。
Oracle:我們是Oracle的第一個(gè)AI客戶,我為能夠第一次向Oracle解釋AI云的概念感到自豪。此后他們發(fā)展迅猛,我們也為其引入了Cohere、Fireworks、OpenAI等眾多合作伙伴。
CoreWeave:全球第一家AI原生云,專為GPU托管和AI云服務(wù)而生,擁有出色的客戶群,增長(zhǎng)勢(shì)頭強(qiáng)勁。
Palantir + Dell:三方聯(lián)合打造了全新的AI平臺(tái),基于Palantir的本體論平臺(tái)(Ontology Platform)和AI平臺(tái),可在任何國(guó)家、任何氣隙隔離環(huán)境下、完全本地化地部署AI——從數(shù)據(jù)處理(向量化或結(jié)構(gòu)化)到AI的完整加速計(jì)算棧,無(wú)所不包。
英偉達(dá)與全球云服務(wù)商建立了這種特殊的合作關(guān)系——我們將客戶引入云端,這是一種互利共贏的生態(tài)。
垂直整合,橫向開(kāi)放:英偉達(dá)的核心戰(zhàn)略
英偉達(dá)是全球第一家垂直整合、橫向開(kāi)放的公司。
這一模式的必要性非常簡(jiǎn)單:加速計(jì)算不是芯片問(wèn)題,也不是系統(tǒng)問(wèn)題,其完整表述應(yīng)為應(yīng)用加速。CPU可以讓計(jì)算機(jī)整體運(yùn)行得更快,但這條路已走到瓶頸。未來(lái),唯有通過(guò)應(yīng)用或領(lǐng)域特定的加速,才能持續(xù)帶來(lái)性能飛躍和成本下降。
這正是英偉達(dá)必須深耕一個(gè)又一個(gè)庫(kù)、一個(gè)又一個(gè)領(lǐng)域、一個(gè)又一個(gè)垂直行業(yè)的原因。我們是一家垂直整合的計(jì)算公司,沒(méi)有其他路可走。我們必須理解應(yīng)用,理解領(lǐng)域,深刻理解算法,并能夠?qū)⑵洳渴鹪谌魏螆?chǎng)景下——數(shù)據(jù)中心、云端、本地、邊緣乃至機(jī)器人系統(tǒng)。
同時(shí),英偉達(dá)保持橫向開(kāi)放,愿意將技術(shù)整合進(jìn)任何合作伙伴的平臺(tái),讓全世界都能享受到加速計(jì)算的紅利。
本屆GTC的參會(huì)者結(jié)構(gòu)充分體現(xiàn)了這一點(diǎn)。本次參會(huì)者中,金融服務(wù)行業(yè)的比例最高——希望來(lái)的是開(kāi)發(fā)者,不是交易員。我們的生態(tài)系統(tǒng)覆蓋了上游和下游供應(yīng)鏈。無(wú)論是成立50年、70年還是150年的企業(yè),去年都迎來(lái)了歷史最佳年份。我們正處于某件非常、非常重大的事情的起點(diǎn)。
CUDA-X:各行業(yè)的加速計(jì)算引擎
在各個(gè)垂直領(lǐng)域,英偉達(dá)均已深度布局:
  • 自動(dòng)駕駛:覆蓋范圍廣泛,影響深遠(yuǎn)
  • 金融服務(wù):量化投資正從人工特征工程轉(zhuǎn)向超級(jí)計(jì)算機(jī)驅(qū)動(dòng)的深度學(xué)習(xí),迎來(lái)其"Transformer時(shí)刻"
  • 醫(yī)療健康:正在迎來(lái)屬于自己的"ChatGPT時(shí)刻",涵蓋AI輔助藥物發(fā)現(xiàn)、AI智能體支持診斷、醫(yī)療客服等方向
  • 工業(yè):全球規(guī)模最大的建設(shè)浪潮正在展開(kāi),AI工廠、芯片廠、數(shù)據(jù)中心廠紛紛落地
  • 娛樂(lè)與游戲:實(shí)時(shí)AI平臺(tái)支持翻譯、直播、游戲互動(dòng),以及智能購(gòu)物代理
  • 機(jī)器人:深耕十余年,三大計(jì)算機(jī)架構(gòu)(訓(xùn)練計(jì)算機(jī)、仿真計(jì)算機(jī)、機(jī)載計(jì)算機(jī))齊備,本次展會(huì)共有110款機(jī)器人亮相
  • 電信:約2萬(wàn)億美元規(guī)模的行業(yè),基站將從單一通信功能演進(jìn)為AI基礎(chǔ)設(shè)施平臺(tái),相關(guān)平臺(tái)名為Aerial,與諾基亞、T-Mobile等企業(yè)均有深度合作
以上所有領(lǐng)域的核心,正是我們的CUDA-X庫(kù)——這是英偉達(dá)作為算法公司的根本所在。這些庫(kù)是公司最核心的資產(chǎn),讓計(jì)算平臺(tái)得以在各個(gè)行業(yè)發(fā)揮實(shí)際價(jià)值。
其中最重要的庫(kù)之一,是cuDNN(CUDA深度神經(jīng)網(wǎng)絡(luò)庫(kù)),它徹底革新了人工智能,引發(fā)了現(xiàn)代AI的大爆炸。
(播放CUDA-X演示視頻)
大家剛才看到的一切都是仿真——包括基于物理原理的求解器、AI代理物理模型,以及物理AI機(jī)器人模型。一切均為仿真,沒(méi)有任何手工動(dòng)畫(huà)或關(guān)節(jié)綁定。這正是英偉達(dá)的核心能力所在:通過(guò)對(duì)算法的深刻理解與計(jì)算平臺(tái)的有機(jī)結(jié)合,解鎖這些機(jī)遇。
AI原生企業(yè)與新計(jì)算時(shí)代
你們剛才看到了沃爾瑪、歐萊雅、摩根大通、羅氏、豐田等定義當(dāng)今社會(huì)的行業(yè)巨頭,也有一大批大家從未聽(tīng)說(shuō)過(guò)的公司——我們稱之為AI原生企業(yè)。這份名單極為龐大,里面有OpenAI、Anthropic,以及眾多服務(wù)于不同垂直領(lǐng)域的新興企業(yè)。
過(guò)去兩年,這一行業(yè)經(jīng)歷了驚人的騰飛。風(fēng)險(xiǎn)投資流入初創(chuàng)企業(yè)的資金規(guī)模達(dá)到1,500億美元,創(chuàng)人類歷史之最。更重要的是,單筆投資規(guī)模首次從數(shù)百萬(wàn)美元躍升至數(shù)億乃至數(shù)十億美元。原因只有一個(gè):這是史上第一次,每一家此類公司都需要大量計(jì)算資源和大量token。這個(gè)行業(yè)正在創(chuàng)造、生成token,或者為來(lái)自Anthropic、OpenAI等機(jī)構(gòu)的token增值。
正如PC革命、互聯(lián)網(wǎng)革命、移動(dòng)云革命各自孕育出一批劃時(shí)代的企業(yè),這一代計(jì)算平臺(tái)變革同樣將誕生一批極具影響力的公司,成為未來(lái)世界的重要力量。
推動(dòng)這一切的三大歷史性突破
過(guò)去兩年究竟發(fā)生了什么?三件大事。
第一:ChatGPT,開(kāi)啟生成式AI時(shí)代(2022年底至2023年)
它不僅能感知和理解,還能生成獨(dú)特內(nèi)容。我展示了生成式AI與計(jì)算機(jī)圖形的融合。生成式AI從根本上改變了計(jì)算的方式——計(jì)算從檢索式轉(zhuǎn)變?yōu)樯墒?,這深刻影響著計(jì)算機(jī)架構(gòu)、部署方式和整體意義。
第二:推理AI(Reasoning AI),以o1為代表
推理能力使AI能夠自我反思、規(guī)劃、分解問(wèn)題——將它無(wú)法直接理解的問(wèn)題拆解為可處理的步驟。o1讓生成式AI變得可信,能夠依據(jù)真實(shí)信息進(jìn)行推理。為此,輸入context的token量和用于思考的輸出token量大幅增加,計(jì)算量隨之顯著提升。
第三:Claude Code,首個(gè)智能體模型
它能讀取文件、編寫(xiě)代碼、編譯、測(cè)試、評(píng)估并迭代。Claude Code徹底革新了軟件工程——英偉達(dá)100%的工程師都在使用Claude Code、Codex和Cursor中的一種或多種,沒(méi)有一位軟件工程師不借助AI助力。
這是一個(gè)全新的拐點(diǎn)——你不再是詢問(wèn)AI"是什么、在哪里、怎么做",而是讓它"創(chuàng)建、執(zhí)行、構(gòu)建",讓它主動(dòng)使用工具、讀取文件、分解問(wèn)題、付諸行動(dòng)。AI從感知,到生成,到推理,再到如今真正能夠完成工作。
過(guò)去兩年,推理所需的計(jì)算量增長(zhǎng)了約10,000倍,使用量增長(zhǎng)了約100倍。我一直認(rèn)為,過(guò)去兩年計(jì)算需求增長(zhǎng)了100萬(wàn)倍——這是所有人的共同感受,是OpenAI的感受,是Anthropic的感受。如果能獲得更多算力,就能生成更多token,收入就會(huì)提升,AI就會(huì)變得更智能。推理拐點(diǎn)已然到來(lái)。
萬(wàn)億美元的AI基礎(chǔ)設(shè)施時(shí)代
去年此時(shí),我在這里表示,我們對(duì)Blackwell和Rubin在2026年之前的需求和采購(gòu)訂單有高度信心,規(guī)模約為5,000億美元。今天,在GTC一年之后,我站在這里告訴大家:展望到2027年,我看到的數(shù)字至少是1萬(wàn)億美元。而且我確信,實(shí)際的計(jì)算需求將遠(yuǎn)不止于此。
2025:英偉達(dá)推理年
2025年是英偉達(dá)的推理年(Year of Inference)。我們希望確保,在訓(xùn)練和后訓(xùn)練之外,也能在AI生命周期的每個(gè)階段都保持卓越,使已投資的基礎(chǔ)設(shè)施能夠持續(xù)高效運(yùn)轉(zhuǎn),且有效使用壽命越長(zhǎng),單位成本越低。
與此同時(shí),Anthropic和Meta正式加入NVIDIA平臺(tái),與此共同代表了全球三分之一的AI算力需求。開(kāi)源模型已接近前沿水平,無(wú)處不在。
英偉達(dá)是目前全球唯一一個(gè)能夠運(yùn)行所有AI領(lǐng)域——語(yǔ)言、生物學(xué)、計(jì)算機(jī)圖形、計(jì)算機(jī)視覺(jué)、語(yǔ)音、蛋白質(zhì)與化學(xué)、機(jī)器人等——所有AI模型的平臺(tái),無(wú)論邊緣還是云端,無(wú)論何種語(yǔ)言。英偉達(dá)架構(gòu)對(duì)所有這些場(chǎng)景均具備通用性,這使我們成為成本最低、置信度最高的平臺(tái)。
目前,英偉達(dá)60%的業(yè)務(wù)來(lái)自全球前五大超大規(guī)模云服務(wù)商,剩余40%遍布區(qū)域云、主權(quán)云、企業(yè)、工業(yè)、機(jī)器人、邊緣計(jì)算等各個(gè)領(lǐng)域。AI的覆蓋廣度本身就是其韌性所在——這毫無(wú)疑問(wèn)是一次全新的計(jì)算平臺(tái)變革。
Grace Blackwell與NVLink 72:大膽的架構(gòu)革新
在Hopper架構(gòu)還處于鼎盛時(shí)期,我們就決定徹底重新架構(gòu)系統(tǒng),將NVLink從8路擴(kuò)展為NVLink 72,對(duì)計(jì)算系統(tǒng)進(jìn)行全面分解重構(gòu)。Grace Blackwell NVLink 72是一次巨大的技術(shù)押注,對(duì)所有合作伙伴而言都不容易,在此向所有人表示誠(chéng)摯感謝。
同時(shí),我們推出了NVFP4——不只是普通的FP4,而是一種全新類型的張量核心和計(jì)算單元。我們已經(jīng)證明,NVFP4可以在無(wú)精度損失的情況下實(shí)現(xiàn)推理,同時(shí)帶來(lái)巨大的性能提升和能效提升,并且同樣適用于訓(xùn)練。此外,Dynamo和TensorRT-LLM等一系列新算法相繼問(wèn)世,我們甚至為優(yōu)化內(nèi)核而專門(mén)投入數(shù)十億美元建造了一臺(tái)超級(jí)計(jì)算機(jī),稱之為DGX Cloud。
結(jié)果證明,我們的推理性能令人矚目。來(lái)自Semi Analysis的數(shù)據(jù)——這是迄今為止最全面的AI推理性能評(píng)測(cè)——顯示英偉達(dá)在每瓦token數(shù)和每token成本兩個(gè)維度上均遙遙領(lǐng)先。原本摩爾定律可能給H200帶來(lái)1.5倍的性能提升,但我們做到了35倍。Semi Analysis的Dylan Patel甚至說(shuō):"黃仁勛保守了,實(shí)際上是50倍。"他說(shuō)得沒(méi)錯(cuò)。
我在此援引他的話:"Jensen sandbagged(黃仁勛保守報(bào)數(shù))。"
英偉達(dá)的每token成本是全球最低,目前無(wú)人能及。原因正在于極致協(xié)同設(shè)計(jì)(Extreme Co-design)。
以Fireworks為例,在英偉達(dá)更新全套軟件和算法之前,其平均token速度約為每秒700個(gè);更新后接近每秒5,000個(gè),提升約7倍。這就是極致協(xié)同設(shè)計(jì)的力量。
AI工廠:從數(shù)據(jù)中心到token工廠
數(shù)據(jù)中心過(guò)去是存儲(chǔ)文件的地方,現(xiàn)在它是生產(chǎn)token的工廠。每一家云服務(wù)商、每一家AI公司,未來(lái)都將以"token工廠效率"作為核心經(jīng)營(yíng)指標(biāo)。
這是我的核心論點(diǎn):
  • 縱軸:吞吐量(Throughput)——在固定功率下每秒生成的token數(shù)
  • 橫軸:交互速度(Token Speed)——每次推理的響應(yīng)速度,速度越快,可使用的模型越大、context越長(zhǎng),AI越智能
token是新的大宗商品,一旦成熟,將分層定價(jià):
  • 免費(fèi)層(高吞吐、低速度)
  • 中級(jí)層(~每百萬(wàn)token 3美元)
  • 高級(jí)層(~每百萬(wàn)token 6美元)
  • 高速層(~每百萬(wàn)token 45美元)
  • 超高速層(~每百萬(wàn)token 150美元)
與Hopper相比,Grace Blackwell在最高價(jià)值層提升了35倍吞吐量,并引入全新層級(jí)。以簡(jiǎn)化模型估算,將25%功率分別分配給四個(gè)層級(jí),Grace Blackwell可比Hopper多產(chǎn)生5倍的收入。
Vera Rubin:下一代AI計(jì)算系統(tǒng)
(播放Vera Rubin系統(tǒng)介紹視頻)
Vera Rubin是一個(gè)完整的、端到端優(yōu)化的系統(tǒng),專為智能體(Agentic)工作負(fù)載設(shè)計(jì):
  • 大型語(yǔ)言模型計(jì)算核心:NVLink 72 GPU集群,處理前填充(Prefill)和KV Cache
  • 全新Vera CPU:專為極高單線程性能設(shè)計(jì),采用LPDDR5內(nèi)存,兼具卓越能效,是全球唯一使用LPDDR5的數(shù)據(jù)中心CPU,適合AI智能體工具調(diào)用
  • 存儲(chǔ)系統(tǒng):BlueField 4 + CX 9,面向AI時(shí)代的全新存儲(chǔ)平臺(tái),全球存儲(chǔ)行業(yè)100%加入
  • CPO Spectrum X交換機(jī):全球首款共封裝光學(xué)以太網(wǎng)交換機(jī),已全面量產(chǎn)
  • Kyber機(jī)架:全新機(jī)架系統(tǒng),支持144塊GPU組成單一NVLink域,前端計(jì)算、后端NVLink交換,形成一臺(tái)巨型計(jì)算機(jī)
  • Rubin Ultra:下一代超算節(jié)點(diǎn),豎插式設(shè)計(jì),配合Kyber機(jī)架,支持更大規(guī)模NVLink互聯(lián)
Vera Rubin已100%液冷,安裝時(shí)間從兩天縮短至兩小時(shí),采用45°C熱水冷卻,大幅降低數(shù)據(jù)中心冷卻壓力。這次Satya(納德拉)已發(fā)文確認(rèn),首臺(tái)Vera Rubin機(jī)架已在微軟Azure上線運(yùn)行,我為此深感振奮。
Groq整合:推理性能的極致延伸
我們收購(gòu)了Groq團(tuán)隊(duì)并獲得其技術(shù)授權(quán)。Groq是一種確定性數(shù)據(jù)流處理器(Deterministic Dataflow Processor),采用靜態(tài)編譯和編譯器調(diào)度,擁有大量SRAM,專為推理單一工作負(fù)載優(yōu)化,具備極低延遲和極高token生成速度。
然而,Groq的內(nèi)存容量有限(500MB片上SRAM),難以獨(dú)立承載大模型的參數(shù)和KV Cache,限制了其大規(guī)模應(yīng)用。
解決方案正是Dynamo——一套推理調(diào)度軟件。我們通過(guò)Dynamo將推理管線解聚(Disaggregate):
  • **前填充(Prefill)及注意力機(jī)制的解碼(Decode)**在Vera Rubin上完成(需要大量算力和KV Cache存儲(chǔ))
  • **前饋網(wǎng)絡(luò)解碼(Feed-Forward Network Decode)**即token生成部分,在Groq上完成(需要極高帶寬和低延遲)
兩者通過(guò)以太網(wǎng)緊密耦合,借助特殊模式將延遲減少約一半。在Dynamo這一"AI工廠操作系統(tǒng)"的統(tǒng)一調(diào)度下,整體性能提升35倍,并開(kāi)辟了NVLink 72此前無(wú)法觸及的全新推理性能層級(jí)。
Groq與Vera Rubin的組合建議:
  • 若工作負(fù)載以高吞吐為主,使用100% Vera Rubin
  • 若大量工作負(fù)載為代碼生成等高價(jià)值token生成,可引入Groq,建議比例約為25% Groq + 75% Vera Rubin
Groq LP30由三星代工,目前已進(jìn)入量產(chǎn),預(yù)計(jì)Q3開(kāi)始出貨。感謝三星的全力配合。
推理性能的歷史性飛躍
將此前技術(shù)進(jìn)步量化:在2年時(shí)間內(nèi),1吉瓦AI工廠的token生成速率將從2,200萬(wàn)token/秒提升至7億token/秒,提升350倍。這就是極致協(xié)同設(shè)計(jì)的力量。
技術(shù)路線圖
  • Blackwell:當(dāng)前在產(chǎn),Oberon標(biāo)準(zhǔn)機(jī)架系統(tǒng),銅纜擴(kuò)展至NVLink 72,可選光學(xué)擴(kuò)展至NVLink 576
  • Vera Rubin(當(dāng)前):Kyber機(jī)架,NVLink 144(銅纜);Oberon機(jī)架,NVLink 72 + 光學(xué),擴(kuò)展至NVLink 576;Spectrum 6,全球首款CPO交換機(jī)
  • Vera Rubin Ultra(即將推出):新一代Rubin Ultra GPU,LP35芯片(首次集成NVFP4),進(jìn)一步提升數(shù)倍性能
  • Feynman(下一代):全新GPU,LP40芯片(由英偉達(dá)與Groq團(tuán)隊(duì)聯(lián)合打造,集成NVFP4);全新CPU——Rosa(Rosalyn);BlueField 5;CX 10;同時(shí)支持銅纜和CPO兩種擴(kuò)展方式的Kyber機(jī)架
路線圖明確:銅纜擴(kuò)展、光學(xué)擴(kuò)展(Scale-Up)、光學(xué)擴(kuò)展(Scale-Out)三條路線并行推進(jìn),我們需要所有合作伙伴在銅纜、光纖和CPO方面持續(xù)擴(kuò)產(chǎn)。
NVIDIA DSX:AI工廠的數(shù)字孿生平臺(tái)
AI工廠越來(lái)越復(fù)雜,但組成它的各類技術(shù)供應(yīng)商過(guò)去從未在設(shè)計(jì)階段相互協(xié)作,直到在數(shù)據(jù)中心才"相遇"——這顯然不夠。
為此,我們創(chuàng)建了Omniverse,以及基于其上的NVIDIA DSX平臺(tái)——一個(gè)供所有合作伙伴在虛擬世界中共同設(shè)計(jì)和運(yùn)營(yíng)吉瓦級(jí)AI工廠的平臺(tái)。DSX提供:
  • 機(jī)架級(jí)機(jī)械、熱學(xué)、電氣、網(wǎng)絡(luò)仿真系統(tǒng)
  • 與電網(wǎng)的連接,實(shí)現(xiàn)協(xié)同節(jié)能調(diào)度
  • 數(shù)據(jù)中心內(nèi)基于Max-Q的動(dòng)態(tài)功耗和冷卻優(yōu)化
保守估計(jì),這套系統(tǒng)可將能源利用效率提升約2倍,在我們談?wù)摰囊?guī)模上,這是非??捎^的收益。Omniverse從數(shù)字地球開(kāi)始,將承載各種規(guī)模的數(shù)字孿生,我們正與全球合作伙伴共同構(gòu)建人類歷史上最大的計(jì)算機(jī)。
此外,英偉達(dá)正在進(jìn)軍太空。Thor芯片已通過(guò)輻射認(rèn)證,正在衛(wèi)星中運(yùn)行。我們正與合作伙伴開(kāi)發(fā)Vera Rubin Space-1,用于建設(shè)太空數(shù)據(jù)中心。在太空中只能依靠輻射散熱,熱管理是核心挑戰(zhàn),我們正集結(jié)頂尖工程師攻關(guān)。
OpenClaw:智能體時(shí)代的操作系統(tǒng)
Peter Steinberger開(kāi)發(fā)了一款名為OpenClaw的軟件。這是人類歷史上最受歡迎的開(kāi)源項(xiàng)目,在短短幾周內(nèi)便超越了Linux三十年的成就。
OpenClaw本質(zhì)上是一個(gè)智能體系統(tǒng)(Agentic System),能夠:
  • 管理資源,訪問(wèn)工具、文件系統(tǒng)和大型語(yǔ)言模型
  • 執(zhí)行調(diào)度、定時(shí)任務(wù)
  • 將問(wèn)題逐步分解,并調(diào)用子智能體
  • 支持任意模態(tài)的輸入輸出(語(yǔ)音、視頻、文字、郵件等)
用操作系統(tǒng)的語(yǔ)法來(lái)描述,它確實(shí)就是一個(gè)操作系統(tǒng)——智能體計(jì)算機(jī)的操作系統(tǒng)。Windows讓個(gè)人計(jì)算機(jī)成為可能,OpenClaw讓個(gè)人智能體成為可能。
每一家企業(yè)都需要制定自己的OpenClaw戰(zhàn)略,正如我們都需要Linux策略、HTML策略、Kubernetes策略一樣。
企業(yè)IT的全面重塑
OpenClaw之前的企業(yè)IT:數(shù)據(jù)和文件進(jìn)入系統(tǒng),流經(jīng)工具和工作流,最終變成供人類使用的工具。軟件公司創(chuàng)建工具,系統(tǒng)集成商(GSI)和咨詢公司幫助企業(yè)使用這些工具。
OpenClaw之后的企業(yè)IT:每一家SaaS公司都將轉(zhuǎn)變?yōu)锳aaS(Agentic as a Service,智能體即服務(wù))公司——不只是提供工具,而是提供專精特定領(lǐng)域的AI智能體。
但這里有一個(gè)關(guān)鍵挑戰(zhàn):企業(yè)內(nèi)部的智能體可以訪問(wèn)敏感數(shù)據(jù)、執(zhí)行代碼、與外部通信。這在企業(yè)環(huán)境中必須得到嚴(yán)格管控。
為此,我們與Peter合作,將安全性融入企業(yè)級(jí)版本,推出了:
  • NeMo Claw(參考設(shè)計(jì)):基于OpenClaw的企業(yè)級(jí)參考框架,集成NVIDIA的全套智能體AI工具包
  • Open Shield(安全層):已集成至OpenClaw,提供策略引擎、網(wǎng)絡(luò)護(hù)欄、隱私路由,確保企業(yè)數(shù)據(jù)安全
  • NeMo Cloud:可下載使用,并與所有SaaS企業(yè)的策略引擎對(duì)接
這是企業(yè)IT的文藝復(fù)興,一個(gè)原本2萬(wàn)億美元規(guī)模的產(chǎn)業(yè),即將成長(zhǎng)為數(shù)萬(wàn)億美元規(guī)模,從提供工具轉(zhuǎn)向提供專業(yè)化的AI智能體服務(wù)。
我完全可以預(yù)見(jiàn):未來(lái),公司里的每一位工程師都將擁有年度token預(yù)算。他們年薪可能是幾十萬(wàn)美元,我會(huì)額外給他們相當(dāng)于薪資一半的token配額,讓他們的產(chǎn)出放大10倍。"入職附帶多少token配額"已經(jīng)成為硅谷的新晉招聘話題。
每一家企業(yè)未來(lái)都將既是token的使用者(供工程師使用),也是token的生產(chǎn)者(為其客戶提供服務(wù))。OpenClaw的意義不可低估,它和HTML、Linux一樣重要。
NVIDIA開(kāi)放模型倡議
在自定義智能體(Custom Claw)方面,我們提供了NVIDIA自研的前沿模型:
模型領(lǐng)域Nemotron大型語(yǔ)言模型Cosmos世界基礎(chǔ)模型(World Foundation Model)GROOT通用人形機(jī)器人模型Alpamayo自動(dòng)駕駛BioNeMo數(shù)字生物學(xué)Phys-AIAI物理
我們?cè)诿恳粋€(gè)領(lǐng)域都處于技術(shù)前沿,并承諾持續(xù)迭代——Nemotron 3之后有Nemotron 4,Cosmos 1之后有Cosmos 2,Groq也將迭代到第二代。
Nemotron 3在OpenClaw中名列全球三大最佳模型之列,處于前沿水平。Nemotron 3 Ultra將成為有史以來(lái)最強(qiáng)的基礎(chǔ)模型,支持各國(guó)構(gòu)建主權(quán)AI。
今天,我們宣布成立Nemotron聯(lián)盟,投資數(shù)十億美元推進(jìn)AI基礎(chǔ)模型研發(fā)。聯(lián)盟成員包括:BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam(印度)、Thinking Machines(Mira Murati的實(shí)驗(yàn)室)等。一個(gè)又一個(gè)企業(yè)軟件公司加入,將NeMo Claw參考設(shè)計(jì)和NVIDIA智能體AI工具包整合到自身產(chǎn)品中。
物理AI與機(jī)器人
數(shù)字智能體在數(shù)字世界中行動(dòng)——撰寫(xiě)代碼、分析數(shù)據(jù);而物理AI則是具身化的智能體,也就是機(jī)器人。
本次GTC共有110款機(jī)器人亮相,幾乎囊括了全球所有機(jī)器人研發(fā)企業(yè)。英偉達(dá)提供三臺(tái)計(jì)算機(jī)(訓(xùn)練計(jì)算機(jī)、仿真計(jì)算機(jī)、機(jī)載計(jì)算機(jī))和完整的軟件棧及AI模型。
自動(dòng)駕駛方面,自動(dòng)駕駛的"ChatGPT時(shí)刻"已經(jīng)到來(lái)。今天,我們宣布四家新合作伙伴加入英偉達(dá)RoboTaxi Ready平臺(tái):比亞迪、現(xiàn)代、日產(chǎn)、吉利,合計(jì)年產(chǎn)量1,800萬(wàn)輛。加上此前的奔馳、豐田、通用,陣容進(jìn)一步壯大。我們同時(shí)宣布與Uber達(dá)成重大合作,將在多個(gè)城市部署并接入RoboTaxi Ready車(chē)輛。
工業(yè)機(jī)器人方面,ABB、Universal Robotics、KUKA等眾多機(jī)器人企業(yè)與我們合作,將物理AI模型與仿真系統(tǒng)相結(jié)合,推動(dòng)機(jī)器人在全球制造產(chǎn)線的落地。
電信方面,卡特彼勒(Caterpillar)和T-Mobile也在其列。未來(lái),無(wú)線基站將不再只是一個(gè)通信節(jié)點(diǎn),而是一個(gè)NVIDIA Aerial AI RAN——能夠?qū)崟r(shí)感知流量、調(diào)整波束成形,實(shí)現(xiàn)節(jié)能增效的智能化邊緣計(jì)算平臺(tái)。
特別環(huán)節(jié):Olaf機(jī)器人亮相
(播放Disney Olaf機(jī)器人演示視頻)
黃仁勛: 雪人登場(chǎng)!Newton運(yùn)行正常!Omniverse也運(yùn)行正常!Olaf,你好嗎?
Olaf: 見(jiàn)到你我真的太開(kāi)心了。
黃仁勛: 是的,因?yàn)槭俏医o了你計(jì)算機(jī)——Jetson!
Olaf: 那是什么?
黃仁勛: 就在你的肚子里。
Olaf: 太神奇了。
黃仁勛: 你是在Omniverse里學(xué)會(huì)走路的。
Olaf: 我喜歡走路。這比騎馴鹿仰望美麗的天空好多了。
黃仁勛: 這正是因?yàn)槲锢矸抡妗贜VIDIA Warp運(yùn)行的Newton求解器,這是我們與Disney和DeepMind聯(lián)合開(kāi)發(fā)的,讓你能夠適應(yīng)真實(shí)的物理世界。
Olaf: 我正想說(shuō)這個(gè)。
黃仁勛: 這就是你聰明的地方。我是雪人,不是雪球。
黃仁勛: 你能想象嗎?未來(lái)的迪士尼樂(lè)園——所有這些機(jī)器人角色在園區(qū)里自由漫步。不過(guò)說(shuō)實(shí)話,我以為你會(huì)更高一些。我從沒(méi)見(jiàn)過(guò)這么矮的雪人。
Olaf: (不置可否)
黃仁勛: 來(lái)幫我結(jié)束今天的演講好嗎?
Olaf: 太棒啦!
主題演講總結(jié)
黃仁勛:今天,我們共同探討了以下核心主題:
  1. 推理拐點(diǎn)的到來(lái):推理已成為AI最核心的工作負(fù)載,token是新的大宗商品,推理性能直接決定收入
  2. AI工廠時(shí)代:數(shù)據(jù)中心已從文件存儲(chǔ)設(shè)施演變?yōu)閠oken生產(chǎn)工廠,未來(lái)每家公司都將以"AI工廠效率"來(lái)衡量自身競(jìng)爭(zhēng)力
  3. OpenClaw智能體革命:OpenClaw開(kāi)啟了智能體計(jì)算時(shí)代,企業(yè)IT正在從工具時(shí)代走向智能體時(shí)代,每家企業(yè)都需要制定OpenClaw戰(zhàn)略
  4. 物理AI與機(jī)器人:具身智能正在規(guī)?;涞兀詣?dòng)駕駛、工業(yè)機(jī)器人、人形機(jī)器人共同構(gòu)成物理AI的下一個(gè)重大機(jī)遇
感謝大家,GTC愉快!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一張機(jī)票暴露一切:全美數(shù)據(jù)與ICE共享,女子在機(jī)場(chǎng)被直接遣返

一張機(jī)票暴露一切:全美數(shù)據(jù)與ICE共享,女子在機(jī)場(chǎng)被直接遣返

華人生活網(wǎng)
2026-03-26 02:26:21
河南街頭用頭撞車(chē)事件,警方回應(yīng)后續(xù)來(lái)了!評(píng)論區(qū)徹底炸鍋

河南街頭用頭撞車(chē)事件,警方回應(yīng)后續(xù)來(lái)了!評(píng)論區(qū)徹底炸鍋

奇思妙想草葉君
2026-03-25 13:12:39
吳國(guó)楨回憶宋氏姐妹:宋靄齡動(dòng)下小指頭,就能將宋美齡弄得團(tuán)團(tuán)轉(zhuǎn)

吳國(guó)楨回憶宋氏姐妹:宋靄齡動(dòng)下小指頭,就能將宋美齡弄得團(tuán)團(tuán)轉(zhuǎn)

浩渺青史
2026-03-26 19:37:41
頂級(jí)負(fù)心漢!成名后與救命恩人離婚娶小三,如今前妻紅了他糊了

頂級(jí)負(fù)心漢!成名后與救命恩人離婚娶小三,如今前妻紅了他糊了

蔡蔡說(shuō)史
2026-03-25 17:33:04
血債血償,中方支援巴基斯坦,重裝合成營(yíng)教俾路支解放軍做人

血債血償,中方支援巴基斯坦,重裝合成營(yíng)教俾路支解放軍做人

獅拓一葉知秋
2025-04-18 22:06:20
俄教授給自己注射350萬(wàn)年前細(xì)菌,尋求長(zhǎng)生,10多年后怎樣了?

俄教授給自己注射350萬(wàn)年前細(xì)菌,尋求長(zhǎng)生,10多年后怎樣了?

火星一號(hào)
2026-03-23 00:49:24
五十歲才徹底明白_為何許多男性對(duì)五十開(kāi)外的女性都保持距離

五十歲才徹底明白_為何許多男性對(duì)五十開(kāi)外的女性都保持距離

車(chē)窗起霧q
2026-03-20 14:31:16
柯文哲案今天下午一審宣判,若判十年以上有期徒刑將失“大選”資格

柯文哲案今天下午一審宣判,若判十年以上有期徒刑將失“大選”資格

海峽導(dǎo)報(bào)社
2026-03-26 07:09:02
你聽(tīng)過(guò)最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

你聽(tīng)過(guò)最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

帶你感受人間冷暖
2025-11-26 00:10:06
大快人心!國(guó)家出手擒下3名華人首富,他們干的事,根本不能饒恕

大快人心!國(guó)家出手擒下3名華人首富,他們干的事,根本不能饒恕

墨印齋
2026-03-24 21:34:56
第81波打擊!以軍司令部遇襲,美迎來(lái)艱難一夜,特朗普向35國(guó)求助

第81波打擊!以軍司令部遇襲,美迎來(lái)艱難一夜,特朗普向35國(guó)求助

黑鷹觀軍事
2026-03-26 19:09:40
梅西讓一些名人開(kāi)始看球!他們一看球就知道梅西是GOAT!

梅西讓一些名人開(kāi)始看球!他們一看球就知道梅西是GOAT!

歷史第一人梅西
2026-03-24 23:20:12
去年中乙金靴費(fèi)爾南多加入蘇超南京隊(duì),目前他效力于云南玉昆

去年中乙金靴費(fèi)爾南多加入蘇超南京隊(duì),目前他效力于云南玉昆

懂球帝
2026-03-26 17:50:02
2026中國(guó)大學(xué)綜合實(shí)力排名200強(qiáng):前十穩(wěn)定,鄭大沖進(jìn)前20

2026中國(guó)大學(xué)綜合實(shí)力排名200強(qiáng):前十穩(wěn)定,鄭大沖進(jìn)前20

馬蹄燙嘴說(shuō)美食
2026-03-26 13:46:58
共和黨元老驚嘆:特朗普只用一年,就讓美國(guó)制度向惡霸統(tǒng)治投降

共和黨元老驚嘆:特朗普只用一年,就讓美國(guó)制度向惡霸統(tǒng)治投降

阿器談史
2026-01-18 21:24:07
越南5年免簽新政策4.1開(kāi)始實(shí)施

越南5年免簽新政策4.1開(kāi)始實(shí)施

創(chuàng)作者_(dá)cLg1
2026-03-26 09:42:32
A股:兩個(gè)信息落地,明天,周五或會(huì)這樣走了!

A股:兩個(gè)信息落地,明天,周五或會(huì)這樣走了!

明心
2026-03-26 16:35:30
人過(guò)五十才懂:和子女最好的相處,不是給錢(qián)出力,而是守住這條線

人過(guò)五十才懂:和子女最好的相處,不是給錢(qián)出力,而是守住這條線

荷蘭豆愛(ài)健康
2026-03-23 01:42:20
張雪峰心源性猝死多嚴(yán)重,那個(gè)最快護(hù)士就有多“牛逼”(張雪峰的慣用詞)

張雪峰心源性猝死多嚴(yán)重,那個(gè)最快護(hù)士就有多“牛逼”(張雪峰的慣用詞)

天山箴言錄
2026-03-26 16:45:50
女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來(lái)上班

女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來(lái)上班

梅子的小情緒
2025-12-19 14:04:18
2026-03-27 03:12:49
華爾街見(jiàn)聞官方 incentive-icons
華爾街見(jiàn)聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
143603文章數(shù) 2653030關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂(lè)要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

科技要聞

美團(tuán)發(fā)布外賣(mài)大戰(zhàn)后成績(jī)單:虧損超200億

汽車(chē)要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

旅游
數(shù)碼
教育
本地
軍事航空

旅游要聞

河南開(kāi)封萬(wàn)歲山武俠城,游客買(mǎi)300元門(mén)票:給妻子拍照被保安阻攔

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動(dòng),支持B70 / B65顯卡

教育要聞

精準(zhǔn)研判,提質(zhì)增效丨我校召開(kāi)2026屆畢業(yè)生就業(yè)工作研判會(huì)

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬(wàn)遍

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版