国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易科技 > IT業(yè)界 > 正文

速看!黃仁勛CES 2026演講萬(wàn)字實(shí)錄:甩出“物理AI”王牌

0
分享至

作者 | 小小

出品 | 網(wǎng)易科技

CES 2026最具熱度的演講,無(wú)疑屬于英偉達(dá)創(chuàng)始人兼CEO黃仁勛。這位被業(yè)界稱為“黃衣教主”的業(yè)界領(lǐng)袖,定于美國(guó)時(shí)間1月5日下午1點(diǎn)開(kāi)講,卻讓慕名而來(lái)的聽(tīng)眾早早體驗(yàn)了“未來(lái)熱度”——網(wǎng)易科技上午11點(diǎn)到達(dá)時(shí),場(chǎng)外排隊(duì)隊(duì)伍已蜿蜒近500米。有前來(lái)參會(huì)的中國(guó)KOL感嘆:“我們等的不僅是黃仁勛,更是在等一個(gè)答案:未來(lái)十年,人與機(jī)器將如何重新分工。而有些答案,似乎只在現(xiàn)場(chǎng)才能聽(tīng)見(jiàn)。”

黃仁勛比預(yù)定時(shí)間晚了約十分鐘登上舞臺(tái)。他拋出核心判斷:“物理AI的‘ChatGPT時(shí)刻’,即將到來(lái)。”

黃仁勛指出,計(jì)算機(jī)行業(yè)正經(jīng)歷十年一遇的“平臺(tái)重置”:我們正從“編程軟件”時(shí)代跨入“訓(xùn)練軟件”時(shí)代,計(jì)算的基礎(chǔ)技術(shù)棧(所謂的“五層蛋糕”),每一層都在被重新發(fā)明。

2025年被黃仁勛定義為“智能體系統(tǒng)”普及的元年。AI不再僅僅是預(yù)先錄制的程序,而是具備推理、規(guī)劃、甚至在實(shí)時(shí)運(yùn)行中進(jìn)行“思考”的智能體。他特別致敬了中國(guó)開(kāi)源模型DeepSeek R1的突破,認(rèn)為開(kāi)源力量正讓AI變得無(wú)處不在,使智能不再拋下任何人。


黃仁勛演講的重頭戲在于“物理AI”。英偉達(dá)正致力于讓AI理解重力、慣性、因果關(guān)系等物理定律。為此,黃仁勛發(fā)布了世界首個(gè)會(huì)思考、會(huì)推理的自動(dòng)駕駛AI——Alpamayo。它不僅能開(kāi)車,還能像人類一樣解釋“為什么這么開(kāi)”。這標(biāo)志著AI正式從屏幕后的對(duì)話框,走向現(xiàn)實(shí)世界的自動(dòng)駕駛汽車與人形機(jī)器人。


面對(duì)AI計(jì)算量每年10倍的暴增,黃仁勛祭出了新一代架構(gòu)Rubin。這不僅是一顆芯片,而是包含Vera CPU、Rubin GPU、NVLink-6等六大核心組件的全棧革命。

黃仁勛強(qiáng)調(diào),英偉達(dá)的角色已從芯片供應(yīng)商轉(zhuǎn)變?yōu)椤叭珬I體系”的構(gòu)建者。通過(guò)開(kāi)源模型、數(shù)據(jù)及NeMo開(kāi)發(fā)庫(kù),英偉達(dá)正通過(guò)“三臺(tái)計(jì)算機(jī)”(訓(xùn)練、推理、模擬)的架構(gòu),為全球提供構(gòu)建物理AI的底座。這場(chǎng)競(jìng)賽不僅關(guān)乎速度,更關(guān)乎誰(shuí)能以更低的成本、更高的能效,將人類文明帶入萬(wàn)物皆有智能的新時(shí)代。

以下為黃仁勛2026 CES演講實(shí)錄(經(jīng)編輯略有修改,小標(biāo)題為后加):

一、時(shí)代定調(diào):兩大“平臺(tái)轉(zhuǎn)移”與AI的重塑之力

拉斯維加斯,新年快樂(lè)!歡迎來(lái)到CES。

大約每十到十五年,計(jì)算機(jī)行業(yè)就會(huì)經(jīng)歷一次重置。平臺(tái)會(huì)發(fā)生一次根本性的轉(zhuǎn)變,從大型機(jī)到個(gè)人電腦,再到互聯(lián)網(wǎng)、云計(jì)算、移動(dòng)設(shè)備。每一次,應(yīng)用生態(tài)都會(huì)瞄準(zhǔn)一個(gè)新的平臺(tái),這就是所謂的“平臺(tái)轉(zhuǎn)移”。每次,你都要為新的計(jì)算平臺(tái)編寫(xiě)新的應(yīng)用程序。但這一次,事實(shí)上,有兩個(gè)平臺(tái)轉(zhuǎn)移在同時(shí)發(fā)生。

當(dāng)我們邁向人工智能時(shí)代時(shí),應(yīng)用程序?qū)?gòu)建在AI之上。起初,人們認(rèn)為AI本身就是應(yīng)用,事實(shí)也確實(shí)如此。但未來(lái),你將要在AI之上構(gòu)建應(yīng)用程序。除此之外,軟件的運(yùn)行方式和開(kāi)發(fā)方式也發(fā)生了根本性改變。

計(jì)算機(jī)工業(yè)的整個(gè)基礎(chǔ)技術(shù)棧正在被重新發(fā)明。你不再“編程”軟件,而是“訓(xùn)練”軟件;你不再在CPU上運(yùn)行它,而是在GPU上運(yùn)行它。過(guò)去的應(yīng)用程序是預(yù)先錄制、預(yù)先編譯并在你的設(shè)備上運(yùn)行的,而現(xiàn)在的應(yīng)用程序能夠理解上下文,每一次、每一個(gè)像素、每一個(gè)token都是從零開(kāi)始生成的。由于加速計(jì)算,由于人工智能,計(jì)算已經(jīng)被徹底重塑。那個(gè)“五層蛋糕”(指技術(shù)棧)的每一層如今都在被重新發(fā)明。

這意味著,過(guò)去十年積累的價(jià)值約十萬(wàn)億美元的計(jì)算機(jī)基礎(chǔ)設(shè)施,現(xiàn)在正被現(xiàn)代化改造,以適應(yīng)這種新的計(jì)算方式。每年有數(shù)千億甚至上萬(wàn)億美元的風(fēng)險(xiǎn)投資正在涌入,用于現(xiàn)代化改造和發(fā)明這個(gè)新世界。

這也意味著,一個(gè)百萬(wàn)億美元規(guī)模的產(chǎn)業(yè),其研發(fā)預(yù)算中有幾個(gè)百分點(diǎn)正在轉(zhuǎn)向人工智能。人們問(wèn)錢從哪里來(lái)?這就是來(lái)源。從傳統(tǒng)AI到現(xiàn)代AI的現(xiàn)代化改造,研發(fā)預(yù)算從經(jīng)典方法轉(zhuǎn)向現(xiàn)在的人工智能方法,海量投資正涌入這個(gè)行業(yè),這解釋了為什么我們?nèi)绱嗣β怠?/p>

過(guò)去這一年也不例外。2025年是不可思議的一年。看起來(lái)似乎所有事情都在同一時(shí)間發(fā)生,事實(shí)上可能也確實(shí)如此。第一件事當(dāng)然是擴(kuò)展定律(Scaling Laws)。2015年,我認(rèn)為第一個(gè)真正會(huì)產(chǎn)生影響的模型BERT出現(xiàn)了,它確實(shí)帶來(lái)了巨大影響。

2017年,Transformer架構(gòu)問(wèn)世。直到五年后的2022年,“ChatGPT時(shí)刻”才發(fā)生,它喚醒了世界對(duì)人工智能可能性的認(rèn)識(shí)。那之后一年發(fā)生了一件非常重要的事。ChatGPT的第一個(gè)推理模型o1面世,“測(cè)試時(shí)縮放”這個(gè)概念也隨之產(chǎn)生。

我們不僅預(yù)訓(xùn)練讓模型學(xué)習(xí),還在后訓(xùn)練階段通過(guò)強(qiáng)化學(xué)習(xí)讓它學(xué)習(xí)新的技能。現(xiàn)在我們還有了測(cè)試時(shí)縮放,這本質(zhì)上是“思考”的另一種說(shuō)法,包括實(shí)時(shí)進(jìn)行思考。人工智能的每一個(gè)階段都需要巨大的計(jì)算量,而計(jì)算定律仍在持續(xù)擴(kuò)展,大語(yǔ)言模型持續(xù)變得更好。

二、開(kāi)源革命:前沿模型與智能體普及

與此同時(shí),另一個(gè)突破發(fā)生了,這個(gè)突破發(fā)生在2024年:智能體系統(tǒng)開(kāi)始出現(xiàn)。到2025年,它開(kāi)始普及,擴(kuò)散到幾乎每個(gè)角落。具備推理能力、能查找信息、進(jìn)行研究、使用工具、規(guī)劃未來(lái)、模擬結(jié)果的智能體模型,突然開(kāi)始解決非常重要的問(wèn)題。我最喜歡的智能體模型之一叫做Cursor,它徹底改變了英偉達(dá)內(nèi)部的軟件開(kāi)發(fā)方式。智能體系統(tǒng)將真正從這里起飛。

當(dāng)然,還有其他類型的AI。我們知道大語(yǔ)言模型并不是唯一的信息類型。宇宙中凡有信息之處、凡有結(jié)構(gòu)之處,我們都能教一種語(yǔ)言模型去理解那種信息,理解其表征,并將其轉(zhuǎn)化為一種AI。其中最重要的一種是物理AI,即能夠理解自然定律的AI。當(dāng)然,物理AI也涉及AI與世界交互。但世界本身蘊(yùn)含著被編碼的信息,這就是“AI物理”。在物理AI的語(yǔ)境下,你有與物理世界交互的AI,也有理解物理定律物理AI。

最后,去年發(fā)生的最重要事情之一是開(kāi)源模型的進(jìn)步。我們現(xiàn)在可以知道,當(dāng)開(kāi)源、當(dāng)開(kāi)放創(chuàng)新、當(dāng)全世界每個(gè)行業(yè)、每家公司的創(chuàng)新同時(shí)被激活時(shí),AI將無(wú)處不在。與此同時(shí),開(kāi)源模型在2025年真正起飛了。

事實(shí)上,去年我們看到了DeepSeek R1的進(jìn)步,這是第一個(gè)開(kāi)源推理系統(tǒng)。它讓世界大吃一驚,現(xiàn)在世界各地有各種不同類型的開(kāi)源模型系統(tǒng)。開(kāi)源模型已經(jīng)達(dá)到了前沿水平,雖然仍落后前沿模型大約六個(gè)月,但每六個(gè)月就有新模型出現(xiàn),而且這些模型越來(lái)越聰明。

正因?yàn)槿绱?,你可以看到開(kāi)源模型的下載量呈現(xiàn)爆炸式增長(zhǎng),因?yàn)槌鮿?chuàng)公司、大公司、研究員、學(xué)生,幾乎每個(gè)國(guó)家都想?yún)⑴cAI革命。

智能——數(shù)字形式的智能——怎么可能拋下任何人呢?因此,開(kāi)源模型去年真的徹底改變了人工智能,整個(gè)行業(yè)將因此被重塑。

其實(shí)我們對(duì)此早有預(yù)感。你可能聽(tīng)說(shuō)過(guò),幾年前,我們開(kāi)始建造和運(yùn)營(yíng)自己的AI超級(jí)計(jì)算機(jī)——DGX Cloud。很多人問(wèn),你們要進(jìn)軍云計(jì)算業(yè)務(wù)嗎?答案是否定的。我們建造這些DGX超級(jí)計(jì)算機(jī)是供自己使用的。結(jié)果是,我們有數(shù)十億美元的超算在運(yùn)行,以便開(kāi)發(fā)我們的開(kāi)源模型。

它開(kāi)始吸引全球各行各業(yè)的關(guān)注,因?yàn)槲覀冊(cè)诒姸嗖煌I(lǐng)域進(jìn)行著前沿的AI模型工作:我們?cè)诘鞍踪|(zhì)、數(shù)字生物學(xué)(La Proteina)方面的工作,用于合成和生成蛋白質(zhì);OpenFold 3,用于理解蛋白質(zhì)結(jié)構(gòu);EVO 2,用于理解和生成多種蛋白質(zhì);以及開(kāi)源的細(xì)胞表征模型的開(kāi)端。

Earth-2 AI,理解物理定律的AI;我們?cè)贔orecastNet方面的工作;我們?cè)贑ordiff方面的工作,真的徹底改變了人們進(jìn)行天氣預(yù)報(bào)的方式。Nemotron,我們現(xiàn)在正在那里進(jìn)行開(kāi)創(chuàng)性的工作。第一個(gè)混合Transformer SSM模型,速度快得驚人,因此可以進(jìn)行長(zhǎng)時(shí)間思考,或者快速思考(不那么長(zhǎng)時(shí)間)并產(chǎn)生非常非常智能的答案。你們可以期待,我們?cè)诓痪玫膶?lái)發(fā)布Nemotron 3的其他版本。

Cosmos,一個(gè)前沿的開(kāi)放世界基礎(chǔ)模型,理解世界如何運(yùn)作。Groot,一個(gè)人形機(jī)器人系統(tǒng),涉及關(guān)節(jié)控制、移動(dòng)性、運(yùn)動(dòng)。這些模型,這些技術(shù)現(xiàn)在正在被集成,并且在每一種情況下,都對(duì)世界開(kāi)源。今天,我們也將談?wù)凙lpamayo,我們?cè)谧詣?dòng)駕駛汽車方面所做的工作。

我們不僅開(kāi)源模型,還開(kāi)源用于訓(xùn)練這些模型的數(shù)據(jù),因?yàn)橹挥羞@樣,你才能真正信任模型的產(chǎn)生過(guò)程。我們開(kāi)源所有模型,我們幫助你基于它們進(jìn)行衍生開(kāi)發(fā)。我們有一整套庫(kù),稱為NeMo庫(kù):物理NeMo庫(kù)、Clara NeMo庫(kù)、BioNeMo庫(kù)。每一個(gè)都是AI的生命周期管理系統(tǒng),讓你能夠處理數(shù)據(jù)、生成數(shù)據(jù)、訓(xùn)練模型、創(chuàng)建模型、評(píng)估模型、為模型設(shè)置防護(hù)欄,一直到部署模型。每一個(gè)庫(kù)都極其復(fù)雜,而且全部開(kāi)源。

因此,在這個(gè)平臺(tái)之上,英偉達(dá)也是一個(gè)前沿AI模型構(gòu)建者,我們以一種非常特殊的方式構(gòu)建:我們完全以開(kāi)放的方式構(gòu)建,以便讓每家公司、每個(gè)行業(yè)、每個(gè)國(guó)家都能成為這場(chǎng)AI革命的一部分。

這些模型不僅具備前沿能力、是開(kāi)源的,它們還在各類排行榜上名列前茅。我們有理解多模態(tài)文檔(即PDF)的重要模型。世界上最有價(jià)值的內(nèi)容都存儲(chǔ)在PDF中,但需要人工智能來(lái)發(fā)現(xiàn)里面有什么、解讀內(nèi)容并幫助你閱讀。

因此,我們的PDF檢索器、PDF解析器是世界級(jí)的。我們的語(yǔ)音識(shí)別模型絕對(duì)是世界級(jí)的。我們的檢索模型,本質(zhì)上是現(xiàn)代AI時(shí)代的搜索、語(yǔ)義搜索、AI搜索、數(shù)據(jù)庫(kù)引擎,也是世界一流的。所以我們經(jīng)常占據(jù)榜首。

所有這些都是為了服務(wù)于你構(gòu)建AI智能體的能力。這真是一個(gè)開(kāi)創(chuàng)性的發(fā)展領(lǐng)域。當(dāng)ChatGPT剛出現(xiàn)時(shí),人們認(rèn)為其產(chǎn)生的結(jié)果很有趣,但幻覺(jué)也很嚴(yán)重。產(chǎn)生幻覺(jué)的原因在于,它可以記住過(guò)去的一切,但無(wú)法記住未來(lái)和當(dāng)前的一切。所以它需要基于研究來(lái)“接地氣”。

在回答問(wèn)題之前,它必須進(jìn)行基礎(chǔ)研究。能夠推理是否需要研究、是否需要使用工具、如何將問(wèn)題分解成更多步驟。ChatGPT能夠?qū)⑦@些步驟組合成一個(gè)序列,來(lái)完成它從未做過(guò)、從未被訓(xùn)練過(guò)的事情。這就是推理的魔力所在。我們可以遇到從未見(jiàn)過(guò)的情況,并將其分解成我們過(guò)去經(jīng)歷過(guò)、知道如何處理的情況、知識(shí)或規(guī)則。

因此,AI模型現(xiàn)在具備的推理能力極其強(qiáng)大。智能體的推理能力為所有這些不同的應(yīng)用打開(kāi)了大門(mén)。我們不再需要在第一天就訓(xùn)練AI模型知道一切,就像我們不需要在第一天就知道一切一樣。我們應(yīng)該能夠在任何情況下,推理出如何解決某個(gè)問(wèn)題。大語(yǔ)言模型現(xiàn)在已經(jīng)實(shí)現(xiàn)了根本性的飛躍。

使用強(qiáng)化學(xué)習(xí)、思維鏈、搜索、規(guī)劃等不同技術(shù)和強(qiáng)化學(xué)習(xí)的能力,使我們具備了這種基本能力,并且現(xiàn)在也完全開(kāi)源了。

但真正了不起的是,另一個(gè)突破發(fā)生了,我第一次看到它是在Perplexity(AI搜索公司)那里。我第一次意識(shí)到他們同時(shí)使用多個(gè)模型。我認(rèn)為這完全是天才之舉。AI在推理鏈的任何環(huán)節(jié),能調(diào)用世界上所有優(yōu)秀的AI來(lái)解決它想解決的問(wèn)題。這就是為什么AI本質(zhì)上是多模態(tài)的,它們理解語(yǔ)音、圖像、文本、視頻、3D圖形、蛋白質(zhì)。

它也是“多模型”的,意味著它們應(yīng)該能夠使用最適合任務(wù)的任何模型。因此,它本質(zhì)上是“多云”的,因?yàn)檫@些AI模型位于所有這些不同的地方。它還是“混合云”的,因?yàn)槿绻闶且患移髽I(yè)公司,或者你構(gòu)建了一個(gè)機(jī)器人或任何設(shè)備,有時(shí)它在邊緣,有時(shí)在無(wú)線基站,有時(shí)在企業(yè)內(nèi)部,或者是在醫(yī)院等需要實(shí)時(shí)處理數(shù)據(jù)的地方。換言之,由于未來(lái)的應(yīng)用構(gòu)建在AI之上,這就是未來(lái)應(yīng)用的基本框架。

這個(gè)基本框架,這種能夠完成我所描述的、具備多模型能力的智能體AI的基本結(jié)構(gòu),現(xiàn)在已經(jīng)極大地推動(dòng)了各類AI初創(chuàng)公司的發(fā)展。

通過(guò)我們開(kāi)源的模型和工具,現(xiàn)在你也可以輕松定制自己的AI,教它那些獨(dú)一無(wú)二的技能。這正是我們開(kāi)發(fā)Nemotron、NeMo等開(kāi)源模型的目標(biāo)。你只需要在AI前面加一個(gè)智能路由管理器,它會(huì)根據(jù)你的指令,自動(dòng)選擇最合適的模型來(lái)解決問(wèn)題。

這樣的架構(gòu)帶來(lái)什么?你得到的AI既能完全按你的需求定制,可以教它公司特有的技能,這些可能正是你的核心優(yōu)勢(shì),而且你也有對(duì)應(yīng)的數(shù)據(jù)和專業(yè)知識(shí)去訓(xùn)練它;同時(shí),它又能始終保持技術(shù)領(lǐng)先,隨時(shí)用上最新的能力。

簡(jiǎn)單來(lái)說(shuō),你的AI既能高度個(gè)性化,又能即開(kāi)即用,始終保持在前沿。

為此,我們做了一個(gè)最簡(jiǎn)單的示例框架,叫“AI Route Blueprint”,已經(jīng)集成到全球多家企業(yè)的SaaS平臺(tái)中,效果很不錯(cuò)。

這是不是很不可思議?使用語(yǔ)言模型。使用預(yù)先訓(xùn)練好的、專有的、前沿的語(yǔ)言模型,與定制的語(yǔ)言模型結(jié)合到一個(gè)智能體框架、一個(gè)推理框架中,允許你訪問(wèn)工具和文件,甚至可能連接到其他智能體。這基本上就是AI應(yīng)用或現(xiàn)代應(yīng)用的基本架構(gòu),而我們創(chuàng)建這些應(yīng)用的能力非常快。

注意,即使你給它從未見(jiàn)過(guò)的應(yīng)用程序信息,或者以一種并非完全如你所想的結(jié)構(gòu)呈現(xiàn),它仍然能進(jìn)行推理,并盡最大努力通過(guò)數(shù)據(jù)和信息去嘗試?yán)斫馊绾谓鉀Q問(wèn)題。這就是人工智能。

這個(gè)基本框架現(xiàn)在正在被整合,而我剛才描述的一切,我們有幸與一些世界領(lǐng)先的企業(yè)平臺(tái)公司合作。例如Palantir,他們整個(gè)AI和數(shù)據(jù)處理平臺(tái)正在集成,并由英偉達(dá)加速。還有世界領(lǐng)先的客戶服務(wù)和員工服務(wù)平臺(tái)ServiceNow、全球頂級(jí)的云端數(shù)據(jù)平臺(tái)Snowflake。CodeRabbit,我們?cè)谟ミ_(dá)內(nèi)部廣泛使用。CrowdStrike,正在創(chuàng)建AI來(lái)檢測(cè)和發(fā)現(xiàn)AI威脅。NetApp,他們的數(shù)據(jù)平臺(tái)現(xiàn)在上面有英偉達(dá)的語(yǔ)義AI,以及智能體系統(tǒng),用于客戶服務(wù)。

但重要的是:這不僅是你現(xiàn)在開(kāi)發(fā)應(yīng)用的方式,它還將成為你平臺(tái)的用戶界面。所以,無(wú)論是Palantir、ServiceNow還是Snowflake,以及我們正在合作的許多其他公司,智能體系統(tǒng)就是界面。它不再是在方格里輸入信息的Excel,也許也不再僅僅是命令行。現(xiàn)在,所有這些多模態(tài)信息交互都成為可能。你與平臺(tái)交互的方式變得更加簡(jiǎn)單,就像你在與人交互一樣。因此,企業(yè)AI正在被智能體系統(tǒng)徹底改變。

三、物理AI突圍:教會(huì)機(jī)器理解與交互真實(shí)世界

下一件事是物理AI。這是你們聽(tīng)我談?wù)摿撕脦啄甑念I(lǐng)域。事實(shí)上,我們已經(jīng)為此工作了八年。問(wèn)題是:如何將計(jì)算機(jī)內(nèi)通過(guò)屏幕和揚(yáng)聲器與你交互的智能體,變成能與世界交互的智能體?這意味著它能理解世界運(yùn)作的常識(shí):物體恒存性(我移開(kāi)視線再回來(lái),物體還在那里)、因果關(guān)系(我推它,它會(huì)倒下)。

它理解摩擦力、重力以及慣性,知道一輛重型卡車在路上行駛需要更多時(shí)間才能停下,一個(gè)球會(huì)繼續(xù)滾動(dòng)。這些想法對(duì)小孩來(lái)說(shuō)都是常識(shí),但對(duì)AI來(lái)說(shuō)完全是未知的。因此,我們必須創(chuàng)建一個(gè)系統(tǒng),讓AI能夠?qū)W習(xí)物理世界的常識(shí)、學(xué)習(xí)其規(guī)律,當(dāng)然也能從數(shù)據(jù)中學(xué)習(xí)。而數(shù)據(jù)相當(dāng)稀缺。并且需要能夠評(píng)估AI是否有效,這意味著它必須在環(huán)境中進(jìn)行模擬。如果AI沒(méi)有能力模擬物理世界對(duì)其動(dòng)作的反饋,它怎么知道自己執(zhí)行的動(dòng)作是否符合預(yù)期?

這個(gè)基本系統(tǒng)需要三臺(tái)計(jì)算機(jī):一臺(tái)是我們熟知的、英偉達(dá)制造的用于訓(xùn)練AI模型的計(jì)算機(jī);第二臺(tái)是用于推理模型的計(jì)算機(jī)。推理模型本質(zhì)上是在汽車、機(jī)器人、工廠或任何邊緣地方運(yùn)行的機(jī)器人計(jì)算機(jī);但必須有另一臺(tái)為模擬設(shè)計(jì)的計(jì)算機(jī),因?yàn)槟M是英偉達(dá)幾乎所有事情的核心,這是我們最得心應(yīng)手的地方。模擬確實(shí)是我們所做的一切物理AI工作的基礎(chǔ)。

所以我們有三臺(tái)計(jì)算機(jī),以及運(yùn)行在這些計(jì)算機(jī)上、讓它們變得有用的多個(gè)技術(shù)棧和庫(kù)。Omniverse是我們的數(shù)字孿生、基于物理的模擬世界。Cosmos是我們的基礎(chǔ)模型,不是語(yǔ)言基礎(chǔ)模型,而是世界基礎(chǔ)模型,并且也與語(yǔ)言對(duì)齊。你可以問(wèn)“球怎么樣了?”,它會(huì)告訴你球正在街上滾動(dòng)。當(dāng)然,還有機(jī)器人模型,我們有兩個(gè):一個(gè)叫Groot,另一個(gè)叫Alpamayo。

對(duì)于物理AI,我們必須做的最重要的事情之一就是創(chuàng)建數(shù)據(jù)來(lái)訓(xùn)練AI。這些數(shù)據(jù)從何而來(lái)?不像語(yǔ)言那樣,因?yàn)槲覀儎?chuàng)造了一堆被認(rèn)為是“真實(shí)情況”的文本,AI可以從中學(xué)習(xí)。我們?nèi)绾谓虝?huì)AI物理世界的“真實(shí)情況”?盡管有大量的視頻,但遠(yuǎn)遠(yuǎn)不足以捕捉我們需要的交互的多樣性和類型。

因此,一些偉大的頭腦聚集在一起,將原本用于計(jì)算的資源轉(zhuǎn)化為數(shù)據(jù)。現(xiàn)在,利用以物理定律為基礎(chǔ)和條件、以真實(shí)情況為基礎(chǔ)和條件的合成數(shù)據(jù)生成技術(shù),我們可以有選擇地、巧妙地生成數(shù)據(jù),然后用來(lái)訓(xùn)練AI。例如,我們可以利用Cosmos基礎(chǔ)模型,生成基于物理、物理上合理的環(huán)繞視頻,AI現(xiàn)在可以從中學(xué)習(xí)。

我知道這很不可思議。Cosmos是世界領(lǐng)先的基礎(chǔ)模型、世界基礎(chǔ)模型。它已被下載數(shù)百萬(wàn)次,在世界各地使用,讓世界為這個(gè)物理AI的新時(shí)代做好準(zhǔn)備。我們自己也在使用它,用它來(lái)創(chuàng)建我們的自動(dòng)駕駛汽車系統(tǒng),用于場(chǎng)景生成和評(píng)估。通過(guò)計(jì)算機(jī)模擬,我們能夠有效地行駛數(shù)十億、數(shù)萬(wàn)億公里。

今天,我們宣布推出Alpamayo,世界上首個(gè)會(huì)思考、會(huì)推理的自動(dòng)駕駛汽車AI。Alpamayo是端到端訓(xùn)練的,從攝像頭輸入到驅(qū)動(dòng)輸出。訓(xùn)練數(shù)據(jù)包括它自己行駛的大量里程、人類駕駛示范,以及由Cosmos生成的大量里程。除此之外,還有數(shù)十萬(wàn)個(gè)非常仔細(xì)標(biāo)記的例子,以便我們教汽車如何駕駛。

Alpamayo獨(dú)特之處在于。它不僅接收傳感器輸入并驅(qū)動(dòng)方向盤(pán)、剎車和加速器,還會(huì)推理它即將采取什么行動(dòng)。它會(huì)告訴你它將采取什么行動(dòng),采取該行動(dòng)的原因,當(dāng)然還有軌跡。所有這些都直接耦合,并通過(guò)人類訓(xùn)練數(shù)據(jù)和Cosmos生成數(shù)據(jù)的巨大組合進(jìn)行專門(mén)訓(xùn)練。結(jié)果非常不可思議。

不僅汽車能像你期望的那樣駕駛,而且駕駛得非常自然,因?yàn)樗苯訌娜祟愂痉吨袑W(xué)習(xí)。但在每一個(gè)場(chǎng)景中,當(dāng)它遇到某個(gè)場(chǎng)景時(shí),它會(huì)進(jìn)行推理,告訴你它將做什么,并推理它為什么要做。這之所以如此重要,是因?yàn)轳{駛的“長(zhǎng)尾”問(wèn)題。

我們不可能簡(jiǎn)單地收集世界上每個(gè)國(guó)家、每種情況、所有人口可能遇到的所有可能的場(chǎng)景。然而,每個(gè)場(chǎng)景如果被分解成一系列更小的場(chǎng)景,很可能都是相當(dāng)常見(jiàn)的、你能理解的。因此,這些長(zhǎng)尾場(chǎng)景將被分解成汽車知道如何處理的相當(dāng)常見(jiàn)的情況,它只需要進(jìn)行推理。

我們八年前就開(kāi)始研發(fā)自動(dòng)駕駛汽車了。原因在于我們很早就認(rèn)識(shí)到,深度學(xué)習(xí)和人工智能將徹底重塑整個(gè)計(jì)算技術(shù)棧。如果我們想要理解如何引領(lǐng)自己、如何指引行業(yè)走向這個(gè)新未來(lái),就必須精通構(gòu)建整個(gè)技術(shù)棧。

四、計(jì)算躍進(jìn):Rubin平臺(tái)與全棧芯片的終極重構(gòu)

正如我之前提到的,AI是一個(gè)“五層蛋糕”。最底層是土地、電力和外殼。在機(jī)器人領(lǐng)域,最底層就是汽車本身。往上一層是芯片:GPU、網(wǎng)絡(luò)芯片、CPU等等。再往上是基礎(chǔ)設(shè)施層。在物理AI這個(gè)具體案例中,基礎(chǔ)設(shè)施就是Omniverse和Cosmos。然后在上層是模型層。我剛才展示的模型就屬于這一層,這個(gè)模型叫做Alpamayo。今天,Alpamayo正式開(kāi)源了。

我們?cè)O(shè)想有一天,道路上的十億輛汽車都將實(shí)現(xiàn)自動(dòng)駕駛。你可以選擇租用別人運(yùn)營(yíng)的自動(dòng)駕駛出租車,也可以擁有自己的車讓它為你駕駛,或者選擇自己駕駛。但每一輛車都將具備自動(dòng)駕駛能力。每一輛車都將由AI驅(qū)動(dòng)。所以在這個(gè)案例中,模型層是Alpamayo,而應(yīng)用層之上就是梅賽德斯-奔馳汽車。

總而言之,這個(gè)技術(shù)棧是英偉達(dá)首次嘗試構(gòu)建的完整技術(shù)棧。我們一直為此努力,非常高興英偉達(dá)的首款自動(dòng)駕駛汽車將于第一季度在美國(guó)上路,然后歐洲是第二季度,亞洲或許是第三、第四季度。強(qiáng)大之處在于,我們將不斷用Alpamayo的后續(xù)版本進(jìn)行更新。

毫無(wú)疑問(wèn),在我看來(lái),這將成為最大的機(jī)器人產(chǎn)業(yè)之一。它教會(huì)了我們大量關(guān)于如何幫助世界其他地區(qū)構(gòu)建機(jī)器人系統(tǒng)的深刻理解。通過(guò)自己構(gòu)建整個(gè)基礎(chǔ)設(shè)施,我們知道了機(jī)器人系統(tǒng)需要什么樣的芯片。

在這個(gè)具體案例中,是下一代雙Thor處理器。這些處理器專為機(jī)器人系統(tǒng)設(shè)計(jì),具備最高級(jí)別的安全能力。梅賽德斯-奔馳CLA剛剛被NCAP評(píng)為世界上最安全的汽車。

據(jù)我所知,這是唯一一個(gè)每一行代碼、芯片、系統(tǒng)都經(jīng)過(guò)安全認(rèn)證的系統(tǒng)。整個(gè)模型系統(tǒng)基于此,傳感器是多樣且冗余的,自動(dòng)駕駛汽車技術(shù)棧也是如此。Alpamayo技術(shù)棧是端到端訓(xùn)練的,擁有驚人的技能。然而,除非無(wú)限期地駕駛,否則沒(méi)人知道它是否絕對(duì)安全。

因此,我們通過(guò)另一個(gè)軟件技術(shù)棧、一個(gè)完整的自動(dòng)駕駛技術(shù)棧來(lái)為其設(shè)置防護(hù)欄。那個(gè)完整的技術(shù)棧被構(gòu)建為完全可追溯的。我們花了大約五年(實(shí)際上是六七年)來(lái)構(gòu)建那個(gè)第二技術(shù)棧。這兩個(gè)軟件技術(shù)棧相互映照。

然后我們利用Alpamayo進(jìn)行策略和安全評(píng)估。如果是一個(gè)我不太自信的情況,安全策略評(píng)估器決定我們將退回到一個(gè)更簡(jiǎn)單、更安全的防護(hù)欄系統(tǒng),那么就回到經(jīng)典的自動(dòng)駕駛技術(shù)棧。這是世界上唯一同時(shí)運(yùn)行這兩個(gè)自動(dòng)駕駛技術(shù)棧的汽車。所有安全系統(tǒng)都應(yīng)該具備多樣性和冗余性。

我們的愿景是,有朝一日每一輛汽車、每一輛卡車都將是自動(dòng)駕駛的。我們一直在朝著那個(gè)未來(lái)努力。這整個(gè)技術(shù)棧是垂直集成的。當(dāng)然,在梅賽德斯-奔馳的案例中,我們一起構(gòu)建了整個(gè)技術(shù)棧,我們將部署汽車、運(yùn)營(yíng)技術(shù)棧,只要我們還存在,就會(huì)維護(hù)這個(gè)技術(shù)棧。

然而,就像我們公司所做的其他一切一樣,我們構(gòu)建整個(gè)技術(shù)棧,但整個(gè)技術(shù)棧對(duì)生態(tài)系統(tǒng)開(kāi)放。與我們合作構(gòu)建L4級(jí)和自動(dòng)駕駛出租車的生態(tài)系統(tǒng)正在擴(kuò)展,無(wú)處不在。我完全相信,這已經(jīng)是我們的一項(xiàng)巨大業(yè)務(wù),因?yàn)榭蛻粲盟鼇?lái)訓(xùn)練、處理訓(xùn)練數(shù)據(jù),以及訓(xùn)練他們的模型。在某些案例中,一些公司用它來(lái)生成合成數(shù)據(jù)。有些公司基本上只制造汽車內(nèi)部的計(jì)算機(jī)和芯片,有些公司與我們進(jìn)行全棧合作,有些則合作部分環(huán)節(jié)。

整個(gè)系統(tǒng)現(xiàn)在是開(kāi)放的。這將成為第一個(gè)大規(guī)模、主流的AI物理AI市場(chǎng)。從非自動(dòng)駕駛汽車到自動(dòng)駕駛汽車的轉(zhuǎn)折點(diǎn),很可能就在此時(shí)開(kāi)始,并在未來(lái)十年內(nèi)發(fā)生。我相當(dāng)確信,世界上很大比例的汽車將是自動(dòng)駕駛或高度自動(dòng)駕駛的。

但是,我剛才描述的這個(gè)基本技術(shù)(使用三臺(tái)計(jì)算機(jī)、利用合成數(shù)據(jù)生成和模擬),適用于所有形式的機(jī)器人系統(tǒng)??赡苤皇且粋€(gè)關(guān)節(jié)、一個(gè)機(jī)械臂,可能是移動(dòng)機(jī)器人,也可能是完整的人形機(jī)器人。所以,下一個(gè)旅程將是機(jī)器人。這些機(jī)器人將會(huì)有各種不同的尺寸。

這些機(jī)器人身上有微型Jetson計(jì)算機(jī),它們是在Omniverse里面訓(xùn)練出來(lái)的。機(jī)器人模擬器叫Isaac Sim和Isaac Lab。 我們有很多建造機(jī)器人的朋友,包括New Robot、AG Bot、LG、卡特彼勒(他們有史上最大的機(jī)器人)、Serve Robot、Agility、波士頓動(dòng)力、Franka以及Universal Robots等。

舉例來(lái)說(shuō),Cadence將CUDA-X集成到他們所有的模擬器和求解器中。他們將使用英偉達(dá)的物理AI來(lái)進(jìn)行不同的物理裝置和工廠模擬。AI物理正被集成到這些系統(tǒng)中。所以,無(wú)論是電子設(shè)計(jì)自動(dòng)化還是系統(tǒng)設(shè)計(jì)自動(dòng)化,以及未來(lái)的機(jī)器人系統(tǒng),我們將擁有基本上與創(chuàng)造你們相同的技術(shù),現(xiàn)在將徹底革新這些設(shè)計(jì)技術(shù)棧。

在芯片設(shè)計(jì)領(lǐng)域,Synopsys和Cadence是完全不可或缺的。Synopsys在邏輯設(shè)計(jì)和IP領(lǐng)域領(lǐng)先,而Cadence在物理設(shè)計(jì)、布局布線、仿真和驗(yàn)證方面領(lǐng)先。Cadence在仿真和驗(yàn)證方面做得非常出色。他們兩家都正在進(jìn)入系統(tǒng)設(shè)計(jì)和系統(tǒng)仿真的領(lǐng)域。所以未來(lái),我們將在Cadence和Synopsys內(nèi)部設(shè)計(jì)芯片,并在這些工具內(nèi)部模擬一切。

西門(mén)子也在做同樣的事情。我們將把CUDA-X物理AI、智能體AI、NeMo、Nemotron深度集成到西門(mén)子的世界中。原因如下:首先,我們?cè)O(shè)計(jì)芯片,未來(lái)這一切都將由英偉達(dá)加速。我們將有智能體芯片設(shè)計(jì)師和系統(tǒng)設(shè)計(jì)師與我們合作,他們幫助我們進(jìn)行設(shè)計(jì),就像我們今天有智能體軟件工程師幫助我們的軟件工程師編碼一樣。

然后我們必須能夠制造機(jī)器人。我們必須建造生產(chǎn)它們的工廠、設(shè)計(jì)組裝它們的生產(chǎn)線。而這些制造工廠本質(zhì)上將是巨型機(jī)器人。所以,機(jī)器人將在計(jì)算機(jī)中被設(shè)計(jì),在計(jì)算機(jī)中被制造,在計(jì)算機(jī)中被測(cè)試和評(píng)估。我們現(xiàn)在創(chuàng)造的技術(shù)已經(jīng)達(dá)到了足夠成熟和強(qiáng)大的水平,可以反過(guò)來(lái)幫助他們徹底革新它們所在的行業(yè)。

放眼全球的模型格局,毫無(wú)疑問(wèn),OpenAI是當(dāng)今領(lǐng)先的token生成器。今天,OpenAI生成的token數(shù)量遠(yuǎn)超其他任何模型。第二大群體,可能就是開(kāi)源模型了。我猜隨著時(shí)間的推移,因?yàn)橛腥绱硕嗟墓?、如此多的研究人員、如此多不同類型的領(lǐng)域和模態(tài),開(kāi)源模型將成為規(guī)模最大的群體。

在此過(guò)程中,離不開(kāi)Rubin構(gòu)架。這個(gè)平臺(tái)的誕生,是為了應(yīng)對(duì)我們面臨的一個(gè)根本性挑戰(zhàn):AI所需的計(jì)算量正在飆升,對(duì)英偉達(dá)GPU的需求也在飆升。這種飆升是因?yàn)槟P兔磕甓荚谝?0倍、一個(gè)數(shù)量級(jí)的規(guī)模增長(zhǎng)。更不用說(shuō),o1模型的引入是AI的一個(gè)轉(zhuǎn)折點(diǎn)。推理不再是一次性給出答案,現(xiàn)在是一個(gè)思考過(guò)程。為了教會(huì)AI如何思考,強(qiáng)化學(xué)習(xí)和極其大量的計(jì)算被引入了后訓(xùn)練階段。它不再是監(jiān)督式微調(diào)(也稱為模仿學(xué)習(xí)或監(jiān)督訓(xùn)練),現(xiàn)在有了強(qiáng)化學(xué)習(xí),本質(zhì)上是計(jì)算機(jī)通過(guò)自我嘗試不同迭代來(lái)學(xué)習(xí)如何執(zhí)行任務(wù)。結(jié)果,用于預(yù)訓(xùn)練、后訓(xùn)練、測(cè)試時(shí)縮放的計(jì)算量爆炸式增長(zhǎng)。

現(xiàn)在,我們進(jìn)行的每一次推理,都可能生成2個(gè)token而不是1個(gè),你可以看到AI在“思考”。它思考得越久,通常能給出更好的答案。因此,測(cè)試時(shí)縮放導(dǎo)致生成的token數(shù)量每年增加5倍。

與此同時(shí),AI的競(jìng)賽正在激烈進(jìn)行。每個(gè)人都在試圖達(dá)到下一個(gè)水平,登上新的前沿。而每當(dāng)他們到達(dá)新的前沿,上一代AI生成token的成本就開(kāi)始下降,降幅大約是10倍。每年下降10倍這件事實(shí)際上說(shuō)明了不同的情況:它表明競(jìng)賽如此激烈,每個(gè)人都在努力達(dá)到下一個(gè)水平,并且確實(shí)有人正在達(dá)到那個(gè)水平。

因此,所有這一切本質(zhì)上都是一個(gè)計(jì)算問(wèn)題。你計(jì)算得越快,就能越早達(dá)到下一個(gè)水平和前沿。所有這些事情都在同時(shí)發(fā)生,所以我們決定,必須每年都推進(jìn)計(jì)算技術(shù)的水平,一年都不能落后。

我們一年半前出貨GB200。目前,我們正在進(jìn)行GB300的大規(guī)模生產(chǎn)。如果Rubin想要在今年及時(shí)推出,它現(xiàn)在就必須已經(jīng)投產(chǎn)。所以今天,我可以告訴你們:Rubin已進(jìn)入全面生產(chǎn)階段。

我們還推出了基于Rubin架構(gòu)的新一代計(jì)算集群DGX SuperPOD,包含1152個(gè)GPU,分布在16個(gè)機(jī)架中,每個(gè)機(jī)架有72個(gè)Rubin GPU。

我們?cè)O(shè)計(jì)了六種不同的芯片。首先,我們公司內(nèi)部有一個(gè)原則:每一代新平臺(tái)不應(yīng)該有超過(guò)一兩個(gè)芯片發(fā)生變動(dòng)。但問(wèn)題來(lái)了:我們知道摩爾定律已經(jīng)基本放緩,因此我們每年能獲得的晶體管數(shù)量,不可能跟上模型每年10倍的增長(zhǎng)速度,不可能跟上每年生成的token數(shù)量5倍的增長(zhǎng),也不可能跟上令牌成本如此激進(jìn)的下降速度。

如果行業(yè)要繼續(xù)前進(jìn),要想跟上這樣的速度是不可能的。除非我們采用激進(jìn)的極致協(xié)同設(shè)計(jì),基本上就是在所有芯片、整個(gè)技術(shù)棧上同時(shí)進(jìn)行創(chuàng)新。為此,我們決定,在這一代平臺(tái)上重新設(shè)計(jì)每一個(gè)芯片。

首先是Vera CPU。在一個(gè)受功率約束的世界里,它的性能是上一代的兩倍,每瓦性能是世界上其他最先進(jìn)CPU的兩倍。它的數(shù)據(jù)速率是瘋狂的,專為處理超級(jí)計(jì)算機(jī)而設(shè)計(jì)。Grace曾是一款出色的CPU,而Vera則將單線程性能、內(nèi)存容量和所有方面都顯著提升了。這是一次巨大的飛躍。

Vera CPU連接到Rubin GPU!這是一個(gè)巨大的芯片,有88個(gè)CPU核心,這些核心設(shè)計(jì)為支持多線程。但Vera的多線程特性設(shè)計(jì)得讓176個(gè)線程中的每一個(gè)都能獲得其完整的性能,所以本質(zhì)上就像有176個(gè)核心,但只有88個(gè)物理核心。這些核心采用了一種叫做空間多線程的技術(shù)設(shè)計(jì),性能驚人。

其次是Rubin GPU。它的浮點(diǎn)性能是Blackwell的5倍,但晶體管數(shù)量只有Blackwell的1.6倍。這多少說(shuō)明了當(dāng)今半導(dǎo)體物理的水平。如果我們不進(jìn)行協(xié)同設(shè)計(jì),不在整個(gè)系統(tǒng)的每一個(gè)芯片層面進(jìn)行極致的協(xié)同設(shè)計(jì),我們?cè)趺纯赡軐?shí)現(xiàn)這種性能水平?

第三,我們做的一件偉大的發(fā)明叫做NVFP4 Tensor Core。我們芯片中的Transformer引擎不僅僅是我們放入數(shù)據(jù)通路的某種4位浮點(diǎn)數(shù),它是一個(gè)完整的處理器單元,懂得如何動(dòng)態(tài)、自適應(yīng)地調(diào)整其精度和結(jié)構(gòu),以處理Transformer的不同層次,從而在可以損失精度的地方實(shí)現(xiàn)更高的吞吐量,在需要的時(shí)候恢復(fù)到最高的可能精度。這種動(dòng)態(tài)調(diào)整能力無(wú)法通過(guò)軟件實(shí)現(xiàn),因?yàn)樗\(yùn)行得太快了。所以必須在處理器內(nèi)部自適應(yīng)地完成。這就是NVFP4的意義。

我們已經(jīng)發(fā)表了關(guān)于NVFP4的論文。它所達(dá)到的吞吐量和精度保持水平是完全不可思議的。這是開(kāi)創(chuàng)性的工作。未來(lái)行業(yè)希望我們將這種格式和結(jié)構(gòu)定為行業(yè)標(biāo)準(zhǔn),我一點(diǎn)也不會(huì)感到意外。這完全是革命性的。這就是為什么我們能夠在晶體管數(shù)量?jī)H增加1.6倍的情況下,實(shí)現(xiàn)如此巨大的性能飛躍。

第四,我們革新了整個(gè)HGX機(jī)箱。這個(gè)節(jié)點(diǎn)以前有43條電纜,現(xiàn)在0條;6根水管,現(xiàn)在0根。以前組裝這個(gè)需要兩小時(shí),現(xiàn)在則只要五分鐘,而且100%液冷。

第五,將這些連接到頂層機(jī)架交換機(jī)、處理東西向流量的,叫做Spectrum-X網(wǎng)卡。這是世界上毫無(wú)疑問(wèn)最好的網(wǎng)卡。Mellanox的算法、芯片設(shè)計(jì)、所有互連、其上運(yùn)行的所有軟件棧、RDMA,絕對(duì)是無(wú)與倫比的世界最佳。現(xiàn)在它還具有可編程的RDMA和數(shù)據(jù)路徑加速器功能,讓我們的合作伙伴(如AI實(shí)驗(yàn)室)可以創(chuàng)建自己的算法來(lái)決定如何在系統(tǒng)中移動(dòng)數(shù)據(jù)。

第六,ConnectX-9和Vera CPU是協(xié)同設(shè)計(jì)的。眾所周知,ConnectX-8和Spectrum-X徹底改變了用于人工智能的以太網(wǎng)技術(shù)。AI的以太網(wǎng)流量要密集得多,要求更低的延遲,流量的瞬時(shí)激增是傳統(tǒng)以太網(wǎng)從未見(jiàn)過(guò)的。所以我們創(chuàng)建了Spectrum-X,即AI以太網(wǎng)。兩年前我們宣布了Spectrum-X。今天,英偉達(dá)已成為全球有史以來(lái)最大的網(wǎng)絡(luò)公司。

它非常成功,在各種設(shè)施中廣泛使用,正在席卷整個(gè)AI領(lǐng)域。其性能令人難以置信,尤其是當(dāng)你擁有一個(gè)200兆瓦的數(shù)據(jù)中心,或者一個(gè)千兆瓦的數(shù)據(jù)中心(價(jià)值數(shù)百億美元,一個(gè)千兆瓦數(shù)據(jù)中心大約500億美元)時(shí)。如果網(wǎng)絡(luò)性能能讓你額外獲得10%的收益——以Spectrum-X為例,實(shí)現(xiàn)25%更高的吞吐量并不罕見(jiàn)——僅僅是10%的提升,就價(jià)值50億美元。等于網(wǎng)絡(luò)成本完全免費(fèi)了。這就是為什么每個(gè)人都在使用Spectrum-X的原因。

第七,現(xiàn)在,我們發(fā)明了一種新型的數(shù)據(jù)處理方式,它的處理器叫做BlueField-4,允許我們管理一個(gè)非常龐大的數(shù)據(jù)中心,隔離其不同部分,以便不同用戶可以使用不同部分,確保所有資源在需要時(shí)都可以被虛擬化。這樣,你就能卸載很多虛擬化軟件、安全軟件以及南北向流量的網(wǎng)絡(luò)軟件。所以,BlueField-4是每個(gè)計(jì)算節(jié)點(diǎn)的標(biāo)準(zhǔn)配置。

第八是NVLink-6交換機(jī)。每個(gè)機(jī)架交換機(jī)里面有四個(gè)芯片,每顆芯片都有歷史上最快的SerDes。世界才剛剛達(dá)到200Gb/s,而這是每秒400Gb/s的交換機(jī)。這之所以如此重要,是因?yàn)樗茏屆總€(gè)GPU都能同時(shí)與其他所有GPU進(jìn)行通信。這個(gè)位于機(jī)架背板上的交換機(jī),使我們能夠以相當(dāng)于全球互聯(lián)網(wǎng)數(shù)據(jù)總量?jī)杀兜乃俣纫苿?dòng)數(shù)據(jù)。全球互聯(lián)網(wǎng)的橫截面帶寬大約是每秒100太字節(jié),而這個(gè)是每秒240太字節(jié),讓每個(gè)GPU都能同時(shí)與其他所有GPU協(xié)同工作。

后面是NVLink脊柱,基本上是兩英里長(zhǎng)的銅纜。銅是我們所知的最佳導(dǎo)體。這些都是屏蔽銅纜、結(jié)構(gòu)銅纜,是計(jì)算系統(tǒng)中有史以來(lái)使用最多的。我們的SerDes以每秒400Gb的速率驅(qū)動(dòng)這些銅纜從機(jī)架頂部一直到機(jī)架底部。這里面總共有長(zhǎng)3200米、5000根銅纜,這使NVLink脊柱成為可能。這項(xiàng)革新真正開(kāi)啟了我們的HGX系統(tǒng),我們決定創(chuàng)建一個(gè)行業(yè)標(biāo)準(zhǔn)系統(tǒng),讓整個(gè)生態(tài)系統(tǒng)、我們所有的供應(yīng)鏈都能基于這些組件進(jìn)行標(biāo)準(zhǔn)化。構(gòu)成這些HGX系統(tǒng)的組件大約有8萬(wàn)個(gè)。

如果我們每年都改變它,那將是巨大的浪費(fèi)。從富士康到廣達(dá)、緯創(chuàng),再到惠普、戴爾、聯(lián)想,所有主要的計(jì)算機(jī)制造商都知道如何構(gòu)建這些系統(tǒng)。所以,盡管性能高得多,而且非常重要的一點(diǎn)是,功耗是前代的兩倍,Vera Rubin的功耗是Grace Blackwell的兩倍——但我們?nèi)匀荒軐era Rubin塞進(jìn)這個(gè)框架里,這本身就是一個(gè)奇跡。

進(jìn)入系統(tǒng)的空氣流量大致相同。更重要的是,進(jìn)入的水溫相同,45攝氏度。在45攝氏度下,數(shù)據(jù)中心不需要冷水機(jī)。我們基本上是用熱水來(lái)冷卻這臺(tái)超級(jí)計(jì)算機(jī),效率高得令人難以置信。

所以,這是新的機(jī)架:晶體管數(shù)量是1.7倍,但峰值推理性能是5倍,峰值訓(xùn)練性能是3.5倍。它們通過(guò)頂部的Spectrum-X連接起來(lái)。

這是世界上第一款采用臺(tái)積電新工藝制造的芯片,這個(gè)新工藝是我們共同創(chuàng)新的,叫做CoWoS,是一種硅光子集成工藝技術(shù)。這使我們能夠?qū)⒐韫庾又苯蛹傻叫酒?。這里有512個(gè)端口,每個(gè)端口200Gb/s。這就是新的以太網(wǎng)AI交換機(jī)——Spectrum-X以太網(wǎng)交換機(jī)。

幾年前我們推出了Spectrum-X,以便徹底改變網(wǎng)絡(luò)連接的方式。以太網(wǎng)確實(shí)易于管理,每個(gè)人都有以太網(wǎng)技術(shù)棧,世界上每個(gè)數(shù)據(jù)中心都知道如何處理以太網(wǎng)。而當(dāng)時(shí)我們使用的另一種技術(shù)叫做InfiniBand,用于超級(jí)計(jì)算機(jī)。InfiniBand延遲非常低,但它的軟件棧和整個(gè)可管理性對(duì)使用以太網(wǎng)的人來(lái)說(shuō)非常陌生。所以我們決定首次進(jìn)入以太網(wǎng)交換機(jī)市場(chǎng)。Spectrum-X一經(jīng)推出就大獲成功,使我們成為世界上最大的網(wǎng)絡(luò)公司。

五、生態(tài)閉環(huán):從基礎(chǔ)設(shè)施到行業(yè)滲透的全棧布局

但就像我之前說(shuō)的,AI已經(jīng)重塑了整個(gè)計(jì)算技術(shù)棧的每一層。同理可證,當(dāng)AI開(kāi)始在世界各地的企業(yè)部署時(shí),它也必將重塑存儲(chǔ)的方式。AI不使用SQL,AI使用語(yǔ)義信息。當(dāng)AI被使用時(shí),它會(huì)創(chuàng)建一種臨時(shí)的知識(shí)、臨時(shí)的記憶,叫做KV緩存(鍵值緩存)。但本質(zhì)上,KV緩存就是AI的工作內(nèi)存。AI的工作內(nèi)存存儲(chǔ)在HBM內(nèi)存中。

對(duì)于生成的每一個(gè)token,GPU都會(huì)讀入整個(gè)模型、整個(gè)工作內(nèi)存,產(chǎn)生一個(gè)token,然后將這個(gè)token存回KV緩存。下一次它再做同樣的事情時(shí),它會(huì)再次讀入整個(gè)內(nèi)存,流經(jīng)GPU,生成另一個(gè)token。它就這樣重復(fù)進(jìn)行。顯然,如果你長(zhǎng)時(shí)間與AI對(duì)話,這個(gè)內(nèi)存——這個(gè)上下文內(nèi)存——將會(huì)急劇增長(zhǎng)。更不用說(shuō)模型本身在增長(zhǎng),我們與AI交互的輪次在增加。我們甚至希望這個(gè)AI能伴隨我們一生,記住我們與它進(jìn)行過(guò)的每一次對(duì)話,對(duì)吧?我要求它研究的每一個(gè)鏈接……當(dāng)然,共享超級(jí)計(jì)算機(jī)的用戶數(shù)量也會(huì)持續(xù)增長(zhǎng)。

因此,這個(gè)最初能放進(jìn)HBM的上下文內(nèi)存,現(xiàn)在已經(jīng)不夠大了。去年,我們創(chuàng)建了Grace Blackwell的快速上下文內(nèi)存,這就是為什么我們將Grace直接連接到Hopper,直接連接到Blackwell,以擴(kuò)展上下文內(nèi)存。但即使那樣也不夠。所以,下一個(gè)解決方案當(dāng)然是走網(wǎng)絡(luò)。但是,如果有大量AI同時(shí)在運(yùn)行,那個(gè)網(wǎng)絡(luò)將不再足夠快。

所以答案很明確:需要一種不同的方法。因此,我們引入了BlueField-4,以便我們能夠在機(jī)架內(nèi)擁有一個(gè)非常快速的KV緩存上下文內(nèi)存存儲(chǔ)。這是一種全新的存儲(chǔ)系統(tǒng)類別。業(yè)界對(duì)此非常興奮,因?yàn)檫@是幾乎所有今天進(jìn)行大量token生成的人的痛點(diǎn)。AI實(shí)驗(yàn)室、云服務(wù)提供商,他們真的受困于KV緩存移動(dòng)所導(dǎo)致的網(wǎng)絡(luò)流量。

因此,我們創(chuàng)建一個(gè)新平臺(tái)、一個(gè)新處理器來(lái)運(yùn)行整個(gè)Dynamo KV緩存/上下文內(nèi)存管理系統(tǒng),并將其放在非??拷鼨C(jī)架其他部分的地方,這完全是革命性的。

每個(gè)這樣的機(jī)架后面有四個(gè)BlueField-4。每個(gè)BlueField-4后面有150太字節(jié)的上下文內(nèi)存。分?jǐn)偟矫總€(gè)GPU上,每個(gè)GPU將獲得額外的16太字節(jié)內(nèi)存?,F(xiàn)在,在這個(gè)節(jié)點(diǎn)內(nèi)部,每個(gè)GPU原本大約有1太字節(jié)內(nèi)存?,F(xiàn)在有了這個(gè)位于同一東西向流量上、數(shù)據(jù)速率完全相同(每秒200Gb)的支撐存儲(chǔ),橫跨整個(gè)計(jì)算節(jié)點(diǎn)的網(wǎng)絡(luò)結(jié)構(gòu),你將獲得額外的16太字節(jié)內(nèi)存。

Vera Rubin有幾個(gè)方面真的非常不可思議。第一點(diǎn)我剛才提到過(guò):整個(gè)系統(tǒng)的能效是前代的兩倍。雖然功耗是前代的兩倍,能耗也是兩倍,但計(jì)算能力是數(shù)倍于此。進(jìn)入系統(tǒng)的液體溫度仍然是45攝氏度。這使我們能節(jié)省全球數(shù)據(jù)中心大約6%的電力,這是件大事。

第二件大事:整個(gè)系統(tǒng)現(xiàn)在支持機(jī)密計(jì)算,意味著所有數(shù)據(jù)在傳輸中、靜態(tài)時(shí)和計(jì)算過(guò)程中都是加密的,每個(gè)總線現(xiàn)在都是加密的——每個(gè)PCIe、每個(gè)NVLink、每個(gè)HBM……CPU與內(nèi)存、CPU與GPU之間、GPU與GPU之間,一切現(xiàn)在都是加密的。所以它是機(jī)密計(jì)算安全的。這讓公司可以放心,即使他們的模型由別人部署,也永遠(yuǎn)不會(huì)被任何人看到。

這個(gè)特定系統(tǒng)不僅能效極高,還有另一個(gè)不可思議之處。由于AI工作負(fù)載的特性,它會(huì)在瞬間激增。這個(gè)叫做“全歸約”的計(jì)算層所使用的電流量、能量同時(shí)飆升,常常會(huì)突然激增25%?,F(xiàn)在,我們?cè)谡麄€(gè)系統(tǒng)中實(shí)現(xiàn)了功率平滑,這樣你就不需要過(guò)度配置25%的容量,或者如果你過(guò)度配置了,你也不必讓那25%的能源被浪費(fèi)或閑置?,F(xiàn)在,你可以用滿整個(gè)功率預(yù)算,而不需要過(guò)度配置。

最后,當(dāng)然是性能。讓我們看看它的性能。這些都是構(gòu)建AI超級(jí)計(jì)算機(jī)的人會(huì)喜歡的圖表。這需要……需要這里的每一個(gè)芯片、每一個(gè)系統(tǒng)的完全重新設(shè)計(jì),并重寫(xiě)整個(gè)軟件棧,才使其成為可能。

我們做的事情其實(shí)圍繞三個(gè)核心環(huán)節(jié):

第一是訓(xùn)練速度。訓(xùn)練AI模型越快,就能越早把下一代前沿模型推向世界。這直接決定技術(shù)領(lǐng)先性、上市時(shí)間和定價(jià)權(quán)。比如綠色部分代表一個(gè)10萬(wàn)億參數(shù)模型(我們稱之為DeepSeek++),需要基于100萬(wàn)億token進(jìn)行訓(xùn)練。在同樣的訓(xùn)練周期(比如一個(gè)月)里,用Rubin平臺(tái)只需四分之一的系統(tǒng)數(shù)量就能完成——在同樣的時(shí)間里,你能訓(xùn)練更大、更先進(jìn)的模型。

第二是數(shù)據(jù)中心效率。數(shù)據(jù)中心是AI的“工廠”,投資巨大。一個(gè)千兆瓦級(jí)數(shù)據(jù)中心可能需要500億美元投入,而電力是硬性約束。如果你的計(jì)算架構(gòu)每瓦性能更高,同樣的電力就能產(chǎn)生更多算力,直接轉(zhuǎn)化為數(shù)據(jù)中心的產(chǎn)出和收益。布萊克韋爾平臺(tái)相比前代實(shí)現(xiàn)了約10倍的能效提升,而魯賓將在此基礎(chǔ)上再次提升近10倍。

第三是推理成本。也就是實(shí)際生成每個(gè)token的成本。Rubin平臺(tái)將這一成本降低到原來(lái)的約十分之一。

這就是我們推動(dòng)整個(gè)行業(yè)走向下一個(gè)前沿的方式——讓訓(xùn)練更快、能效更高、推理更經(jīng)濟(jì),從而支撐AI持續(xù)向更大規(guī)模、更高水平發(fā)展。

如大家所見(jiàn),今天的英偉達(dá)早已不僅是芯片公司。我們構(gòu)建的是完整的全棧AI體系——從芯片、系統(tǒng)、基礎(chǔ)設(shè)施,到模型和應(yīng)用。我們的使命是打造完整的技術(shù)棧,讓在座的每一位都能在此基礎(chǔ)上,為世界創(chuàng)造令人驚嘆的AI應(yīng)用。

謝謝大家到場(chǎng),祝大家在CES收獲滿滿!

延伸閱讀
相關(guān)推薦
熱點(diǎn)推薦
濮存昕與許晴聯(lián)袂演繹,電視劇《來(lái)來(lái)往往》精彩紛呈

濮存昕與許晴聯(lián)袂演繹,電視劇《來(lái)來(lái)往往》精彩紛呈

動(dòng)物奇奇怪怪
2026-01-07 12:20:15
面對(duì)解放軍的臺(tái)海大演習(xí),懂王輕描淡寫(xiě)的評(píng)價(jià),說(shuō)出了內(nèi)心的無(wú)奈

面對(duì)解放軍的臺(tái)海大演習(xí),懂王輕描淡寫(xiě)的評(píng)價(jià),說(shuō)出了內(nèi)心的無(wú)奈

浩洋真知
2026-01-07 15:09:56
蔚來(lái)不飄了

蔚來(lái)不飄了

中國(guó)企業(yè)家雜志
2026-01-07 22:45:22
誤打誤撞把病治好是啥體驗(yàn)?網(wǎng)友:華佗在世都要甘拜下風(fēng)啊

誤打誤撞把病治好是啥體驗(yàn)?網(wǎng)友:華佗在世都要甘拜下風(fēng)啊

帶你感受人間冷暖
2025-07-21 00:15:06
16次出價(jià)、96.6萬(wàn)元成交!成都一特殊房源被一女性買家拍下,準(zhǔn)備自住

16次出價(jià)、96.6萬(wàn)元成交!成都一特殊房源被一女性買家拍下,準(zhǔn)備自住

愛(ài)看頭條
2026-01-08 09:39:05
被曝光后才明白,中國(guó)的錢,究竟去了哪里?

被曝光后才明白,中國(guó)的錢,究竟去了哪里?

復(fù)轉(zhuǎn)這些年
2025-12-27 23:56:37
別再可憐李詠了!離世7年后醫(yī)生揭秘離世真相,難怪選擇葬身美國(guó)

別再可憐李詠了!離世7年后醫(yī)生揭秘離世真相,難怪選擇葬身美國(guó)

LULU生活家
2025-12-29 18:30:47
司曉迪再曝猛料!曬開(kāi)房記錄實(shí)錘男方,同學(xué)反曝她人品:太反面了

司曉迪再曝猛料!曬開(kāi)房記錄實(shí)錘男方,同學(xué)反曝她人品:太反面了

青梅侃史啊
2026-01-06 09:03:42
女孩當(dāng)小姐,一晚要提供4到5次上門(mén)服務(wù),2015年被親人點(diǎn)到不赴約

女孩當(dāng)小姐,一晚要提供4到5次上門(mén)服務(wù),2015年被親人點(diǎn)到不赴約

漢史趣聞
2025-11-08 09:27:32
曹丕"荒淫無(wú)度"在位7年就駕崩?以他的玩法,40歲實(shí)屬是高壽!

曹丕"荒淫無(wú)度"在位7年就駕崩?以他的玩法,40歲實(shí)屬是高壽!

沈言論
2026-01-07 18:55:03
自曝與檀健次談過(guò)戀愛(ài)不到24小時(shí),劉一諾“底褲”都快被扒光了!

自曝與檀健次談過(guò)戀愛(ài)不到24小時(shí),劉一諾“底褲”都快被扒光了!

叨嘮
2026-01-08 04:59:23
曼聯(lián)選帥遭暴擊!5000 萬(wàn)年薪挖不動(dòng) 名帥拒當(dāng)英超頂薪主帥

曼聯(lián)選帥遭暴擊!5000 萬(wàn)年薪挖不動(dòng) 名帥拒當(dāng)英超頂薪主帥

瀾歸序
2026-01-08 04:12:48
中央“點(diǎn)名” 公積金制度改革破局在即

中央“點(diǎn)名” 公積金制度改革破局在即

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-01-08 19:03:18
萬(wàn)億央企蛀蟲(chóng)終于揪出來(lái)了!離職七年難逃法網(wǎng),25年腐化史現(xiàn)真容

萬(wàn)億央企蛀蟲(chóng)終于揪出來(lái)了!離職七年難逃法網(wǎng),25年腐化史現(xiàn)真容

墨蘭史書(shū)
2026-01-06 11:30:03
男子出走失聯(lián)5天后續(xù):原因曝光,車被丟高速,家人已做最壞打算

男子出走失聯(lián)5天后續(xù):原因曝光,車被丟高速,家人已做最壞打算

奇思妙想草葉君
2026-01-08 16:33:02
女子酒后跳河自殺身亡,孩子才兩歲半!丈夫向共同飲酒者和出租車司機(jī)索賠被駁回

女子酒后跳河自殺身亡,孩子才兩歲半!丈夫向共同飲酒者和出租車司機(jī)索賠被駁回

紅星新聞
2026-01-08 21:46:42
筱梅灣灣辦節(jié)日家宴!箖箖和玥兒露正臉!玥兒坐在那神態(tài)太像大S

筱梅灣灣辦節(jié)日家宴!箖箖和玥兒露正臉!玥兒坐在那神態(tài)太像大S

鋒哥與八卦哥
2026-01-06 16:03:26
挪媒:索帥若執(zhí)教曼聯(lián)周薪約5-6萬(wàn)鎊,進(jìn)歐冠獎(jiǎng)金300-400萬(wàn)鎊

挪媒:索帥若執(zhí)教曼聯(lián)周薪約5-6萬(wàn)鎊,進(jìn)歐冠獎(jiǎng)金300-400萬(wàn)鎊

懂球帝
2026-01-08 18:26:20
事件升級(jí)!閆學(xué)晶拒不認(rèn)錯(cuò),再現(xiàn)囂張嘴臉,再多名和利也救不了她

事件升級(jí)!閆學(xué)晶拒不認(rèn)錯(cuò),再現(xiàn)囂張嘴臉,再多名和利也救不了她

林輕吟
2026-01-07 09:04:23
李顯龍:美國(guó)軍事干預(yù)委內(nèi)瑞拉令小國(guó)擔(dān)憂

李顯龍:美國(guó)軍事干預(yù)委內(nèi)瑞拉令小國(guó)擔(dān)憂

新華社
2026-01-08 15:35:03
2026-01-09 07:47:00

科技要聞

內(nèi)存一天一個(gè)價(jià),華強(qiáng)北老板們卻高興不起來(lái)

頭條要聞

男子與女友吵架飆車泄憤撞死1家3口 當(dāng)時(shí)討論鸚鵡學(xué)舌

頭條要聞

男子與女友吵架飆車泄憤撞死1家3口 當(dāng)時(shí)討論鸚鵡學(xué)舌

體育要聞

世乒賽銀牌得主,說(shuō)自己夢(mèng)里都是孫穎莎

娛樂(lè)要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評(píng)

財(cái)經(jīng)要聞

微軟CTO韋青:未來(lái)人類會(huì)花錢"戒手機(jī)"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

旅游
手機(jī)
藝術(shù)
家居
房產(chǎn)

旅游要聞

探秘京津冀科學(xué)名片|保定這家博物館超好逛

手機(jī)要聞

1699元起,續(xù)航性能拉滿,一加剛發(fā)布的新機(jī)太狂了

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

家居要聞

理性主義 冷調(diào)自由居所

房產(chǎn)要聞

豪宅搶瘋、剛需撿漏……2025年,一張房票改寫(xiě)了廣州市場(chǎng)格局

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版
×