国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

黃仁勛:日薪兩千美元的員工,我巴不得你每天花一千去“養(yǎng)蝦”!|閉門會(huì)2萬字實(shí)錄

0
分享至

出品 | 網(wǎng)易智能

作者 | 小小

編輯 | 王鳳枝

在2026年GTC兩小時(shí)主題演講引爆全場(chǎng)后,英偉達(dá)創(chuàng)始人兼CEO黃仁勛18日再度現(xiàn)身GTC 2026現(xiàn)場(chǎng),面向金融分析師舉行了一場(chǎng)閉門問答會(huì)。面對(duì)諸多尖銳提問,“黃教主”不僅展現(xiàn)出對(duì)行業(yè)趨勢(shì)的深刻洞察,更罕見地披露了關(guān)于下一代架構(gòu)的萬億級(jí)市場(chǎng)預(yù)期。


黃仁勛在問答中提出了一系列觀點(diǎn)。他認(rèn)為,AI產(chǎn)業(yè)正邁入“第三個(gè)拐點(diǎn)”,從生成式AI向“智能體系統(tǒng)”階段演進(jìn),AI將不再僅是回答問題,而是能夠自主執(zhí)行復(fù)雜任務(wù)。

這一轉(zhuǎn)變將徹底重塑計(jì)算產(chǎn)業(yè)形態(tài):計(jì)算機(jī)正從單純的工具演變?yōu)椤爸圃煸O(shè)備”,其核心產(chǎn)出物是具有經(jīng)濟(jì)價(jià)值的Token。他將其定義為“AI工廠”模式,并強(qiáng)調(diào)衡量算力優(yōu)劣的標(biāo)準(zhǔn)已轉(zhuǎn)向“單位功耗下的Token生成效率”。

在黃仁勛看來,驅(qū)動(dòng)這座“AI工廠”高速運(yùn)轉(zhuǎn)的核心操作系統(tǒng),正是當(dāng)下火爆的開源項(xiàng)目OpenClaw。他毫不諱言地指出:“今天,全球每家公司都必須確立自己的OpenClaw戰(zhàn)略。”

黃仁勛算了一筆“經(jīng)濟(jì)賬”:他曾瀏覽過一篇Reddit帖子,發(fā)帖人的Claw智能體一天內(nèi)竟消耗了5000萬個(gè)Token。聽起來猶如天文數(shù)字,但折算下來不過區(qū)區(qū)50美元。倘若這50美元能讓智能體替你從事極具生產(chǎn)力的工作,這筆投資簡(jiǎn)直微不足道。未來的常態(tài)將是:一位日薪數(shù)千美元的精英,統(tǒng)領(lǐng)著一支龐大的智能體大軍,為每個(gè)智能體分配50美元的日預(yù)算,從而將個(gè)人生產(chǎn)力推向極致。這一場(chǎng)景很快便會(huì)司空見慣。

事實(shí)上,在英偉達(dá),他們已然將此付諸實(shí)踐。黃仁勛坦言:“對(duì)于那些我每天支付數(shù)千美元薪酬的員工,我巴不得他們每天消耗的Token遠(yuǎn)超50美元。我期望他們能運(yùn)籌帷幄,管理一整支智能體編隊(duì)來代勞繁雜任務(wù)。”他還稱,真心期盼一位日入2000美元的干將,每天能豪擲1000美元在Token消耗上。

正是基于這種由智能體引爆的算力渴求,面對(duì)分析師對(duì)市場(chǎng)天花板的疑慮,黃仁勛再次重申了其預(yù)測(cè):基于Blackwell和下一代Rubin架構(gòu),英偉達(dá)在2027年前的明確可見市場(chǎng)需求已超過1萬億美元。他進(jìn)一步展望,傳統(tǒng)的2萬億美元軟件許可行業(yè),正加速向基于AI智能體的Token轉(zhuǎn)售模式轉(zhuǎn)型,潛在市場(chǎng)規(guī)模有望擴(kuò)張至8萬億美元。

這場(chǎng)對(duì)話不僅勾勒出英偉達(dá)的雄心,也揭示了AI底層商業(yè)邏輯即將迎來的根本性變革。

以下為黃仁勛記者問答會(huì)全文:

01重新定義AI時(shí)代:計(jì)算機(jī)不再是工具,是制造設(shè)備

主持人:大家早上好。希望各位喜歡昨天GTC的主題演講,雖然時(shí)間稍長(zhǎng),但我認(rèn)為它為我們做了一次極佳的總結(jié)。接下來,我們將利用這段時(shí)間聚焦各位的需求,解答大家可能存在的其他疑問。我們將先過幾張幻燈片,隨后開放提問。現(xiàn)在,把時(shí)間交給黃仁勛。

黃仁勛:正如我昨日所述,AI的發(fā)展正經(jīng)歷三個(gè)關(guān)鍵的轉(zhuǎn)折點(diǎn):第一個(gè)是生成式AI,第二個(gè)是推理階段,而我們現(xiàn)在正處于第三個(gè)即智能體系統(tǒng)。每一次轉(zhuǎn)折都建立在上一代的基礎(chǔ)之上,但智能體系統(tǒng)的本質(zhì)突破在于“自主性”。過去,AI只是回答問題;現(xiàn)在,你可以為其設(shè)定目標(biāo),它便能真正著手執(zhí)行任務(wù)。

任務(wù)可以是什么?最典型的一個(gè)應(yīng)用就是編寫軟件。如今,貴公司的工程師,當(dāng)然也包括我們公司的,每天都在高頻使用智能體系統(tǒng)。過去,工程師上班只需一臺(tái)筆記本電腦;而現(xiàn)在,他們需要筆記本電腦,外加Token。Token預(yù)算已成為切實(shí)存在的資源。試想,如果你雇了一位年薪30萬美元的工程師,而他在工作中竟完全不消耗任何Token,你恐怕得問問他:你到底在忙些什么?所以結(jié)論很清楚:每個(gè)工程師都將消耗大量Token,而這些Token必須被生產(chǎn)出來。

這就引發(fā)了一場(chǎng)根本性變革:過去計(jì)算機(jī)只是工具,而未來的計(jì)算機(jī)將是制造設(shè)備。它們和ASML的光刻機(jī)沒什么兩樣,都在生產(chǎn)某種可供出售的商品。就像很久以前的發(fā)電機(jī)生產(chǎn)電力一樣,這些都是制造系統(tǒng)。其能效與生產(chǎn)效率,將直接決定你的營(yíng)收與競(jìng)爭(zhēng)力。

第三個(gè)轉(zhuǎn)折點(diǎn)已經(jīng)到來。以O(shè)penClaw項(xiàng)目為例,很多人初見其開源版本時(shí),還以為那是個(gè)玩具。但若你退一步,從第一性原理出發(fā)去思考,便會(huì)發(fā)現(xiàn)OpenClaw本質(zhì)上就是一臺(tái)計(jì)算機(jī),它是AI計(jì)算機(jī)的操作系統(tǒng),也是一臺(tái)個(gè)人AI計(jì)算機(jī)。它具備計(jì)算系統(tǒng)的所有屬性:資源管理、任務(wù)調(diào)度、執(zhí)行輸入輸出、網(wǎng)絡(luò)連接等,它擁有基礎(chǔ)計(jì)算機(jī)所需的一切。那條陡峭的增長(zhǎng)曲線已說明一切,這才是真正值得矚目的焦點(diǎn)。

所以,今天每家公司都需要思考一個(gè)問題:你的OpenClaw戰(zhàn)略是什么?過去,我們必須制定Linux戰(zhàn)略、互聯(lián)網(wǎng)戰(zhàn)略、移動(dòng)云戰(zhàn)略;而如今,每家軟件公司都必須確立OpenClaw戰(zhàn)略。這件事的重要性怎么強(qiáng)調(diào)都不為過。

在此背景下,我想更新一下去年做出的某項(xiàng)預(yù)測(cè)。一年前我曾提到,我們對(duì)Blackwell和Rubin架構(gòu)到2026年的出貨量有著極高的業(yè)務(wù)可見度,包括明確的采購(gòu)訂單和需求,當(dāng)時(shí)的預(yù)期規(guī)模約為5000億美元。很多人當(dāng)時(shí)對(duì)此有疑問,想知道最新進(jìn)展?,F(xiàn)在是3月,我們距離2027年底還有很長(zhǎng)時(shí)間。正因?yàn)槲覀冊(cè)诮ㄔO(shè)的是基礎(chǔ)設(shè)施和工廠,而每個(gè)人的交付周期都很長(zhǎng),所以我希望他們盡早下單以確保供應(yīng)。

今天我可以更新的數(shù)據(jù)是:我們對(duì)Blackwell加Rubin的出貨價(jià)值(僅限這兩款產(chǎn)品)突破1萬億美元,有著極強(qiáng)的信心與可見度。這不是一個(gè)浮動(dòng)的估值,不是精確到小數(shù)點(diǎn)后94位的數(shù)字,我們也沒有在錙銖必較地算零頭。我的意思是,針對(duì)超過1萬億美元的Blackwell加Rubin市場(chǎng),我們抱有強(qiáng)烈的預(yù)期。為什么只說Blackwell和Rubin?因?yàn)槿ツ晡姨岬臅r(shí)候只談了這兩款芯片。今年我們新增了Groq、獨(dú)立的CPU還有很多其他產(chǎn)品,但為了口徑一致,我今天的更新只聚焦于Blackwell和Rubin。

所以我需要把話說清楚:我所說的這1萬億美元,只包括Blackwell和Rubin這兩款產(chǎn)品。不包括Feynman,不包括Rubin Plus或Rubin Ultra,不包括Vera Standalone,也不包括Groq。僅僅是Blackwell加Rubin,我們就已經(jīng)有了超過1萬億美元的采購(gòu)訂單,這是基于高度確信的需求、清晰的可見性和扎實(shí)的預(yù)測(cè)得出的結(jié)論。

我們一直在達(dá)成交易、完成出貨,而且從現(xiàn)在到2027年底,我們預(yù)計(jì)還會(huì)達(dá)成更多交易、預(yù)訂更多訂單、出貨更多產(chǎn)品。原因很簡(jiǎn)單:我們會(huì)一直工作到那一天。英偉達(dá)有一個(gè)獨(dú)特的優(yōu)勢(shì)。因?yàn)槲覀冊(cè)O(shè)計(jì)和交付的是高度復(fù)雜的整體系統(tǒng),我們可以在同一個(gè)季度內(nèi)完成從贏單、預(yù)訂到出貨的全過程。如果你做的是ASIC(專用集成電路),你做不到這一點(diǎn)。如果你現(xiàn)在還沒看到需求,就不可能趕在2027年底前出貨。但我們不同。

我們提前建立庫(kù)存,構(gòu)建了完整的供應(yīng)鏈,我們必須把這個(gè)優(yōu)勢(shì)用足。當(dāng)前客戶對(duì)算力如饑似渴,如果他們?cè)谧詈笠豢掏蝗惶岢觥拔覀冞€需要更多”,我希望我們永遠(yuǎn)有底氣回應(yīng):“沒問題,我們樂意效勞。”更何況,我們還在開拓新客戶、新市場(chǎng)、新區(qū)域,這些甚至還沒有算進(jìn)這1萬億美元里。畢竟,距離2027年底還有21個(gè)月。因此,我希望大家真正理解這1萬億美元意味著什么:它絕非終點(diǎn),它本身將持續(xù)增長(zhǎng),未來勢(shì)必會(huì)超越這一數(shù)字。

02推理經(jīng)濟(jì)學(xué):最貴的計(jì)算機(jī),最便宜的Token

我再補(bǔ)充幾點(diǎn)。

2025年對(duì)我們來說是意義非凡的一年,因?yàn)樗恰巴评碇辍?。在這一年里,我們幫助市場(chǎng)理清了一個(gè)核心邏輯:計(jì)算機(jī)的售價(jià)與Token的成本之間并無必然聯(lián)系。人們買這些計(jì)算機(jī)是為了生產(chǎn)Token,而Token的生產(chǎn)效率至關(guān)重要。如果你買了一臺(tái)昂貴的計(jì)算機(jī)然后轉(zhuǎn)手賣掉,那它確實(shí)只是“昂貴”;但若你用它來生產(chǎn)Token,它的“貴”則源于其技術(shù)足夠先進(jìn),能以驚人的效率產(chǎn)出Token。這意味著你完全可以同時(shí)擁有“最昂貴的計(jì)算機(jī)”與“成本最低的Token”,這正是我們每天在做的事,也是我們創(chuàng)造獨(dú)特價(jià)值的根源。

這種價(jià)值差,最終體現(xiàn)在兩個(gè)指標(biāo)上:每秒生成的Token數(shù)以及每瓦功耗產(chǎn)出的Token數(shù)。我們每一代產(chǎn)品都在實(shí)現(xiàn)指數(shù)級(jí)的性能躍升,以至于客戶寧愿出高價(jià)購(gòu)買我們的下一代產(chǎn)品,也不愿低價(jià)購(gòu)入上一代。Vera Rubin一旦上市,他們便會(huì)立刻切換。因?yàn)楸M管價(jià)格更高,其創(chuàng)造的價(jià)值卻大得多。我之所以將這兩個(gè)系統(tǒng)放在一起比較,是因?yàn)樗鼈円殉蔀槿蚴聦?shí)上的標(biāo)準(zhǔn)。在無法超越這兩個(gè)系統(tǒng)之前,購(gòu)買其他產(chǎn)品毫無意義。然而想要超越它們難如登天,因?yàn)槟柖蔁o法再賦予你35倍的性能提升,單靠制造更快的芯片已無濟(jì)于事,你必須打造出“海量的、速度更快的芯片群”。

作為推理之年,2025年我們也切實(shí)證明了自身在推理領(lǐng)域的領(lǐng)導(dǎo)力,從訓(xùn)練到后訓(xùn)練,再到推理,全面領(lǐng)跑。

去年我們還完成了另一件大事:大幅拓寬了平臺(tái)的模型覆蓋廣度。我們新增了對(duì)Anthropic的支持,這是全新的舉措;新增了對(duì)Meta Superintelligence Labs的支持,這是一個(gè)擁有全新計(jì)算需求的全新實(shí)體。眾所周知,去年開源軟件與開源模型真正迎來了爆發(fā)。時(shí)至今日,若按生成的Token總量計(jì)算,位列第一的是OpenAI,第二名是所有開源模型的總和,第三是Anthropic,第四是xAI。繼續(xù)梳理下去你會(huì)發(fā)現(xiàn),英偉達(dá)正是全球開源模型的最佳運(yùn)行平臺(tái),這也解釋了為何我們?cè)谌绱她嫶蟮幕鶖?shù)之上,依然能實(shí)現(xiàn)加速增長(zhǎng)。

最后我想強(qiáng)調(diào)一點(diǎn):我們極為珍視與超大規(guī)模云廠商的合作關(guān)系,但這絕不僅僅是簡(jiǎn)單的買賣關(guān)系。我們也在幫他們“獲客”。既然CUDA運(yùn)行在他們的云端,就意味著所有CUDA開發(fā)者、AI原生初創(chuàng)企業(yè)以及與我們合作的大型企業(yè)都會(huì)隨之遷移。我們每推動(dòng)一家大企業(yè)或初創(chuàng)公司落地,都會(huì)引導(dǎo)他們到某家云廠商處進(jìn)行托管。從某種意義上說,我們堪稱全球各大云廠商最頂尖的銷售團(tuán)隊(duì)之一。

你去展區(qū)看看就明白了:AWS的展位規(guī)模龐大,Google Cloud、Azure、Oracle、CoreWeave的展位同樣宏大。他們?yōu)楹螀R聚于此?正是為了向我們的開發(fā)者推銷產(chǎn)品。而我們的開發(fā)者只熟悉一種編程方式,那就是CUDA。當(dāng)他們完成開發(fā)并尋求落地時(shí),自然會(huì)選擇入駐某位云服務(wù)提供商合作伙伴的云平臺(tái)。這便是我們與超大規(guī)模云廠商之間最真實(shí)的關(guān)系。

03拆解60/40客戶版圖:英偉達(dá)成了云廠商最好的銷售團(tuán)隊(duì)

最后,我想重點(diǎn)談?wù)効蛻艚Y(jié)構(gòu)的另一面。

我們與超大規(guī)模云廠商的合作固然緊密,貢獻(xiàn)了約60%的業(yè)務(wù)份額。但許多人忽視了另外的40%,即來自區(qū)域云、工業(yè)、企業(yè)及本地部署的龐大需求。戴爾、聯(lián)想、惠普正在快速增長(zhǎng),所有的ODM也在快速增長(zhǎng)。這部分業(yè)務(wù),正在流向圖表右側(cè)的那40%。

這40%意味著什么?倘若沒有英偉達(dá)的全棧能力,沒有我們構(gòu)建完整“AI工廠”的實(shí)力,沒有全球所有開源平臺(tái)皆運(yùn)行于英偉達(dá)之上這一鐵律,你根本無從觸及這片市場(chǎng)。左側(cè)那60%的份額中,很大一部分歸功于我們將開發(fā)者引流至云端;而右側(cè)這40%的陣地,如果僅僅是一家芯片制造商,絕對(duì)是100%無能為力的,因?yàn)檫@部分客戶不買芯片,他們買的是平臺(tái)。

不知我是否將這一信息傳達(dá)清晰了?準(zhǔn)確理解我們的業(yè)務(wù)結(jié)構(gòu)至關(guān)重要。我們將這一切深度整合,并統(tǒng)稱為“加速計(jì)算”。

明年我們可能會(huì)換一種方式拆分業(yè)務(wù),大概就像這張圖表展示的那樣:超大規(guī)模占60%,但請(qǐng)記住,其中很多客戶是我們帶上云的。右側(cè)那40%,只做芯片的公司永遠(yuǎn)夠不著。

一張幻燈片里塞滿了三重信息,可能讓大家有些應(yīng)接不暇。我本該將其拆分為三張的,盡管那樣演講可能會(huì)拉長(zhǎng)到七個(gè)小時(shí),但也絕對(duì)物超所值。

好了,就這些。謝謝。

以下為問答環(huán)節(jié):

04 OpenAI和Anthropic的收入,你們低估了

問:首先感謝你們提供這次交流機(jī)會(huì)。祝賀你和你的團(tuán)隊(duì)。現(xiàn)在大家都理解了推理的重要性,但我認(rèn)為市場(chǎng)最大的疑慮是:投入到底值不值?超大規(guī)模企業(yè)能否通過API和云服務(wù)獲得足夠的收入增長(zhǎng),來證明當(dāng)前資本支出的合理性?我自己做了一些測(cè)算,目前他們的資本支出比云API收入高出20%。Jensen,你看到的情況是什么?你曾說過,你的客戶,尤其是那些支撐Anthropic和OpenAI的超大規(guī)模企業(yè),會(huì)帶來巨大的現(xiàn)金流上行空間。那么,我們什么時(shí)候能看到這些收入真正兌現(xiàn)?我知道這個(gè)問題對(duì)您而言略顯棘手,畢竟您還要兼顧對(duì)其他公司的指引。但如果我們能看到這種上行空間,市場(chǎng)對(duì)你們的信心會(huì)強(qiáng)得多,大家才會(huì)相信這種建設(shè)是可以持續(xù)的。那么,收入上行何時(shí)出現(xiàn)?我們?cè)鯓硬拍芨行判模?/p>

黃仁勛:我多希望這些公司已經(jīng)上市,這樣大家就能真切地看到我眼中的景象了。縱觀歷史,從未有過任何一家未上市的初創(chuàng)企業(yè),能實(shí)現(xiàn)每周狂攬十億乃至二十億美元的營(yíng)收增量。而他們當(dāng)下正在經(jīng)歷的,正是這種堪稱恐怖的量級(jí)增長(zhǎng)。

記住我剛才說的是“每周”。整個(gè)IT軟件行業(yè)的規(guī)模約為2萬億美元。在我看來,這一行業(yè)不會(huì)被顛覆,而是將迎來徹底的重塑。我堅(jiān)信,這2萬億美元IT版圖中的每一家企業(yè),都會(huì)將OpenAI、Anthropic及各大開源模型整合進(jìn)來,接入名為OpenClaw的開源軟件中。隨后,我們會(huì)將其打造為企業(yè)級(jí)版本,也就是NeMoClaw。借此,你瞬間便能擁有一個(gè)智能體。目前已有150萬人下載了OpenClaw并搭建了專屬智能體。只需寥寥一行代碼,當(dāng)你下達(dá)任務(wù)指令時(shí),這個(gè)智能體便會(huì)自動(dòng)展開學(xué)習(xí)與執(zhí)行。

未來,這些智能體會(huì)被整合進(jìn)整個(gè)IT行業(yè)。這個(gè)行業(yè)現(xiàn)在還是2萬億美元的軟件許可模式,但將來可能會(huì)變成8萬億美元規(guī)模。同時(shí),他們還會(huì)轉(zhuǎn)售海量的Token。全球100%的IT公司,都將成為OpenAI和Anthropic的經(jīng)銷商。因此,請(qǐng)各位務(wù)必調(diào)高對(duì)OpenAI和Anthropic的估值預(yù)期。

我相信,Anthropic、OpenAI,當(dāng)然還有所有的IT公司,也會(huì)用開放模型來修改和定制自己的軟件。這就是英偉達(dá)開源大模型NeMotron的用途,這就是開發(fā)與部署平臺(tái)NeMo的用途。我們創(chuàng)建了所有這些工具,這就是為什么我們和每一家公司都在合作。他們都會(huì)去創(chuàng)建整合了這三個(gè)組件的智能體。我相信他們會(huì)以難以置信的速度增長(zhǎng)。這個(gè)時(shí)刻很快就會(huì)到來,因?yàn)槟憧梢詮腁nthropic和OpenAI的數(shù)字里看到,他們不是在普通地增長(zhǎng),他們?cè)谝粋€(gè)月內(nèi)就能增長(zhǎng)出一家完整的IT公司。

這些AI公司的營(yíng)收模式在于:其能力一部分將由企業(yè)直接采購(gòu)使用,另一部分則會(huì)通過IT公司分銷,深度嵌入到IT企業(yè)的產(chǎn)品線中。因?yàn)锳I本身就是軟件。他們的軟件可以直接提供給企業(yè),也可以被集成、被定制,變成特定領(lǐng)域的、受管控的、安全的、易于配置的智能體系統(tǒng),連接到企業(yè)的核心系統(tǒng)。然后這些智能體系統(tǒng)會(huì)被租給客戶,而客戶在使用過程中,仍然需要通過AI工廠來消耗Token。無論這些Token來自O(shè)penAI、Anthropic還是開放模型,都需要被生成出來。

歸根結(jié)底,傳統(tǒng)的IT公司售賣的是軟件授權(quán),而未來的IT企業(yè)出租的將是Token。他們的商業(yè)模式必將重構(gòu),企業(yè)體量將進(jìn)一步膨脹,毛利率結(jié)構(gòu)亦將隨之改變,因?yàn)槿缃袼麄兊某杀竞怂阒屑尤肓薚oken這一銷貨成本,但相應(yīng)地,他們所能提供的價(jià)值也呈幾何級(jí)數(shù)躍升。對(duì)他們而言,這無疑是令人振奮的時(shí)代機(jī)遇。

05 40%會(huì)變成70%:物理AI的萬億市場(chǎng)

問:我想聊聊那張60/40圖的演變。你昨天談到了NeMo,又發(fā)布了Vera Rubin DSX AI工廠參考設(shè)計(jì),這基本上是為非超大規(guī)模客戶提供了一個(gè)藍(lán)圖,讓他們有能力與超大規(guī)模企業(yè)競(jìng)爭(zhēng)。當(dāng)你把所有這些東西整合在一起,看到Token生成量的大幅飆升,你預(yù)計(jì)這張圖會(huì)如何演變?我們?cè)撛趺纯创煌瑓⑴c者的發(fā)展方向?

黃仁勛:我認(rèn)為該圖表的左右兩側(cè)均會(huì)保持增長(zhǎng),且在未來幾年內(nèi)增速將基本持平,直至物理AI的拐點(diǎn)真正降臨。

一旦跨過那個(gè)拐點(diǎn),工業(yè)端的計(jì)算處理就必須轉(zhuǎn)至本地,必須在邊緣側(cè)、在業(yè)務(wù)現(xiàn)場(chǎng)、在生產(chǎn)車間內(nèi)完成。到那時(shí),那40%很可能會(huì)開始加速增長(zhǎng)。我甚至認(rèn)為,最終那40%會(huì)變得更大,因?yàn)榕c物理AI相關(guān)的全球工業(yè)規(guī)模,遠(yuǎn)比與數(shù)字AI相關(guān)的規(guī)模大得多。

全球工業(yè)領(lǐng)域有高達(dá)70萬億美元的經(jīng)濟(jì)活動(dòng)亟需物理AI的深度介入,因?yàn)槭澜绲倪\(yùn)轉(zhuǎn)并非僅僅局限于我們的筆記本電腦屏幕內(nèi),而是實(shí)實(shí)在在地發(fā)生于廣袤的物理空間中。大量與原子相關(guān)的業(yè)務(wù),沒有物理AI根本處理不了。因此我堅(jiān)信,也熱切期盼著,那40%的份額最終能攀升至70%。

但無論比例如何變化,兩邊都會(huì)變得極其巨大。因?yàn)檫@個(gè)世界將進(jìn)入一個(gè)狀態(tài):每天、每時(shí)每刻都在持續(xù)不斷地生產(chǎn)Token,永不停歇。就在我們說話的這會(huì)兒,我們所有的筆記本電腦都在持續(xù)運(yùn)轉(zhuǎn),希望你們大部分人的電腦都處于閑置狀態(tài),但在未來,計(jì)算機(jī)會(huì)24小時(shí)不間斷運(yùn)行,持續(xù)創(chuàng)造Token。因?yàn)槟愕闹悄荏w們正在替你工作。

我曾瀏覽過一篇Reddit帖子,發(fā)帖人的Claw智能體一天內(nèi)竟消耗了5000萬個(gè)Token。聽起來猶如天文數(shù)字,但折算下來不過區(qū)區(qū)50美元。倘若你手下有一個(gè)智能體正在從事極具生產(chǎn)力的工作,這50美元簡(jiǎn)直微不足道。你完全可以讓一位日薪數(shù)千美元的精英,統(tǒng)領(lǐng)一支龐大的智能體大軍,為每個(gè)智能體分配50美元的日預(yù)算,從而將生產(chǎn)力推向極致。這一場(chǎng)景很快便會(huì)司空見慣。

在英偉達(dá),我們已然付諸實(shí)踐。對(duì)于那些我每天支付數(shù)千美元薪酬的員工,我巴不得他們每天消耗的Token遠(yuǎn)超50美元。我期望他們能運(yùn)籌帷幄,管理一整支智能體編隊(duì)來代勞繁雜任務(wù)。說實(shí)話,我真心期盼一位日入2000美元的干將,每天能豪擲1000美元在Token消耗上。這絕非天方夜譚,此時(shí)此刻全球各地的軟件公司里,這一切正在真實(shí)上演。

06解密推理光譜:Groq不是來取代,是來補(bǔ)位的

問:你們談過Rubin會(huì)在下半年開始出貨,Groq聽起來像是在第三季度推出。那么,我是否可以認(rèn)為Rubin應(yīng)該和Groq一起推出?因?yàn)槲也徽J(rèn)為Groq是獨(dú)立存在的。然后,我想問一個(gè)更長(zhǎng)遠(yuǎn)的問題。我真的很喜歡你們前幾天放出的那張圖,它在我看來幾乎是展示了推理光譜的延伸,這為Groq創(chuàng)造了價(jià)值。你過去常說GPU是唯一的出路,我們現(xiàn)在看到像Groq這樣的架構(gòu)是必要的,以便利用不斷擴(kuò)大的推理光譜,低延遲變得更加重要。我想知道的是,你如何看待這個(gè)光譜從今往后的演變?你的平臺(tái)現(xiàn)在是否擁有了未來幾年所需的所有組件?展望未來,隨著推理的發(fā)展,會(huì)出現(xiàn)哪些新型的工作負(fù)載?你是否擁有抓住這些機(jī)會(huì)所需的所有組件?

黃仁勛:謝謝你對(duì)Groq和LPDDR的提問。我們確實(shí)溝通過,Groq也會(huì)在今年下半年開始出貨,具體時(shí)間臨近時(shí)再看,但確實(shí)是在今年。你可以說Groq在第三季度出貨,我昨天確認(rèn)了,這是我們的預(yù)期。但我要說明一點(diǎn):Vera Rubin會(huì)在Groq之前出貨。原因是我們已經(jīng)在生產(chǎn)Vera Rubin了,系統(tǒng)已經(jīng)在生產(chǎn)線上跑著。Vera Rubin本身便難以逾越,即便對(duì)手是Groq亦是如此,哪怕將Groq與Vera Rubin強(qiáng)強(qiáng)聯(lián)手,想要擊敗純粹的Vera Rubin也并非易事。

在計(jì)算架構(gòu)領(lǐng)域,大致可劃分為兩大流派:一派追求極致的低延遲,另一派則主攻極高的吞吐量。事實(shí)上,CPU本質(zhì)上就是一臺(tái)低延遲計(jì)算機(jī),看看其芯片上的緩存規(guī)模便知,幾乎全由SRAM構(gòu)成。而Groq正是此類架構(gòu)的極端化產(chǎn)物:SRAM幾乎霸占了整塊芯片,任務(wù)調(diào)度完全依靠靜態(tài)完成,由編譯器精準(zhǔn)測(cè)算數(shù)據(jù)與計(jì)算指令的位置,確保它們“如期相遇”。整個(gè)Groq系統(tǒng)猶如一臺(tái)龐大的同步機(jī)器,這賦予了它極強(qiáng)的確定性與極低的延遲。然而代價(jià)也顯而易見:編程門檻高、缺乏靈活性,且并非面向通用計(jì)算。

因此我們所做的是采用了Vera Rubin,正如昨天我所描述的,它占據(jù)了大約四分之三的空間。Vera Rubin是正確的答案。我們不知道如何使它變得更好。如果我們知道如何讓它變得更好,我們就會(huì)去改進(jìn)它。NVLink 72以及Vera Rubin Ultra NVLink 144、Feynman NVLink 1152,我們會(huì)繼續(xù)擴(kuò)大左側(cè)那個(gè)高吞吐量至關(guān)重要的區(qū)域的范圍。同時(shí),我們會(huì)把Groq加進(jìn)來,與Vera Rubin融合,與我們的GPU融合,用Groq來處理自回歸模型的最后一個(gè)階段,也就是語(yǔ)言模型中那個(gè)對(duì)帶寬要求極高的最后階段。如果我們把一大堆SRAM聚集起來,比如數(shù)千個(gè)Groq芯片,比例大概是8比1。

所以,對(duì)于最后25%的功耗以及最后25%的用例,我們都在用ChatGPT,但我們以不同的方式使用它,我們有不同的定價(jià)層級(jí)。因?yàn)槟愕臄?shù)據(jù)中心有各種各樣的用例,不是只有一種。我們都在我那張圖里的不同波段中。我展示了零級(jí)、免費(fèi)級(jí)、好、更好、最好、極致版本。對(duì)于免費(fèi)、好、更好這幾個(gè)層級(jí),Vera Rubin是無敵的,我們想不出任何接近的東西。而對(duì)于最好和極致,加上Groq,你可以提高最好層的吞吐量,甚至把極致層推得更遠(yuǎn)。

“極致”層級(jí)開辟了一片全新市場(chǎng),但受制于吞吐量曲線,其受眾規(guī)模注定極小,你無法指望需求量呈爆發(fā)式增長(zhǎng),因此必須輔以極高的定價(jià)策略。然而,一個(gè)全新的高凈值客戶群已然浮出水面:那些身價(jià)不菲的資深軟件工程師。其自身的人力成本本就極為高昂,若我每天再為他們?cè)黾?00美元的推理與Token成本,我也甘之如飴。哪怕在項(xiàng)目攻堅(jiān)期暴增1000美元,他們同樣樂見其成。我描述的是一個(gè)正在成熟的市場(chǎng)里正在發(fā)生的事情。

在市場(chǎng)莽荒期,沒人確切知曉該如何駕馭這項(xiàng)技術(shù),技術(shù)本身亦不夠成熟,用戶根本無法做到精準(zhǔn)施放。100%的早期推理客戶都在免費(fèi)層。但隨著技術(shù)開始達(dá)到o1和o3水平,付費(fèi)層突然飆升,因?yàn)槿藗儸F(xiàn)在能用它來做有用的事情了。然后當(dāng)智能體出現(xiàn)時(shí),比如云代碼、Codex,那些Token比免費(fèi)層貴得多,也比每月20美元貴得多。所以我們剛剛增加了兩個(gè)細(xì)分市場(chǎng)。

這和iPhone沒什么不同,起初只有一個(gè)版本,現(xiàn)在有很多版本。和汽車行業(yè)沒什么不同,和任何行業(yè)都沒什么不同。隨著市場(chǎng)擴(kuò)大,細(xì)分市場(chǎng)也在擴(kuò)大。

我展示的是一個(gè)能夠生產(chǎn)不同細(xì)分市場(chǎng)和不同層級(jí)Token的工廠:從非常聰明、極其快速,到高吞吐量的免費(fèi)層。這描述的是一種AI工廠架構(gòu),允許你覆蓋所有需求,最終最大化工廠的總收入。我們讓你自己決定如何搭配組合。

我的估計(jì)是,現(xiàn)在大概有25%的市場(chǎng),主要針對(duì)少數(shù)幾家公司,你需要是其中之一,你需要生成大量Token才值得這么做。然后還有一大批所謂的推理服務(wù)提供商、API服務(wù)提供商,我認(rèn)為他們也可以從中受益,因?yàn)樗麄兿M胁煌腡oken生成細(xì)分市場(chǎng)。所以我稱之為一個(gè)由10家客戶組成的群體,其中那25%的客戶代表了那個(gè)蛋糕的很大一部分。通過Groq,我們可以把那25%的蛋糕的總收入提高2倍。

問:隨著你繼續(xù)推出新版本的Groq,新一代產(chǎn)品會(huì)對(duì)市場(chǎng)產(chǎn)生什么影響?你是把那個(gè)邊界推得更遠(yuǎn),還是降低成本并增加需求?

黃仁勛:我們始終在雙線并進(jìn):一方面不斷拉升各個(gè)層級(jí)的吞吐量上限,另一方面持續(xù)拓寬AI的智能邊界。各位留意到那張帕累托圖了嗎?我始終在將其向上推舉。剛才我向大家演示了從Hopper、Blackwell到Vera Rubin的代際演進(jìn),每一次架構(gòu)迭代,我都在將其向上推、向外拓。

每當(dāng)我向上推,你的工廠在同等價(jià)格點(diǎn)上的產(chǎn)量就會(huì)增加。每當(dāng)我向外推,你就可以引入全新的AI層級(jí)、全新的Token層級(jí),從而獲得全新的價(jià)格點(diǎn)。現(xiàn)在的價(jià)格點(diǎn)大概是每百萬Token 6美元左右。但我知道,大家都希望看到每百萬Token 50美元的產(chǎn)品,那是超大模型、超快速度的層級(jí)。你能想象一個(gè)10萬億參數(shù)的模型,以每秒500個(gè)Token的速度運(yùn)行嗎?我們的工程師會(huì)為此付出大價(jià)錢,我也會(huì)讓我的工程師為此付出大價(jià)錢。那個(gè)世界很快就會(huì)到來,然后明年還會(huì)再來,因?yàn)槟P蜁?huì)變得更大,它們會(huì)思考得更多,會(huì)使用更多工具。

這就像早年的Nvidia。不知道你們有多少人記得,我們最初只有一個(gè)產(chǎn)品:Riva 128,299美元,就這一個(gè)SKU。那些美好的舊時(shí)光。然后今天我們有了5090、5080兩個(gè)不同的SKU,5070更是分出了三個(gè)。所有這些SKU的出現(xiàn),是因?yàn)槭袌?chǎng)變大了,開始出現(xiàn)細(xì)分,人們想要不同的東西。

Token市場(chǎng)也完全一樣。它正變得越來越大,不同的細(xì)分市場(chǎng)想要不同的東西。所以我需要幫助我們的客戶、幫助我們的模型制造者,為不同的細(xì)分市場(chǎng)制造不同的Token。我知道它們看起來只是數(shù)字,但它們是不同的AI。

所以答案是:我們將同時(shí)提高吞吐量并提高他們的定價(jià)。這就是Vera Rubin帶來的好處,我們每一代都是這樣做的。我們用Blackwell做到了,用Vera Rubin做到了,用帶Groq的Vera Rubin也會(huì)做到,用Vera Rubin Ultra同樣會(huì)做到。我們會(huì)持續(xù)不斷地突破那個(gè)邊界。

最終,簡(jiǎn)單來說,就是那張帕累托圖。一個(gè)工廠要處理大量不同的工作負(fù)載和不同的客戶,我們希望不斷地把帕累托前沿向外推、向上推,不斷地向外、向上。而要做到這一點(diǎn)所需要的計(jì)算機(jī)科學(xué),是所有問題中最難的。

07 1萬億之外的1.25萬億:Groq、CPU、存儲(chǔ)的增量空間

問:我有兩個(gè)相關(guān)的問題。第一,在1萬億美元之外,昨天你還談到了其他產(chǎn)品:Vera CPU、其他CPU、Groq、存儲(chǔ)解決方案、CPX。這些增量有多少?沒有包含在這1萬億里的可尋址市場(chǎng)有多大?我假設(shè)它們對(duì)這1萬億是增量。第二,我想更深入了解Groq。你提到它將占據(jù)推理的25%,這是個(gè)相當(dāng)重要的聲明。它是在蠶食什么嗎?隨著時(shí)間的推移,Groq的價(jià)值捕獲是怎樣的?很多人問我們,它是否會(huì)蠶食高帶寬內(nèi)存的需求?

黃仁勛:首先,今天全球只有我們一家公司能夠在一個(gè)AI工廠里,同時(shí)優(yōu)化和整合三種內(nèi)存架構(gòu):HBM內(nèi)存是我們第一個(gè)使用LPDDR5的公司,它具有極高的帶寬和極低的功耗,這徹底改變了CPU的游戲規(guī)則;第三種是SRAM。我們現(xiàn)在可以利用所有這三種內(nèi)存類型,來打造真正完美的架構(gòu)。

過去,我們只有一個(gè)機(jī)柜產(chǎn)品:NV Link72 Grace Blackwell?,F(xiàn)在我們有了五個(gè)機(jī)柜。NVLink 72的設(shè)計(jì)目標(biāo)就是運(yùn)行各種大型語(yǔ)言模型,我們所有的推理?xiàng)6荚谏厦媾堋5阋斫庵悄荏w系統(tǒng)是什么,它正在運(yùn)行的東西比如Claude Code現(xiàn)在做的,比如Codex現(xiàn)在做的。這些系統(tǒng)的內(nèi)存需求進(jìn)入了KV緩存,那是在STX系統(tǒng)上處理的。這個(gè)內(nèi)存增長(zhǎng)得實(shí)在太快了,必須被加速。我們運(yùn)行時(shí)占用的內(nèi)存越多,能解決的問題就越難。這涵蓋了結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),正是我在主題演講開篇所提及的cuDF與cuVS。過去鮮少有人談及這些底層架構(gòu),但其未來的商業(yè)價(jià)值無可估量,因?yàn)橹悄荏w的處理速度遠(yuǎn)超人類,它將以更為狂暴、迅猛的姿態(tài)瘋狂吞吐這些數(shù)據(jù)。

然后是工具使用,比如網(wǎng)頁(yè)瀏覽器。網(wǎng)頁(yè)瀏覽器運(yùn)行在CPU上,所以你需要一個(gè)CPU來讓智能體訪問工具。然后它會(huì)衍生出子智能體:其中一個(gè)可能是Co-opt,由GPU加速;另一個(gè)可能是Omniverse,同樣由GPU加速。所以我們?cè)跀?shù)據(jù)中心里需要那種GPU。

所以,理解Vera Rubin的正確方式是:Vera Rubin作為一個(gè)系統(tǒng),它的能力被極大地?cái)U(kuò)展了,我們從處理那90%的工作負(fù)載擴(kuò)展到了處理所有這些任務(wù)。這就是AI。這是ChatGPT開始的地方,但這是它現(xiàn)在所處的位置。

這就是一個(gè)智能體。那么,剛剛在我們的數(shù)據(jù)中心里發(fā)生了什么?畢竟,沒人希望數(shù)據(jù)中心被東拼西湊成“科學(xué)怪人”般的縫合怪,它渴求的是極其優(yōu)雅的供電與液冷系統(tǒng)。所以我們把所有這些計(jì)算機(jī)都放進(jìn)了MGX機(jī)柜,為其中每一個(gè)組件都設(shè)計(jì)了完美的處理器,然后直接裝上機(jī)架。如果你要把存儲(chǔ)放進(jìn)去,如果你要把那東西放在和計(jì)算同一條走廊的東西向網(wǎng)絡(luò)上,你最好別搞成弗蘭肯斯坦那樣。你不能一邊用著液冷的NVLink 72機(jī)柜,另一邊用著風(fēng)冷的;不能這里用300千瓦,那里用50千瓦。所以我們把所有這些統(tǒng)一到一個(gè)單一的機(jī)柜架構(gòu)里。如果你想建一個(gè)能運(yùn)行那個(gè)智能體的集群,你只需要把它們?nèi)窟B接起來:同樣的供電,同樣的冷卻系統(tǒng),全部100%液冷,全部針對(duì)工作負(fù)載做了完全優(yōu)化,全部完全加速。

所以回到你的問題。為了運(yùn)行這個(gè)智能體,為了提供我們剛才討論的所有這些東西,你的資本支出會(huì)增加,你的GPU計(jì)算支出會(huì)增加25%。你把Groq加到那25%的工作負(fù)載里,你購(gòu)買八倍數(shù)量的芯片,價(jià)格大概和NVLink 72機(jī)柜差不多。所以25%乘以2,就是25%的增量?對(duì),你的計(jì)算支出增加了25%。這是第一點(diǎn),而這部分不在那1萬億美元里面。所以如果那1萬億美元中的100%都加上Groq,那就變成1.25萬億美元。

然后我們還有存儲(chǔ)。這個(gè)量很大,因?yàn)槭澜缟洗鎯?chǔ)量本來就很大,它是第二大計(jì)算支出。第三是用于工具使用的CPU,但我不預(yù)期CPU會(huì)占很多,大概5%左右。所以如果你要問,Grace Blackwell機(jī)柜和Vera Rubin機(jī)柜之間的全部差異,如果它增加了另外50%的機(jī)會(huì),我認(rèn)為這很可能差不多。

這就是Grace Blackwell上市和Vera Rubin上市的根本區(qū)別:在Grace Blackwell時(shí)代,我們要解決的是推理,我們要成為推理之王;而Vera Rubin,我們解決的是這個(gè)。這就是為什么我說OpenClaw是完全變革性的,終于我們有了一個(gè)統(tǒng)一的軟件可以運(yùn)行在這整個(gè)架構(gòu)上,一個(gè)開源軟件。它就是這張圖的操作系統(tǒng)?,F(xiàn)在,世界上的每一家公司都可以去構(gòu)建這個(gè)了。

問:能談?wù)勀銈內(nèi)绾问褂矛F(xiàn)金來建立業(yè)務(wù)戰(zhàn)略優(yōu)勢(shì)嗎?你們?cè)谕顿Y生態(tài)伙伴,有組件的采購(gòu)承諾,也在向股東返還現(xiàn)金。你們?nèi)绾纹胶膺@些優(yōu)先事項(xiàng)?

黃仁勛:優(yōu)先事項(xiàng)必須這樣安排:第一,必須為我們的增長(zhǎng)提供資金。我們與供應(yīng)鏈的合作非常緊密,我們今天與供應(yīng)鏈的關(guān)系處于良好狀態(tài)是有原因的,因?yàn)槲覀兒退麄冞M(jìn)行非常長(zhǎng)期的合作。我們幫助他們規(guī)劃業(yè)務(wù),把業(yè)務(wù)授予他們來支持他們的增長(zhǎng),我們甚至?xí)A(yù)付款項(xiàng),有時(shí)甚至?xí)Y助他們擴(kuò)充產(chǎn)能。我們正在為未來幾年那超過1萬億美元的需求做準(zhǔn)備。

第二,我們投資于我們的生態(tài)系統(tǒng),因?yàn)镃UDA開發(fā)者和這個(gè)階段AI原生公司的增長(zhǎng)非常重要。在這之后,我們?nèi)匀粫?huì)產(chǎn)生大量的自由現(xiàn)金流。這個(gè)問題我讓CFO科萊特·克雷斯(Colette Kress)來回答。

克雷斯:隨著我們未來1萬億美元的強(qiáng)勁增長(zhǎng),這自然為我們的自由現(xiàn)金流創(chuàng)造了非常有利的局面。黃仁勛剛才也提到了一些關(guān)鍵點(diǎn):首先,我們要確保供應(yīng)商以及構(gòu)建所需的一切都井然有序,這當(dāng)中可能涉及一些預(yù)付款。其次是我們?nèi)栽诼男械耐顿Y承諾,這些是去年做出的,需要今年上半年完成。一旦我們把這些事情推進(jìn)并落實(shí),我們就有機(jī)會(huì)進(jìn)行股票回購(gòu),把重心真正放在向股東返還資本上。這依然是我們接下來工作的重要部分。去年我們做得不錯(cuò),在向股東返還資本這件事上,今年我們也會(huì)交出出色的成績(jī)。

關(guān)于資本返還,我們現(xiàn)在討論的情況,還沒有把那個(gè)“加號(hào)”考慮進(jìn)去。如果不算那個(gè)“加號(hào)”,我們目前的計(jì)劃是:將自由現(xiàn)金流的50%用于股票回購(gòu)和股息加總。這是我們現(xiàn)在的起點(diǎn)。但那個(gè)“加號(hào)”是真實(shí)存在的,它會(huì)給我們帶來額外的機(jī)會(huì),讓我們有能力做得更多。至于具體的時(shí)間安排,需要考慮的是,我們今年上半年還有一些現(xiàn)有的承諾需要處理。但請(qǐng)保持關(guān)注。

08利潤(rùn)率問題的正面回?fù)簦嘿I便宜的設(shè)備,還是賺更多的錢?

問:有人認(rèn)為你們從生態(tài)系統(tǒng)中獲取了太多價(jià)值,長(zhǎng)期來看無法維持這樣的利潤(rùn)率。你如何回應(yīng)這種擔(dān)憂?我知道你在網(wǎng)上也看到一些關(guān)于"必須投資生態(tài)系統(tǒng)"的評(píng)論,有些人用消極的方式解讀。你能談?wù)勀銈內(nèi)绾尉S持利潤(rùn)率嗎?

黃仁勛:首先,我昨天告訴大家的幾乎都是全新的視角。每個(gè)人都必須理解Token經(jīng)濟(jì)學(xué)。這個(gè)世界需要重新認(rèn)識(shí):計(jì)算機(jī)已經(jīng)變成了什么。如果我們能持續(xù)每年交付每瓦每秒Token數(shù)量的成倍增長(zhǎng),如果我們能持續(xù)通過引入新的Token細(xì)分市場(chǎng),讓客戶的平均售價(jià)也成倍增長(zhǎng),那客戶有什么理由不繼續(xù)和我們合作?

還有一點(diǎn),我以前也說過,這在數(shù)學(xué)上絕對(duì)清晰。我會(huì)挑戰(zhàn)每一家云服務(wù)提供商的CEO,讓他們?yōu)樽约寒嫵瞿菑垐D,我會(huì)幫他們畫。然后你選你最喜歡的其他配置,無論是第三方芯片還是自研芯片,忠實(shí)地把它放進(jìn)那個(gè)模型里。然后你自己決定:你是想要更高的收入,還是更低的?想要更高的平均售價(jià),還是更低的?想要更高的利潤(rùn)率,還是更低的?這才是全部的意義所在。

臺(tái)積電的晶圓堪稱全球最貴,但其性價(jià)比同樣冠絕全球,我極其樂意為此買單。ASML的系統(tǒng)造價(jià)不菲,但絕對(duì)物超所值,這毫無爭(zhēng)議。所以問題很簡(jiǎn)單:你是想賺更多錢,還是想買最便宜的設(shè)備?

我剛才拋出的本質(zhì)上是一個(gè)前沿概念:我將計(jì)算機(jī)系統(tǒng)視作臺(tái)積電的晶圓廠,視作ASML的光刻機(jī)來對(duì)待。而在過去,人們的認(rèn)知并非如此。如果我有兩個(gè)CPU,一個(gè)是256核,另一個(gè)也是256核,哪個(gè)更好?更便宜的那個(gè)更好,因?yàn)槲野春俗赓U。但Token不是這樣創(chuàng)造的。你不是按核租賃,你是通過每秒Token數(shù)量來實(shí)現(xiàn)收益的。這是一種完全不同的經(jīng)濟(jì)模式,你不是在租核心,不是在租節(jié)點(diǎn),你是在生產(chǎn)Token。這就是為什么一切都變了。

任何散布此類言論的人,純粹是外行。他們滿腦子只想采購(gòu)最廉價(jià)的設(shè)備?!拔业脑O(shè)備便宜30%”,但這筆賬算到整座工廠頭上,究竟意味著什么?這才是觸及靈魂的拷問。如果有人跑來向你推銷“我的芯片便宜50%”,請(qǐng)務(wù)必將這番話置于“AI工廠”的宏大語(yǔ)境下審視,這番說辭恰恰暴露了他對(duì)AI的一竅不通。

問:你昨天幾次提到,預(yù)計(jì)到2027年產(chǎn)能都會(huì)緊張。能詳細(xì)說明一下你具體在哪里看到這些短缺嗎?另外,你稱自己為“首席收入破壞者”,微軟CEO薩蒂亞·納德拉也評(píng)論過說不想過度依賴某一代產(chǎn)品,因?yàn)橹篮芸炀蜁?huì)有下一代。這種行為是微軟獨(dú)有的嗎?這些限制是否反而保護(hù)了您的其他客戶?還是說他們也持有類似的心態(tài)?

黃仁勛:納德拉也會(huì)告訴你這話是誰(shuí)跟他說的,是我告訴他的:買你今年需要的,因?yàn)槊髂陼?huì)有更好的。我不希望你們過于細(xì)致地揣測(cè)我們的用詞。

世界在某種程度上是否供應(yīng)緊張?是的。我們可以達(dá)成共識(shí),說相反的話反而奇怪。世界上汽車緊張嗎?你看到汽車了,但如果我把需求提高三倍呢?一切都某種程度上是緊張的,這完全取決于具體情況。

因?yàn)槲覀兘ㄔO(shè)的規(guī)模如此之大,我們的生活并不簡(jiǎn)單。我們正在多個(gè)維度上與多個(gè)供應(yīng)商合作,確保一切和諧運(yùn)轉(zhuǎn)。不能太多,不能太少,要能夠滿足我們的需求甚至更多。我們想要滿足需求甚至更多,是因?yàn)槲磥?1個(gè)月總有新需求出現(xiàn)。我還有很多新需求要來,所以我必須為此做好準(zhǔn)備。這里有各種各樣的參數(shù),并不簡(jiǎn)單。如果我告訴你們我們?cè)谀硞€(gè)特定項(xiàng)目上供應(yīng)緊張,那我知道你們接下來會(huì)做什么了。

所以我認(rèn)為系統(tǒng)是和諧的:沒有太多,也沒有太少。我們沒有太多電力,也沒有太少電力。我們沒有太多建筑工人,也沒有太多水管工。我們沒有太多電纜,也沒有太少光模塊。就是剛好差不多。我們會(huì)每天努力維持這種平衡。但那一萬億美元訂單,我們是可以滿足的。

問:我收到了很多關(guān)于昨天演示的問題:CPO從哪里開始,銅纜到哪里結(jié)束?你概述了NVLink 576,有一張幻燈片上還有NVLink 1152。所以我很好奇你目前關(guān)于同時(shí)提供這兩者的想法,以及隨著我們擴(kuò)展到Vera Rubin Ultra,這會(huì)如何演變?

黃仁勛:首先,請(qǐng)善待我的合作伙伴們,他們都做得很好。我這里說的任何話都不意味著他們的業(yè)務(wù)會(huì)走向另一條路,他們所有的業(yè)務(wù)都會(huì)因?yàn)槲覀兌鲩L(zhǎng)。我們會(huì)讓銅纜業(yè)務(wù)增長(zhǎng),也會(huì)讓光模塊業(yè)務(wù)大幅增長(zhǎng)。我說的有沒有完全合乎邏輯?答案是肯定的。讓我告訴你為什么。

我們應(yīng)該盡可能用銅纜擴(kuò)展,能撐多遠(yuǎn)就撐多遠(yuǎn)。但在一米左右,銅纜有其物理極限。你們已經(jīng)看到我們從NVLink 72發(fā)展到現(xiàn)在的Rubin Ultra NVLink 144,背板設(shè)計(jì)就是為了支持這一點(diǎn)。我們會(huì)繼續(xù)研究,如果能從144擴(kuò)展到288,我們非常樂意這么做,因?yàn)槟銘?yīng)該盡可能使用銅纜。銅纜更容易制造,更可靠,人類制造和使用銅纜已經(jīng)很長(zhǎng)時(shí)間了。

這道理好比呼吸空氣:只要條件允許,你就應(yīng)該大口呼吸自然空氣,直到氧氣耗盡。在那之后,你或許不得不依靠壓縮液態(tài)空氣續(xù)命。但在此之前,自然空氣不僅免費(fèi),而且極其安全。

所以第一原則是:盡可能用銅纜擴(kuò)展。如你們所知,我們也把以太網(wǎng)帶到了結(jié)構(gòu)化電纜背板,這是增量的增長(zhǎng)機(jī)會(huì)。我們要把以太網(wǎng)的背板變成這些脊柱,因?yàn)檫@些結(jié)構(gòu)化電纜非常容易使用?,F(xiàn)在我們掌握了如何制造和使用的技術(shù),我們可以創(chuàng)造這些東西,使其容易維護(hù),容易運(yùn)輸,容易布線,不會(huì)出錯(cuò)。

然而,同時(shí)我們想擴(kuò)展到72以上,到144,到1152,甚至未來可能更遠(yuǎn)。銅纜能走多遠(yuǎn)是有限度的。所以你可以看到這樣的演進(jìn)路徑:目前是100%銅纜。下一代Ultra會(huì)有兩個(gè)選擇:你可以用銅纜,或者銅纜加CPO。這是從現(xiàn)在起一年后。兩年后,到1152,就全是CPO了,因?yàn)殂~纜的物理距離極限到了。所以會(huì)有一個(gè)自然的過渡。

但即使當(dāng)NVLink變成了CPO,Spectrum X也變成了CPO,我們?cè)跈C(jī)架上的以太網(wǎng)scale-up仍然會(huì)使用銅纜,我們的存儲(chǔ)也仍然會(huì)使用銅纜。因?yàn)槲覀冇形鍌€(gè)不同的機(jī)柜。所以銅纜的使用量會(huì)繼續(xù)維持在高位,因?yàn)榧词箂cale-up在兩三年后轉(zhuǎn)向CPO,隨著所有其他機(jī)柜的需求和總產(chǎn)能持續(xù)增長(zhǎng),銅纜連接器的總消耗量也會(huì)持續(xù)增長(zhǎng)。

09細(xì)分市場(chǎng)的終局猜想:法拉利沒有免費(fèi)版,Token也一樣

問:你之前談到Token成本,聽到高端占25%非常有幫助。你如何看待市場(chǎng)隨時(shí)間演變,低端或免費(fèi)層與高端層的增長(zhǎng)率會(huì)如何?在一個(gè)以Token成本大幅下降為前提的市場(chǎng)中,你認(rèn)為這一趨勢(shì)會(huì)如何發(fā)展?是否會(huì)開始放緩或趨于平緩?

黃仁勛:Token成本會(huì)持續(xù)下降,每年都在下降。從Grace Blackwell到Rubin,Token成本會(huì)再次下降,Rubin Ultra還會(huì)繼續(xù)下降。與此同時(shí),每個(gè)Token背后的智能程度,會(huì)隨著我們把那條曲線向右推而持續(xù)上升。同時(shí),我們會(huì)不斷提高吞吐量。

這一切都繞不開一個(gè)核心命題:任何人都不應(yīng)盲目盯著“每秒Token數(shù)”看,你必須始終將其與功耗相除進(jìn)行歸一化。邏輯很簡(jiǎn)單,你的數(shù)據(jù)中心容量存在物理天花板。你的數(shù)據(jù)中心是一個(gè)吉瓦,你不會(huì)有第二個(gè);如果是200兆瓦,你也不會(huì)有第三個(gè)。所以你必須始終將其歸一化到功耗。否則,你無法比較任何架構(gòu)。摩爾定律也總是要除以某個(gè)東西。所以你必須看的是:每瓦每秒Token數(shù)。任何向你兜售其他衡量標(biāo)準(zhǔn)的人,要么是AI門外漢,要么就是心懷鬼胎。這正是SemiAnalysis(半導(dǎo)體研究機(jī)構(gòu))之所以能看透本質(zhì)的原因,一切指標(biāo)都必須歸一化至單位功耗。

我們將不斷提高吞吐量。所以無論Token價(jià)格是多少,無論平均售價(jià)是多少,我們都在提高吞吐量。同時(shí),無論那個(gè)細(xì)分市場(chǎng)是什么,我們都在降低成本。下端基本上是你們的細(xì)分產(chǎn)品市場(chǎng),那是吞吐量、產(chǎn)量、成本的問題。這就是為什么這兩條曲線如此重要?,F(xiàn)在我把這兩條曲線結(jié)合在一起,這條曲線本質(zhì)上就是帕累托前沿。

目前世界大部分地區(qū)還在這里,這是Hopper的世界。Blackwell把它擴(kuò)展了,并增加了一些新的細(xì)分市場(chǎng)。這非常有價(jià)值,因?yàn)檫@里和這里的平均售價(jià)差異可能達(dá)到5倍、10倍,模型更大,速度更快。

那么我如何看待需求曲線的變化?昨天我用了25%在這里,25%在這里,25%在那里,25%在另一邊。但一個(gè)制造商的不同產(chǎn)品細(xì)分市場(chǎng)的分布,完全取決于具體情況。法拉利全是高端,沒有免費(fèi)層;而其他品牌則完全不同。我認(rèn)為這里也一樣。

如果你的業(yè)務(wù)是搜索,你主要會(huì)在免費(fèi)層,因?yàn)闆]人會(huì)為搜索付費(fèi)。如果你是代碼生成、智能體代碼,你會(huì)大量集中在這里。如果你的客戶是企業(yè)員工,平均工資可能是5萬或7萬美元,你可能在這里,你希望你的產(chǎn)品定價(jià)也在相應(yīng)的位置。這取決于你的客戶、你為他們做的工作,以及競(jìng)爭(zhēng)格局。AI Token是一種產(chǎn)品,一種新商品,它會(huì)以這種方式被營(yíng)銷。不同的供應(yīng)商、不同的品牌、不同的目標(biāo)市場(chǎng),會(huì)有完全不同的形狀分布。我昨天只是隨便選了一個(gè)平均分布做示例。

問:你認(rèn)為未來哪個(gè)細(xì)分市場(chǎng)增長(zhǎng)更快?

黃仁勛:目前它們都會(huì)增長(zhǎng)得非??欤荚诔手笖?shù)級(jí)增長(zhǎng)。我們還處在開始階段,增長(zhǎng)率是被一個(gè)很小的基數(shù)相除后得到的結(jié)果。

問:我們的實(shí)地調(diào)研告訴我們,AI工程師對(duì)狀態(tài)空間模型感到興奮,因?yàn)樗鼈兘鉀Q了內(nèi)存需求問題。在主題演講中,你展示了NeMotron 3在頂級(jí)模型中的基準(zhǔn)測(cè)試,我相信那是一個(gè)混合了混合專家和狀態(tài)空間的模型。智能體AI是否創(chuàng)造了對(duì)新AI模型的需求?這就是你通過NeMotron和混合模型所做的嗎?狀態(tài)空間為NeMotron 3帶來了什么,是純混合專家模型沒有的?如果發(fā)生向新型AI模型的轉(zhuǎn)變,這對(duì)Nvidia的競(jìng)爭(zhēng)環(huán)境有何影響?

黃仁勛:我們運(yùn)行所有AI模型,無論是純Transformer、離散Token、連續(xù)模型、擴(kuò)散模型、狀態(tài)空間模型,還是混合模型。我們架構(gòu)的美妙之處在于,它能處理所有模型。舉個(gè)例子,Groq做不了擴(kuò)散模型,但我們什么都能做。我之所以拿Groq開玩笑,絕非刻意針對(duì),畢竟它現(xiàn)在已歸我麾下。只是客觀而言,每種架構(gòu)都各有其主戰(zhàn)場(chǎng)。

英偉達(dá)之所以如此全能,之所以被如此廣泛地自由使用,是因?yàn)闊o論你的研究科學(xué)家明天想出什么創(chuàng)新,我向你保證:它在CUDA上會(huì)運(yùn)行得很好。原因很簡(jiǎn)單,我們擁有執(zhí)行所有這些任務(wù)所需的所有計(jì)算元素。

NeMotron 3的設(shè)計(jì)初衷,是為了讓你能夠處理極長(zhǎng)的上下文。將來,你與你的AI的對(duì)話,希望能持續(xù)你的一生。所以問題來了:如何處理上下文?如何處理相關(guān)的對(duì)話記憶?一方面,如果你記住了所有東西,隨著時(shí)間的推移,我們談?wù)撨^很多事情,當(dāng)記憶太多時(shí),你該調(diào)用哪個(gè)版本?可能會(huì)變得混亂。這些都是研究的前沿領(lǐng)域。

但我認(rèn)為,混合架構(gòu)將是一件非常重要的事情。因?yàn)樗试S你處理極長(zhǎng)的上下文,而不必遭受計(jì)算量二次爆炸的痛苦。這就是我們發(fā)明它的原因。我們把它開源,希望每個(gè)人都能使用它。它的目的就是推動(dòng)AI進(jìn)步,而不是與任何人競(jìng)爭(zhēng)。我們只是想推動(dòng)AI向前發(fā)展。

問:我想試著理解你下游的AI市場(chǎng)目前有多集中,以及未來會(huì)如何演變。你那張圖顯示60%是超大規(guī)模企業(yè)。但我感覺另外40%里,大部分是二級(jí)云提供商,而他們中的很多人實(shí)際上是在把產(chǎn)能轉(zhuǎn)售或租賃給超大規(guī)模企業(yè)或前沿實(shí)驗(yàn)室。所以如果把超大規(guī)模企業(yè)和前沿實(shí)驗(yàn)室合在一起,可能80%的實(shí)際基礎(chǔ)設(shè)施使用者都在里面了。而這些模型,比如Anthropic的模型、OpenAI的模型,似乎只有極少數(shù)真正處在最前沿。你認(rèn)為這是對(duì)今天情況的準(zhǔn)確描述嗎?你如何看待這種情況的演變?這對(duì)價(jià)值鏈上的賺錢能力、發(fā)展方向以及AI的進(jìn)一步加速意味著什么?

黃仁勛:我會(huì)把它拆成三個(gè)維度來看。

第一個(gè)維度是:最終運(yùn)行的是什么模型?我之前說過,OpenAI是最大的,第二大類是所有開放模型的總和,絕對(duì)穩(wěn)居第二,第三是Anthropic,然后依次往下排。長(zhǎng)尾其實(shí)相當(dāng)長(zhǎng)。所以如果你看模型消費(fèi)的世界,哪怕只看語(yǔ)言模型,也應(yīng)該這樣思考。我們運(yùn)行所有這些模型,我們參與其中每一個(gè)。

在這個(gè)模型的子維度里,你還必須加上物理AI模型,也就是機(jī)器人技術(shù)。你看到的所有機(jī)器人,它們運(yùn)行的是視覺模型、語(yǔ)言模型、動(dòng)作模型。這些和純語(yǔ)言模型完全不同。舉個(gè)例子,控制電機(jī)是連續(xù)的,不是離散的“點(diǎn)、點(diǎn)、點(diǎn)”;物理世界是連續(xù)的,生物學(xué)里的基因組遵循的是幾何規(guī)律。所以有很多不同類型的模型。但重點(diǎn)是,你首先要搞清楚正在運(yùn)行的是哪些類型的模型,這有助于你思考如何開展業(yè)務(wù)。

第二個(gè)維度是:根據(jù)公司的結(jié)構(gòu)、意圖或利益,計(jì)算的位置在哪里?他們是想要自研芯片的公司,那我們必須和他們競(jìng)爭(zhēng)?他們是想要在自己的云里托管Nvidia客戶的公司,顯然CUDA只在Nvidia上運(yùn)行?他們是像NCPs這樣的公司,他們不能只買芯片,他們真的需要買系統(tǒng),所以他們是真正的基礎(chǔ)設(shè)施客戶?還是那些想要本地部署的公司?因此,我們的分銷渠道需要通過戴爾、惠普和聯(lián)想,因?yàn)楸仨氄弦淮蠖哑渌髽I(yè)計(jì)算組件,而戴爾和惠普不自研芯片?;蛘呤窃谶吘墸苍S是無線網(wǎng)絡(luò)、機(jī)器人系統(tǒng)、自動(dòng)駕駛汽車,甚至是衛(wèi)星?現(xiàn)在你得決定計(jì)算在哪里進(jìn)行。

當(dāng)你把這些全部細(xì)分完之后,再回到我展示的那張60/40圖。在那40%里,他們本質(zhì)上需要的是計(jì)算平臺(tái)。不管他們運(yùn)行什么模型,可能是OpenAI的模型,可能是Anthropic的模型,Nvidia支持機(jī)密計(jì)算,這讓OpenAI和Anthropic有可能在右側(cè)那部分運(yùn)行。那一邊,他們想要完整的平臺(tái),想要機(jī)密計(jì)算,想要在世界不同地方部署計(jì)算機(jī),而不僅僅是在云里。

即使在云里,我們也和那60%CSP圖中的某一部分存在競(jìng)爭(zhēng)關(guān)系,但我們也把客戶帶到另一部分。所以在那60%的CSP圖里,有一部分我們必須競(jìng)爭(zhēng)。我們的工作就是比世界上任何人都更好地交付那張圖的價(jià)值,我們做得非常好,實(shí)際上我們的地位還在日益增強(qiáng)。而在另一部分,我們把客戶帶給他們,他們只有感激。

我把所有這些維度壓縮成兩個(gè)餅圖。你可以用這個(gè)壓縮后的圖來檢驗(yàn):他們是否設(shè)計(jì)自己的芯片?我們是否在芯片層面和他們競(jìng)爭(zhēng)?我不認(rèn)為OCI會(huì)設(shè)計(jì)自己的芯片,我認(rèn)為他們這樣做不明智。顯然Coreweave也不會(huì)設(shè)計(jì)自己的芯片。所以我們?cè)谀睦锔?jìng)爭(zhēng)?我們?cè)谀睦餅樵品?wù)提供商帶來客戶?他們?cè)剖杖氲暮艽笠徊糠郑@然OCI幾乎是100%,是因?yàn)镹vidia。

10黃仁勛的組織哲學(xué):60個(gè)人管1萬億

問:展望未來,12個(gè)月的創(chuàng)新飛輪是你競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵部分。但當(dāng)我看到員工人數(shù)時(shí),增長(zhǎng)其實(shí)非常緩慢,相對(duì)緩慢。然而,你們承擔(dān)的任務(wù)量比這增長(zhǎng)得快得多。你如何管理這一點(diǎn)?如何管理這可能給業(yè)務(wù)帶來的風(fēng)險(xiǎn)?

黃仁勛:我的直接匯報(bào)團(tuán)隊(duì)有60人。我們需要60人,是因?yàn)楣镜募軜?gòu)就是為了交付這種產(chǎn)品架構(gòu)而設(shè)計(jì)的。組織的架構(gòu)應(yīng)該反映他們構(gòu)建的產(chǎn)品。每家公司不應(yīng)該看起來都一樣。打造法拉利與流水線生產(chǎn)福特的方式截然不同,前者是圍繞底盤調(diào)動(dòng)技師,后者則是讓車輛在流水線上流轉(zhuǎn)穿梭。這完全取決于你渴望締造怎樣的結(jié)果,而組織架構(gòu)理應(yīng)成為這一愿景的映射。

你看看我的管理團(tuán)隊(duì),構(gòu)建Vera Rubin整個(gè)工廠所需技術(shù)的每一個(gè)方面,都在那里,百分之百具備。每個(gè)人都代表一個(gè)關(guān)鍵領(lǐng)域,所有專業(yè)知識(shí)都坐在同一張桌子上,共同決策。

第二件事是,我們有紀(jì)律去開發(fā)整個(gè)軟件棧。如果你不能把它啟用起來,你就無法每年構(gòu)建我們所構(gòu)建的東西。如果不能啟用,你怎么測(cè)試它?如果你從其他人那里拼湊新技術(shù),你怎么能做到每年啟用一次?這根本不現(xiàn)實(shí),不可能。

所以我們讓我們所有的芯片與平臺(tái)對(duì)齊,所有七款芯片都只有一個(gè)流片時(shí)間表。我不會(huì)拼湊每個(gè)人的流片時(shí)間表然后算出系統(tǒng)什么時(shí)候出來。系統(tǒng)需要在它該來的時(shí)候來,每個(gè)人都對(duì)齊到那個(gè)時(shí)間點(diǎn)。而軟件棧,我們完全擁有每一部分。存儲(chǔ)是我們自己開發(fā)的,網(wǎng)絡(luò)當(dāng)然也是,甚至工廠操作系統(tǒng)Dynamo也是我們創(chuàng)造的。這樣我們就可以交付每一個(gè)基準(zhǔn)測(cè)試,測(cè)試到極限,測(cè)試可靠性。

英偉達(dá)構(gòu)建NeMotron的原因,就是為了我們能做預(yù)訓(xùn)練、后訓(xùn)練,現(xiàn)在還能做推理。我們擁有所有的軟件,這樣我們就可以每年啟用所有的系統(tǒng),這基本上意味著你一直在啟用。

如果你不擁有所有東西,你毫無機(jī)會(huì),是絕對(duì)的零概率事件。人們談?wù)撍麄兊男翯PU,但他們的scale-up結(jié)構(gòu)從哪里來?那要怎么工作?我們之前討論的那個(gè)完整的智能體系統(tǒng),就是未來的計(jì)算機(jī)。所以我們公司的組織、公司的使命、公司的能力,都與我向市場(chǎng)交付承諾的目標(biāo)完全一致。這就是為什么我們能持續(xù)做到。

區(qū)區(qū)一張PPT是絕對(duì)造不出那套系統(tǒng)的。僅憑一張畫著兩根柱狀圖的幻燈片,也絕無可能忽悠別人砸給你500億美元。當(dāng)你真正將其全面工程化,并在數(shù)據(jù)中心內(nèi)部成功落地時(shí),我們?cè)缫堰b遙領(lǐng)先了兩個(gè)身位。這正是我們倒逼整個(gè)行業(yè)滾滾向前的獨(dú)特模式,一條鋪滿荊棘的極難之路。我們之所以能披荊斬棘,全憑我剛才詳述的種種底蘊(yùn)。

我們的每一個(gè)系統(tǒng)都與CUDA兼容,所以第一天,昨天的軟件就能完美地在今天的系統(tǒng)上運(yùn)行。我擁有所有的scale-up交換機(jī)、所有的scale-out交換機(jī)、所有的軟件。第一天,我把昨天的軟件放到新系統(tǒng)上。如果它不工作,那還有什么意義?然后一旦我們啟用了所有東西,因?yàn)槲覀儞碛姓麄€(gè)軟件棧,我們就可以把它推向極限。擁有CUDA兼容性,我們有這個(gè)叫DOCA的兼容層。我們擁有所有的編譯器,我們擁有所有的軟件棧,這非常非常重要。你不能把這外包給別人。別人為你構(gòu)建芯片,但他們不會(huì)為你啟用系統(tǒng),不會(huì)為你做驗(yàn)證。

11 99%的算力應(yīng)該用在推理上

問:這次活動(dòng)上我們談了很多關(guān)于推理的內(nèi)容。我希望你能花幾分鐘談?wù)動(dòng)?xùn)練。你認(rèn)為計(jì)算強(qiáng)度會(huì)如何增長(zhǎng)?未來幾年,驅(qū)動(dòng)因素是什么?仍然是越來越大的模型,還是你看到地平線上有其他東西?如果從三到五年的角度來看,你對(duì)訓(xùn)練與推理在計(jì)算需求上的比例有何看法?

黃仁勛:訓(xùn)練已經(jīng)從預(yù)訓(xùn)練發(fā)展到了后訓(xùn)練階段。

預(yù)訓(xùn)練的本質(zhì)是記憶和泛化。你記憶得越多,泛化能力就越強(qiáng),你擁有的基礎(chǔ)就越好。有了這個(gè)基礎(chǔ),也就是預(yù)訓(xùn)練模型,它有點(diǎn)像AI的幼兒園,或者更準(zhǔn)確地說,是AI的高中,它掌握了基本的詞匯、語(yǔ)法,甚至隱含了很多推理能力。這樣當(dāng)我教它新技能時(shí),它才能理解我在說什么。如果你連我的意思都聽不懂,怎么可能去執(zhí)行任務(wù)?所以預(yù)訓(xùn)練做的就是這件事。

后訓(xùn)練則是教模型各種各樣的技能:強(qiáng)化學(xué)習(xí)、帶可執(zhí)行基礎(chǔ)的強(qiáng)化學(xué)習(xí)、帶可驗(yàn)證反饋的強(qiáng)化學(xué)習(xí)、面向批處理的強(qiáng)化學(xué)習(xí)技術(shù)、工具使用,無論是基于結(jié)構(gòu)的API,還是非結(jié)構(gòu)化的工具使用。領(lǐng)域太多了。這部分的計(jì)算強(qiáng)度,我猜可能比預(yù)訓(xùn)練大一百萬倍。我可能差個(gè)1.2倍,但肯定是非常大的量級(jí)。原因是有太多技能需要學(xué)習(xí),而所有這些技能的學(xué)習(xí)周期都非常非常長(zhǎng)。所以模型必須變得越來越大。當(dāng)你把這些技能都掌握之后,你生成的大量合成數(shù)據(jù),其中一部分又會(huì)回流到下一輪的預(yù)訓(xùn)練中。

因此,過去的預(yù)訓(xùn)練皆以互聯(lián)網(wǎng)數(shù)據(jù)為起點(diǎn),當(dāng)下的預(yù)訓(xùn)練依然以此為主力。但假以時(shí)日,再歷經(jīng)幾代迭代,合成數(shù)據(jù)將全面接管預(yù)訓(xùn)練的半壁江山。同時(shí),你還在增加多模態(tài)能力,增加運(yùn)動(dòng)能力,讓模型能夠在物理世界中長(zhǎng)時(shí)間執(zhí)行動(dòng)作。因?yàn)橛泻芏喑WR(shí)是與認(rèn)知邏輯相關(guān)的,如果你能在物理世界中互動(dòng),即使在抽象世界中,你也能更容易地處理那個(gè)概念,因?yàn)槟銚碛辛嗽谖锢硎澜缰薪拥氐慕?jīng)驗(yàn)。

請(qǐng)注意我剛才描述的計(jì)算量。我們未來所需的訓(xùn)練計(jì)算量是百萬倍、十億倍級(jí)別的,再加上持續(xù)學(xué)習(xí)。幾乎每個(gè)人的模型都會(huì)被最后訓(xùn)練、被微調(diào),以便它也能為每個(gè)人做記憶和泛化。所以在未來,推理從哪里開始、從哪里結(jié)束,訓(xùn)練從哪里開始、從哪里結(jié)束,會(huì)變得越來越模糊。你什么時(shí)候在學(xué)習(xí),什么時(shí)候在應(yīng)用你的智慧?對(duì)大多數(shù)人來說,現(xiàn)在是持續(xù)不斷的。

至于推理與訓(xùn)練的比例,我的希望是:世界上99%的計(jì)算都用于推理。因?yàn)橥评憝h(huán)節(jié),才是我們將生成的Token兌現(xiàn)為真金白銀的變現(xiàn)場(chǎng)。世界上沒人會(huì)為你的學(xué)習(xí)過程買單,也沒人會(huì)替你的訓(xùn)練成本掏錢,你必須自掏腰包搞訓(xùn)練,而真正能榨出商業(yè)價(jià)值的,唯有推理。我希望這個(gè)世界能夠把這些Token用于有價(jià)值的成果:醫(yī)療保健、制造業(yè)、金融服務(wù)、工程等等。我們希望未來99%的Token都用于產(chǎn)生經(jīng)濟(jì)效益,而AI模型則在不斷學(xué)習(xí)。

有一個(gè)很好的理由可以解釋為什么Nvidia去年全力以赴投入推理,因?yàn)槲覀兛吹搅诉@個(gè)未來:推理和訓(xùn)練、預(yù)訓(xùn)練和學(xué)習(xí),所有這些都只是一個(gè)大的連續(xù)統(tǒng)一體。不妨回味一下兩年前坊間流傳的論調(diào):“英偉達(dá)確實(shí)擅長(zhǎng)訓(xùn)練,但推理簡(jiǎn)直是小菜一碟,阿貓阿狗的公司都能做?!敝T位還記得嗎?時(shí)至今日,真相大白,推理簡(jiǎn)直難如登天。端詳一下這張圖表,它難到了極點(diǎn),且未來將呈地獄級(jí)難度遞增。推理的本質(zhì)就是深度思考、硬核工作、真刀真槍地干活。這種苦差事,怎么可能“容易”?

所以我認(rèn)為人們完全把它搞反了,他們只是想編造故事來合理化他們自己的機(jī)會(huì),這沒問題。但你得從第一性原理來推理。我花很長(zhǎng)時(shí)間回答你們的問題,而不是用一個(gè)高度篩選、精心選擇、精準(zhǔn)調(diào)整動(dòng)詞和名詞的簡(jiǎn)短回答,是因?yàn)槲蚁M銈儗W(xué)會(huì)如何通過這些來推理。這樣當(dāng)你們自己看到某些說法時(shí),你會(huì)想“不,那沒道理”或者“那有道理”。因?yàn)槟銈兪欠治鰩煟銈冃枰軌蚶斫膺@些事情。

相關(guān)推薦
熱點(diǎn)推薦
老板娘問我她屁股圓嗎?我該怎么回答?

老板娘問我她屁股圓嗎?我該怎么回答?

太急張三瘋
2026-03-22 04:14:46
廣東91歲老人讓兒子保管900多萬養(yǎng)老錢,兒媳去世前卻將300多萬分給自己姐姐,老人瞬間傻眼,法院:錢是保管不是贈(zèng)與,全額返還

廣東91歲老人讓兒子保管900多萬養(yǎng)老錢,兒媳去世前卻將300多萬分給自己姐姐,老人瞬間傻眼,法院:錢是保管不是贈(zèng)與,全額返還

觀威海
2026-03-18 22:11:07
凌晨的一聲悶響,美軍堅(jiān)不可摧的神話碎了!

凌晨的一聲悶響,美軍堅(jiān)不可摧的神話碎了!

安安說
2026-03-18 11:26:01
315 過后良心紅榜來了!這些老牌國(guó)貨值得信賴,老百姓可以放心買

315 過后良心紅榜來了!這些老牌國(guó)貨值得信賴,老百姓可以放心買

姩姩有娛
2026-03-20 15:13:35
紐森變量:當(dāng)美國(guó)迎來一位“專業(yè)級(jí)”對(duì)手

紐森變量:當(dāng)美國(guó)迎來一位“專業(yè)級(jí)”對(duì)手

民間胡扯老哥
2026-03-21 20:09:26
4月1日起去醫(yī)院,只帶醫(yī)??ú粔蛴茫@兩樣必須帶齊

4月1日起去醫(yī)院,只帶醫(yī)??ú粔蛴茫@兩樣必須帶齊

花小貓的美食日常
2026-03-22 06:27:29
兒子拒絕送飯后續(xù):母親餓到崩潰,孩子撒謊享樂,反被說小題大做

兒子拒絕送飯后續(xù):母親餓到崩潰,孩子撒謊享樂,反被說小題大做

離離言幾許
2026-03-17 17:31:31
預(yù)測(cè)票房60億,《澎湖海戰(zhàn)》遭抵制也不怕,統(tǒng)一臺(tái)灣勢(shì)不可擋

預(yù)測(cè)票房60億,《澎湖海戰(zhàn)》遭抵制也不怕,統(tǒng)一臺(tái)灣勢(shì)不可擋

娛樂圈筆娛君
2026-03-20 16:15:43
52歲北京炒股冠軍罕見發(fā)聲:洗盤如果洗不掉散戶,莊家會(huì)怎么辦?

52歲北京炒股冠軍罕見發(fā)聲:洗盤如果洗不掉散戶,莊家會(huì)怎么辦?

股經(jīng)縱橫談
2026-03-20 21:45:04
3-0!本菲卡爭(zhēng)冠重現(xiàn)生機(jī):主場(chǎng)大勝+差榜首4分,穆帥或帶隊(duì)逆襲

3-0!本菲卡爭(zhēng)冠重現(xiàn)生機(jī):主場(chǎng)大勝+差榜首4分,穆帥或帶隊(duì)逆襲

體育知多少
2026-03-22 07:15:31
蘋果CEO庫(kù)克:新款Mac吸引了創(chuàng)紀(jì)錄的首購(gòu)客戶

蘋果CEO庫(kù)克:新款Mac吸引了創(chuàng)紀(jì)錄的首購(gòu)客戶

第一財(cái)經(jīng)資訊
2026-03-21 09:00:44
剛剛,特朗普做出最瘋狂決定,他要孤注一擲!

剛剛,特朗普做出最瘋狂決定,他要孤注一擲!

霹靂炮
2026-03-21 22:28:40
違規(guī)走私AI服務(wù)器,超微電腦聯(lián)合創(chuàng)始人被捕

違規(guī)走私AI服務(wù)器,超微電腦聯(lián)合創(chuàng)始人被捕

芯智訊
2026-03-20 12:37:54
藥效飆升60倍!科學(xué)家改造老藥甲硝唑,可低劑量根治幽門螺桿菌

藥效飆升60倍!科學(xué)家改造老藥甲硝唑,可低劑量根治幽門螺桿菌

DeepTech深科技
2026-03-21 16:33:52
泰山0-4不敵,宿茂臻賽后言論徹底打服眾人

泰山0-4不敵,宿茂臻賽后言論徹底打服眾人

春日筆記
2026-03-22 05:05:57
李鵬晚年親口澄清身世:說我是周總理養(yǎng)子?這話其實(shí)不準(zhǔn)確

李鵬晚年親口澄清身世:說我是周總理養(yǎng)子?這話其實(shí)不準(zhǔn)確

老杉說歷史
2026-03-21 16:56:05
苗僑偉也沒想到,長(zhǎng)太丑而被攻擊的兒子,如今在加拿大為他爭(zhēng)光了

苗僑偉也沒想到,長(zhǎng)太丑而被攻擊的兒子,如今在加拿大為他爭(zhēng)光了

攬星河的筆記
2026-03-21 16:10:40
5處美軍基地同時(shí)遭襲,以軍最后防線崩潰??jī)?nèi)塔:戰(zhàn)爭(zhēng)將很快結(jié)束

5處美軍基地同時(shí)遭襲,以軍最后防線崩潰??jī)?nèi)塔:戰(zhàn)爭(zhēng)將很快結(jié)束

游古史
2026-03-22 06:45:30
轉(zhuǎn)告家里所有人:門外一喊這幾句,馬上提高警惕,很多人已上當(dāng)

轉(zhuǎn)告家里所有人:門外一喊這幾句,馬上提高警惕,很多人已上當(dāng)

吃貨的分享
2026-03-20 17:04:45
女子跳傘掛在150米高懸崖5小時(shí)獲救,當(dāng)事人:舅舅現(xiàn)場(chǎng)嚇出了高血壓,事前有過報(bào)備,感謝救援人員

女子跳傘掛在150米高懸崖5小時(shí)獲救,當(dāng)事人:舅舅現(xiàn)場(chǎng)嚇出了高血壓,事前有過報(bào)備,感謝救援人員

極目新聞
2026-03-21 21:39:28
2026-03-22 08:44:49

科技要聞

庫(kù)克在華這四天,一場(chǎng)既定的市場(chǎng)秀

頭條要聞

男子在壺口瀑布外拍視頻喊"門口要錢"被投訴 景區(qū)回應(yīng)

頭條要聞

男子在壺口瀑布外拍視頻喊"門口要錢"被投訴 景區(qū)回應(yīng)

體育要聞

誰(shuí)在決定字母哥未來?

娛樂要聞

田栩?qū)幗K于涼了?出軌風(fēng)波影響惡劣

財(cái)經(jīng)要聞

通脹警報(bào)拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年?duì)I收767億

態(tài)度原創(chuàng)

游戲
旅游
本地
時(shí)尚
公開課

全球先鋒賽:爆大冷,Chovy又倒了!G2零封GEN,挺進(jìn)決賽

旅游要聞

千畝杏林迎客來,濟(jì)南南山柳埠街道解鎖春日度假新玩法

本地新聞

春色滿城關(guān)不?。B興春日頂流,這片櫻花海藏不住了

這些才是適合普通人借鑒的穿搭!衣服疊穿、多穿襯衫,好耐看

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版
×