国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛:龍蝦就是新操作系統(tǒng)!英偉達(dá)7種芯片拼出算力怪獸

0
分享至

夢(mèng)晨 henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

英偉達(dá)GTC 2026很不尋常,黃仁勛遲到了15分鐘。

今年有450家企業(yè)贊助、1000場(chǎng)技術(shù)分會(huì)、2000位演講者、110臺(tái)機(jī)器人,這樣的規(guī)模已經(jīng)不像一場(chǎng)技術(shù)會(huì)議,更像AI行業(yè)的年度朝圣

皮衣老黃站在舞臺(tái)中央,接受了新稱(chēng)號(hào)“Token之王”。



這次他沒(méi)有直奔芯片發(fā)布,而是花了整整一個(gè)小時(shí),從25年前的GeForce游戲顯卡講起,講到20年前的CUDA,講到10年前的RTX渲染技術(shù),講到云計(jì)算合作伙伴,再講到今天的爆火OpenClaw和token經(jīng)濟(jì)。

AI從感知到生成到推理再到執(zhí)行,每一步都需要生成更多token,消耗更多算力。

所有這一切鋪墊,只為引出一個(gè)數(shù)字:

英偉達(dá)到2027年?duì)I收預(yù)計(jì)至少達(dá)到1萬(wàn)億美元。

  • 去年GTC上,我看到了5000億美元的高確信需求。今年,站在同一個(gè)舞臺(tái)上,這個(gè)數(shù)字變成了1萬(wàn)億美元,覆蓋Blackwell和Rubin到2027年的訂單。
  • 而且我確定,實(shí)際需求會(huì)比這更高。

就在這個(gè)瞬間,與現(xiàn)場(chǎng)觀眾的掌聲和歡呼聲一同高漲的是英偉達(dá)股價(jià)。



Token工廠經(jīng)濟(jì)學(xué):老黃教全球CEO看一張圖

  • 只有英偉達(dá)的Keynote,你才會(huì)看到去年的slide再出現(xiàn)一次。

而老黃稱(chēng)這是全球CEO都要仔仔細(xì)細(xì)研究的一張圖。



縱軸是Token吞吐量(每瓦產(chǎn)出多少Token),橫軸是Token速率(每秒生成多少Token)。

吞吐量代表你的工廠產(chǎn)能,速率代表AI的“聰明程度”,模型越大、上下文越長(zhǎng)、思考越深,速率就越低,但每個(gè)Token越值錢(qián)。

老黃把這張圖變成了一套完整的商業(yè)模型。

免費(fèi)層:高吞吐、低速率,用來(lái)獲客。
中間層:$3-$6/百萬(wàn)Token,服務(wù)普通用戶(hù)。
高級(jí)層:$45/百萬(wàn)Token,大模型深度推理。
頂級(jí)層:$150/百萬(wàn)Token,超長(zhǎng)研究任務(wù)、關(guān)鍵路徑實(shí)時(shí)響應(yīng)。



去年Semi Analysis做了一次有史以來(lái)最大規(guī)模的AI推理基準(zhǔn)測(cè)試。結(jié)果顯示,Grace Blackwell NVLink 72的每瓦token吞吐量,比上一代Hopper H200高出50倍。

而黃仁勛自己說(shuō)說(shuō)的35倍。對(duì)此,Semi Analysis創(chuàng)始人公開(kāi)表示:“黃仁勛在sand bagging(故意保留余地)”。

老黃說(shuō)沒(méi)錯(cuò),我就說(shuō)故意的,實(shí)際是50倍,

每瓦性能決定了一切。

因?yàn)槊孔鶖?shù)據(jù)中心的功率都是物理約束,一座1GW的AI工廠永遠(yuǎn)不會(huì)變成2GW。在固定功率下,誰(shuí)的每瓦token產(chǎn)出更高,誰(shuí)的token成本就更低。

這就是Vera Rubin存在的理由:

作為下一代計(jì)算平臺(tái),再次將每瓦token吞吐量提高2-10倍。



Vera Rubin:十年千萬(wàn)倍加速

Hopper時(shí)代老黃還會(huì)舉起一塊芯片秀給觀眾看,但那個(gè)時(shí)代已經(jīng)結(jié)束了。

  • 去年我說(shuō)Hopper的時(shí)候,會(huì)舉起一塊芯片,那很可愛(ài)。
  • 但這是Vera Rubin,當(dāng)人們想到Vera Rubin,人們想到的是整個(gè)系統(tǒng)。



Vera Rubin是英偉達(dá)有史以來(lái)最復(fù)雜的AI計(jì)算系統(tǒng)。

7種芯片,5種機(jī)架,垂直集成、端到端優(yōu)化成一臺(tái)巨型計(jì)算機(jī):

  • Rubin GPU
  • 全新架構(gòu),支持NVLink 72全互聯(lián),3.6 exaflops算力,260TB/s全對(duì)全帶寬。
  • Vera CPU
  • 全新數(shù)據(jù)中心CPU,全球唯一采用LPDDR5的服務(wù)器處理器,單線程性能和能效比出色。老黃原本沒(méi)打算單獨(dú)賣(mài)CPU,但Vera賣(mài)得太好,這已經(jīng)確定是一個(gè)數(shù)十億美元的業(yè)務(wù)了。
  • Groq LP30
  • 世界上從未見(jiàn)過(guò)的第三代芯片,500MB片上SRAM,確定性數(shù)據(jù)流處理器,靜態(tài)編譯、軟件調(diào)度,專(zhuān)為推理而生。
  • BlueField 4 DPU + CX9網(wǎng)卡
  • 全新存儲(chǔ)平臺(tái),共同構(gòu)成了面向AI原生的全新存儲(chǔ)基礎(chǔ)設(shè)施。
  • NVLink Switch
  • 第六代NVLink交換芯片,提供大規(guī)模MoE模型所需的快速、無(wú)縫的GPU到GPU通信
  • Spectrum X CPO交換機(jī)
  • 全球首款量產(chǎn)的共封裝光學(xué)(Co-Packaged Optics)交換機(jī),電子直接轉(zhuǎn)光子。



在同一座1GW數(shù)據(jù)中心里,從Grace Blackwell到Vera Rubin + Groq,token生成速率從200萬(wàn)跳到7億?!?/p>

兩年時(shí)間,350倍。

摩爾定律在同樣的時(shí)間里能給多少?大約1.5倍。

350倍不是靠芯片上多塞幾個(gè)晶體管實(shí)現(xiàn)的。當(dāng)算力密度卷到這個(gè)程度,瓶頸早就轉(zhuǎn)移到了芯片之外:散熱和互聯(lián)。

Vera Rubin的答案是兩大變化,一個(gè)關(guān)于水,一個(gè)關(guān)于光

關(guān)于水,Vera Rubin采用100%液冷方案,連NVLink交換機(jī)都泡在液冷系統(tǒng)里。

互聯(lián)不再靠外部線纜,而是在液冷模塊內(nèi)部做板級(jí)/背板式集成互聯(lián)。

線纜全部消失了,過(guò)去安裝一個(gè)機(jī)架要兩天,現(xiàn)在兩小時(shí)。



關(guān)于光,黃仁勛舉起了世界首款量產(chǎn)的CPO(共封裝光學(xué))交換機(jī)



傳統(tǒng)交換機(jī)里,電信號(hào)從芯片出來(lái),經(jīng)過(guò)PCB走線,到達(dá)光模塊,在光模塊里完成電-光轉(zhuǎn)換,再通過(guò)光纖傳出去。每一次轉(zhuǎn)換都有延遲,每一段銅線都有損耗。

CPO把這條鏈路壓縮到極致:光學(xué)器件直接封裝到芯片上,電子在硅片表面就轉(zhuǎn)換成光子。 沒(méi)有光模塊,沒(méi)有銅線中轉(zhuǎn)。英偉達(dá)和TSMC聯(lián)合發(fā)明了一種叫CoUP的封裝工藝,目前全球只有英偉達(dá)在量產(chǎn)。

要讓72塊GPU實(shí)現(xiàn)260TB/s的全對(duì)全帶寬,如果還用傳統(tǒng)銅纜,信號(hào)跑不了太遠(yuǎn),機(jī)架尺寸就是物理極限。

CPO打破了這個(gè)限制,光子跑得更遠(yuǎn)、損耗更低、能效更高。

但銅纜和光學(xué)不是二選一。

黃仁勛被問(wèn)了太多次這個(gè)問(wèn)題,干脆一次說(shuō)清:

  • 我們都要,我們需要更多的銅纜產(chǎn)能,更多的光芯片產(chǎn)能,更多的CPO產(chǎn)能。

十年前的DGX-1,8塊Pascal GPU,170 TFLOPS。

十年后的Vera Rubin NVLink 72,3.6 ExaFLOPS。

十年,算力增長(zhǎng)四千萬(wàn)倍。



高吞吐的歸Rubin,低延遲的歸Groq

但還有一個(gè)問(wèn)題沒(méi)解決。

NVLink 72在高吞吐區(qū)間幾乎無(wú)敵,72塊GPU全對(duì)全互聯(lián),帶寬拉滿(mǎn)。

可一旦要求的不是400 token/秒,而是1000 token/秒的極速推理,NVLink 72的帶寬就不夠用了。

這就是Groq的故事。

英偉達(dá)在2025年底收購(gòu)了推理芯片公司Groq,后者以“LPU”(Language Processing Unit)著稱(chēng)。

Groq的架構(gòu)和英偉達(dá)GPU截然相反:它是一顆確定性數(shù)據(jù)流處理器,靜態(tài)編譯、編譯器調(diào)度,沒(méi)有動(dòng)態(tài)調(diào)度,片上堆了500MB的巨量SRAM,只干一件事,推理。



此前業(yè)界一直猜測(cè)英偉達(dá)會(huì)如何整合這項(xiàng)資產(chǎn)。

答案來(lái)了:不是替代GPU,而是與GPU協(xié)同。

一顆Groq芯片4GB SRAM,一顆Rubin芯片288GB HBM。

前者極致快,后者極致大。單獨(dú)用Groq,裝不下萬(wàn)億參數(shù)模型和海量KV cache;單獨(dú)用Rubin,推不到極速token生成。



英偉達(dá)的解法是分離式推理,用Dynamo推理框架把流水線拆開(kāi)。

Pre-fill和attention的計(jì)算量大,交給Vera Rubin;decode階段的token生成對(duì)帶寬敏感、對(duì)延遲敏感,卸載給Groq。

兩顆極端不同的處理器,通過(guò)以太網(wǎng)緊密耦合,延遲減半。



結(jié)果在最高價(jià)值的推理層級(jí)上,再提升35倍吞吐量。同時(shí)解鎖了此前根本不存在的新推理層級(jí),千token/秒級(jí)別的極速生成。

黃仁勛給出了配比建議:如果你的工作負(fù)載主要是高吞吐,100%上Vera Rubin就夠了。如果你有大量編程、工程級(jí)token生成需求,拿出25%的數(shù)據(jù)中心功率給Groq。

Groq 3芯片由三星代工,已經(jīng)量產(chǎn),預(yù)計(jì)Q3出貨。

而Vera Rubin的首個(gè)機(jī)架,已經(jīng)在微軟Azure云上跑起來(lái)了。



OpenClaw:AI時(shí)代的Linux時(shí)刻

發(fā)布會(huì)的最后一部分,老黃畫(huà)風(fēng)一轉(zhuǎn),開(kāi)始聊人類(lèi)歷史上最受歡迎的開(kāi)源項(xiàng)目OpenClaw。



OpenClaw能做什么,老黃舉例有人幫60歲的父親自動(dòng)化了整個(gè)精釀啤酒生意,藍(lán)牙連接釀造設(shè)備,自動(dòng)生成銷(xiāo)售網(wǎng)站,顧客可以直接下單“龍蝦拉格啤酒”。



但老黃更在意的是它的本質(zhì)。他用操作系統(tǒng)的語(yǔ)言重新定義了OpenClaw:

資源管理:可以調(diào)用大語(yǔ)言模型、訪問(wèn)文件系統(tǒng)、使用工具。

調(diào)度系統(tǒng):能做cron jobs、分步執(zhí)行、生成子Agent。

I/O系統(tǒng):多模態(tài)輸入輸出,你可以沖它揮手,它給你發(fā)郵件。

  • OpenClaw開(kāi)源了Agent計(jì)算機(jī)的操作系統(tǒng)。就像Windows讓我們創(chuàng)造了個(gè)人電腦,OpenClaw讓我們創(chuàng)造了個(gè)人Agent。

Windows→PC時(shí)代,Linux→服務(wù)器時(shí)代,HTML→互聯(lián)網(wǎng)時(shí)代,Kubernetes→云時(shí)代,OpenClaw→Agent時(shí)代。

每一次平臺(tái)轉(zhuǎn)移,都催生了一批改變世界的公司。

企業(yè)IT的全部邏輯即將改寫(xiě)。

老黃直接斷言:每家SaaS公司都將變成Agent-as-a-Service公司。



But!

Agent在企業(yè)網(wǎng)絡(luò)中能訪問(wèn)敏感信息、執(zhí)行代碼、對(duì)外通信,“你把這三件事連起來(lái)大聲說(shuō)出來(lái),再想一想……”

所以英偉達(dá)與OpenClaw合作推出了企業(yè)版NeMo Claw,加上了策略引擎、網(wǎng)絡(luò)護(hù)欄、隱私路由器。



老黃給出了他對(duì)未來(lái)企業(yè)的終極想象:

  • 未來(lái)每個(gè)工程師都會(huì)有一個(gè)年度Token預(yù)算。
  • 他們年薪幾十萬(wàn)美元,我會(huì)在此基礎(chǔ)上再給他們一半的金額作為T(mén)oken額度。

這已經(jīng)是硅谷的新招聘籌碼了:你的offer里帶多少Token?

Two More Thing

在發(fā)布會(huì)上,對(duì)于外界備受關(guān)注的下一代計(jì)算架構(gòu)Feynman(費(fèi)曼),老黃也做了預(yù)告,并表示計(jì)算架構(gòu),每年都會(huì)有新東西。



Feynman將帶來(lái)全新的GPU、LPU(LP?40)和CPU Rosa。

新一代的BlueField 5將連接下一代CPU與SuperNIC CX10,并配合新的Kyber技術(shù)實(shí)現(xiàn)銅線與光學(xué)雙擴(kuò)展——

這意味著,F(xiàn)eynman將首次同時(shí)支持銅線與光學(xué)封裝的水平擴(kuò)展。

老黃強(qiáng)調(diào),無(wú)論是銅線、光學(xué)還是CPO,未來(lái)都需要更高的容量與帶寬,這正是Feynman的核心突破。

此外,他還透露,NVIDIA 正與合作伙伴聯(lián)合開(kāi)發(fā)英偉達(dá)Space?One,一臺(tái)將部署在太空的數(shù)據(jù)中心計(jì)算機(jī),開(kāi)啟“太空算力”的新篇章。



太空中沒(méi)有對(duì)流,沒(méi)有傳導(dǎo),只有輻射散熱。

  • 我們得想辦法在太空里給GPU散熱。不過(guò)我們有很多優(yōu)秀的工程師在搞這件事。

把GPU送上近地軌道,這大概是“AI無(wú)處不在”最字面意義上的詮釋了。

直播回放:https://www.youtube.com/watch?v=jw_o0xr8MWU

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
遭外機(jī)雷達(dá)照射挑釁 殲-10C飛行員“奪槍反打”

遭外機(jī)雷達(dá)照射挑釁 殲-10C飛行員“奪槍反打”

環(huán)球網(wǎng)資訊
2026-03-28 11:15:53
熱火主帥斯波談慘敗騎士:哈登14次助攻教訓(xùn)我隊(duì)狂妄

熱火主帥斯波談慘敗騎士:哈登14次助攻教訓(xùn)我隊(duì)狂妄

老皢尾聲體育解說(shuō)
2026-03-29 04:41:52
80年我提干營(yíng)長(zhǎng),妹妹懷孕來(lái)看望我,可首長(zhǎng)見(jiàn)到她卻當(dāng)場(chǎng)愣住了

80年我提干營(yíng)長(zhǎng),妹妹懷孕來(lái)看望我,可首長(zhǎng)見(jiàn)到她卻當(dāng)場(chǎng)愣住了

紅豆講堂
2025-03-22 10:30:08
特朗普最怕的來(lái)了,關(guān)鍵時(shí)刻,中國(guó)加入戰(zhàn)斗,商務(wù)部:對(duì)美調(diào)查

特朗普最怕的來(lái)了,關(guān)鍵時(shí)刻,中國(guó)加入戰(zhàn)斗,商務(wù)部:對(duì)美調(diào)查

無(wú)情有思ss
2026-03-29 08:15:14
朱拉尼搶奪伊朗戰(zhàn)爭(zhēng)紅利,土耳其突然宣布,要把敘利亞石油接入伊土戰(zhàn)略管道

朱拉尼搶奪伊朗戰(zhàn)爭(zhēng)紅利,土耳其突然宣布,要把敘利亞石油接入伊土戰(zhàn)略管道

楓紅染山徑
2026-03-29 08:19:48
65歲男人和37歲女人再婚,女人:他老折騰我,男人:夫妻就這樣

65歲男人和37歲女人再婚,女人:他老折騰我,男人:夫妻就這樣

惟來(lái)
2026-03-28 11:12:08
難怪醫(yī)藥股暴漲,龍頭利潤(rùn)暴漲352%,5個(gè)龍頭利潤(rùn)翻倍,17股大增

難怪醫(yī)藥股暴漲,龍頭利潤(rùn)暴漲352%,5個(gè)龍頭利潤(rùn)翻倍,17股大增

風(fēng)風(fēng)順
2026-03-28 20:35:18
山東一男嬰日夜啼哭,母親掀開(kāi)被子后,將月嫂當(dāng)場(chǎng)掐死

山東一男嬰日夜啼哭,母親掀開(kāi)被子后,將月嫂當(dāng)場(chǎng)掐死

罪案洞察者
2025-03-31 09:35:41
小學(xué)生入學(xué)年齡將調(diào)整?9月1日起幼兒園入學(xué)年齡有新變化

小學(xué)生入學(xué)年齡將調(diào)整?9月1日起幼兒園入學(xué)年齡有新變化

一口娛樂(lè)
2026-03-29 04:00:36
68歲陳忠和近況:四口之家很幸福,女兒系前妻生,趙蕊蕊常去探望

68歲陳忠和近況:四口之家很幸福,女兒系前妻生,趙蕊蕊常去探望

白面書(shū)誏
2026-03-21 16:13:21
美國(guó)商務(wù)部:在美國(guó)制裁下,中國(guó)休想大批量制造的AI芯片

美國(guó)商務(wù)部:在美國(guó)制裁下,中國(guó)休想大批量制造的AI芯片

顧史
2026-03-24 19:56:17
手機(jī)放床頭輻射傷身?央視實(shí)驗(yàn)給出答案:這樣放手機(jī),輻射降10倍

手機(jī)放床頭輻射傷身?央視實(shí)驗(yàn)給出答案:這樣放手機(jī),輻射降10倍

天氣觀察站
2026-03-24 19:02:53
張雪峰為什么配享太廟

張雪峰為什么配享太廟

黔有虎
2026-03-28 17:25:42
“華人神探”李昌鈺美國(guó)家中去世 四個(gè)月前回國(guó)時(shí)老態(tài)龍鐘 輪椅代步

“華人神探”李昌鈺美國(guó)家中去世 四個(gè)月前回國(guó)時(shí)老態(tài)龍鐘 輪椅代步

娛樂(lè)的硬糖吖
2026-03-28 16:49:28
一家子全是美籍,卻還在國(guó)內(nèi)“撈金”,年賺4億,賬上還存有130億

一家子全是美籍,卻還在國(guó)內(nèi)“撈金”,年賺4億,賬上還存有130億

云景侃記
2026-02-26 23:05:22
張凌赫事件持續(xù)升級(jí)!官方點(diǎn)名怒批,粉絲正面硬剛,這下恐要涼涼

張凌赫事件持續(xù)升級(jí)!官方點(diǎn)名怒批,粉絲正面硬剛,這下恐要涼涼

秋風(fēng)悲畫(huà)芯
2026-03-29 04:06:41
萬(wàn)萬(wàn)沒(méi)想到!不起眼的馬來(lái)西亞竟率先掀桌子,廢除對(duì)美貿(mào)易協(xié)定

萬(wàn)萬(wàn)沒(méi)想到!不起眼的馬來(lái)西亞竟率先掀桌子,廢除對(duì)美貿(mào)易協(xié)定

橙色書(shū)卷
2026-03-28 19:05:05
拔蘿卜帶泥!逃往美國(guó)的恒大“二把手”,鄰居卻是另一名潛逃富豪

拔蘿卜帶泥!逃往美國(guó)的恒大“二把手”,鄰居卻是另一名潛逃富豪

二大爺觀世界
2026-03-14 18:43:53
詐騙13.9億,千萬(wàn)豪車(chē),成堆金條被拍,才知王麗坤夫婦究竟多奢靡

詐騙13.9億,千萬(wàn)豪車(chē),成堆金條被拍,才知王麗坤夫婦究竟多奢靡

傲傲講歷史
2026-03-09 02:50:57
最后5米!菲律賓用仁愛(ài)礁同款戰(zhàn)艦硬剛054,中國(guó)戰(zhàn)艦喊話(huà)失效

最后5米!菲律賓用仁愛(ài)礁同款戰(zhàn)艦硬剛054,中國(guó)戰(zhàn)艦喊話(huà)失效

健身狂人
2026-03-28 20:30:43
2026-03-29 09:40:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12362文章數(shù) 176427關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

牛彈琴:特朗普親口對(duì)沙特說(shuō)出傲慢的話(huà) 全世界不敢相信

頭條要聞

牛彈琴:特朗普親口對(duì)沙特說(shuō)出傲慢的話(huà) 全世界不敢相信

體育要聞

全球第二大車(chē)企,也救不了這支德甲隊(duì)?

娛樂(lè)要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財(cái)經(jīng)要聞

臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

汽車(chē)要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

教育
房產(chǎn)
數(shù)碼
健康
公開(kāi)課

教育要聞

“黃毛的爹,酗酒的媽”,上海三口之家火了,只有孩子看著不叛逆

房產(chǎn)要聞

首日430組來(lái)訪,單日120組認(rèn)籌!??谑讉€(gè)真四代,徹底爆了!

數(shù)碼要聞

小心假冒偽劣硬盤(pán):山寨版三星990 Pro SSD已能偽造讀寫(xiě)速度

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版