国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

黃仁勛的Token經(jīng)濟學

0
分享至

防走失,電梯直達安全島


來源:經(jīng)濟觀察報

來源:鄭晨燁


黃仁勛的這場演講值得仔細看的地方不在于萬億美元這個數(shù)字本身,而在于他用兩個小時講了一套新的商業(yè)邏輯:數(shù)據(jù)中心正在從訓練模型的地方,變成生產(chǎn)Token的工廠。

封圖:英偉達官網(wǎng)


素有AI行業(yè)年度風向標之稱的英偉達GTC大會,今年3月16日至19日在美國加利福尼亞州圣何塞舉行。

當?shù)貢r間3月16日上午11點,也就是北京時間3月17日凌晨2點,英偉達CEO黃仁勛在圣何塞SAP中心發(fā)表了超過兩小時的主題演講。

黃仁勛在演講中預(yù)測,到2027年全球AI基礎(chǔ)設(shè)施相關(guān)需求將達到1萬億美元。他還說,實際需求可能會比1萬億美元高得多,英偉達的產(chǎn)品甚至會供不應(yīng)求。

這個數(shù)字發(fā)布后,英偉達美股股價瞬時跳漲超過4%。但幾個小時后A股開盤,算力產(chǎn)業(yè)鏈股票集體下跌,天孚通信(300394.SZ)收盤跌幅超10%,長光華芯(688048.SH)收盤跌幅亦達9.72%,多數(shù)龍頭股回吐了近5日漲幅。

一邊是萬億美元預(yù)期,一邊是產(chǎn)業(yè)鏈股票大跌,落差來自時間尺度。

黃仁勛講的是未來的需求預(yù)期,而他預(yù)告的下一代Feynman芯片架構(gòu)要到2028年才上市。另外,萬聯(lián)證券在3月16日發(fā)布的研報中指出,A股電子板塊截至3月15日的平均市盈率約為82倍,市場或在擔心“高處不勝寒”。

但黃仁勛的這場演講值得仔細看的地方不在于萬億美元這個數(shù)字本身,而在于他用兩個小時講了一套新的商業(yè)邏輯:數(shù)據(jù)中心正在從訓練模型的地方,變成生產(chǎn)Token的工廠。

Token工廠

Token是大語言模型處理信息的基本單位,可以粗略理解為AI處理或生成的文字片段,一個漢字大約對應(yīng)一到兩個Token。

過去兩年,Token的消耗量發(fā)生了幾次量級上的跳躍。

黃仁勛在演講中把這件事追溯到了三個節(jié)點:2022年底ChatGPT上線,AI學會了生成內(nèi)容,開始大量消耗Token;ChatGPT o1模型出現(xiàn)后,AI學會了推理和反思,為了思考,它要在內(nèi)部生成大量Token給自己看;Claude Code(Anthropic公司開發(fā)的AI編程工具)發(fā)布后,AI能讀取文件、編寫代碼、編譯測試,每完成一個任務(wù)消耗的Token比簡單對話多出好幾個數(shù)量級。

黃仁勛提到,英偉達所有的軟件工程師都在用AI輔助編程。

AI的工作分兩個階段:訓練是讓模型變聰明的過程,需要花一次大錢把模型練出來;推理是模型干活的過程,每天都在發(fā)生,需求也越來越大。過去全球買GPU(圖形處理器,目前AI計算的核心硬件)主要是為了訓練,現(xiàn)在重心已經(jīng)在向推理轉(zhuǎn)移。

黃仁勛說,推理服務(wù)商的業(yè)務(wù)規(guī)模過去一年增長了100倍。IDC中國分析師杜昀龍也告訴經(jīng)濟觀察報記者,目前國內(nèi)推理服務(wù)器不論增速還是占比均已超過訓練,從服務(wù)器出貨金額來看,推理占比已接近60%。

推理的需求在爆發(fā),但Token還沒有形成市場定價體系。

黃仁勛在演講中給出了他認為未來會出現(xiàn)的五檔價格:免費層,Token產(chǎn)出量大但響應(yīng)速度慢;中等層,每百萬Token約3美元;高級層,每百萬Token約6美元;高速層,每百萬Token約45美元;頂級層,每百萬Token約150美元。模型越大、上下文越長、響應(yīng)速度越快,Token就越貴。

他以頂級層舉了個例子:一個研究團隊每天用5000萬Token,按每百萬Token150美元來算也就只有7500美元,對企業(yè)來說不算什么。上下文窗口從32K個Token拉到400K個Token之后,AI能一次性讀完一整份合同或一整個代碼庫,價格對應(yīng)的是此前做不了的事情。

有了分層定價,數(shù)據(jù)中心的經(jīng)濟模型就變了。

黃仁勛說,每一座數(shù)據(jù)中心都受電力限制,一座1GW(吉瓦,一種電力計量單位)的數(shù)據(jù)中心永遠不會變成2GW,這是電力和土地決定的。在固定功率下,誰消耗每瓦電力能產(chǎn)出的Token最多,誰的生產(chǎn)成本就最低。也就是說,同樣耗一度電,誰能生產(chǎn)更多Token,誰就能賺得更多。

他在演講時展示了一組數(shù)字:同一個1GW數(shù)據(jù)中心,假設(shè)把算力分配給不同價格層級,使用英偉達當前的Blackwell架構(gòu)年營收約300億美元,換成新一代Vera Rubin約1500億美元,再加上Groq LPU推理加速器約3000億美元。同一座數(shù)據(jù)中心,換一套設(shè)備,營收可以相差10倍。

英偉達2026財年全年營收2159億美元,數(shù)據(jù)中心業(yè)務(wù)貢獻了其中的1937億美元。

按黃仁勛的邏輯,客戶現(xiàn)有的數(shù)據(jù)中心還沒有被充分利用,換上新一代設(shè)備,同樣的電力條件下收入可以翻好幾倍。萬億美元預(yù)期就是這么來的,不是芯片漲價,是同樣的電力能生產(chǎn)出更多、更貴的Token。

黃仁勛說,未來每一位CEO都會盯著自己Token工廠的效能,因為那直接就是收入。

他還描述了一個正在硅谷出現(xiàn)的變化:現(xiàn)在越來越多工程師日常用AI寫代碼、做研究、處理文檔,這些操作都要消耗Token,企業(yè)需要為員工使用AI的開銷買單。

黃仁勛預(yù)測這筆開銷會大到需要單獨列預(yù)算,就像企業(yè)給員工配電腦和軟件一樣。

他還說,未來每個工程師入職時都會拿到一份年度Token預(yù)算,金額大約相當于基礎(chǔ)薪資的一半。

兩種芯片

黃仁勛的這套Token經(jīng)濟學對應(yīng)的硬件,是GTC上正式發(fā)布的Vera Rubin平臺。

黃仁勛在演講中說,過去談Hopper架構(gòu)的時候他會舉起一塊芯片,但Vera Rubin不是一塊芯片的事,它是一整個系統(tǒng)。這套系統(tǒng)做到了百分之百的液冷,安裝時間從過去的兩天壓縮到了兩個小時。

Vera Rubin由七款芯片組成。核心機架NVL72集成72顆Rubin GPU和36顆Vera CPU,通過NVLink 6(英偉達自研的芯片間高速互連技術(shù))相連。與上一代Blackwell相比,每瓦推理吞吐量最高提升10倍,單Token成本降至十分之一。

英偉達同時發(fā)布了全新88核Vera CPU,為AI智能體場景下的工具調(diào)用和數(shù)據(jù)處理做了專門優(yōu)化。

黃仁勛在演講中稱,微軟CEO納德拉已向他確認,首批Vera Rubin機架已在Azure(微軟的云計算平臺)上運行。

但Vera Rubin有一個短板,黃仁勛在演講時說,當每個用戶每秒需要生成超過400個Token時,NVL72的帶寬就不夠用了。補上這個缺口的,是Groq這家成立于2016年的美國AI加速芯片公司。英偉達此前收購了Groq的技術(shù)授權(quán)和核心團隊。

Groq的LPU(語言處理單元)和GPU是完全不同的兩種芯片。GPU內(nèi)存大、算力強,單顆Rubin GPU有288GB內(nèi)存,適合處理復(fù)雜計算。LPU內(nèi)存小但讀寫速度極快,單顆只有500MB存儲,裝不下大模型的完整參數(shù),但生成Token的速度和延遲遠優(yōu)于GPU。

英偉達通過一套叫Dynamo的推理調(diào)度軟件,把推理過程拆成了兩步:需要大量算力和內(nèi)存的上下文理解交給Vera Rubin處理,對延遲敏感的Token生成交給Groq LPU。兩者通過以太網(wǎng)高速連接協(xié)同工作,延遲減少約一半。

黃仁勛管這種方式叫解耦推理(即把推理過程拆分給不同芯片處理),核心想法是承認高吞吐和低延遲天然矛盾,不如讓兩種芯片各干各擅長的事。

他說,這套組合在45美元和150美元的高價格層級實現(xiàn)了相比上一代35倍的性能提升。

從更長的時間維度看,同一個1GW的數(shù)據(jù)中心,兩年時間,Token生成速率可以從每秒2200萬提升到7億。

黃仁勛給客戶的建議是,如果工作以高吞吐的批量推理為主,就完全用Vera Rubin;如果有大量編程、實時交互等需求,可以拿出25%的數(shù)據(jù)中心算力配Groq LPU。

黃仁勛表示,Groq 3 LPU由三星代工,已在量產(chǎn),預(yù)計今年三季度出貨。

軟件方面,英偉達發(fā)布了企業(yè)級智能體平臺NemoClaw,支持近期火爆的開源項目OpenClaw。OpenClaw在幾周之內(nèi)成為GitHub(全球最大的開源代碼托管平臺)上增長最快的開源項目,黃仁勛把它的地位抬到和Linux同一級別,說它是智能體計算機的操作系統(tǒng)。

但企業(yè)環(huán)境下直接用開源的OpenClaw有安全風險,因為智能體可以訪問公司的敏感數(shù)據(jù)、執(zhí)行代碼和外部通信。NemoClaw就是英偉達給OpenClaw加上的企業(yè)安全層。Adobe、Salesforce、SAP等17家企業(yè)軟件公司已宣布采用英偉達的Agent Toolkit(智能體開發(fā)工具包)。

路線圖方面,英偉達預(yù)告了2028年上市的下一代Feynman架構(gòu),首次同時支持銅纜和CPO(將光通信元件直接集成到芯片上的技術(shù))兩種互連方式。

今年也是CUDA(英偉達開發(fā)的GPU通用計算平臺,被視為英偉達軟件生態(tài)的基石)誕生20周年。據(jù)黃仁勛在演講中介紹,英偉達目前60%的業(yè)務(wù)來自全球前五大云服務(wù)商,另外40%分布在主權(quán)AI、企業(yè)、工業(yè)、機器人等各個領(lǐng)域。

在本次GTC大會上,英偉達還宣布了與Uber、比亞迪、吉利、現(xiàn)代、日產(chǎn)、五十鈴在自動駕駛領(lǐng)域的合作。受此消息推動,港股汽車板塊17日集體走強,吉利汽車(00175.HK)盤中一度漲超5%,最終收漲4.55%。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
你是怎么發(fā)現(xiàn)老婆出軌的?網(wǎng)友匿名分享真實經(jīng)歷,一個比一個扎心

你是怎么發(fā)現(xiàn)老婆出軌的?網(wǎng)友匿名分享真實經(jīng)歷,一個比一個扎心

大熊歡樂坊
2026-04-20 02:29:01
斯諾克世錦賽太殘酷了:隨著周躍龍6-10,已有2名中國選手止步32強

斯諾克世錦賽太殘酷了:隨著周躍龍6-10,已有2名中國選手止步32強

側(cè)身凌空斬
2026-04-20 08:42:16
上海偶遇李晨吃包子,看著挺壯實一人,晚飯居然就吃三個包子

上海偶遇李晨吃包子,看著挺壯實一人,晚飯居然就吃三個包子

悅君兮君不知
2026-04-19 13:21:45
持續(xù)三個世紀的仇恨難解,85%民眾痛斥中國,瑞典為何如此反華?

持續(xù)三個世紀的仇恨難解,85%民眾痛斥中國,瑞典為何如此反華?

音樂時光的娛樂
2026-04-19 16:54:01
小寶與王某雷,誰探訪花的數(shù)量更多?

小寶與王某雷,誰探訪花的數(shù)量更多?

挪威森林
2026-01-31 12:15:26
中美人均GDP差距:1995年只有美國的2%,2010年是9.5%,現(xiàn)在呢?

中美人均GDP差距:1995年只有美國的2%,2010年是9.5%,現(xiàn)在呢?

壹號股權(quán)
2026-04-19 19:25:03
尷尬的“清零”儀式后 御林軍殘陣迎接魔鬼賽程大考

尷尬的“清零”儀式后 御林軍殘陣迎接魔鬼賽程大考

體壇周報
2026-04-20 09:15:23
張豆豆曝孫楊干涉自己交友:他被好幾個朋友重創(chuàng)過

張豆豆曝孫楊干涉自己交友:他被好幾個朋友重創(chuàng)過

懂球帝
2026-04-17 10:55:07
東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
最近你發(fā)現(xiàn)沒有,好多城市的路口、天橋底下,突然冒出一群怪人。

最近你發(fā)現(xiàn)沒有,好多城市的路口、天橋底下,突然冒出一群怪人。

阿振觀點
2026-04-20 06:02:48
朱丹揭露張豆豆對孫楊態(tài)度: 孩子發(fā)燒也不在乎,家庭究竟何在?

朱丹揭露張豆豆對孫楊態(tài)度: 孩子發(fā)燒也不在乎,家庭究竟何在?

科學發(fā)掘
2026-04-20 07:17:30
山東贏8分!廣廈13分大勝!北京5分險勝,排名大變,官宣重罰山西

山東贏8分!廣廈13分大勝!北京5分險勝,排名大變,官宣重罰山西

老吳說體育
2026-04-19 21:51:59
提到本山大叔家的公子趙大牛,他的座駕在沈陽街頭可算相當拉風。

提到本山大叔家的公子趙大牛,他的座駕在沈陽街頭可算相當拉風。

情感大頭說說
2026-04-12 05:21:17
一個害國害民的歷史罪人,老百姓還把他當成英雄崇拜

一個害國害民的歷史罪人,老百姓還把他當成英雄崇拜

小豫講故事
2026-04-19 06:00:10
太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

橙星文娛
2026-04-17 13:19:56
45歲宋佳:陪玩陪睡、風流成性傳聞?wù)嫦嘟颐?>
    </a>
        <h3>
      <a href=暗香暗香
2026-03-23 04:26:38
多名院士調(diào)查發(fā)現(xiàn):喝一次酒,就等于洗一次肝,真的假的?

多名院士調(diào)查發(fā)現(xiàn):喝一次酒,就等于洗一次肝,真的假的?

路醫(yī)生健康科普
2026-04-20 08:58:55
華誼虧損超82億,不放棄事業(yè)不整容的羅海瓊,才是最清醒的老板娘

華誼虧損超82億,不放棄事業(yè)不整容的羅海瓊,才是最清醒的老板娘

一盅情懷
2026-04-18 08:08:54
一覺醒來美伊又開火了!多艘美艦遭襲!美軍要在全球打擊伊朗船只

一覺醒來美伊又開火了!多艘美艦遭襲!美軍要在全球打擊伊朗船只

暮色史觀
2026-04-20 08:30:30
“雙一流”副校長,任大學黨委書記

“雙一流”副校長,任大學黨委書記

EOL教育在線
2026-04-20 09:07:31
2026-04-20 10:35:00
報人劉亞東 incentive-icons
報人劉亞東
不唯上,不唯書,只唯實。
5867文章數(shù) 43352關(guān)注度
往期回顧 全部

財經(jīng)要聞

月之暗面IPO迷局

頭條要聞

媒體:日本近期一系列危險動作挑釁中國 中國需警惕

頭條要聞

媒體:日本近期一系列危險動作挑釁中國 中國需警惕

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

科技要聞

藍色起源一級火箭完美回收 客戶衛(wèi)星未入軌

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

親子
數(shù)碼
旅游
健康
公開課

親子要聞

這睡眠質(zhì)量也太高了

數(shù)碼要聞

內(nèi)存供應(yīng)短缺迫使蘋果推遲新Mac Studio與觸控屏MacBook Pro發(fā)布

旅游要聞

谷雨時節(jié),赴一場牡丹與蝴蝶的浪漫之約

干細胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版