国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI算力的瓶頸已不是電,而是半導(dǎo)體供應(yīng)鏈

0
分享至

2026 年,全球四大科技巨頭亞馬遜、Meta、谷歌和微軟的資本支出預(yù)測(cè)總額達(dá)到 6,000 億美元。換算成數(shù)據(jù)中心的年租賃價(jià)格,大約對(duì)應(yīng) 50 GW(吉瓦)的算力容量。與此同時(shí),OpenAI 剛剛完成 1,100 億美元融資,Anthropic 官宣了 300 億美元的新一輪募資。錢到位了,但這些錢到底能不能變成真正運(yùn)轉(zhuǎn)的芯片和數(shù)據(jù)中心?

半導(dǎo)體研究機(jī)構(gòu) SemiAnalysis 創(chuàng)始人兼 CEO Dylan Patel 近日做客 Dwarkesh Patel 的播客節(jié)目,就 AI 算力擴(kuò)展的核心瓶頸進(jìn)行了一次信息量極高的深度對(duì)話。Dylan 長(zhǎng)期追蹤全球半導(dǎo)體供應(yīng)鏈和 AI 基礎(chǔ)設(shè)施建設(shè),SemiAnalysis 的客戶涵蓋超級(jí)云廠商、AI 實(shí)驗(yàn)室和對(duì)沖基金,其數(shù)據(jù)和預(yù)測(cè)在行業(yè)內(nèi)被廣泛引用。


圖丨 Dylan Patel(來源:Youtube)

對(duì)話核心要點(diǎn)如下:

?6,000 億美元資本支出的真相:四大科技巨頭今年的資本支出中,大量用于未來數(shù)年的前置投入(渦輪機(jī)定金、數(shù)據(jù)中心建設(shè)、電力協(xié)議),而非今年直接上線的算力。美國(guó)今年新增約 20 GW 數(shù)據(jù)中心容量。

?Anthropic 的算力困境:收入增速遠(yuǎn)超預(yù)期(1 月 +40 億、2 月 +60 億 ARR),年底需要超過 5 GW 才能滿足推理和訓(xùn)練需求,但因此前采購過于保守,不得不接受更高價(jià)格或更大比例的收入分成來獲取算力。OpenAI 因激進(jìn)簽約獲得了顯著的算力先發(fā)優(yōu)勢(shì)。

?H100 今天比三年前更值錢:因?yàn)楦鼜?qiáng)的模型(如 GPT-5.4)能從同一顆芯片中榨取更多價(jià)值,而芯片供給始終有限,其定價(jià)取決于芯片能產(chǎn)生的經(jīng)濟(jì)價(jià)值,而非替代品的比較價(jià)格。

?瓶頸已從電力轉(zhuǎn)向芯片制造:2026 年最大瓶頸不再是電力或數(shù)據(jù)中心,而是半導(dǎo)體供應(yīng)鏈本身,邏輯晶圓、內(nèi)存和晶圓廠產(chǎn)能。

?ASML 是終極天花板:每 GW AI 算力需要約 3.5 臺(tái) EUV 光刻機(jī)。ASML 目前年產(chǎn)約 70 臺(tái),到 2030 年最多約 100 臺(tái)。全球存量加增量到 2030 年底約 700 臺(tái),理論上限約 200 GW,12 億美元的光刻設(shè)備卡住了 500 億美元的數(shù)據(jù)中心投資。ASML 的供應(yīng)鏈(蔡司透鏡、Cymer 光源等)極度復(fù)雜且手工化,無法快速擴(kuò)產(chǎn)。

?內(nèi)存危機(jī)正在到來:內(nèi)存廠商過去數(shù)年未建新廠,新產(chǎn)能最早 2027 年底才能上線。HBM 每晶圓面積比特?cái)?shù)僅為普通 DRAM 的 1/4,但帶寬高一個(gè)數(shù)量級(jí),無法用 DDR 替代。內(nèi)存漲價(jià)將導(dǎo)致智能手機(jī)出貨量從 11 億部驟降至 5-6 億部,中低端機(jī)型首當(dāng)其沖。

?回到 7 納米不現(xiàn)實(shí):雖然舊制程有存量產(chǎn)能,但 Hopper 與 Blackwell 在實(shí)際推理場(chǎng)景中的性能差距達(dá) 20 倍(非 FLOPS 暗示的 2-3 倍),因?yàn)樾酒瑑?nèi)通信帶寬、封裝密度、網(wǎng)絡(luò)架構(gòu)等優(yōu)勢(shì)層層疊加。

?電力不是主要瓶頸:除聯(lián)合循環(huán)燃?xì)廨啓C(jī)外,還有航改燃機(jī)、往復(fù)式發(fā)動(dòng)機(jī)、船用發(fā)動(dòng)機(jī)、燃料電池、太陽能 + 儲(chǔ)能等十余種技術(shù)路線,每種可貢獻(xiàn)數(shù)十 GW,合計(jì)可達(dá)數(shù)百 GW。釋放美國(guó)電網(wǎng) 20% 的峰值冗余容量即可獲得 200+ GW。

?太空數(shù)據(jù)中心這十年不可行:芯片是最稀缺資源,部署到太空額外延遲 6 個(gè)月以上;衛(wèi)星間通信帶寬遠(yuǎn)不及地面 NVLink;散熱更困難;可靠性更差。唯有芯片不再是瓶頸且地面資源耗盡時(shí),太空方案才有意義。

?快時(shí)間線美國(guó)贏,慢時(shí)間線中國(guó)贏:如果 AI 收入和能力快速起飛,美國(guó)的基礎(chǔ)設(shè)施和模型優(yōu)勢(shì)在擴(kuò)大;如果到 2035 年 AGI 才成熟,中國(guó)有足夠時(shí)間建立完全自主的垂直整合半導(dǎo)體供應(yīng)鏈。

以下是這期節(jié)目的完整編譯。

為什么 H100 現(xiàn)在的價(jià)值比三年前更高

Dwarkesh:如果把四大科技巨頭今年的資本支出加在一起是 6,000 億美元,按每 GW 數(shù)據(jù)中心年租金大約 130 億美元來算,接近 50 GW。但我們今年顯然不可能一下子部署 50 GW,那這些資本支出到底什么時(shí)候才能變成真正上線的算力?

另外,AI 實(shí)驗(yàn)室也在瘋狂融資,OpenAI 融了 1,100 億,Anthropic 融了 300 億。如果看它們今年實(shí)際上線的算力,加上租賃成本,這些融資似乎單獨(dú)就夠覆蓋今年的算力支出了,還不算它們會(huì)賺到的收入。所以第一,大型科技公司的資本支出到底什么時(shí)候轉(zhuǎn)化為上線算力?第二,實(shí)驗(yàn)室融這么多錢到底要干什么?

Dylan:6,000 億美元的超級(jí)云廠商資本支出,加上供應(yīng)鏈其他環(huán)節(jié)的開支,總額接近 1 萬億美元。其中一部分確實(shí)直接用于今年上線的芯片和算力,但還有大量的前置性資本支出。我們今年在美國(guó)大約新增 20 GW 的增量數(shù)據(jù)中心容量,但其中不少資本支出其實(shí)是去年花出去的。

以谷歌 1,800 億美元為例,很大一塊花在了 2028、2029 年的渦輪機(jī)定金,還有 2027 年的數(shù)據(jù)中心建設(shè)、長(zhǎng)期電力采購協(xié)議的預(yù)付款等等。微軟、亞馬遜和 Meta 也是類似的情況,它們花這些錢是為了后續(xù)幾年的超高速擴(kuò)張鋪路。

而這些公司最大的客戶就是 Anthropic 和 OpenAI。OpenAI 目前大約有 2 到 2.5 GW 的算力,Anthropic 大約在 1.5 GW 左右,兩家都在拼命往上擴(kuò)。

如果看 Anthropic 最近幾個(gè)月的收入走勢(shì),1 月新增約 40 億美元 ARR(年化經(jīng)常性收入),2 月是短月,居然新增了大約 60 億美元。有人甚至?xí)f這個(gè)線性外推還是偏保守的。按這個(gè)速度算,未來 10 個(gè)月 Anthropic 會(huì)新增大約 600 億美元的收入。

以目前媒體報(bào)道的毛利率推算,對(duì)應(yīng)大約 400 億美元的算力支出。按每 GW 約 100 億美元的租賃成本計(jì)算,Anthropic 光是為了支撐推理收入增長(zhǎng)就需要新增 4 GW。這還是假設(shè)它的研發(fā)訓(xùn)練集群規(guī)模保持不變。所以 Anthropic 今年年底需要達(dá)到遠(yuǎn)超 5 GW,才能滿足需求,但這對(duì)它來說將非常艱難。

Dwarkesh:所以如果 Anthropic 不可能在年底達(dá)到 5 GW,但收入的瘋狂增長(zhǎng)和下一代模型訓(xùn)練都需要這些算力,它該怎么辦?

Dylan:Dario 之前在你的播客上說過,他不會(huì)在算力上瘋狂下注,因?yàn)槿f一收入拐點(diǎn)來得比預(yù)期晚,他不想公司破產(chǎn),要負(fù)責(zé)任地?cái)U(kuò)張。但實(shí)際上,他確實(shí)在算力采購上比 OpenAI 保守太多了。OpenAI 的策略一直是直接簽下那些看起來瘋狂的大合約。結(jié)果到年底,OpenAI 的算力獲取遠(yuǎn)多于 Anthropic。

Anthropic 最優(yōu)質(zhì)的算力供應(yīng)商歷來是谷歌和亞馬遜,也就是世界上最大的幾家公司。OpenAI 就激進(jìn)得多,除了從微軟拿到大量算力,還拿了谷歌、亞馬遜的算力,同時(shí)跟 CoreWeave、Oracle 簽了巨量合約,甚至找到像 SoftBank Energy 這種從來沒建過數(shù)據(jù)中心的公司來給它建數(shù)據(jù)中心。還有 N Scale 等各種新興供應(yīng)商。

所以 Anthropic 面臨一個(gè)困境。它太保守了,簽合同時(shí)故意低估自己的需求,以免破產(chǎn)。而 OpenAI 呢,去年下半年確實(shí)有一段時(shí)間整個(gè)金融市場(chǎng)都在恐慌:“OpenAI 簽了這么多合約,它根本沒錢付”,Oracle 的股票暴跌,CoreWeave 的股票暴跌,信用市場(chǎng)也跟著慌。結(jié)果現(xiàn)在好了,OpenAI 融到錢了,可以付了。

Dwarkesh:那我想理解的是,“臨時(shí)搶算力”到底意味著什么?是 Neo Cloud(新興云服務(wù)商)的硬件質(zhì)量更差?還是說你得給云服務(wù)商額外付高額利潤(rùn),因?yàn)槟銇淼锰砹??如?OpenAI 和 Anthropic 到 2027 年算力規(guī)模差不多,那 OpenAI 到底得到了什么具體好處?今年年底兩家各有多少 GW?

Dylan:要獲取額外算力,確實(shí)有一些存量可用。不是所有的算力合約都是五年長(zhǎng)約,也有一年、兩年、六個(gè)月甚至按需的短期合約。當(dāng)這些合約到期時(shí),誰最愿意出高價(jià)?我們已經(jīng)看到 H100 的價(jià)格大幅上漲,有些 AI 實(shí)驗(yàn)室,我就不點(diǎn)名了,他們?cè)诤灻啃r(shí) 2.4 美元、為期兩到三年的 H100 合約。要知道 H100 的五年部署成本大約是每小時(shí) 1.4 美元,而現(xiàn)在兩年后你簽的合約已經(jīng)到了 2.4 美元,利潤(rùn)率高得多。

所以你可以用高價(jià)格把其他供應(yīng)商的客戶擠出去,不管是亞馬遜、CoreWeave、Together AI 還是 Nebius。這些 Neo Cloud 的特點(diǎn)是 Hopper 占比更高(因?yàn)樗鼈兏みM(jìn)地采購了),而且很多簽的是短期合約。所以如果你想要 Hopper 算力,市面上確實(shí)還有一些。至于 Blackwell,基本上所有在本季度上線的算力都已經(jīng)賣掉了。而且有些供應(yīng)商實(shí)際交付的量還達(dá)不到承諾的數(shù)字,因?yàn)閿?shù)據(jù)中心建設(shè)有延誤。

但還有一種路徑,Anthropic 不必直接持有所有算力。亞馬遜可以通過 Bedrock 提供算力為 Anthropic 服務(wù),谷歌可以通過 Vertex,微軟可以通過 Foundry,然后跟 Anthropic 做收入分成。

Dwarkesh:所以你是說,Anthropic 要么接受 50% 的收入分成抽成,要么就得去接受臨時(shí)加價(jià)的現(xiàn)貨算力,如果當(dāng)初早點(diǎn)買,就不需要多付這些錢。

Dylan:對(duì),而且這里面還有一個(gè)有趣的動(dòng)態(tài)。過去有好幾個(gè)月,所有人都在說“OpenAI,我們不會(huì)跟你簽合同,聽起來太瘋狂了,你們根本沒錢”?,F(xiàn)在呢,所有人都說“我們一直都相信你,隨便簽什么合同都行,因?yàn)槟闳诘藉X了”。從這個(gè)意義上說,Anthropic 是受限的,因?yàn)槭袌?chǎng)上目前的增量算力大買家并不多,Anthropic 是第一個(gè)命中能力拐點(diǎn)、收入開始飛漲的。

不過我認(rèn)為 Anthropic 通過自己的直接采購,加上通過 Bedrock、Vertex 和 Foundry 服務(wù)其產(chǎn)品,今年年底大概能達(dá)到 5 到 6 GW。這遠(yuǎn)超它最初的計(jì)劃。OpenAI 大致也在這個(gè)量級(jí),可能稍高一些。

Dwarkesh:這也引出一個(gè)有趣的問題。有人一直在討論 GPU 的折舊周期??疹^們說折舊應(yīng)該是兩年而不是四五年,因?yàn)榧夹g(shù)進(jìn)步太快了。但按你說的,如果 H100 在 2024 年價(jià)值 2 美元/小時(shí),2026 年 Blackwell 大批量部署后就只值 1 美元了,到 2027 年 Rubin 出來又降到 0.7 美元,但問題是,你造不出無限量的最新芯片。供給是有限的。所以給芯片定價(jià)的不是“我今天能買到什么更好的替代品”,而是“這顆芯片今天能為我產(chǎn)生多少價(jià)值”。

Dylan:完全正確。拿 GPT-5.4 來舉例。GPT-5.4 比 GPT-4 便宜得多,活躍參數(shù)更少,模型更小,不是像 GPT-4 那樣的粗粒度 MoE(混合專家模型),再加上訓(xùn)練方法、RL(強(qiáng)化學(xué)習(xí))、模型架構(gòu)、數(shù)據(jù)質(zhì)量等各方面的進(jìn)步,GPT-5.4 的質(zhì)量遠(yuǎn)超 GPT-4。一顆 H100 跑 GPT-5.4 能產(chǎn)出更多的 token,而且每個(gè) token 的質(zhì)量更高。

想想看,GPT-4 的 token 最大 TAM(總可尋址市場(chǎng))也許是幾十億美元。GPT-5.4 的 TAM 可能超過 1,000 億美元,只是采用需要時(shí)間,而且有競(jìng)爭(zhēng)。如果技術(shù)進(jìn)步停在這里不動(dòng)了,一顆 H100 的價(jià)值就不再由 GPT-4 能從它身上榨取多少價(jià)值決定,而是由 GPT-5.4 能榨取多少價(jià)值決定,而后者遠(yuǎn)大于前者。

所以一顆 H100 今天的價(jià)值確實(shí)比三年前更高。

Dwarkesh:這太瘋狂了。如果再往前推,假設(shè)我們真的開發(fā)出了 AGI 模型,真正實(shí)現(xiàn)了“服務(wù)器上的人類”。一顆 H100 大約有 10^15 FLOPS,有人估算人腦大約也是這個(gè)量級(jí)。如果一個(gè)人類知識(shí)工作者一年能產(chǎn)出六位數(shù)的經(jīng)濟(jì)價(jià)值,一顆 H100 的價(jià)值就是在幾個(gè)月內(nèi)就能收回成本。

Dylan:在那種場(chǎng)景下,GPU 的價(jià)值只會(huì)隨著時(shí)間推移不斷上升。目前只有 OpenAI 和 Anthropic 真正持有這個(gè)信念。但隨著時(shí)間推移,即便是開源模型,所有人都會(huì)開始看到每顆 GPU 的價(jià)值在飛漲。從這個(gè)意義上說,你現(xiàn)在就應(yīng)該鎖定算力。

Dwarkesh:這讓我想到一個(gè)經(jīng)濟(jì)學(xué)效應(yīng)叫 Alchian-Allen 效應(yīng),如果你對(duì)兩種商品同時(shí)加上一個(gè)固定成本(比如關(guān)稅),其中一種質(zhì)量更高、一種更低,那消費(fèi)者會(huì)更傾向于選擇高質(zhì)量的那種,因?yàn)橄鄬?duì)價(jià)差縮小了。

拿一個(gè)具體例子:好蘋果 2 美元,差蘋果 1 美元,好蘋果是差蘋果的 2 倍價(jià)格。如果對(duì)兩種蘋果各加 1 美元關(guān)稅,變成 3 美元和 2 美元,好蘋果只貴 1.5 倍了。如果 GPU 越來越貴,所有人都在付這個(gè)固定成本,那人們就更愿意多花一點(diǎn)錢用最好的模型,因?yàn)榉凑懔σ呀?jīng)花了那么多錢了,不如多花一點(diǎn)用最強(qiáng)的模型。

Dylan:完全對(duì)。如果一顆 Hopper 從每小時(shí) 2 美元漲到 3 美元,而它能產(chǎn)出 100 萬個(gè) Opus token 或 200 萬個(gè) Sonnet token,那 Opus 和 Sonnet 之間的價(jià)差就縮小了,因?yàn)?GPU 本身貴了 1 美元。事實(shí)上我們今天已經(jīng)看到,所有的使用量和收入都集中在最好的模型上。

在算力受限的世界里,還有兩件事同時(shí)發(fā)生:第一,那些早早鎖定了五年長(zhǎng)約的公司,也就是沒有“承諾恐懼癥”的公司,鎖定了巨大的成本優(yōu)勢(shì),因?yàn)樗鼈儼慈昵盎騼赡昵暗膬r(jià)格買的算力。第二,誰能攫取利潤(rùn)?隨著模型越來越有價(jià)值,云服務(wù)商能不能提價(jià)?

如果看 CoreWeave,它 98% 以上的算力合約平均期限超過三年,所以它沒法靈活提價(jià)。但每年新增的算力遠(yuǎn)多于存量,Meta 今年新增的算力相當(dāng)于它 2022 年整個(gè)數(shù)據(jù)中心和計(jì)算基礎(chǔ)設(shè)施的總量。新增算力按新價(jià)格成交,所以只要我們處于起飛階段,OpenAI 從去年的 600 MW 到 2 GW,今年到 6 GW 以上,明年到 12 GW,真正的成本在增量部分,不在存量長(zhǎng)期合約上。

那誰掌握定價(jià)權(quán)?往上游走,最終是英偉達(dá)。它們已經(jīng)簽了約 900 億美元的長(zhǎng)期合約,正在跟內(nèi)存廠商談三年期協(xié)議。英偉達(dá)、亞馬遜、谷歌(通過博通)和 AMD 這些芯片公司掌握著主動(dòng)權(quán),因?yàn)樗鼈冩i定了產(chǎn)能。臺(tái)積電沒怎么漲價(jià),但內(nèi)存廠商在大幅漲價(jià)。至少今年,我們會(huì)看到模型廠商的利潤(rùn)率大幅提升,因?yàn)樗鼈儺a(chǎn)能受限嚴(yán)重,不得不通過提價(jià)來抑制需求。Anthropic 不可能按目前的節(jié)奏繼續(xù)增長(zhǎng)而不抑制需求。

英偉達(dá)搶先鎖定了臺(tái)積電產(chǎn)能;谷歌正面臨擠壓

Dwarkesh:那我們來具體聊聊英偉達(dá)是怎么鎖定邏輯和內(nèi)存產(chǎn)能的。據(jù)你的數(shù)據(jù),到 2027 年英偉達(dá)將占據(jù) N3(3 納米)晶圓產(chǎn)能的 70% 以上。如果看 Neo Cloud 的商業(yè)模式,英偉達(dá)通過給各種小型 Neo Cloud 分配算力來分散互補(bǔ)產(chǎn)業(yè)、確保自己有最大的議價(jià)權(quán)。

同樣,Anthropic 和 OpenAI 與數(shù)據(jù)中心供應(yīng)商合作時(shí)也會(huì)故意培養(yǎng)一大批供應(yīng)商,不被任何一家鎖定。那為什么在 3 納米制程上,臺(tái)積電就這么把產(chǎn)能大量給了英偉達(dá),而不是試圖分散市場(chǎng)?

Dylan:先看 3 納米的背景,去年 3 納米的絕大部分產(chǎn)能是蘋果。蘋果現(xiàn)在正向 2 納米遷移,2 納米目前只能做移動(dòng)芯片,未來 AI 芯片也會(huì)遷過去。內(nèi)存價(jià)格上漲也在擠壓蘋果,要么自己吃掉成本,要么削減出貨量。

臺(tái)積電的算盤其實(shí)是這樣的:它們更愿意把產(chǎn)能分配給做 CPU 的公司。比如亞馬遜既有 Trainium(AI 芯片)又有 Graviton(CPU),兩者都在 3 納米上。臺(tái)積電對(duì) Graviton 的分配更積極,因?yàn)樗鼈冋J(rèn)為 CPU 業(yè)務(wù)是更穩(wěn)定的長(zhǎng)期增長(zhǎng)。作為一家保守的公司,臺(tái)積電不想過度依賴高增長(zhǎng)市場(chǎng)的周期波動(dòng),所以優(yōu)先分配給增長(zhǎng)更穩(wěn)的市場(chǎng)。對(duì) AMD 也一樣,臺(tái)積電更看重它的 CPU 而不是 GPU。

但英偉達(dá)比較特殊,它有 CPU、交換機(jī)、網(wǎng)絡(luò)設(shè)備、NVLink、以太網(wǎng),各種產(chǎn)品。到今年年底 Rubin 系列發(fā)布時(shí),英偉達(dá)的大多數(shù)產(chǎn)品都會(huì)在 3 納米上。而且英偉達(dá)就是更早下手了。比谷歌早,比亞馬遜早。谷歌和亞馬遜還碰到了一些波折,某顆芯片(Trainium)延遲了幾個(gè)季度。

而英偉達(dá)一直在說“要更多、更多、更多”。它會(huì)去檢查整個(gè)供應(yīng)鏈的每個(gè)環(huán)節(jié),去 PCB 供應(yīng)商那里確認(rèn)“有沒有足夠的 PCB 產(chǎn)能?”,去內(nèi)存廠商那里確認(rèn)“誰有所有的內(nèi)存產(chǎn)能?”,答案是英偉達(dá)。

道理和 AI 實(shí)驗(yàn)室鎖定算力一樣。誰足夠相信 AGI,誰就敢在看起來荒謬的時(shí)間尺度上鎖定大量產(chǎn)能、支付不錯(cuò)的利潤(rùn)率。英偉達(dá)在半導(dǎo)體供應(yīng)鏈上做的是同樣的事。雖然我不認(rèn)為英偉達(dá)像 Dario 或 Sam 那樣真正相信 AGI,Jensen 一直說的是“加速計(jì)算”,不是“AI 芯片”,但他比去年三季度的谷歌和亞馬遜 AGI 信念強(qiáng)得多,也看到了更多的需求。

Dwarkesh:等一下,谷歌不是賣了大約一百萬顆 V7(Ironwood)TPU 給 Anthropic 嗎?如果邏輯和內(nèi)存是最大瓶頸,谷歌又有 DeepMind 這個(gè)世界第三大 AI 實(shí)驗(yàn)室,為什么不把芯片留給自己,而是賣給 Anthropic?

Dylan:這個(gè)問題確實(shí)讓 DeepMind 的人很崩潰,“我們?yōu)槭裁匆@樣做?”但谷歌云的人和谷歌高管看到的是另一套邏輯。據(jù)我們掌握的數(shù)據(jù),事情是這樣的:Anthropic 的算力采購團(tuán)隊(duì)核心成員有兩位來自谷歌,他們看到了一個(gè)窗口期,快速談判了一筆交易,在谷歌自己反應(yīng)過來之前就拿到了算力。

具體的時(shí)間線是,去年三季度初,我們?cè)诖蠹s六周內(nèi)看到 TPU 的產(chǎn)能出現(xiàn)了顯著增長(zhǎng),而且是多次增加。谷歌甚至不得不向臺(tái)積電解釋為什么突然需要增加這么多產(chǎn)能,很大一部分就是因?yàn)橐u給 Anthropic。

然后事情發(fā)生了轉(zhuǎn)折。谷歌推出了 Nano Bono 和 Gemini 3,用戶指標(biāo)暴漲。谷歌高層突然清醒了過來,開始說“我們必須每六個(gè)月把算力翻一倍”之類的話。然后他們?nèi)フ遗_(tái)積電說想要更多,但臺(tái)積電說:“抱歉,明年的產(chǎn)能已經(jīng)賣光了。我們可以在 2026 年多給 5% 到 10%,但真正能大幅增加得等到 2027 年。”

從供應(yīng)鏈數(shù)據(jù)來看,比如晶圓訂單、數(shù)據(jù)中心合同、Anthropic 簽約的情況等,在我看來,很明顯谷歌搞砸了。從收入數(shù)據(jù)也能看出來:谷歌的 Gemini 收入在去年一季度和三季度幾乎為零,三季度才開始起量,四季度退出時(shí)大約到了 50 億美元 ARR。說明谷歌確實(shí)沒預(yù)見到收入會(huì)暴漲。Anthropic 在收入起飛之前就已經(jīng)有“承諾恐懼癥”了,谷歌當(dāng)然會(huì)更保守,谷歌的 ARR 甚至還不如 Anthropic 高。

不過好消息是,從那以后谷歌已經(jīng)極度 AGI 化了。它們收購了能源公司,預(yù)付了渦輪機(jī)定金,購買了大量有電力的土地,跟公用事業(yè)公司談長(zhǎng)期協(xié)議,在數(shù)據(jù)中心電力方面非常激進(jìn)。谷歌大約在去年年底才真正醒過來,但確實(shí)花了一些時(shí)間。

到 2030 年,ASML 將成為 AI 算力擴(kuò)展的最大瓶頸

Dwarkesh:過去幾年,每年的瓶頸都在變,前年是 CoWoS 封裝,去年是電力。今年的瓶頸是什么?五年后呢?

Dylan:今年最大的瓶頸是芯片本身。瓶頸已經(jīng)從電力和數(shù)據(jù)中心切換回了半導(dǎo)體供應(yīng)鏈。在芯片供應(yīng)鏈內(nèi)部,有多個(gè)瓶頸:內(nèi)存、臺(tái)積電的邏輯晶圓、晶圓廠本身。晶圓廠建設(shè)需要兩到三年,而數(shù)據(jù)中心不到一年,亞馬遜最快八個(gè)月就能建一個(gè)。差距非常大。

之前的瓶頸,包括 CoWoS 封裝、電力、數(shù)據(jù)中心,都是相對(duì)短交期的東西。CoWoS 是比較簡(jiǎn)單的芯片封裝工藝,電力和數(shù)據(jù)中心雖然復(fù)雜但比芯片制造簡(jiǎn)單得多。過去一段時(shí)間,移動(dòng)和 PC 芯片的產(chǎn)能在向數(shù)據(jù)中心滑動(dòng),但這種騰挪空間已經(jīng)用盡了。英偉達(dá)現(xiàn)在是臺(tái)積電最大的客戶,也是 SK 海力士(最大的內(nèi)存制造商)最大的客戶。移動(dòng)和 PC 行業(yè)已經(jīng)沒有更多資源可以轉(zhuǎn)給 AI 了。

Dwarkesh:基于 EUV 光刻機(jī)的產(chǎn)量。有沒有可能算出 2030 年的一個(gè)絕對(duì) GW 天花板?

Dylan:完全可以。要進(jìn)一步擴(kuò)大算力,今年和明年有不同的瓶頸,但到 2028、2029 年,瓶頸最終會(huì)落到供應(yīng)鏈的最底層——ASML。ASML 制造的是人類有史以來最復(fù)雜的機(jī)器:EUV(極紫外光刻機(jī)),單臺(tái)售價(jià) 3 到 4 億美元。目前它每年能造大約 70 臺(tái),明年到 80 臺(tái)。即使在非常激進(jìn)的供應(yīng)鏈擴(kuò)張假設(shè)下,到這個(gè)十年末它也只能到 100 臺(tái)出頭。

那 EUV 怎么跟 AI 算力掛鉤?我來算一筆賬。造一個(gè) GW 的英偉達(dá) Rubin 芯片數(shù)據(jù)中心容量,你需要大約 55,000 片 3 納米晶圓、6,000 片 5 納米晶圓和約 170,000 片 DRAM(內(nèi)存)晶圓。這三種晶圓各需要不同數(shù)量的 EUV 光刻步驟。一片先進(jìn)的 3 納米邏輯晶圓大約有 70 層光刻,其中 20 層是最關(guān)鍵的 EUV 光刻。算下來,55,000 片晶圓乘以 20 次 EUV 曝光,就是 110 萬次 EUV 曝光。加上 5 納米和內(nèi)存的部分,一個(gè) GW 總共需要大約 200 萬次 EUV 曝光。

一臺(tái) EUV 光刻機(jī)大約每小時(shí)處理 75 片晶圓,開機(jī)率約 90%。算下來,大約需要 3.5 臺(tái) EUV 光刻機(jī)才能滿足一個(gè) GW 的需求。

想想這些數(shù)字的對(duì)比:一個(gè) GW 的數(shù)據(jù)中心資本支出大約 500 億美元,而支撐它的 3.5 臺(tái) EUV 光刻機(jī)成本只有 12 億美元。500 億美元甚至 1,000 億美元的 AI 價(jià)值鏈被 12 億美元的光刻設(shè)備卡住了,僅僅因?yàn)樗墓?yīng)鏈無法快速擴(kuò)張。

Dwarkesh:你前陣子寫過,臺(tái)積電過去三年花了 1,000 億美元的資本支出。英偉達(dá)只用了其中一小部分的 3 納米產(chǎn)能,就把它變成了每季度 400 億美元的收入,年化 1,600 億。然后再往下游看 ASML,12 億美元的光刻機(jī)就能支撐一個(gè) GW。Sam Altman 說他想到 2030 年每周上線一個(gè) GW,這跟 EUV 產(chǎn)能兼容嗎?

Dylan:完全兼容。臺(tái)積電和整個(gè)生態(tài)系統(tǒng)目前已經(jīng)擁有 250 到 300 臺(tái) EUV 光刻機(jī)的存量。再加上今年 70 臺(tái)、明年 80 臺(tái),逐步增長(zhǎng)到 100 臺(tái),到 2030 年底全球會(huì)有大約 700 臺(tái) EUV 光刻機(jī)。700 臺(tái)除以 3.5 臺(tái)/GW,如果全部分配給 AI(當(dāng)然不可能),就是 200 GW 的 AI 芯片產(chǎn)能。

Sam 想要 52 GW/年。如果全球 AI 用掉 200 GW 的芯片產(chǎn)能,他拿 25% 的份額??紤]到今年他可能就已經(jīng)獲取了約 25% 的 Blackwell GPU 部署量,這個(gè)數(shù)字其實(shí)是很合理的。

Dwarkesh:我很驚訝的是,ASML 大約從 2020 年才開始大批量出貨 EUV,到 2030 年人們還在用十年前的機(jī)器?

Dylan:工具確實(shí)不是原封不動(dòng)的。ASML 在持續(xù)改進(jìn)光刻機(jī)的幾項(xiàng)關(guān)鍵指標(biāo)。第一是晶圓產(chǎn)出速度,一直在提升。第二是一個(gè)叫“overlay(套刻精度)”的規(guī)格,你做了第一層光刻和一堆沉積、蝕刻步驟之后,做第二層時(shí),兩層圖案必須精確對(duì)齊在一起,允許的偏差只有 3 納米量級(jí)。這項(xiàng)指標(biāo)也在快速改善。第三,工具的價(jià)格確實(shí)漲了,從最初的 1.5 億美元到現(xiàn)在的 4 億美元,但漲幅沒有性能提升幅度大。

順便說一句,ASML 可能是世界上最慷慨的壟斷公司了。它在 EUV 領(lǐng)域沒有任何競(jìng)爭(zhēng)者,也許中國(guó)到本十年末會(huì)有一些,但 ASML 從來沒有像英偉達(dá)那樣瘋狂提價(jià)。它的價(jià)格漲幅始終沒超過性能提升幅度,一直在為客戶提供凈價(jià)值。

Dwarkesh:如果 ASML 直接把資本支出翻倍或翻三倍呢?為什么我們能如此有信心地預(yù)測(cè),五年后它也只能造 100 臺(tái)左右?

Dylan:幾個(gè)原因。首先,ASML 沒有決定全力擴(kuò)產(chǎn)。整個(gè)半導(dǎo)體供應(yīng)鏈都沒有。它們經(jīng)歷過太多周期的繁榮與蕭條。沒有人真正相信每年 200 GW 的 AI 芯片需求或者每年數(shù)萬億美元的半導(dǎo)體支出。我們不斷被告知我們的數(shù)字太高了,然后當(dāng)我們的預(yù)測(cè)被驗(yàn)證時(shí),他們又說“好吧,但你明年的數(shù)字肯定還是太高了”。

其次,一臺(tái) EUV 光刻機(jī)有四個(gè)核心組件:光源(由位于圣地亞哥的 Cymer 制造)、掩膜臺(tái)(在康涅狄格州威爾明頓制造)、晶圓臺(tái)和光學(xué)系統(tǒng)(在歐洲制造)。每個(gè)組件都有極其復(fù)雜的供應(yīng)鏈。

我來描述一下光源是怎么工作的。它每秒釋放數(shù)萬個(gè)錫液滴,然后用激光精準(zhǔn)地三次擊中每個(gè)液滴,第一次命中使錫滴展開,第二次使它擴(kuò)展成完美的形狀,第三次高功率轟擊使錫滴激發(fā)出 13.5 納米的 EUV 光。然后收集光線并導(dǎo)入透鏡組。

透鏡組由蔡司(Carl Zeiss)制造,這是最關(guān)鍵的部分。每臺(tái)光刻機(jī)大約有 18 面透鏡/反射鏡,它們是多層反射鏡,由鉬和釕(如果我沒記錯(cuò)的話)的完美薄層交替堆疊而成。光線在這些鏡面上精確反射。任何沉積層的缺陷、任何曲率問題都會(huì)導(dǎo)致失敗。這個(gè)制造過程非常手工化,每年只造幾百到一千面這樣的透鏡。蔡司也沒有試圖大幅擴(kuò)產(chǎn),因?yàn)樗鼈円膊徽J(rèn)為需要從 60 臺(tái)增長(zhǎng)到幾百臺(tái)。

然后是掩膜臺(tái),這個(gè)東西運(yùn)動(dòng)時(shí)承受 9 個(gè) G 的加速度。因?yàn)楣饪踢^程中,掩膜臺(tái)和晶圓臺(tái)在反方向高速移動(dòng),掃描晶圓上 26×33 毫米的區(qū)域,然后停下來移到下一個(gè)區(qū)域,在幾秒內(nèi)完成。兩個(gè)方向各 9 個(gè) G。

每個(gè)組件都是化學(xué)、制造工藝、機(jī)械工程、光學(xué)工程的奇跡。全部需要大量的計(jì)量測(cè)試,因?yàn)槿魏纹疃紩?huì)導(dǎo)致良率歸零。而且這臺(tái)巨大的機(jī)器在荷蘭埃因霍溫的工廠組裝好之后,要拆開裝上多架飛機(jī)運(yùn)到客戶現(xiàn)場(chǎng),再重新組裝測(cè)試,這個(gè)過程又要好幾個(gè)月。

ASML 的供應(yīng)鏈有超過一萬家供應(yīng)商。整個(gè)系統(tǒng)中,每個(gè)物理運(yùn)動(dòng)部件的精度都必須小于 1 納米,因?yàn)楦鱾€(gè)環(huán)節(jié)的誤差會(huì)累加,而層間套刻精度要求在 3 納米量級(jí)。你不可能打個(gè)響指就擴(kuò)大產(chǎn)量。

打個(gè)比方:美國(guó)從 0% 的電力增長(zhǎng)轉(zhuǎn)向 2% 的電力增長(zhǎng),而中國(guó)已經(jīng)在 30% 了,光這一步對(duì)美國(guó)來說都極其困難。電力供應(yīng)鏈相對(duì)簡(jiǎn)單,從業(yè)人員可能有十萬人以上。而 ASML 員工數(shù)量有限,蔡司做這個(gè)的可能不到 1,000 人,每個(gè)人都是超級(jí)專業(yè)化的。你沒法在短時(shí)間內(nèi)培訓(xùn)出這些人才,也沒法讓整個(gè)供應(yīng)鏈立刻動(dòng)員起來。

我們難道不能直接利用臺(tái)積電的舊晶圓廠嗎?

Dwarkesh:過去幾年,每次有人說“AI 算力被 X 卡住了”,你都能指出替代方案,電網(wǎng)不夠?那就用廠區(qū)自備發(fā)電、燃?xì)廨啓C(jī)。半導(dǎo)體供應(yīng)鏈也能這樣繞過去嗎?如果 EUV 成為瓶頸,那我們回到 7 納米,用中國(guó)正在用的 DUV 多重曝光技術(shù)行不行?A100 是 7 納米,到 B100 大約只有 3 倍的 FP16 性能提升,而且其中一部分是架構(gòu)改進(jìn)而非制程改進(jìn)。7 納米有大量存量產(chǎn)能,即使打個(gè) 50% 的折扣,不是也能再增加 50 到 100 GW 嗎?

Dylan:理論上有可能走到那一步,但我認(rèn)為不太可能。有幾個(gè)不太公平的對(duì)比需要澄清。

從 A100(312 TFLOPS FP16)到 Blackwell(約 1,000 TFLOPS FP16)到 Rubin(約 5,000 TFLOPS FP16),這些數(shù)字看起來只是幾倍的差距,但實(shí)際性能差距遠(yuǎn)大于此。因?yàn)槊看酒脑O(shè)計(jì)目標(biāo)不同,A100 針對(duì) FP16 優(yōu)化,Hopper 針對(duì) FP8,Rubin 針對(duì) FP4 和 FP6。所以單看 FLOPS 不是公平的比較。

更關(guān)鍵的是,這些模型不是跑在單顆芯片上的。DeepSeek 的生產(chǎn)部署跑在 160 顆 GPU 上。每次跨越芯片邊界就有效率損失,延遲、功耗、帶寬都受影響。芯片內(nèi)部的數(shù)據(jù)傳輸速度是每秒數(shù)十到數(shù)百 TB,芯片之間降到每秒 TB 量級(jí),跨機(jī)架降到每秒數(shù)百 Gb。

所以當(dāng)你比較 Hopper 和 Blackwell 在推理 DeepSeek 和 Kimi K2.5 等模型時(shí)的實(shí)際性能差距,在 100 tokens/秒的推理場(chǎng)景下,差距大約是 20 倍,不是 FLOPS 數(shù)字暗示的 2-3 倍。因?yàn)樾酒罅?,每顆芯片的計(jì)算密度更高,單芯片內(nèi)的通信帶寬遠(yuǎn)超跨芯片通信,所以很多通信瓶頸被消除了。

這個(gè)差距是累加的:每顆芯片的 FLOPS、芯片間網(wǎng)絡(luò)速度、單芯片上有多少 FLOPS 相對(duì)于系統(tǒng)、單芯片內(nèi)存帶寬和整個(gè)系統(tǒng)的內(nèi)存帶寬,所有這些因素疊加在一起。

Dwarkesh:今年 B200 已經(jīng)把兩個(gè) die 做到一顆芯片上了,明年 Rubin Ultra 會(huì)是 4 個(gè) die。為什么不繼續(xù)加?一顆芯片上能放多少個(gè) die 還能保持這種高帶寬?

Dylan:即便在 Blackwell 內(nèi)部,同一個(gè) package 里跨 die 通信也有性能損失,雖然比跨 package 小得多。英偉達(dá)的方案是 CoWoS 封裝。你可以回過頭看 Tesla 的 Dojo 芯片,它把 25 顆芯片做在一整片晶圓上。它到今天可能仍然是跑卷積神經(jīng)網(wǎng)絡(luò)最好的芯片,只是不擅長(zhǎng) Transformer,因?yàn)閮?nèi)存和算力的形狀不適合。華為的 Ascend 910 也在做類似的事,從單 die 到雙 die,專注于擴(kuò)展封裝。

但你在 7 納米上能做的,在 3 納米上也能做。先進(jìn)封裝是兩個(gè)維度都在推進(jìn)的。

中國(guó)半導(dǎo)體規(guī)模何時(shí)會(huì)超越西方?

Dwarkesh:如果到 2030 年西方有最先進(jìn)的制程但產(chǎn)能沒拉滿,而中國(guó)雖然制程落后但瘋狂擴(kuò)產(chǎn),而且整條供應(yīng)鏈都在一個(gè)國(guó)家內(nèi),什么時(shí)候會(huì)出現(xiàn)交叉點(diǎn)?

Dylan:到目前為止,中國(guó)仍然沒有完全自主的半導(dǎo)體供應(yīng)鏈。中國(guó)所有的 7 納米和 14 納米產(chǎn)能都用的是 ASML 的 DUV 光刻機(jī),ASML 持續(xù)向中國(guó)出貨,但所有 EUV 收入都在中國(guó)之外。所以規(guī)模優(yōu)勢(shì)目前仍在西方加臺(tái)灣和日本這邊。

Dwarkesh:到 2030 年,中國(guó)會(huì)有完全自主的 DUV 和 EUV 嗎?

Dylan:DUV 我覺得肯定會(huì)有。EUV 嘛,我認(rèn)為他們會(huì)有能工作的工具,但不一定能大量生產(chǎn)。就像 ASML 在 2010 年代初就讓 EUV 在實(shí)驗(yàn)室里工作了,但精度不夠、產(chǎn)量不夠、可靠性不夠,又花了五到七年才進(jìn)入大規(guī)模量產(chǎn)。中國(guó)的 DUV 國(guó)產(chǎn)化到 2030 年可能達(dá)到每年約 100 臺(tái)的產(chǎn)量,而 ASML 目前每年出貨數(shù)百臺(tái) DUV。

Dwarkesh:我覺得有一個(gè)很有意思但討論不夠的問題:如果你認(rèn)為 AI 的時(shí)間線是“長(zhǎng)”的,比如 2035 年才達(dá)到某個(gè)關(guān)鍵能力,那時(shí)候中國(guó)在半導(dǎo)體上會(huì)不會(huì)已經(jīng)超過西方了?舊金山的人在以周為單位思考,舊金山以外的人根本不在想 AGI。如果 AGI 真的到 2035 年才來,而它會(huì)帶來數(shù)十萬億美元的經(jīng)濟(jì)增長(zhǎng),那到時(shí)候誰控制半導(dǎo)體就太重要了。

Dylan:這確實(shí)是個(gè)非常難的問題。時(shí)間尺度拉到 2035 年,誤差棒變得巨大。但我的基本判斷是:如果快速起飛,不一定要相信 AGI,只要 AI 收入以當(dāng)前速度持續(xù)增長(zhǎng),那美國(guó)和西方正在拉開差距。

看看現(xiàn)在的情況:美國(guó)今年大約有接近 1 萬億美元的資本支出投入數(shù)據(jù)中心。Anthropic 一月新增 40 億收入,二月新增 60 億,而 Claude Code 的可靠性還因?yàn)樗懔Σ蛔愣芟蓿绻サ暨@個(gè)瓶頸,增速可能更快。這些資本支出的投資回報(bào)率極高。美國(guó)經(jīng)濟(jì)因此增長(zhǎng)加速。

中國(guó)目前還沒有做到這一點(diǎn),沒有建起同等規(guī)模的基礎(chǔ)設(shè)施,也沒有訓(xùn)練出同等能力的模型來部署和產(chǎn)生收入。而且 Opus 4.6 和 GPT-5.4 已經(jīng)明顯拉開了與中國(guó)模型的差距。當(dāng) AI 實(shí)驗(yàn)室從“賣 token 和推理鏈”轉(zhuǎn)向“賣自動(dòng)化白領(lǐng)工作”時(shí),從美國(guó)模型蒸餾到中國(guó)模型的難度會(huì)大幅增加,因?yàn)槟阗I的不再是展示完整推理鏈的 token,而是結(jié)果。

如果起飛速度夠快,美國(guó)在發(fā)散。如果起飛速度慢,中國(guó)就有時(shí)間建立完全自主的垂直整合供應(yīng)鏈??鞎r(shí)間線,美國(guó)贏;慢時(shí)間線,中國(guó)贏。

即將到來的巨大內(nèi)存瓶頸

Dwarkesh:HBM(高帶寬內(nèi)存)由 DRAM 制造,但每單位晶圓面積的比特?cái)?shù)只有普通 DRAM 的三到四分之一。如果未來 AI 應(yīng)用更多是 agent(智能代理),不需要同步聊天那種極低延遲,能不能用普通 DRAM 代替 HBM?

Dylan:理論上可以。Anthropic 甚至可以推出一個(gè)“慢模式”,大幅降低 Opus 4.6 的價(jià)格,可能降 4-5 倍,速度降 2 倍。但沒人想用慢模型。即使 agent 任務(wù)可以跑幾個(gè)小時(shí),如果模型更快的話幾個(gè)小時(shí)就能變成一個(gè)小時(shí)。最有價(jià)值的任務(wù)往往也有時(shí)間敏感性。

更根本的問題在于帶寬。一塊 HBM4 芯片堆的帶寬大約是 2.5 TB/s,2,048 bit 寬、10 Giga transfers/秒。同樣的芯片邊緣面積放 DDR5 呢?大約 64 或 128 bit 寬,傳輸速率 6.4-8 GT/s,帶寬只有大約 64-128 GB/s。差一個(gè)數(shù)量級(jí)。而芯片的邊緣面積是有限的,die 的最大尺寸是 26×33 毫米,邊緣放內(nèi)存和 I/O,內(nèi)部放計(jì)算單元。你受限于帶寬。

推理性能受四個(gè)約束:FLOPS、網(wǎng)絡(luò)帶寬、內(nèi)存帶寬和內(nèi)存容量。如果換成 DDR,你確實(shí)得到了 4 倍的比特?cái)?shù)/晶圓,但內(nèi)存帶寬暴跌,所有那些計(jì)算單元就只能干等著,算力被浪費(fèi)了。

Dwarkesh:那回到宏觀層面,你在 newsletter 里說 2026 年大型科技公司資本支出的 30% 要花在內(nèi)存上?

Dylan:對(duì),去掉英偉達(dá)的利潤(rùn)率堆疊之后,大約三分之一的資本支出花在內(nèi)存上。

內(nèi)存價(jià)格還會(huì)繼續(xù)漲。這對(duì)市場(chǎng)不同部分的影響是不同的。一部 iPhone 有 12 GB 內(nèi)存,以前每 GB 大約 3-4 美元,所以內(nèi)存成本大約 50 美元。現(xiàn)在 DDR 漲到了約 12 美元/GB,變成 150 美元,多了 100 美元。蘋果不太會(huì)全部自己吃掉這個(gè)成本,所以最終消費(fèi)者可能要為一部 iPhone 多付大約 250 美元。

但這只是高端市場(chǎng),蘋果每年只賣兩三億部手機(jī)。大頭在中低端市場(chǎng)。之前全球每年賣 14 億部智能手機(jī),現(xiàn)在降到 11 億。我們的預(yù)測(cè)是今年可能降到 8 億,明年 6 億甚至 5 億。我們?cè)趤喼薜姆治鰩熥粉櫟叫∶缀?OPPO 正在把中低端手機(jī)出貨量砍半。因?yàn)榈投耸謾C(jī)內(nèi)存占物料成本的比例更高,利潤(rùn)更薄,根本吃不下這個(gè)成本上漲。

關(guān)鍵是,砍掉的主要是低端,每部手機(jī)內(nèi)存量小,釋放出來的內(nèi)存產(chǎn)能也少。消費(fèi)端仍然占全球內(nèi)存需求的一半以上。釋放出來的 DRAM 會(huì)流向 AI 芯片,AI 客戶愿意簽更長(zhǎng)的合約、付更高的價(jià)格。

NAND 閃存也在漲價(jià)。但手機(jī)和 PC 的 NAND 占比更高,所以當(dāng)消費(fèi)需求被擠壓時(shí),釋放的 NAND 相對(duì)更多,DRAM 漲價(jià)幅度會(huì)大于 NAND。

這大概率會(huì)讓普通消費(fèi)者更加厭惡 AI。你已經(jīng)能在 PC 論壇和 Twitter 上看到各種表情包了,“就是因?yàn)檫@些貓咪跳舞視頻(指 AI 訓(xùn)練),內(nèi)存價(jià)格翻倍了,我買不起新顯卡了”。等內(nèi)存價(jià)格再翻一倍,情況只會(huì)更糟。

Dwarkesh:為什么不能多造一些內(nèi)存?

Dylan:限制內(nèi)存擴(kuò)產(chǎn)的原因跟限制邏輯芯片擴(kuò)產(chǎn)的原因驚人地相似。過去三四年,內(nèi)存廠商根本沒建新晶圓廠。2023 年內(nèi)存價(jià)格很低,廠商在虧錢,所以不建廠。市場(chǎng)慢慢恢復(fù),但直到去年價(jià)格才真正起來。我們一年半前就一直在說:推理意味著長(zhǎng)上下文,長(zhǎng)上下文意味著大 KV Cache,大 KV Cache 意味著需要大量?jī)?nèi)存,而 AI 加速器成本的一半就是內(nèi)存。

但從“顯然需要更多內(nèi)存”到內(nèi)存價(jià)格實(shí)際反映這個(gè)現(xiàn)實(shí),花了整整一年。價(jià)格反映之后,又過了三到六個(gè)月內(nèi)存廠商才開始建新廠。而新廠建設(shè)需要兩年。所以有意義的新產(chǎn)能要到 2027 年底或 2028 年才能上線。

現(xiàn)在的情況是一些非常規(guī)操作,美光收購了臺(tái)灣一家做落后制程芯片的公司的晶圓廠,SK 海力士和三星也在想各種辦法在現(xiàn)有廠房里擠出產(chǎn)能。核心問題就是,沒有地方放設(shè)備。晶圓廠是人類建造的最復(fù)雜的建筑,建設(shè)需要兩年。

在美國(guó)擴(kuò)展電力供應(yīng)不會(huì)成為問題

Dwarkesh:聽起來你認(rèn)為電力可以幾乎無限擴(kuò)展?

Dylan:不是無限,但電力不會(huì)成為主要瓶頸。

目前今年我們大約部署 20 GW 的關(guān)鍵 IT 容量。需要注意,我說的 GW 是服務(wù)器插上電源的實(shí)際功耗,但還有傳輸損耗、變換損耗、冷卻功耗等,所以發(fā)電端要上浮 20-30%。而且渦輪機(jī)不是 100% 運(yùn)行,PJM(美國(guó)最大的電網(wǎng)之一)在模型中假設(shè)渦輪機(jī)的開機(jī)率約 90%,外加 20% 的冗余容量。所以發(fā)電端的銘牌容量始終遠(yuǎn)高于實(shí)際關(guān)鍵 IT 容量。

但電力來源不只是聯(lián)合循環(huán)燃?xì)廨啓C(jī)(CCGT)。雖然全球只有三家 CCGT 制造商,GE Vernova、三菱、西門子,但我們追蹤了 16 家不同的天然氣發(fā)電設(shè)備制造商。還有航改型燃?xì)廨啓C(jī),把飛機(jī)引擎改成發(fā)電機(jī),包括像 Boom Supersonic 這樣的新進(jìn)入者在跟 Crusoe 合作。

還有中速往復(fù)式發(fā)動(dòng)機(jī),康明斯等十幾家廠商。以前柴油發(fā)動(dòng)機(jī)主要用在卡車上,現(xiàn)在汽車產(chǎn)量在下降,這些廠商有產(chǎn)能可以轉(zhuǎn)做數(shù)據(jù)中心發(fā)電。船用發(fā)動(dòng)機(jī)也可以,Nebius 在新澤西州就是用船用發(fā)動(dòng)機(jī)為微軟的數(shù)據(jù)中心發(fā)電。Bloom Energy 在做燃料電池,我們對(duì)它很看好,已經(jīng)看好一年半了。還有太陽能加儲(chǔ)能、風(fēng)電加儲(chǔ)能,成本曲線在持續(xù)下降。

還有一個(gè)很重要的維度:美國(guó)電網(wǎng)的容量是按用電高峰設(shè)計(jì)的,夏天最熱的那天。但那只是全年平均負(fù)荷的 10-15-20%。如果部署足夠多的公用事業(yè)級(jí)儲(chǔ)能或調(diào)峰電廠,可以是燃?xì)?、工業(yè)燃?xì)廨啓C(jī)、電池、任何上述電源,你就能釋放出美國(guó)電網(wǎng) 20% 的容量給數(shù)據(jù)中心。因?yàn)榇蟛糠謺r(shí)間那些容量是閑置的,只在每年幾天的幾個(gè)小時(shí)會(huì)達(dá)到峰值。美國(guó)電網(wǎng)是太瓦級(jí)的,20% 就是 200 多 GW。

今天數(shù)據(jù)中心只占美國(guó)電網(wǎng)的 3-4%,到 2028 年會(huì)到 10%。而如果能像我說的這樣釋放電網(wǎng)容量,空間是非常充足的。這些事情不容易,涉及大量的硬件工程和風(fēng)險(xiǎn),但供應(yīng)鏈比芯片簡(jiǎn)單太多了。

Dwarkesh:即使 CCGT 可能要 1500 美元/千瓦的資本支出,其他技術(shù)成本更高也沒關(guān)系?

Dylan:可以高到 3,500 美元/千瓦。電力成本翻倍意味著什么?一顆 Hopper 的部署成本從每小時(shí) 1.4 美元變成 1.5 美元。因?yàn)槟P偷倪呺H效用提升遠(yuǎn)大于那一毛錢的能源成本增加。

我們追蹤的數(shù)據(jù)顯示,到這個(gè)十年末,大約一半的新增數(shù)據(jù)中心容量會(huì)是“behind the meter”(廠區(qū)自備發(fā)電)。Behind the meter 幾乎總是比電網(wǎng)接入貴,但電網(wǎng)有審批、互聯(lián)排隊(duì)等各種問題。Behind the meter 的技術(shù)路線非常多樣,往復(fù)式發(fā)動(dòng)機(jī)、船用發(fā)動(dòng)機(jī)、航改燃機(jī)、CCGT、Bloom Energy 燃料電池、太陽能加儲(chǔ)能,每一種技術(shù)單獨(dú)都能做到數(shù)十 GW,加起來就是數(shù)百 GW。

太空 GPU 在這十年內(nèi)不會(huì)實(shí)現(xiàn)

Dwarkesh:馬斯克非??春锰諗?shù)據(jù)中心。如果你說電力在地面不是瓶頸,那太空數(shù)據(jù)中心的理由是什么?馬斯克可能會(huì)說地面的審批太難了。

Dylan:用地方面,美國(guó)很大,數(shù)據(jù)中心占地不多。空氣排放許可是個(gè)挑戰(zhàn),但特朗普政府已經(jīng)降低了門檻,在得克薩斯州可以跳過很多這類繁文縟節(jié)。

太空確實(shí)能源免費(fèi),這是唯一的理由。但即便地面電力成本翻倍,它仍然只占 GPU 總成本的一小部分。

真正區(qū)分各個(gè)云服務(wù)商的,除了軟件之外,是它們部署和管理故障的能力。GPU 可靠性很差,Blackwell 大約 15% 部署后需要返修。你已經(jīng)在地面測(cè)試好了,然后要拆掉、裝上火箭、送進(jìn)太空、再重新上線——這至少多花六個(gè)月。而在算力受限的世界里,前六個(gè)月是算力最有價(jià)值的時(shí)候,因?yàn)楝F(xiàn)在比未來更稀缺。你延遲了六個(gè)月的算力部署。地面上我們看到有的云服務(wù)商部署 GPU 需要六個(gè)月,有的快得多。太空不可能更快。

Dwarkesh:那通信怎么辦?Starlink 衛(wèi)星之間現(xiàn)在是 100 Gb/s 的激光鏈路,未來可以更高,接近 InfiniBand 的 400 Gb/s。

Dylan:但那是每顆 GPU 的帶寬,不是每個(gè)機(jī)架。而且還要乘以 72(一個(gè) NVL72 里的 GPU 數(shù)量)。從 Hopper 到 Blackwell 到 Rubin 還分別翻倍。

更關(guān)鍵的是,隨著模型變得越來越稀疏(MoE 專家越來越多,領(lǐng)先模型已經(jīng)有數(shù)百甚至上千個(gè)專家),你需要在成百上千顆芯片之間做通信。你沒法把衛(wèi)星做到無限大,所以需要衛(wèi)星間的互聯(lián)。這些空間激光比地面的可插拔光收發(fā)器貴得多、可靠性更差,地面的光收發(fā)器是百萬級(jí)量產(chǎn)的,而且已經(jīng)很不可靠了,經(jīng)常需要拔出來擦一擦再插回去。

歸根結(jié)底,空間數(shù)據(jù)中心面臨的是同一個(gè)稀缺資源:我們到本十年末每年只能造 200 GW 的芯片。不管放在地面還是太空,都不重要。芯片是最大的瓶頸,所以你要做的是讓芯片在制造完成的那一刻就開始工作產(chǎn)出 token。為此,地面的人們?cè)谧龈鞣N事情來加速部署,數(shù)據(jù)中心模塊化、機(jī)架模塊化、甚至在數(shù)據(jù)中心現(xiàn)場(chǎng)才裝芯片(其他所有東西提前布好線)。這些在太空做不到。

太空數(shù)據(jù)中心終會(huì)有意義的那一天,但不會(huì)在這個(gè)十年,而是在更遠(yuǎn)的未來。當(dāng)能源真正成為大瓶頸、當(dāng)土地和審批更加困難、當(dāng)芯片不再是瓶頸的時(shí)候。馬斯克不靠 20% 的優(yōu)化贏,他靠的是 10 倍的顛覆,那是 SpaceX 和 Tesla 成功的模式。太空數(shù)據(jù)中心也許最終能提供 10 倍優(yōu)勢(shì),但不是在地球資源還沒用完的時(shí)候。

為什么沒有更多對(duì)沖基金進(jìn)行 AGI 交易?

Dwarkesh:你做 SemiAnalysis 這些數(shù)據(jù)表格,六個(gè)月前預(yù)測(cè)了內(nèi)存危機(jī),現(xiàn)在在講清潔室(潔凈室)危機(jī),未來是設(shè)備危機(jī)。為什么只有 Leopold Aschenbrenner(前 OpenAI 超級(jí)對(duì)齊團(tuán)隊(duì)研究員,對(duì)沖基金 Situational Awareness LP 創(chuàng)始人,專注押注 AI 基礎(chǔ)設(shè)施供應(yīng)鏈的公開市場(chǎng)股票。

該基金 2025 年上半年扣費(fèi)后回報(bào)率達(dá) 47%,遠(yuǎn)超同期標(biāo)普 500 的 6%;截至 2025 年四季度,其公開持倉規(guī)模從創(chuàng)立時(shí)的 2.25 億美元增長(zhǎng)至約 55 億美元)在用你的數(shù)據(jù)賺瘋了?其他人在干什么?

Dylan:很多人在賺錢,只是方式不同。Leopold 開玩笑說他是唯一一個(gè)告訴我“你的數(shù)字太低了”的客戶,其他所有人都說我的數(shù)字太高了。不管是超級(jí)云廠商還是 AI 實(shí)驗(yàn)室,都說“那家公司不可能有那么多”,然后我們得費(fèi)勁用事實(shí)說服他們。有時(shí)候他們要六個(gè)月到一年才接受現(xiàn)實(shí)。

我大約 60% 的業(yè)務(wù)來自產(chǎn)業(yè)客戶,AI 實(shí)驗(yàn)室、數(shù)據(jù)中心公司、超級(jí)云廠商、半導(dǎo)體公司。另外 40% 來自對(duì)沖基金。很多基金也在用我們的數(shù)據(jù)交易。比如內(nèi)存交易,一年前如果你告訴別人內(nèi)存價(jià)格會(huì)翻四倍、智能手機(jī)出貨量下降 40%,所有人都會(huì)說你瘋了。但有一些人相信了,而且交易了內(nèi)存股票。Leopold 當(dāng)然在持倉規(guī)模和倉位構(gòu)建上做得可能比大多數(shù)人好,但他絕不是唯一一個(gè)。

關(guān)鍵在于信念。你得真正相信 AI 會(huì)以這種方式爆發(fā),才會(huì)去做這些交易。而 Leopold 可能是所有人中對(duì) AGI 起飛最有信念的。

臺(tái)積電會(huì)將蘋果踢出 N2 制程名單嗎?

Dwarkesh:如果英偉達(dá)、亞馬遜和谷歌都愿意為 N2 產(chǎn)能出高價(jià),臺(tái)積電會(huì)不會(huì)把蘋果踢出去?

Dylan:不會(huì)直接踢出去。芯片設(shè)計(jì)周期很長(zhǎng),超過一年,所以更可能發(fā)生的是英偉達(dá)等預(yù)付產(chǎn)能擴(kuò)張費(fèi)用。臺(tái)積電不會(huì)完全驅(qū)逐蘋果,但當(dāng)蘋果訂了 X 的量時(shí),臺(tái)積電可能會(huì)說“我們預(yù)測(cè)你只需要 X-1”,然后只給 X-1。蘋果傳統(tǒng)上總是多訂 10%、然后在年中削減 10%。這個(gè)彈性空間蘋果以后可能就沒有了。

今年蘋果仍然占據(jù) N2 大部分產(chǎn)能,AMD 也在爭(zhēng)取一小部分來早期做 AI 芯片和 CPU——這對(duì) AMD 來說是個(gè)很大的賭注,因?yàn)樾轮瞥逃醒舆t風(fēng)險(xiǎn)。但隨著時(shí)間推移,蘋果占臺(tái)積電收入的比例會(huì)越來越小。

到 A16 節(jié)點(diǎn)時(shí),第一個(gè)客戶已經(jīng)不是蘋果而是 AI。蘋果不再是臺(tái)積電最親密的伙伴了,它的業(yè)務(wù)沒在增長(zhǎng),而臺(tái)積電的資本支出在膨脹。加上內(nèi)存和封裝成本上漲擠壓蘋果的物料成本,蘋果的出貨量可能會(huì)下降,進(jìn)一步變成一個(gè)不那么重要的客戶。

機(jī)器人與地緣風(fēng)險(xiǎn)

Dwarkesh:如果到 2030 年有數(shù)百萬臺(tái)人形機(jī)器人在運(yùn)行,每臺(tái)都需要本地算力,這對(duì)半導(dǎo)體有什么影響?

Dylan:不需要把所有智能都放在機(jī)器人里。更高效的做法是把大部分規(guī)劃和高層任務(wù)交給云端更強(qiáng)大的模型來做,高批量推理、更大的模型。云端給出指令比如“拿起那個(gè)杯子”,然后機(jī)器人本地的小模型處理具體的力度、重量等實(shí)時(shí)反饋。每秒或每秒十次從云端更新指令就夠了。

如果把所有處理都放在設(shè)備端,一是更貴(無法做批量推理),二是智能不夠(云端模型更大更強(qiáng)),三是我們處于半導(dǎo)體短缺的世界,機(jī)器人需要先進(jìn)制程芯片(因?yàn)楣拿舾校忝拷o一臺(tái)機(jī)器人裝一顆先進(jìn)芯片,就少了一顆給 AI 數(shù)據(jù)中心的。

Dwarkesh:這其實(shí)暗示了一個(gè)關(guān)于未來的有趣事實(shí),智能會(huì)高度集中在物理空間上。今天 80 億人的計(jì)算是分布在每個(gè)人的腦袋里的。未來即使有數(shù)百萬臺(tái)機(jī)器人散布在世界各地,實(shí)際的思考和計(jì)算仍然在集中式數(shù)據(jù)中心里完成。

Dylan:沒錯(cuò)。我覺得馬斯克也意識(shí)到了這一點(diǎn),所以他跟三星簽了大合同來造機(jī)器人芯片,一方面分散地緣風(fēng)險(xiǎn),另一方面三星的 AI 芯片產(chǎn)能競(jìng)爭(zhēng)沒臺(tái)積電那么激烈。他同時(shí)得到了地緣政治多元化和供應(yīng)鏈多元化,而且不必跟那些愿意付“無限”價(jià)格的數(shù)據(jù)中心買家直接競(jìng)爭(zhēng)。

參考資料:

1.https://www.youtube.com/watch?v=mDG_Hx3BSUE

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
47年毛主席深陷生死絕境,許光達(dá)晝夜奔襲,血戰(zhàn)一天挽救中央機(jī)關(guān)

47年毛主席深陷生死絕境,許光達(dá)晝夜奔襲,血戰(zhàn)一天挽救中央機(jī)關(guān)

山月明史
2026-03-22 19:03:08
誰還敢充長(zhǎng)期會(huì)員?男子視頻VIP充到2028年,被一紙新規(guī)一夜返貧

誰還敢充長(zhǎng)期會(huì)員?男子視頻VIP充到2028年,被一紙新規(guī)一夜返貧

溫讀史
2026-03-26 10:41:06
90后頂流被曝秘密生子,楊紫官宣休息后荒唐一幕上演

90后頂流被曝秘密生子,楊紫官宣休息后荒唐一幕上演

徐醇老表哥
2026-03-25 23:36:14
炸鍋!北約最高司令當(dāng)眾認(rèn)慫:烏軍愛國(guó)者戰(zhàn)力吊打美軍

炸鍋!北約最高司令當(dāng)眾認(rèn)慫:烏軍愛國(guó)者戰(zhàn)力吊打美軍

老馬拉車莫少裝
2026-03-26 20:01:46
重磅!新加坡國(guó)立大學(xué)原副校長(zhǎng),全職加盟清華大學(xué)

重磅!新加坡國(guó)立大學(xué)原副校長(zhǎng),全職加盟清華大學(xué)

TOP大學(xué)來了
2026-03-26 17:43:56
克羅斯“吐槽”皇馬:剛拿歐冠老佛爺就催明年?這豪門真不好混!

克羅斯“吐槽”皇馬:剛拿歐冠老佛爺就催明年?這豪門真不好混!

仰臥撐FTUer
2026-03-26 22:58:07
真男人開路虎!2026款路虎攬勝運(yùn)動(dòng)上市:售價(jià)89.8萬元起

真男人開路虎!2026款路虎攬勝運(yùn)動(dòng)上市:售價(jià)89.8萬元起

快科技
2026-03-26 21:50:10
張雪峰猝死全過程曝光!知情人發(fā)聲,本來可以活,3次機(jī)會(huì)沒抓住

張雪峰猝死全過程曝光!知情人發(fā)聲,本來可以活,3次機(jī)會(huì)沒抓住

智慧生活筆記
2026-03-25 18:23:01
57歲男護(hù)工的勸告:只靠退休金養(yǎng)老的老人,晚年生活都過得很糟糕

57歲男護(hù)工的勸告:只靠退休金養(yǎng)老的老人,晚年生活都過得很糟糕

惟來
2026-03-26 14:46:11
iPhone半夜自動(dòng)打電話,蘋果官網(wǎng)發(fā)文回應(yīng)

iPhone半夜自動(dòng)打電話,蘋果官網(wǎng)發(fā)文回應(yīng)

界面新聞
2026-03-26 15:46:22
洗草莓時(shí),有人放食鹽,有人放面粉,果農(nóng):都不對(duì),教你正確做法

洗草莓時(shí),有人放食鹽,有人放面粉,果農(nóng):都不對(duì),教你正確做法

阿龍美食記
2026-02-28 10:49:43
王曼昱悼念張雪峰:曾在逆境中力挺的博主離世,網(wǎng)絡(luò)世界的真摯友誼

王曼昱悼念張雪峰:曾在逆境中力挺的博主離世,網(wǎng)絡(luò)世界的真摯友誼

天光破云來
2026-03-27 00:12:27
光通信+CPO,邏輯最硬的11家公司

光通信+CPO,邏輯最硬的11家公司

龍頭主升趨勢(shì)
2026-03-25 17:51:33
浪姐第七季陣容官宣,越南浪姐冠軍莊法加盟

浪姐第七季陣容官宣,越南浪姐冠軍莊法加盟

生命之泉的奧秘
2026-03-25 17:55:08
一份文檔,一個(gè)截止日期:英國(guó)政府給所有房東發(fā)了"最后通知",必須發(fā)給租客!

一份文檔,一個(gè)截止日期:英國(guó)政府給所有房東發(fā)了"最后通知",必須發(fā)給租客!

英國(guó)那些事兒
2026-03-24 23:18:10
伊朗首都德黑蘭遭空襲 多地傳出爆炸聲

伊朗首都德黑蘭遭空襲 多地傳出爆炸聲

財(cái)聯(lián)社
2026-03-26 19:44:11
硬核!全省首臺(tái)!“抗癌神器”落地福建一醫(yī)院!新門診正式開診……

硬核!全省首臺(tái)!“抗癌神器”落地福建一醫(yī)院!新門診正式開診……

福建衛(wèi)生報(bào)
2026-03-26 20:09:44
2-0!2-1!邁阿密站四強(qiáng)敲定,薩巴倫卡再戰(zhàn)萊巴金娜,鄭欽文紅土賽程出爐

2-0!2-1!邁阿密站四強(qiáng)敲定,薩巴倫卡再戰(zhàn)萊巴金娜,鄭欽文紅土賽程出爐

生活新鮮市
2026-03-26 13:51:52
奔馳車主故意撞人后逃逸后續(xù)!拘5日罰500引眾怒,知情人曝內(nèi)情

奔馳車主故意撞人后逃逸后續(xù)!拘5日罰500引眾怒,知情人曝內(nèi)情

奇思妙想草葉君
2026-03-26 21:48:26
南京風(fēng)向突然變了!以前愛搭不理的南邊,現(xiàn)在要讓你高攀不起!

南京風(fēng)向突然變了!以前愛搭不理的南邊,現(xiàn)在要讓你高攀不起!

天氣觀察站
2026-03-27 02:00:11
2026-03-27 06:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16491文章數(shù) 514798關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績(jī)單:虧損超200億

頭條要聞

特朗普:對(duì)伊朗能源設(shè)施空襲再推遲10天

頭條要聞

特朗普:對(duì)伊朗能源設(shè)施空襲再推遲10天

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

本地
手機(jī)
游戲
藝術(shù)
公開課

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

手機(jī)要聞

1499 iQOO Z11系列發(fā)布丨9020mAh電池 165Hz高刷

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

藝術(shù)要聞

最美花卉圖譜!記住后保你啥花都認(rèn)識(shí)!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版