国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

從越用越便宜到越用越貴,誰在為AI的“算力饑渴”買單?

0
分享至

文 | 多空象限

大模型越用越便宜的神話,在一輪又一輪漲價(jià)公告中宣告終結(jié)。

短短四天之內(nèi),阿里云連發(fā)三條產(chǎn)品漲價(jià)公告:4月13日,DataWorks取消每日API調(diào)用次數(shù)限制,標(biāo)準(zhǔn)版免費(fèi)額度調(diào)整為10萬次/月,超出部分按量付費(fèi);4月15日晚,百煉部分模型單元服務(wù)價(jià)格上調(diào)2%至5%不等;同日,DDoS高防彈性95定價(jià)從100元/Mbps/月調(diào)整為150元/Mbps/月。而這已是阿里云一個(gè)月內(nèi)的第二次漲價(jià)——3月18日,其AI算力、文件存儲(chǔ)等產(chǎn)品最高漲幅已達(dá)34%。


海外的漲價(jià)更為隱蔽但同樣深刻,Anthropic調(diào)整了旗下Claude Enterprise訂閱模式:從每月每用戶最高200美元的固定費(fèi)用,轉(zhuǎn)變?yōu)槊吭?0美元基礎(chǔ)費(fèi)加上按照實(shí)際算力消耗計(jì)費(fèi)。對(duì)于重度用戶而言,新定價(jià)可能導(dǎo)致成本翻倍甚至三倍。

這一輪漲價(jià)遠(yuǎn)非一次簡(jiǎn)單的成本傳導(dǎo),有人用“硅基通脹”一詞來形容新型工業(yè)血液的價(jià)值重估,從這個(gè)角度來看,漲價(jià)的趨勢(shì)也很難就此打住。算力正在從“可無限獲取的公共資源”轉(zhuǎn)變?yōu)椤靶韪?jìng)價(jià)獲取的戰(zhàn)略資產(chǎn)”,定價(jià)權(quán)正在從應(yīng)用層向基礎(chǔ)設(shè)施層遷移。誰掌握算力,誰就掌握AI時(shí)代的鑄幣權(quán)。

為什么越用越貴?

2026年以來,全球算力需求增長(zhǎng)曲線變得越發(fā)陡峭,據(jù)全球最大的API聚合平臺(tái)OpenRouter數(shù)據(jù),2026年4月其周度累計(jì)Token消耗量較一年前提升約7-8倍。國(guó)家統(tǒng)計(jì)局今天(4月16日)發(fā)布會(huì)上的最新數(shù)據(jù)顯示,截至今年3月,日均詞元(Token)調(diào)用量突破140萬億,比上年末增長(zhǎng)超40%。

中信證券在研報(bào)中指出,Token調(diào)用量井噴帶來的是算力需求極大爆發(fā),與此同時(shí)供給側(cè)受到各類硬約束短期邊際增量有限,目前國(guó)內(nèi)外均出現(xiàn)了嚴(yán)重的算力荒。

Agent的興起是算力需求結(jié)構(gòu)最深刻的變革,以O(shè)penClaw為代表的AI Agent,單次任務(wù)消耗Token是ChatBot的10到100倍,國(guó)內(nèi)廠商紛紛推出“國(guó)產(chǎn)龍蝦”,進(jìn)一步加速了“養(yǎng)蝦”的普及。

關(guān)鍵轉(zhuǎn)變?cè)谟趥鹘y(tǒng)ChatBot產(chǎn)生的算力負(fù)載是間歇性的——用戶提問、模型回答、會(huì)話結(jié)束;而Agent的常態(tài)是持續(xù)運(yùn)行,多步驟推理、信息檢索、代碼執(zhí)行、結(jié)果迭代。這種“常駐負(fù)載”從根本上改變了算力需求的形態(tài)——從請(qǐng)求/響應(yīng)的離散模式,轉(zhuǎn)變?yōu)槿旌虺掷m(xù)的算力消耗。

這種轉(zhuǎn)變也解釋了為什么Agent和多模態(tài)應(yīng)用的爆發(fā)對(duì)推理端算力需求拉動(dòng)極大。中信證券認(rèn)為,AI芯片需求可分為訓(xùn)練和推理,目前推理端算力需求的增長(zhǎng)動(dòng)力顯著更強(qiáng)。

這樣看來,傳統(tǒng)產(chǎn)業(yè)經(jīng)濟(jì)學(xué)里的“規(guī)模效應(yīng)”失效了嗎?

傳統(tǒng)SaaS的定價(jià)邏輯建立在邊際成本遞減的假設(shè)之上——用戶越多,單位成本越低。但AI推理的邊際成本結(jié)構(gòu)截然不同,根源在于算力的邊際成本并非算法決定的,而是由物理供應(yīng)鏈決定的。高帶寬內(nèi)存的產(chǎn)能、先進(jìn)封裝的吞吐量、電力供應(yīng)的規(guī)!@些物理約束在供給側(cè)設(shè)置了剛性天花板,導(dǎo)致“需求越大、成本越高”的現(xiàn)象持續(xù)存在。

誰的產(chǎn)能,誰的壁壘?

算力“荒”的本質(zhì)并非芯片不夠,而是整個(gè)物理供應(yīng)鏈的“木桶效應(yīng)”正在集中顯形。從晶圓到封裝,從內(nèi)存到光模塊,每一個(gè)環(huán)節(jié)都在構(gòu)成一道硬約束。

在AI芯片生產(chǎn)鏈條中,CoWoS先進(jìn)封裝是當(dāng)前最關(guān)鍵的瓶頸。摩根士丹利研報(bào)顯示,臺(tái)積電2026年CoWoS總產(chǎn)能約93kwpm,較2025年底的70k增長(zhǎng)33%。但更關(guān)鍵的是,新增產(chǎn)能幾乎被輝達(dá)與博通兩大國(guó)際客戶包走,僅部分少量產(chǎn)能分配給聯(lián)發(fā)科。據(jù)臺(tái)媒報(bào)道,臺(tái)積電已全面上調(diào)2026至2027年CoWoS產(chǎn)能目標(biāo),機(jī)構(gòu)推估臺(tái)積電先進(jìn)封裝產(chǎn)能將從今年的130萬片增至2027年的200萬片。即便如此,供給仍遠(yuǎn)遠(yuǎn)無法滿足井噴式的需求。

高帶寬內(nèi)存(HBM)是AI算力另一項(xiàng)核心成本,根據(jù)SemiAnalysis的存儲(chǔ)模型測(cè)算,2026年第一季度,LPDDR5合約價(jià)格同比漲幅預(yù)計(jì)將達(dá)約4倍,DDR5合約價(jià)格同比漲幅預(yù)計(jì)將達(dá)約5倍。

AI服務(wù)器的內(nèi)存成本占比正在急劇攀升,一臺(tái)配備8顆H100 GPU的高端AI服務(wù)器,僅HBM內(nèi)存的采購(gòu)成本就可能占整機(jī)成本的30%以上。當(dāng)內(nèi)存價(jià)格以數(shù)倍的幅度跳漲時(shí),整機(jī)成本被成倍推高。

除了芯片和內(nèi)存,AI基礎(chǔ)設(shè)施中的“毛細(xì)血管”同樣面臨短缺,800G以上光收發(fā)模塊2026年預(yù)計(jì)增至6300萬組,但EML激光器產(chǎn)能被英偉達(dá)等巨頭壟斷,交期已排至2027年之后。Paddle Card等關(guān)鍵PCB組件的交期從正常的6周拉長(zhǎng)到6個(gè)月。

SemiAnalysis報(bào)告指出,更高的服務(wù)器采購(gòu)成本壓縮了項(xiàng)目預(yù)期回報(bào),迫使部分運(yùn)營(yíng)商放緩甚至擱置新部署計(jì)劃。換言之,原本應(yīng)進(jìn)入市場(chǎng)的新增供給被迫滯后,進(jìn)一步收緊了租賃市場(chǎng)的供給格局。

當(dāng)供給側(cè)每個(gè)環(huán)節(jié)——晶圓、封裝、內(nèi)存、光模塊——都形成寡頭壁壘時(shí),算力就從“可復(fù)制的商品”變成“需排隊(duì)爭(zhēng)奪的稀缺品”。

定價(jià)權(quán)轉(zhuǎn)移下的產(chǎn)業(yè)鏈博弈

漲價(jià)潮最深刻的變革不在于價(jià)格本身,而在于它重新定義了AI產(chǎn)業(yè)鏈中的權(quán)力關(guān)系。

過去十年,云計(jì)算行業(yè)遵循“只降不升”的鐵律——規(guī)模效應(yīng)驅(qū)動(dòng)價(jià)格持續(xù)下行,廠商以低價(jià)獲客、以規(guī)模取勝。然而2026年,阿里云、騰訊云、百度云等頭部廠商集體打破這一慣例。

所謂的定價(jià)權(quán)轉(zhuǎn)移主要體現(xiàn)在三個(gè)層面:

云廠商從“規(guī)模擴(kuò)張優(yōu)先”轉(zhuǎn)向“價(jià)值定價(jià)優(yōu)先”,將稀缺的GPU資源向高毛利的模型即服務(wù)(MaaS)與核心API集中。東吳證券研報(bào)分析,當(dāng)前算力緊缺下,算力租賃廠商的議價(jià)權(quán)有望提升,其業(yè)務(wù)正從單純的裸算力出租升級(jí)為模型服務(wù)或Token分成模式,即從“賣算力”轉(zhuǎn)向“賣詞元”。

大模型廠商的商業(yè)模式也在發(fā)生根本性轉(zhuǎn)變,智譜年內(nèi)三次提價(jià),整體漲幅超60%。Anthropic從固定訂閱轉(zhuǎn)向按量計(jì)費(fèi),標(biāo)志著大模型公司從“燒錢換增長(zhǎng)”向“精細(xì)化運(yùn)營(yíng)”的轉(zhuǎn)型。

硬件廠商是這輪漲價(jià)的最大受益者,SemiAnalysis數(shù)據(jù)顯示,部分2至3年前簽署的H100租賃合約,正以原價(jià)完成續(xù)約,有的合約甚至直接續(xù)約4年至2028年。一款2022年發(fā)布的芯片,在四五年后仍能以原價(jià)鎖定長(zhǎng)期租約——這在半導(dǎo)體行業(yè)歷史上極為罕見。

誰在承受成本壓力呢?

重度用戶是這場(chǎng)漲價(jià)中最直接的“受害者”,Anthropic新定價(jià)模式下,重度用戶的成本可能翻倍甚至三倍。

開發(fā)者與中小企業(yè)正在面臨“算力鴻溝”的擠壓,國(guó)內(nèi)模型廠和云平臺(tái)紛紛下調(diào)Coding Plan的額度和優(yōu)惠,智譜等廠商的Coding Plan產(chǎn)品出現(xiàn)了限購(gòu)現(xiàn)象。

二線云廠商與大模型公司同樣承壓,僅有頭部云廠商能夠獲得較為充足的先進(jìn)算力資源,中小型廠商在算力爭(zhēng)奪中處于明顯劣勢(shì)。

在此背景下,算力正在制造新的社會(huì)分層。頭部科技公司鎖定長(zhǎng)期協(xié)議和先進(jìn)產(chǎn)能,享有穩(wěn)定的算力供給和相對(duì)有利的價(jià)格;中小企業(yè)只能按小時(shí)租賃、按Token付費(fèi),在供需波動(dòng)中承受更大的成本壓力。

國(guó)產(chǎn)替代的加速窗口

算力短缺不僅帶來漲價(jià),也為國(guó)產(chǎn)算力產(chǎn)業(yè)鏈創(chuàng)造了歷史性機(jī)遇。中信證券明確判斷,AI應(yīng)用爆發(fā)對(duì)應(yīng)的國(guó)內(nèi)算力荒將會(huì)加速國(guó)產(chǎn)卡放量,預(yù)計(jì)2026年國(guó)產(chǎn)算力芯片出貨量至少實(shí)現(xiàn)翻倍以上增長(zhǎng),將為算力設(shè)計(jì)公司、先進(jìn)制程、先進(jìn)封裝、先進(jìn)存儲(chǔ)以及配套產(chǎn)業(yè)鏈帶來強(qiáng)勁增長(zhǎng)動(dòng)能。

據(jù)IDC數(shù)據(jù),2025年中國(guó)AI加速卡出貨量約400萬張,其中國(guó)產(chǎn)AI加速卡出貨量165萬張,市場(chǎng)份額約41%。華為出貨量約81萬張,市場(chǎng)份額約20%,已與英偉達(dá)形成實(shí)質(zhì)性競(jìng)爭(zhēng)格局。


在英偉達(dá)新的AI加速卡恢復(fù)對(duì)華銷售之前,中國(guó)國(guó)產(chǎn)AI加速卡廠商有望持續(xù)替代英偉達(dá)的市場(chǎng)份額。

從推理端切入國(guó)產(chǎn)替代的邏輯同樣清晰,中信證券分析指出,推理環(huán)節(jié)對(duì)算力產(chǎn)品綜合性能要求相較訓(xùn)練端任務(wù)更低,國(guó)產(chǎn)算力芯片廠商通過與互聯(lián)網(wǎng)廠商深度合作(針對(duì)特定需求定制化或優(yōu)化),能夠提供更適配需求的推理芯片,國(guó)產(chǎn)替代節(jié)奏相較于訓(xùn)練端進(jìn)展更快。

國(guó)產(chǎn)算力產(chǎn)業(yè)正形成多強(qiáng)并驅(qū)的格局,除華為外,寒武紀(jì)計(jì)劃在2026年交付50萬件AI加速器,其中包含多達(dá)30萬件最先進(jìn)的思元590和690芯片,并計(jì)劃將其芯片產(chǎn)量提高兩倍以上。海光信息新一代芯片性能約為H100的45%,2026年計(jì)劃量產(chǎn)近30萬顆。

中銀國(guó)際證券在研報(bào)中稱,“十五五”規(guī)劃建議明確提出“適度超前建設(shè)新型基礎(chǔ)設(shè)施”,算力不再僅僅是技術(shù)圈的專業(yè)議題,而是上升為國(guó)家戰(zhàn)略層面的核心競(jìng)爭(zhēng)力。

結(jié)語

短期內(nèi),供需緊張的格局難以根本緩解。大摩預(yù)測(cè)2026年CoWoS產(chǎn)能僅增長(zhǎng)33%,而Token消耗量同比已增長(zhǎng)7-8倍——產(chǎn)能增速遠(yuǎn)落后于需求增速。關(guān)鍵問題集中在AI需求可能出現(xiàn)的問題以及除NVIDIA外的投資標(biāo)的。當(dāng)定價(jià)權(quán)加速向上游集中時(shí),產(chǎn)業(yè)鏈的投資邏輯也在同步重構(gòu)。

中長(zhǎng)期來看,這輪漲價(jià)潮最深遠(yuǎn)的影響,可能在于AI產(chǎn)業(yè)成本結(jié)構(gòu)的轉(zhuǎn)變。

從“訓(xùn)練昂貴、推理便宜”到“訓(xùn)練平價(jià)、推理昂貴” 。隨著模型架構(gòu)創(chuàng)新和訓(xùn)練效率提升,訓(xùn)練成本在持續(xù)下降;但推理環(huán)節(jié)因Agent常駐負(fù)載和多模態(tài)交互的普及,正成為算力消耗和成本的核心來源。這意味著未來AI商業(yè)模式的盈利模型需要重新設(shè)計(jì)。

“算力效率”成為核心競(jìng)爭(zhēng)力,當(dāng)Token本身成為計(jì)價(jià)單位,如何降低每次交互的Token消耗、優(yōu)化推理效率,將成為繼模型能力之后企業(yè)競(jìng)爭(zhēng)的第二條核心賽道。

參考資料

[1]Token量井噴導(dǎo)致算力荒,國(guó)產(chǎn)算力在推理端加速突圍,中信證券

[2]電子行業(yè)國(guó)產(chǎn)算力全面突破:從芯片替代到系統(tǒng)架構(gòu)創(chuàng)新,中銀國(guó)際證券

[3]算力告急!SemiAnalysis深度解讀:從GPU到內(nèi)存再到光纖,AI供應(yīng)鏈全線緊繃,華爾街見聞

[4]算力漲價(jià)潮席卷全球!阿里、Anthropic連續(xù)調(diào)價(jià) 嚴(yán)重算力荒再現(xiàn),財(cái)聯(lián)社

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
砸下400億開戰(zhàn)!徐明聯(lián)手本拉登家族,硬剛中石油,千億帝國(guó)崩塌

砸下400億開戰(zhàn)!徐明聯(lián)手本拉登家族,硬剛中石油,千億帝國(guó)崩塌

愛看劇的阿峰
2026-04-19 17:40:52
狂勝35分!一場(chǎng)恥辱的勝利!和文班亞馬相比,你確實(shí)不太配拿MVP

狂勝35分!一場(chǎng)恥辱的勝利!和文班亞馬相比,你確實(shí)不太配拿MVP

籃球掃地僧
2026-04-21 09:47:36
79年對(duì)越作戰(zhàn)我軍陣亡近8千人,骨灰盒分2類,白色的不發(fā)放撫恤金

79年對(duì)越作戰(zhàn)我軍陣亡近8千人,骨灰盒分2類,白色的不發(fā)放撫恤金

翠羽
2026-04-20 20:10:06
哈文:在北京過57歲生日,在美國(guó)紐約住富人區(qū),兌現(xiàn)與李詠的約定

哈文:在北京過57歲生日,在美國(guó)紐約住富人區(qū),兌現(xiàn)與李詠的約定

姩姩有娛
2026-04-20 17:26:32
77年高考第1位女狀元,語文差1分到100,49年過去了她過得還好嗎

77年高考第1位女狀元,語文差1分到100,49年過去了她過得還好嗎

尋墨閣
2026-04-21 02:45:18
國(guó)民黨內(nèi)訌,前高層沖闖黨部斥責(zé)鄭麗文:你不配當(dāng)主席,是個(gè)卒子

國(guó)民黨內(nèi)訌,前高層沖闖黨部斥責(zé)鄭麗文:你不配當(dāng)主席,是個(gè)卒子

面包夾知識(shí)
2025-12-31 23:04:14
世錦賽:希金斯逆轉(zhuǎn)卡特晉級(jí),吳宜澤大勝晉級(jí)16強(qiáng)

世錦賽:希金斯逆轉(zhuǎn)卡特晉級(jí),吳宜澤大勝晉級(jí)16強(qiáng)

余蹮搞笑段子
2026-04-21 01:25:36
別再忍了!女生主動(dòng)用這3個(gè)技巧,高潮爽到打顫

別再忍了!女生主動(dòng)用這3個(gè)技巧,高潮爽到打顫

精彩分享快樂
2026-04-21 07:10:08
CBA一夜爆3門慘案!繼偉怒噴遼籃,廣東鎖定第5,季后賽剩4個(gè)懸念

CBA一夜爆3門慘案!繼偉怒噴遼籃,廣東鎖定第5,季后賽剩4個(gè)懸念

后仰大風(fēng)車
2026-04-20 22:36:46
“我媽說AA制暫時(shí)取消,你伺候我坐月子”聽完我直接跑去旅游了

“我媽說AA制暫時(shí)取消,你伺候我坐月子”聽完我直接跑去旅游了

多久情感
2026-04-20 09:29:24
美方敦促中國(guó)停止向俄羅斯提供軍民兩用物項(xiàng)等,中方駁斥:長(zhǎng)期向戰(zhàn)場(chǎng)提供武器、試圖延長(zhǎng)戰(zhàn)爭(zhēng)的是美國(guó)不是中國(guó),再次敦促美方停止甩鍋推責(zé)

美方敦促中國(guó)停止向俄羅斯提供軍民兩用物項(xiàng)等,中方駁斥:長(zhǎng)期向戰(zhàn)場(chǎng)提供武器、試圖延長(zhǎng)戰(zhàn)爭(zhēng)的是美國(guó)不是中國(guó),再次敦促美方停止甩鍋推責(zé)

極目新聞
2026-04-21 08:35:27
老年人的性生活多久一次合理?要戴套嗎?答案顛覆認(rèn)知

老年人的性生活多久一次合理?要戴套嗎?答案顛覆認(rèn)知

賤議你讀史
2026-03-06 23:28:50
張本智和父親怒了:請(qǐng)中國(guó)人不要罵我兒子,我們很受日本人尊重!

張本智和父親怒了:請(qǐng)中國(guó)人不要罵我兒子,我們很受日本人尊重!

拳擊時(shí)空
2026-04-21 06:23:13
女演員千萬別整容!看“金像獎(jiǎng)紅毯”章子怡,舒淇同框,就懂了

女演員千萬別整容!看“金像獎(jiǎng)紅毯”章子怡,舒淇同框,就懂了

童叔不飆車
2026-04-20 09:49:21
中日情況有變,岸田已扛旗,數(shù)萬人逼高市辭職,052D抵近奄美大島

中日情況有變,岸田已扛旗,數(shù)萬人逼高市辭職,052D抵近奄美大島

萬物知識(shí)圈
2026-04-21 09:50:55
美軍有多可怕?美專家:一旦出動(dòng)全部軍力,全球聯(lián)合也沒法抗衡!

美軍有多可怕?美專家:一旦出動(dòng)全部軍力,全球聯(lián)合也沒法抗衡!

健身狂人
2026-04-20 18:36:21
阿聯(lián)酋速度很快,剛訪華回來,高調(diào)表態(tài):上萬億真金白銀押注中國(guó)

阿聯(lián)酋速度很快,剛訪華回來,高調(diào)表態(tài):上萬億真金白銀押注中國(guó)

命運(yùn)自認(rèn)幽默
2026-04-20 13:30:49
殲-10C在伊朗現(xiàn)身,巴空軍三次嘗試未成功

殲-10C在伊朗現(xiàn)身,巴空軍三次嘗試未成功

余塩搞笑段子
2026-04-20 10:11:44
心有歸岸,何懼浮生漂泊

心有歸岸,何懼浮生漂泊

青蘋果sht
2026-04-21 05:12:24
古裝劇都是騙人的:真實(shí)的古代百姓餐桌,現(xiàn)代人看一眼就想吐

古裝劇都是騙人的:真實(shí)的古代百姓餐桌,現(xiàn)代人看一眼就想吐

富貴說
2026-04-19 14:52:13
2026-04-21 11:07:00
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
132528文章數(shù) 862110關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫(kù)克卸任,特努斯接任蘋果CEO

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

體育要聞

“被優(yōu)化”8年后,國(guó)乒方博決定換一條路重新上場(chǎng)

娛樂要聞

周潤(rùn)發(fā)時(shí)隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財(cái)經(jīng)要聞

減速機(jī)訂單已排到明年!

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

教育
時(shí)尚
親子
數(shù)碼
游戲

教育要聞

“學(xué)碩不讓讀,專碩21.8萬!”復(fù)旦讓普通人看清現(xiàn)實(shí):沒錢別硬卷

“爆冷”又如何?陳法拉的人生本就是一場(chǎng)逆襲大戲

親子要聞

孩子休學(xué)躺平,我做的第一件事,是放過自己

數(shù)碼要聞

必須收藏!2026年智能垃圾處理器推薦TOP5

《識(shí)質(zhì)存在》一百萬銷量 卡普空發(fā)布可愛賀圖

無障礙瀏覽 進(jìn)入關(guān)懷版