国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

下一個(gè)智能服務(wù)風(fēng)口:Token工廠行業(yè)模式解析

0
分享至


核心觀點(diǎn):

  • Token工廠的提出,引發(fā)了學(xué)術(shù)界和產(chǎn)業(yè)界極大的關(guān)注。當(dāng)前,對(duì)AI基礎(chǔ)設(shè)施的討論仍沿用“數(shù)據(jù)中心”“算力中心”這樣的傳統(tǒng)概念。但是這些概念是無(wú)法精準(zhǔn)的描述token工廠的。事實(shí)上,token工廠正在成為AI世界的基礎(chǔ)貨幣。但圍繞它的生產(chǎn)、定價(jià)、交易、消耗等內(nèi)容都處于初期階段,尚未成型。

  • Token的生產(chǎn)是token工廠的核心目標(biāo),不再是泛泛的計(jì)算或存儲(chǔ),而是聚焦于AI模型推理與訓(xùn)練所產(chǎn)生Token。

  • Token工廠的運(yùn)營(yíng)成本中,電力占比可達(dá)50-70%,其次是芯片折舊、液冷散熱、網(wǎng)絡(luò)互聯(lián)和運(yùn)維人力。與功耗產(chǎn)出對(duì)應(yīng),單位Token成本與單位功耗產(chǎn)出成反比——功耗產(chǎn)出越高,單位Token成本越低。

  • 現(xiàn)實(shí)層面看,token工廠的能源策略對(duì)于電力能源的要求極高,傳統(tǒng)研究視角將算力和電力視為獨(dú)立的兩個(gè)問(wèn)題,但是token工廠的運(yùn)行模式,兩者必須作為一個(gè)耦合系統(tǒng)來(lái)研究。電力系統(tǒng)如何配合與供應(yīng)成為了當(dāng)前的關(guān)注點(diǎn)。


(1)行業(yè)定義概念界定

Token工廠(token factory)是指大規(guī)模、高效率、低成本生產(chǎn)token為核心目標(biāo),通過(guò)算—電—熱—網(wǎng)深度協(xié)同的技術(shù)架構(gòu),電力、芯片、數(shù)據(jù)等輸入要素轉(zhuǎn)化為標(biāo)準(zhǔn)化智能服務(wù)輸出(token)的新型基礎(chǔ)設(shè)施。

Token的生產(chǎn)是token工廠的核心目標(biāo),不再是泛泛的計(jì)算或存儲(chǔ),而是聚焦于AI模型推理與訓(xùn)練所產(chǎn)生Token。它更強(qiáng)調(diào)工業(yè)化的規(guī)模經(jīng)濟(jì)效應(yīng),實(shí)現(xiàn)高效率、低成本的生產(chǎn)模式。將計(jì)算、電力、散熱、網(wǎng)絡(luò)視為一個(gè)有機(jī)整體進(jìn)行優(yōu)化,而非割裂的子系統(tǒng)。對(duì)于Token工廠來(lái)說(shuō),電力、芯片和數(shù)據(jù)才是他的原材料,產(chǎn)出可計(jì)量、可定價(jià)、具有交易屬性的Token則是它的產(chǎn)出物,也就是為客戶提供標(biāo)準(zhǔn)化的智能服務(wù)(Token)。

相較于傳統(tǒng)的數(shù)據(jù)中心、算力中心,Token工廠的核心是“生產(chǎn)token”這個(gè)工業(yè)化過(guò)程,而不僅僅是提供計(jì)算資源。

具體區(qū)別如下:

表格1 Token工廠與傳統(tǒng)數(shù)據(jù)中心、算力中心的對(duì)比


數(shù)據(jù)來(lái)源:公開(kāi)資料,融中研究

(2)市場(chǎng)規(guī)模及競(jìng)爭(zhēng)格局

1)行業(yè)市場(chǎng)規(guī)模

Token工廠目前還沒(méi)有官方統(tǒng)計(jì)口徑,這一概念是英偉達(dá)在2026年的GTC大會(huì)上正式提出的。因此,融中研究根據(jù)Token消耗量、AI推理市場(chǎng)、AI數(shù)據(jù)中心市場(chǎng)等不同口徑來(lái)進(jìn)行市場(chǎng)規(guī)模推測(cè)。

消耗端:根據(jù)國(guó)家數(shù)據(jù)局披露的數(shù)據(jù),中國(guó)日均Token調(diào)用量從2024年初的1000億增長(zhǎng)到2026年3月的140萬(wàn)億,兩年增長(zhǎng)超過(guò)1000倍。

產(chǎn)業(yè)端:2026年3月,阿里云、百度智能云、騰訊云等相繼上調(diào)AI算力相關(guān)產(chǎn)品價(jià)格,部分模型Token計(jì)費(fèi)漲幅超過(guò)400%。英偉達(dá)預(yù)測(cè)2026-2027年全球AI算力采購(gòu)訂單積壓規(guī)模將突破1萬(wàn)億美元。阿里宣布未來(lái)三年投入超千億元用于云和AI硬件基礎(chǔ)設(shè)施建設(shè)。

2)競(jìng)爭(zhēng)格局

作為2026年3月英偉達(dá)GTC大會(huì)上正式提出的新概念,token工廠的競(jìng)爭(zhēng)格局正在快速形成中。英偉達(dá)CEO黃仁勛在GTC 2026大會(huì)上明確指出,AI競(jìng)爭(zhēng)的核心已從模型訓(xùn)練轉(zhuǎn)向Token生產(chǎn)效率(即推理)。衡量標(biāo)準(zhǔn)不再是“峰值算力”,而是“每瓦token吞吐量”和“每百萬(wàn)token成本”。

從全球來(lái)看,中美走向兩條側(cè)重不同的發(fā)展道路。美國(guó)側(cè)重于前沿突破,驅(qū)動(dòng)力來(lái)自資本與頂尖研發(fā)的良性循環(huán)。目前,英偉達(dá)Vera Rubin平臺(tái)七顆芯片全部投產(chǎn),從3nm走向1.6nm,從地面延伸至太空,從GPU擴(kuò)展至LPU。

中國(guó)則更重視向深處扎根,驅(qū)動(dòng)力來(lái)自國(guó)家戰(zhàn)略和產(chǎn)業(yè)升級(jí)的現(xiàn)實(shí)需求。應(yīng)用空間廣闊,工業(yè)場(chǎng)景和商業(yè)鏈路完整,要優(yōu)先解決算力如何真正用起來(lái)。

Token工廠概念的提出,使得AI行業(yè)內(nèi)的企業(yè)更加清晰了自己的行業(yè)定位,同時(shí)也開(kāi)始了進(jìn)一步的行業(yè)布局。英偉達(dá)的角色不再是單純的芯片供應(yīng)商,而是token工廠的全棧方案提供商。芯片層的競(jìng)爭(zhēng)正在從單性能芯片轉(zhuǎn)向系統(tǒng)解決方案。從云服務(wù)和模型層來(lái)看,調(diào)用量排名前十中,中國(guó)模型占據(jù)四席并包攬前三名:MiniMax M2.5、階躍星辰Step 3.5 Flash、DeepSeek V3.2,Kimi K2.5位列第九,中國(guó)模型的核心競(jìng)爭(zhēng)力在于極致性價(jià)比——Token價(jià)格僅為國(guó)外競(jìng)品的1/6至1/10。

(3)產(chǎn)業(yè)鏈圖譜

Token工廠產(chǎn)業(yè)鏈的傳導(dǎo)邏輯是:下游應(yīng)用爆發(fā),大模型、AI智能體等的大規(guī)模應(yīng)用,使得Token需求激增,從而導(dǎo)致算力開(kāi)始漲價(jià),上游硬件開(kāi)始擴(kuò)產(chǎn)。

表格2 Token工廠產(chǎn)業(yè)鏈?zhǔn)崂?/p>


數(shù)據(jù)來(lái)源:公開(kāi)資料,融中研究

注:電力供應(yīng)環(huán)節(jié)因企業(yè)較為分散(如核電、綠電、電網(wǎng)調(diào)度等),且此前未列出具體代表企業(yè),故暫未納入表格。如有需要,可補(bǔ)充國(guó)家電網(wǎng)、南方電網(wǎng)、中廣核等。

(4)影響與意義

Token工廠的出現(xiàn),標(biāo)志著AI產(chǎn)業(yè)從“模型競(jìng)賽”轉(zhuǎn)向“生產(chǎn)競(jìng)賽”,價(jià)值錨點(diǎn)從模型智能水平轉(zhuǎn)移至Token的生產(chǎn)效率與成本。模型正從稀缺品變?yōu)榇笞谏唐?,?jìng)爭(zhēng)焦點(diǎn)變?yōu)椤罢l(shuí)生產(chǎn)Token更快、更便宜、更穩(wěn)定”,AI由此從實(shí)驗(yàn)室經(jīng)濟(jì)走向工廠經(jīng)濟(jì)。同時(shí),能源與算力深度耦合,“算電協(xié)同”成為新范式:電力從成本項(xiàng)升級(jí)為戰(zhàn)略資源,占比高達(dá)50-70%,Token工廠通過(guò)柔性負(fù)載調(diào)度、自建微電網(wǎng)甚至捆綁核電,將算力從“云”變?yōu)榕c地理、能源、電網(wǎng)綁定的重資產(chǎn),徹底改寫(xiě)了數(shù)據(jù)中心選址與運(yùn)營(yíng)邏輯。

全球競(jìng)爭(zhēng)格局正被重塑,Token成為新型戰(zhàn)略商品。中國(guó)憑借極致性價(jià)比,在Token調(diào)用量上已反超美國(guó),形成“Token出?!边@一智能服務(wù)出口模式,中美分化出自主可控與前沿技術(shù)兩條路徑。經(jīng)濟(jì)模式上,Token演變?yōu)榭捎?jì)價(jià)、可交易的“智能貨幣”,黃仁勛提出五級(jí)定價(jià)模型,商業(yè)模式從“賣資源”(按卡時(shí))升級(jí)為“賣產(chǎn)品”(按Token),2026年集體漲價(jià)潮宣告賣方市場(chǎng)來(lái)臨。垂直整合與重資產(chǎn)化成為巨頭戰(zhàn)略,Token工廠使AI真正成為千行百業(yè)的生產(chǎn)力工具,開(kāi)啟了智能的工業(yè)化大生產(chǎn)時(shí)代。


(1)生產(chǎn)核心:芯片與集群

1)芯片

從“單芯片性能競(jìng)賽”轉(zhuǎn)向“全棧系統(tǒng)級(jí)協(xié)同”。芯片不再是孤立元件,而是與互聯(lián)、存儲(chǔ)、網(wǎng)絡(luò)深度綁定的平臺(tái)化解決方案。

表格3 關(guān)鍵玩家與策略


數(shù)據(jù)來(lái)源:融中研究

2)集群

當(dāng)集群從千卡邁向萬(wàn)卡/十萬(wàn)卡,芯片間通信效率成為整體算力利用率的關(guān)鍵瓶頸。供電、散熱、網(wǎng)絡(luò)拓?fù)?、與電網(wǎng)協(xié)同共同決定系統(tǒng)上限。

表格4 集群架構(gòu)分層


數(shù)據(jù)來(lái)源:融中研究

(2)生產(chǎn)流程

1)輸入階段

Token工廠的輸入主要包括三類核心資源:電力、數(shù)據(jù)、算力基礎(chǔ)設(shè)施。

表格5 Token工廠的輸入


數(shù)據(jù)來(lái)源:融中研究

輸入環(huán)節(jié)的競(jìng)爭(zhēng)已從“單純堆砌算力”升級(jí)為“算-電-熱-網(wǎng)”四位一體的資源整合能力。誰(shuí)能以更低成本獲得穩(wěn)定電力和高質(zhì)量數(shù)據(jù),誰(shuí)就占據(jù)Token生產(chǎn)的成本優(yōu)勢(shì)。

2)加工階段

加工環(huán)節(jié)是將輸入轉(zhuǎn)化為Token的核心過(guò)程,分為訓(xùn)練和推理兩大階段,目前重心正從訓(xùn)練向推理遷移。

表格6 Token的加工環(huán)節(jié)


數(shù)據(jù)來(lái)源:融中研究

最新架構(gòu)趨勢(shì):

Prefill-Decode分離:英偉達(dá)將推理拆分為預(yù)填充(GPU負(fù)責(zé))和解碼(Groq LPU負(fù)責(zé)),延遲降至0.1毫秒以下,性能提升35倍。

MoE(混合專家模型):僅激活部分參數(shù),大幅降低推理成本。DeepSeek等模型已廣泛應(yīng)用。

投機(jī)解碼:用小模型快速生成候選Token,大模型并行驗(yàn)證,顯著提升推理速度。

加工環(huán)節(jié)正從“通用計(jì)算”走向“場(chǎng)景化分工”。不同模型架構(gòu)、不同任務(wù)類型需要定制化的計(jì)算流水線,單一芯片難以包攬全局。

3)輸出階段

輸出環(huán)節(jié)是將加工產(chǎn)生的Token封裝為可交付、可計(jì)價(jià)的標(biāo)準(zhǔn)化產(chǎn)品,并通過(guò)API或應(yīng)用層送達(dá)用戶。

表格7 Token的輸出環(huán)節(jié)


數(shù)據(jù)來(lái)源:融中研究

輸出環(huán)節(jié)的本質(zhì)是將無(wú)形的“智能”轉(zhuǎn)化為可交易的商品。Token作為標(biāo)準(zhǔn)化計(jì)量單位,使AI服務(wù)能夠像水電一樣按需付費(fèi),極大地降低了應(yīng)用門檻。

(3)核心生產(chǎn)效率指標(biāo)

Token工廠的核心生產(chǎn)效率指標(biāo)是衡量其競(jìng)爭(zhēng)力的關(guān)鍵標(biāo)尺。與傳統(tǒng)數(shù)據(jù)中心看重資源利用率(如CPU利用率、存儲(chǔ)利用率)不同,Token工廠的價(jià)值產(chǎn)出完全圍繞“Token”展開(kāi)——評(píng)價(jià)標(biāo)準(zhǔn)已從“擁有多少芯片”轉(zhuǎn)變?yōu)椤懊客吣芎哪墚a(chǎn)出多少高質(zhì)量Token”。

1)單位功耗產(chǎn)出

核心指標(biāo)定義:Tokens per second per watt(每秒每瓦產(chǎn)出的Token數(shù)),或更宏觀的Tokens per second per megawatt(每兆瓦每秒產(chǎn)出的Token數(shù))。這一指標(biāo)直接反映了Token工廠將電力轉(zhuǎn)化為智能產(chǎn)品的核心生產(chǎn)效率。

背景與意義:AI數(shù)據(jù)中心的能耗正以驚人的速度攀升,供電能力、散熱可持續(xù)性、網(wǎng)絡(luò)拓?fù)湫誓酥僚c公共電網(wǎng)的協(xié)同能力,開(kāi)始共同決定整個(gè)系統(tǒng)的上限。因此,“每瓦Token產(chǎn)出效率(Token per Watt)”正取代傳統(tǒng)的峰值算力與單卡性能,成為新的核心KPI。這意味著評(píng)價(jià)對(duì)象已經(jīng)從“芯片”轉(zhuǎn)向“系統(tǒng)”——供電、冷卻、網(wǎng)絡(luò)、調(diào)度乃至建筑交付周期,都會(huì)被納入同一個(gè)經(jīng)濟(jì)模型進(jìn)行統(tǒng)一優(yōu)化。

提升單位功耗產(chǎn)出的核心路徑已從芯片優(yōu)化擴(kuò)展到“算-電-熱-網(wǎng)”四位一體的協(xié)同優(yōu)化。英偉達(dá)在GTC 2026上推出了Vera Rubin DSX AI Factory參考設(shè)計(jì),其核心目標(biāo)就是實(shí)現(xiàn)“每瓦最大Token產(chǎn)出”。該參考設(shè)計(jì)覆蓋計(jì)算、網(wǎng)絡(luò)與存儲(chǔ),并配套開(kāi)放、模塊化、可組合的軟件棧,將集群硬件與供電、冷卻系統(tǒng)聯(lián)動(dòng)起來(lái),從而在整體層面獲取更高的Token per watt。

2)單位成本產(chǎn)出

核心指標(biāo)定義:Cost per million tokens(每百萬(wàn)Token的成本),以及Token吞吐量帶來(lái)的每GPU每秒Token數(shù)(TPS per GPU)所對(duì)應(yīng)的總擁有成本(TCO)。它直接決定了Token工廠的盈利能力和市場(chǎng)競(jìng)爭(zhēng)力。

成本構(gòu)成:Token工廠的運(yùn)營(yíng)成本中,電力占比可達(dá)50-70%,其次是芯片折舊、液冷散熱、網(wǎng)絡(luò)互聯(lián)和運(yùn)維人力。與功耗產(chǎn)出對(duì)應(yīng),單位Token成本與單位功耗產(chǎn)出成反比——功耗產(chǎn)出越高,單位Token成本越低。

表格8 定價(jià)體系:Token作為“智能貨幣”


數(shù)據(jù)來(lái)源:融中研究

單位成本產(chǎn)出是Token工廠的“利潤(rùn)核心”。在固定功耗下,誰(shuí)的每瓦Token產(chǎn)出更高,誰(shuí)的Token成本就更低,誰(shuí)就能獲得更高的利潤(rùn)空間。分級(jí)定價(jià)體系將Token從技術(shù)術(shù)語(yǔ)轉(zhuǎn)變?yōu)榭捎?jì)價(jià)、可交易的商品,使AI服務(wù)能夠像水電一樣按需付費(fèi),極大地降低了應(yīng)用門檻。

3)時(shí)間效率

核心指標(biāo)定義:Token吞吐量(Tokens per second,TPS)、首Token延遲(Time To First Token,TTFT)、每Token生成時(shí)間(Time Per Output Token,TPOT)。這些指標(biāo)直接決定了用戶體驗(yàn)和AI系統(tǒng)的可用性。

吞吐量基準(zhǔn)(Tokens per Second)

吞吐量是Token工廠在單位時(shí)間內(nèi)能夠生成的Token總數(shù),決定了系統(tǒng)能同時(shí)服務(wù)多少用戶請(qǐng)求。

AMD MLPerf突破:2026年4月,AMD在MLPerf Inference v6.0基準(zhǔn)測(cè)試中首次突破每秒100萬(wàn)Token的吞吐量里程碑,在Llama 2 70B和GPT-OSS-120B等模型上均達(dá)到百萬(wàn)級(jí)Token/秒的性能。AMD MI355X單GPU在Llama 2 70B上實(shí)現(xiàn)100,282 Token/秒,是上一代MI325X的3.1倍。

英偉達(dá)Blackwell Ultra:GB300 NVL72的最大單GPU吞吐量達(dá)到226.2 Token/秒,比上一代GB200有顯著提升。GB300在延遲敏感型工作負(fù)載上的性能提升約1.4-1.5倍,延遲改善約1.58倍。

極致案例:字節(jié)跳動(dòng)豆包的日均Token消耗量已達(dá)120萬(wàn)億Token,折合每秒并發(fā)處理約13.9億Token。這已不是實(shí)驗(yàn)室壓力測(cè)試,而是真實(shí)生產(chǎn)環(huán)境的持續(xù)負(fù)載,代表了Token工廠吞吐能力的極限邊界。

延遲指標(biāo)(TTFT與TPOT)

首Token延遲(TTFT):從用戶發(fā)送請(qǐng)求到收到第一個(gè)Token的時(shí)間。對(duì)于交互式應(yīng)用(如聊天機(jī)器人),這是最關(guān)鍵的體驗(yàn)指標(biāo)。Lambda等廠商通過(guò)Smart Expert Routing技術(shù)將TTFT的P99延遲降低了31%。

Prefill-Decode分離:英偉達(dá)將推理拆分為預(yù)填充(Prefill,GPU負(fù)責(zé))和解碼(Decode,Groq LPU負(fù)責(zé)),通過(guò)分工協(xié)作將延遲降至0.1毫秒以下,推理性能提升35倍。

表格9 三大指標(biāo)的聯(lián)動(dòng)關(guān)系


數(shù)據(jù)來(lái)源:融中研究


(1)成本結(jié)構(gòu)

表格10 Token工廠成本結(jié)構(gòu)


數(shù)據(jù)來(lái)源:融中研究

電力成本是Token工廠最大的單項(xiàng)支出,占比過(guò)半且持續(xù)上升。控制Token成本的核心在于提升“每瓦Token產(chǎn)出效率”,而非單純壓降電價(jià)。自建微電網(wǎng)、捆綁核電、液冷普及是主要降本手段。

(2)收入模式(定價(jià)方式)

表格11 Token工廠收入模式


數(shù)據(jù)來(lái)源:融中研究

Token已成為可計(jì)價(jià)的“智能貨幣”,收入模式從單一按量計(jì)費(fèi)走向分層定價(jià)。頭部云廠商通過(guò)漲價(jià)(2026年3月漲幅30%-400%)掌握了定價(jià)權(quán),市場(chǎng)進(jìn)入賣方市場(chǎng)。未來(lái)收入增長(zhǎng)依賴智能體驅(qū)動(dòng)的Token消耗量指數(shù)級(jí)上升。

(3)商業(yè)模式

表格12 Token工廠商業(yè)模式


數(shù)據(jù)來(lái)源:融中研究

Token工廠推動(dòng)商業(yè)模式從“賣資源”向“賣智能”升級(jí),垂直整合成為巨頭首選。英偉達(dá)從芯片商轉(zhuǎn)型為“AI工廠架構(gòu)師”,阿里、字節(jié)則打通從生產(chǎn)到應(yīng)用的全鏈條。未來(lái)可能出現(xiàn)專業(yè)化的Token生產(chǎn)商與交易平臺(tái),進(jìn)一步細(xì)化分工。

Token工廠的經(jīng)濟(jì)本質(zhì)是將電力、芯片、數(shù)據(jù)轉(zhuǎn)化為可交易的智能商品。成本端以電力為核心瓶頸,收入端依賴Token分層定價(jià)與消耗量增長(zhǎng),商業(yè)模式正從資源出租走向智能產(chǎn)品交付。三者協(xié)同決定了Token工廠的盈利能力和競(jìng)爭(zhēng)壁壘。


(1)電力供應(yīng)側(cè)

電力供給側(cè)的挑戰(zhàn):從“成本項(xiàng)”到“產(chǎn)能瓶頸”的質(zhì)變

Token工廠的電力需求已從傳統(tǒng)數(shù)據(jù)中心的數(shù)十兆瓦躍升至數(shù)百兆瓦乃至吉瓦級(jí),電力不再是可替代的運(yùn)營(yíng)成本,而是決定Token總產(chǎn)量的“硬天花板”。更嚴(yán)峻的是,AI芯片對(duì)電壓波動(dòng)極度敏感,而風(fēng)光綠電的間歇性與Token工廠7×24小時(shí)連續(xù)生產(chǎn)的要求形成根本矛盾。部分地區(qū)電網(wǎng)容量已耗盡,新建Token工廠面臨“有GPU、無(wú)供電”的尷尬。黃仁勛直言:“數(shù)據(jù)中心受電力限制,1GW工廠永遠(yuǎn)不會(huì)變成2GW。”電力供給側(cè)正成為制約AI產(chǎn)業(yè)擴(kuò)張的最短木板。

(2)解決方案:算電協(xié)同

算電協(xié)同的解決方案:從“被動(dòng)用電”到“柔性共生”

破解電力瓶頸的關(guān)鍵在于讓Token工廠與電力系統(tǒng)深度協(xié)同,而非單向依賴。一方面,工廠作為“柔性負(fù)載”,可根據(jù)電網(wǎng)電價(jià)和綠電波動(dòng)動(dòng)態(tài)調(diào)整算力分配——電價(jià)低時(shí)全力訓(xùn)練模型,電價(jià)高時(shí)僅維持推理服務(wù);另一方面,頭部企業(yè)正自建微電網(wǎng),捆綁核電(微軟重啟三哩島)、地?zé)幔ü雀瑁┑确€(wěn)定清潔能源,甚至部署小型模塊化反應(yīng)堆(SMR)實(shí)現(xiàn)“離網(wǎng)運(yùn)行”。液冷普及和余熱回收進(jìn)一步提升了能源利用效率,使Token工廠從“電老虎”轉(zhuǎn)型為電網(wǎng)的“調(diào)峰伙伴”。

(3)未來(lái)趨勢(shì)

Token工廠未來(lái)的發(fā)展趨勢(shì):從“算力堆砌”到“系統(tǒng)效率”的終極競(jìng)爭(zhēng)

未來(lái)Token工廠的競(jìng)爭(zhēng)將圍繞三大趨勢(shì)展開(kāi):一是推理主導(dǎo),隨著AI智能體爆發(fā),推理算力占比將超60%,低延遲、高吞吐的推理專用芯片(如LPU)和Prefill-Decode分離架構(gòu)成為新焦點(diǎn);二是能效為王,每瓦Token產(chǎn)出(Token per Watt)取代峰值算力成為核心KPI,液冷、CPO互聯(lián)、算電協(xié)同等系統(tǒng)級(jí)優(yōu)化決定生死;三是垂直整合與分化并存,巨頭自建全鏈條Token工廠(如阿里ATH),而中小玩家轉(zhuǎn)向?qū)I(yè)化分工(算力租賃、Token交易平臺(tái))。最終,Token將像水電一樣成為普惠智能服務(wù),其生產(chǎn)成本無(wú)限逼近物理極限——電力轉(zhuǎn)化效率。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國(guó)行 eSIM 推出重要新功能,終于能在線查詢辦理了!

國(guó)行 eSIM 推出重要新功能,終于能在線查詢辦理了!

XCiOS俱樂(lè)部
2026-04-18 09:44:15
中伊原油交易遭美軍全面封鎖,中國(guó)反制措施出臺(tái)

中伊原油交易遭美軍全面封鎖,中國(guó)反制措施出臺(tái)

空景孤擾人心
2026-04-18 14:16:45
CBA焦點(diǎn)戰(zhàn)今夜打響!CCTV5直播!遼寧浙江卡位戰(zhàn)廣東沖5連勝守前4

CBA焦點(diǎn)戰(zhàn)今夜打響!CCTV5直播!遼寧浙江卡位戰(zhàn)廣東沖5連勝守前4

老吳說(shuō)體育
2026-04-18 10:20:12
長(zhǎng)沙50億身家大佬被曝私生子!曾被留置調(diào)查,如今業(yè)績(jī)壓力山大了

長(zhǎng)沙50億身家大佬被曝私生子!曾被留置調(diào)查,如今業(yè)績(jī)壓力山大了

火山詩(shī)話
2026-04-18 07:58:57
央視調(diào)查暗黑動(dòng)漫正侵蝕青少年:多平臺(tái)公然傳播被禁多年的《東京食尸鬼》,內(nèi)容充斥絕望與暴力,偽裝成0.3元可買的資源或超長(zhǎng)風(fēng)光片

央視調(diào)查暗黑動(dòng)漫正侵蝕青少年:多平臺(tái)公然傳播被禁多年的《東京食尸鬼》,內(nèi)容充斥絕望與暴力,偽裝成0.3元可買的資源或超長(zhǎng)風(fēng)光片

極目新聞
2026-04-17 14:26:49
丹麥華裔王妃文雅麗回香港娘家,還帶上27歲大兒子,母子倆長(zhǎng)得像

丹麥華裔王妃文雅麗回香港娘家,還帶上27歲大兒子,母子倆長(zhǎng)得像

健身狂人
2026-04-01 17:56:50
巴西前模特:17歲坐過(guò)愛(ài)潑斯坦飛機(jī),今揚(yáng)言要特朗普老婆身敗名裂

巴西前模特:17歲坐過(guò)愛(ài)潑斯坦飛機(jī),今揚(yáng)言要特朗普老婆身敗名裂

阿庫(kù)財(cái)經(jīng)
2026-04-15 02:02:05
俄公布?xì)W盟境內(nèi)“合法打擊目標(biāo)”!德國(guó)援烏數(shù)百枚“愛(ài)國(guó)者”導(dǎo)彈

俄公布?xì)W盟境內(nèi)“合法打擊目標(biāo)”!德國(guó)援烏數(shù)百枚“愛(ài)國(guó)者”導(dǎo)彈

鷹眼Defence
2026-04-16 16:51:03
英博2-1逆轉(zhuǎn)河南迎四連勝,呂焯毅天外飛仙絕殺,馬萊萊建功

英博2-1逆轉(zhuǎn)河南迎四連勝,呂焯毅天外飛仙絕殺,馬萊萊建功

懂球帝
2026-04-18 21:01:03
紀(jì)實(shí) 老人狂扇未讓座小伙4個(gè)耳光后猝死,家屬索賠50萬(wàn),法院判了

紀(jì)實(shí) 老人狂扇未讓座小伙4個(gè)耳光后猝死,家屬索賠50萬(wàn),法院判了

談史論天地
2026-02-19 15:41:31
59歲男子堅(jiān)持早餐吃燕麥兩年,結(jié)果讓醫(yī)生稱贊:這種習(xí)慣很值得學(xué)

59歲男子堅(jiān)持早餐吃燕麥兩年,結(jié)果讓醫(yī)生稱贊:這種習(xí)慣很值得學(xué)

健康科普365
2026-03-20 11:25:07
52 歲張震岳湘江邊夜跑!黝黑絡(luò)腮胡像外國(guó)人,男人味拉滿

52 歲張震岳湘江邊夜跑!黝黑絡(luò)腮胡像外國(guó)人,男人味拉滿

南萬(wàn)說(shuō)娛26
2026-04-12 15:22:37
太猛了,大連英博逆轉(zhuǎn)河南隊(duì)豪取4連勝,儼然已是爭(zhēng)冠熱門球隊(duì)

太猛了,大連英博逆轉(zhuǎn)河南隊(duì)豪取4連勝,儼然已是爭(zhēng)冠熱門球隊(duì)

姜大叔侃球
2026-04-18 21:26:29
澳大利亞前總理:美國(guó)扮演國(guó)際秩序的“破壞者”是有意為之

澳大利亞前總理:美國(guó)扮演國(guó)際秩序的“破壞者”是有意為之

北青網(wǎng)-北京青年報(bào)
2026-04-18 17:04:03
“最佳血壓”是多少?醫(yī)生:過(guò)65歲以后,血壓最好控制在這個(gè)范圍

“最佳血壓”是多少?醫(yī)生:過(guò)65歲以后,血壓最好控制在這個(gè)范圍

寶哥精彩賽事
2026-04-18 09:40:38
4月18日下午消息:8家發(fā)布重大利空消息,4家減持1%,最高超過(guò)4.63%

4月18日下午消息:8家發(fā)布重大利空消息,4家減持1%,最高超過(guò)4.63%

股市皆大事
2026-04-18 15:30:21
哇這大體格,目測(cè)身高175,身形如此的勻稱,男人心中的完美伴侶

哇這大體格,目測(cè)身高175,身形如此的勻稱,男人心中的完美伴侶

動(dòng)物奇奇怪怪
2026-04-12 03:42:39
未公開(kāi)的1972年尼克松訪華全套高清照

未公開(kāi)的1972年尼克松訪華全套高清照

深度知局
2026-04-15 00:16:09
訪陸剛回臺(tái)就遭清算?國(guó)臺(tái)辦強(qiáng)勢(shì)撐腰!

訪陸剛回臺(tái)就遭清算?國(guó)臺(tái)辦強(qiáng)勢(shì)撐腰!

墜入二次元的海洋
2026-04-18 20:31:54
丟大發(fā)了!濟(jì)南司機(jī)稱深夜代駕遭女子羞辱,奔馳大G手剎不知在哪

丟大發(fā)了!濟(jì)南司機(jī)稱深夜代駕遭女子羞辱,奔馳大G手剎不知在哪

火山詩(shī)話
2026-04-17 08:49:25
2026-04-18 22:11:00
融資中國(guó) incentive-icons
融資中國(guó)
股權(quán)投資與產(chǎn)業(yè)投資媒體平臺(tái)
7379文章數(shù) 21327關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

因壓線被罰 張雪機(jī)車征戰(zhàn)WSBK荷蘭站第一回合憾獲第四

頭條要聞

因壓線被罰 張雪機(jī)車征戰(zhàn)WSBK荷蘭站第一回合憾獲第四

體育要聞

時(shí)隔25年重返英超!沒(méi)有人再嘲笑他了

娛樂(lè)要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

健康
教育
手機(jī)
藝術(shù)
時(shí)尚

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

教育要聞

定了!綿陽(yáng)富樂(lè)二中、富樂(lè)二小學(xué)區(qū)劃片范圍正式變更

手機(jī)要聞

藍(lán)廠續(xù)航之王來(lái)了!vivo Y600 Pro首發(fā)10200mAh藍(lán)海電池:告別充電寶

藝術(shù)要聞

耗資600億,貴陽(yáng)人的“上海外灘”,現(xiàn)在去看,荒得嚇人

選對(duì)發(fā)型,真的能少走很多變美彎路

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版