国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

落子“三算盤”,華為押注Token經(jīng)濟(jì)時代

0
分享至






內(nèi)容/山南

編輯/詠鵝

校對/莽夫

在AI應(yīng)用遍地開花的2025年,AI推理這一細(xì)分賽道也因行業(yè)急速發(fā)展而規(guī)模膨脹。

“現(xiàn)在所需的推理計算量已經(jīng)比大型語言模型剛開始出現(xiàn)時增加了100倍,而這僅僅是個開始。”英偉達(dá)首席執(zhí)行官黃仁勛在今年2月時公開表示。

無獨有偶,摩根士丹利分析師也預(yù)估,未來幾年美國超過75%的電力和計算需求將用于推理。

推理算力需求百倍增長的背后,是觸及到了企業(yè)AI應(yīng)用落地的核心邏輯:推理性能直接決定了用戶體驗的優(yōu)劣與商業(yè)模式的可行性。正因如此,AI推理這塊蛋糕,成為了基建企業(yè)勢在必得之利。

華為近期發(fā)布的UCM推理記憶數(shù)據(jù)管理器,被業(yè)界譽(yù)為AI推理技術(shù)的一次重大革命。然而,華為落子AI推理的真正意圖,遠(yuǎn)不止于押注單一技術(shù)的工具增益,而在于構(gòu)筑一盤AI生態(tài)的大棋局。

Part.1

AI步入深水區(qū)

推理成增長奇點

AI浪潮席卷之下,產(chǎn)業(yè)鏈上下游機(jī)遇與挑戰(zhàn)并存,AI推理首當(dāng)其沖,成為重要戰(zhàn)場與增長爆點。

中信建投最新白皮書揭示顯著趨勢,隨著AI算力消耗從訓(xùn)練向推理的結(jié)構(gòu)性轉(zhuǎn)變,國內(nèi)算力消耗正快速增長。以字節(jié)跳動為例,其Token消耗量每三個月近乎翻倍,5月底已達(dá)16.4萬億Token。按此增速,主流云服務(wù)商將很快感受到算力緊張,出現(xiàn)算力缺口——單次Agent任務(wù)平均消耗Token量級已攀升至10萬量級。

然而,新興市場的定價邏輯往往異于常理,并不完全由需求決定價格。面對大模型藍(lán)海,巨頭、創(chuàng)企、運(yùn)營商…各類企業(yè)蜂擁而入,ToB市場也沒能逃脫卷價格的魔咒。

自去年5月先是阿里云打響大模型降價第一槍,后百度旋即宣布文心兩大主力模型ERNIE Speed和ERNIE Lite全面免費(fèi),再至今年6月,豆包大模型1.6發(fā)布并進(jìn)一步降低價格門檻壓至2.6元/百萬Tokens。

價格廝殺背后,Token的處理成本和質(zhì)量成為大模型行業(yè)競爭的關(guān)鍵要素,AI推理能力則成為撬動增長的關(guān)鍵奇點。MiniMax創(chuàng)始人、CEO閆俊杰斷言:“在接下來一兩年之內(nèi),最好模型的推理成本可能還能再降低一個數(shù)量級!

但技術(shù)差距不容忽視。據(jù)華為數(shù)據(jù)顯示,目前國外主要大模型(OpenAI O3-mini、Google Gemini等)服務(wù)的單用戶輸出速度已達(dá)200 tokens/s區(qū)間(時延5ms),而國內(nèi)普遍低于60 tokens/s(時延50—100ms)。

OpenAI O3 mini每秒輸出的Token數(shù)約為國內(nèi)某開源大模型的10倍,用戶體驗差異立現(xiàn),直接感受到OpenAI的回答速度比國內(nèi)大模型要快很多。由此可見,中國AI推理市場還有很大的上升空間。

正如華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰所言:“AI時代,模型訓(xùn)練、推理效率與體驗的量綱都以Token數(shù)為表征,Token經(jīng)濟(jì)已經(jīng)到來”。

搶占Token時代先機(jī),是華為布局AI推理最顯性的戰(zhàn)略落子,這是華為的第一個算盤。

Part.2

華為UCM

AI推理能力橫向剖析

聚焦華為最新推出的AI推理技術(shù)UCM,其核心競爭力與市場定位究竟如何?

華為UCM是一款以KV Cache(鍵值緩存)為中心的推理加速套件,融合多類型緩存加速算法工具,可以分級管理推理過程中產(chǎn)生的KV Cache記憶數(shù)據(jù),擴(kuò)大推理上下文窗口,以實現(xiàn)高吞吐、低時延的推理體驗,從而降低每個Token的推理成本。

通易而言,華為UCM就像是廚房的智能調(diào)度系統(tǒng),可以把廚師做菜時需要的各種食材清單(KV Cache),用不同大小的白板、活頁夾和文件柜(多級緩存)分門別類存放,再搭配各種記憶管理工具(緩存算法工具),使大廚能輕松記住超長的菜單(擴(kuò)大上下文),從而出菜更快(低延遲),能夠服務(wù)更多客人(高吞吐),同時還更省人力(降低每個Token的成本)。最終,顧客(使用AI)的體驗就是上菜快、服務(wù)好、價格實惠。

和業(yè)界相比,華為UCM的差異化優(yōu)勢體現(xiàn)在從單點算力模組轉(zhuǎn)向系統(tǒng)級優(yōu)化。華為數(shù)據(jù)存儲產(chǎn)品線AI存儲首席架構(gòu)師李國杰表示,業(yè)界有很多開源方案有類似的方向,有的是做了其中某一層或某一些組件,但是并未看到可商用的端到端完整方案,而UCM是第一個全流程、全場景且可演進(jìn)的系統(tǒng)性方案。

這也標(biāo)志著,AI推理引擎從依賴單點算力模組,向整體系統(tǒng)效能優(yōu)化的戰(zhàn)略轉(zhuǎn)變。

此外UCM也是封鎖之下的應(yīng)對之策。美國自2025年1月2日起全面禁止向中國出口HBM2E及以上級別高帶寬內(nèi)存。這對依賴先進(jìn)硬件的AI發(fā)展構(gòu)成發(fā)展障礙。

與普通內(nèi)存(DDR)相比,HBM的傳送帶寬度是其10倍以上,并且能實現(xiàn)數(shù)千條微型通道并行傳輸,但弊端就是費(fèi)用十分高昂。在AI服務(wù)器中,HBM的成本占比約為20%至30%。

而UCM可根據(jù)記憶熱度在HBM、DRAM、SSD等存儲介質(zhì)中實現(xiàn)按需流動,同時融合多種稀疏注意力算法實現(xiàn)存算深度協(xié)同,使長序列場景下TPS(每秒處理Token數(shù))提升2至22倍,從而降低每個Token的推理成本。

外媒TEKEDIA報道指出,UCM的“核心訴求”和服務(wù)賣點很明確:如果軟件能更充分地挖掘普通內(nèi)存的性能潛力,那么中國的供應(yīng)商(如華為等廠商)就能在不那么依賴稀缺且昂貴的高帶寬內(nèi)存(HBM)的情況下,依然提供有競爭力的AI推理服務(wù)。

“這一點至關(guān)重要。因為全球HBM市場正在迅猛增長——今年規(guī)模約340億美元,預(yù)計到2030年將達(dá)980億美元——而其供應(yīng)基本被SK海力士、三星和美光這三家非中國企業(yè)壟斷,完全不受中國控制!

可見UCM的意義遠(yuǎn)不止在于提升AI推理效率,其更深層的戰(zhàn)略意圖是為華為在內(nèi)的廠商,減少對HBM內(nèi)存的依賴,構(gòu)建一條降低關(guān)鍵硬件對外依存度、增強(qiáng)供應(yīng)鏈韌性與自主可控能力的技術(shù)路徑。

這是華為在復(fù)雜國際環(huán)境下的第二個算盤。

Part.3

開源筑基

“產(chǎn)業(yè)帝國”輪廓初顯

“大多數(shù)初創(chuàng)公司在早期階段依賴于最先進(jìn)的模型,這些模型通常都是封閉的生態(tài)系統(tǒng),擁有自己的推理機(jī)制,但今后會有越來越多的企業(yè)開始尋找替代方案,例如訓(xùn)練自己的模型,或者使用開源模型來緩解部分經(jīng)濟(jì)壓力。目前市面上已經(jīng)有很多強(qiáng)大的開源模型,未來還會有更多!盢ebius首席技術(shù)官Danila Shtan表示。

華為宣布計劃于今年9月正式開源UCM,屆時將在魔擎社區(qū)首發(fā),后續(xù)逐步貢獻(xiàn)給業(yè)界主流推理引擎社區(qū),并共享給業(yè)內(nèi)所有Share Everything(共享架構(gòu))存儲廠商和生態(tài)伙伴。

這一開源舉措,將吸引更多的開發(fā)者和企業(yè)參與到AI推理生態(tài)的建設(shè)中來,促進(jìn)框架、存儲、GPU廠商共建和成熟化整套機(jī)制,激發(fā)創(chuàng)新活力,加速技術(shù)的迭代和優(yōu)化。

不過,UCM開源也絕非賠錢“搞慈善”,當(dāng)中國乃至全球的存儲廠商、云服務(wù)商甚至競爭對手都跑在廣泛采用UCM時,一個基于華為技術(shù)棧、自主可控的AI推理基礎(chǔ)設(shè)施層將強(qiáng)勢崛起。屆時,一張由華為主導(dǎo)、覆蓋算力硬件、推理框架、應(yīng)用落地全棧的超級生態(tài)網(wǎng)絡(luò)將浮出水面,新的“產(chǎn)業(yè)帝國”已初見輪廓。

據(jù)不完全統(tǒng)計,圍繞UCM展開的AI推理生態(tài)“關(guān)鍵盟友”包括但不限于:算力硬件層的拓維信息、神州數(shù)碼、軟通動力、恒為科技等;推理框架層的華海誠科、格靈深瞳、寒武紀(jì)、瀾起科技等;應(yīng)用落地層的潤達(dá)醫(yī)療、賽意信息、云鼎科技和高瀾股份等。

開源亦是生態(tài)投資。通過賦能伙伴、壯大生態(tài),華為將收獲更廣泛的應(yīng)用場景反饋、更強(qiáng)大的標(biāo)準(zhǔn)話語權(quán)以及更穩(wěn)固的市場基礎(chǔ)。這種“以商業(yè)成功反哺技術(shù)進(jìn)化”的良性循環(huán),何嘗不是一種“以戰(zhàn)養(yǎng)戰(zhàn)”的智慧?而這也是華為押注AI推理的第三個算盤。

技術(shù)革新的車輪滾滾向前,模型的“思考”與推理能力只會愈發(fā)強(qiáng)大。華為押注AI推理的“三個算盤”,即搶占Token經(jīng)濟(jì)先機(jī)、突破HBM封鎖、構(gòu)建自主生態(tài)已清晰落子。而對于其他AI廠商而言,構(gòu)建自主、強(qiáng)大且開放的生態(tài),同樣是不容遲疑的戰(zhàn)略任務(wù)。

留給中國企業(yè)的窗口期正在收窄,構(gòu)建核心競爭力的戰(zhàn)役,已然打響。

王慶儒@ okokok-74

長期關(guān)注互聯(lián)網(wǎng)大廠、垂直行業(yè)頭部企業(yè),歡迎建聯(lián)溝通

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
特朗普稱“美國擁有無人知曉的武器”,克宮表態(tài)

特朗普稱“美國擁有無人知曉的武器”,克宮表態(tài)

環(huán)球網(wǎng)資訊
2026-01-21 21:29:06
苦盡甘來!陳光標(biāo)表示將捐贈1300萬,李亞鵬稱“德不孤行必有鄰”

苦盡甘來!陳光標(biāo)表示將捐贈1300萬,李亞鵬稱“德不孤行必有鄰”

火山詩話
2026-01-21 18:35:21
國內(nèi)媒體:向余望打進(jìn)關(guān)鍵一球,其父親喝酒慶祝到早上

國內(nèi)媒體:向余望打進(jìn)關(guān)鍵一球,其父親喝酒慶祝到早上

懂球帝
2026-01-21 16:30:14
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
上映56天,僅38個觀眾,片方分賬390元,2026年最慘電影誕生

上映56天,僅38個觀眾,片方分賬390元,2026年最慘電影誕生

胡一舸南游y
2026-01-21 17:19:09
中方收到入群邀請函,特朗普也翻臉了:關(guān)稅加到200%!受害者出現(xiàn)

中方收到入群邀請函,特朗普也翻臉了:關(guān)稅加到200%!受害者出現(xiàn)

策略述
2026-01-21 19:13:24
委內(nèi)瑞拉代總統(tǒng)會見美國中情局局長,特朗普:她會來但現(xiàn)在不合適

委內(nèi)瑞拉代總統(tǒng)會見美國中情局局長,特朗普:她會來但現(xiàn)在不合適

合贊歷史
2026-01-21 16:27:56
著名京劇演員孫彩虹逝世,曾參演并擔(dān)任87版《紅樓夢》劇務(wù)

著名京劇演員孫彩虹逝世,曾參演并擔(dān)任87版《紅樓夢》劇務(wù)

澎湃新聞
2026-01-21 15:55:20
廣東三地市新任命副市長

廣東三地市新任命副市長

南方都市報
2026-01-21 13:24:05
女子拍攝姑姑偷玉米被姑父棒殺!姑姑哀求出諒解書,女兒絕不原諒

女子拍攝姑姑偷玉米被姑父棒殺!姑姑哀求出諒解書,女兒絕不原諒

葉公子
2026-01-21 18:50:53
剛剛 | 德云社嚴(yán)正聲明!

剛剛 | 德云社嚴(yán)正聲明!

天津廣播
2026-01-21 20:23:38
讓“吹哨人”敢吹哨!謹(jǐn)以此文致敬羅永浩

讓“吹哨人”敢吹哨!謹(jǐn)以此文致敬羅永浩

社會日日鮮
2026-01-21 09:17:54
“三評西貝關(guān)店事件”,人民日報有6個問題說錯了

“三評西貝關(guān)店事件”,人民日報有6個問題說錯了

黔有虎
2026-01-21 16:52:45
直沖20℃!浙江升溫時間確定

直沖20℃!浙江升溫時間確定

魯中晨報
2026-01-21 19:27:03
四連勝的越南隊!為何會被U23國足吊打,越南媒體撰文給出答案

四連勝的越南隊!為何會被U23國足吊打,越南媒體撰文給出答案

懂個球
2026-01-22 00:08:47
國家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

國家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

霹靂炮
2026-01-19 22:24:13
人去樓空、資金鏈斷裂!又一平臺暴雷,老板疑跑路,有人剛充上萬

人去樓空、資金鏈斷裂!又一平臺暴雷,老板疑跑路,有人剛充上萬

品牌觀察官
2026-01-20 17:53:37
一份假公證書引發(fā)的“繼承之戰(zhàn)”:西安翻譯學(xué)院已故創(chuàng)始人兩女兒爭奪“舉辦者身份”,一審宣判后3名原告上訴

一份假公證書引發(fā)的“繼承之戰(zhàn)”:西安翻譯學(xué)院已故創(chuàng)始人兩女兒爭奪“舉辦者身份”,一審宣判后3名原告上訴

極目新聞
2026-01-21 21:50:59
藍(lán)白迎戰(zhàn)彈劾審查會,賴清德不出席,現(xiàn)場擺出“清德宗”看板

藍(lán)白迎戰(zhàn)彈劾審查會,賴清德不出席,現(xiàn)場擺出“清德宗”看板

海峽導(dǎo)報社
2026-01-21 09:52:03
中國網(wǎng)球名將退役!曾4奪大滿貫冠軍,最高排名雙打世界第一

中國網(wǎng)球名將退役!曾4奪大滿貫冠軍,最高排名雙打世界第一

全景體育V
2026-01-21 14:45:38
2026-01-22 02:04:49
正見TrueView incentive-icons
正見TrueView
去見證,用正見。
262文章數(shù) 235關(guān)注度
往期回顧 全部

科技要聞

給機(jī)器人做仿真訓(xùn)練 這家創(chuàng)企年營收破億

頭條要聞

中國球迷被指可免費(fèi)入場看U23國足決賽 中使館回應(yīng)

頭條要聞

中國球迷被指可免費(fèi)入場看U23國足決賽 中使館回應(yīng)

體育要聞

只會防守反擊?不好意思,我們要踢決賽了

娛樂要聞

首位捐款的明星 苗圃現(xiàn)身嫣然醫(yī)院捐款

財經(jīng)要聞

丹麥打響第一槍 歐洲用資本保衛(wèi)格陵蘭島

汽車要聞

2026款上汽大眾朗逸正式上市 售價12.09萬起

態(tài)度原創(chuàng)

本地
家居
游戲
旅游
公開課

本地新聞

云游遼寧|漫步千年小城晨昏,“康”復(fù)好心情

家居要聞

褪去浮華 觸達(dá)松弛與欣喜

《FF7RE》N2版M站均分90分:無一差評質(zhì)量夯爆了

旅游要聞

不必跟風(fēng)“殺豬宴”,鄉(xiāng)村旅游沒有“標(biāo)準(zhǔn)答案”|新京報專欄

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版