国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從囤卡競賽到全棧競爭:GPU云賽道在卷什么?

0
分享至



昨天發(fā)的《云廠商的AI決戰(zhàn)》里,我們聊到一個關鍵判斷:今天的AI云競爭,早就不是比誰家GPU多、Token跑得快了,而是進入了全棧AI Infra的深水區(qū)。

今天咱們就順著這個思路再往下探一層:既然勝負手不在表面指標,而在底層效率,那到底該怎么評估一家云廠商是不是真的能打?

回望2025年,AI Infra的發(fā)展已經(jīng)清晰地走過了一個關鍵拐點。過去一年,模型能力的躍遷不再只是參數(shù)規(guī)模的競賽,而是越來越多地被算力可獲得性、成本結構、部署效率所重新定義。頭部廠商在GPU云、算力調度、異構集群以及工程化落地能力上的差距逐漸拉大,而這種分化正決定著誰有能力真正承載下一階段的AI商業(yè)化浪潮。

在這一進程中,一些曾被廣泛依賴的評估標準開始顯露出其局限性。



比如,Token這個易于量化、便于傳播的指標,一度被部分廠商視為衡量AI云市場的北極星。但現(xiàn)實卻給出了不同的答案:國家統(tǒng)計局最新數(shù)據(jù)顯示,2025年中國日均Token消耗量已從年初的約1000億飆升至30萬億。但據(jù)全球權威技術市場研究機構Omdia統(tǒng)計,按Token計費的MaaS服務收入僅占整個AI云市場規(guī)模的不到1%。

究其原因,大量發(fā)生在GPU云租賃、私有化部署乃至端側設備的AI算力消耗根本無法被MaaS平臺統(tǒng)計。將Token等同于AI云本身,不僅忽略了中國數(shù)字化市場復雜多樣的需求,更可能誤判了真正的技術護城河。同樣具有誤導性的還有對硬件數(shù)量的迷信,GPU的絕對數(shù)量并不等于穩(wěn)定、高效的可用算力,某頭部云廠商的模型市場中曾出現(xiàn)17.7%的GPU算力僅用于處理1.35%的極少量請求,資源浪費嚴重。

由此可見,評估一家云廠商的GPU云實力,不能只看Token消耗量或GPU卡數(shù),而應關注其底層系統(tǒng)的整體效率與可控性。而要實現(xiàn)這種效率與可控性,往往離不開對基礎設施的深度掌控。



正是在這一背景下,具備自研GPU云能力的廠商逐漸顯現(xiàn)出結構性優(yōu)勢:它們不僅能規(guī)避通用硬件的性能瓶頸與供應鏈風險,還能在軟硬協(xié)同、調度優(yōu)化和成本控制上實現(xiàn)更高維度的突破。

于是,當堆砌硬件的競賽逐漸失效、大模型進入工程期后,一個更深刻的問題浮出水面:云廠商選擇什么樣的AI Infra的建設路徑才真的可持續(xù)?對于志在擁抱AI的企業(yè)而言,決定其智能化進程成敗的究竟是采購了多少塊芯片,還是選擇一個具備怎樣系統(tǒng)性效率的合作伙伴?



在模型快速發(fā)展的關鍵時期,打開任何一篇關于AI基礎設施的報道,幾乎都會看到這樣的討論:誰又拿到了多少H20或B200?哪家云廠商降價了多少?卡型、規(guī)格、單價、交付周期……似乎只要擁有更多高端GPU,就能在這場AI競賽中勝出。

這種“唯卡論”的敘事在過去一段時間確實主導了市場情緒。畢竟,在大模型訓練高度依賴算力的背景下,硬件似乎成了最直觀的勝負手。然而,隨著行業(yè)從狂熱擴張走向理性落地,越來越多的實踐案例開始揭示一個行業(yè)現(xiàn)實:擁有算力,不等于能用好算力。AI算力的價值,最終要通過高效、穩(wěn)定、可規(guī)?;姆招问结尫懦鰜怼?/strong>

而這其中最關鍵的板塊就是GPU云。GPU云作為AI基礎設施的核心,其競賽邏輯已經(jīng)發(fā)生了根本性變革。

一方面,高端GPU供應鏈高度集中且波動劇烈。市場機構IDC統(tǒng)計數(shù)據(jù)顯示,英偉達在訓練級AI芯片(如H100、H200、B200)領域占據(jù)全球超90%的市場份額,而在中國市場,受出口管制影響,H20、L20等合規(guī)型號供應持續(xù)緊張,價格波動劇烈,交付周期長達數(shù)月,即便企業(yè)愿意支付溢價,也未必能及時拿到所需資源。



但比拿不到更棘手的,是“用不好”。以近期備受關注的英偉達H200為例,盡管已有消息傳出春節(jié)前可交付數(shù)萬顆的消息,但即便交易成行,H200也早已不是技術前沿。它的下一代Blackwell系列(如B200/GB200)性能更高。更重要的是,即便企業(yè)成功采購到H200,若缺乏底層系統(tǒng)整合能力,依然難以發(fā)揮其潛力。

許多智算中心直接部署整機柜設備,卻在上層面臨調度系統(tǒng)割裂、通信協(xié)議不統(tǒng)一、驅動與框架適配粗糙等問題,導致跨節(jié)點任務調度效率低下、故障恢復緩慢、資源碎片化嚴重。結果往往是顯存占滿,算力空轉。

這一矛盾在現(xiàn)實中尤為突出。在“2025云網(wǎng)智聯(lián)大會”上,SNAI推委會榮譽主席韋樂平指出,當前國內(nèi)智算中心已超280個,看似算力充沛,實則GPU平均利用率不足30%,且分布極不均衡。大量設施長期閑置或低效運行,暴露出典型的“有硬件、無體系”短板。而隨著MoE(Mixture of Experts)等新一代大模型架構的普及,對算力調度精度、通信效率和資源彈性的要求更是大幅提升,這也進一步放大了能用與好用之間的鴻溝。

問題顯然不在芯片本身,而在于缺少一套自主可控、軟硬協(xié)同的全棧技術底座。今天的GPU云競爭早已超越資源囤積階段,進入系統(tǒng)工程深水區(qū),成為芯片、集群、調度、穩(wěn)定性與商業(yè)化服務有機整合的綜合博弈。

也正是在這樣的行業(yè)轉折點上,百度昆侖芯、華為昇騰等國產(chǎn)AI芯片開始嶄露頭角,贏得越來越多頭部客戶的實際認可。國際權威咨詢機構弗若斯特沙利文發(fā)布的《2025年中國GPU云市場研究報告》清晰捕捉到了這一趨勢。報告首次以“自研AI加速芯片 + 萬卡級算力集群 + 云服務商業(yè)化能力”為三大核心維度,對中國GPU云市場進行系統(tǒng)評估。



報告指出,2025年上半年的中國自研GPU云市場中,百度智能云以40.4%的市場份額位居第一,華為云以29.5%份額位居第二,其他廠商合計份額為30.1%。值得注意的是,此前百度智能云已經(jīng)連續(xù)六年穩(wěn)居AI云領域榜首。

乍看之下,這似乎只是又一份廠商排名,但結合當下GPU云市場的現(xiàn)實,這個第一其實揭示了一個更深層的趨勢,AI基礎設施的競爭正在從搶卡轉向用卡,以及更深層次、更系統(tǒng)性的布局。

沿著這條路徑,我們可以以百度智能云這個領先的案例去看一看,為什么GPU云競賽的焦點不再是某一個單一指標,而是轉變成了一整個系統(tǒng)工程的轉型。



自研AI基礎設施從來不是一條容易走的路,投入大、周期長、技術風險高,任何一個環(huán)節(jié)都可能讓前期努力付諸東流,且短期內(nèi)難以看到商業(yè)回報。正因如此,盡管“全棧自研”被廣泛視為長期競爭力的關鍵,真正躬身入局的玩家卻寥寥無幾。目前,在中國AI云市場中,僅有百度智能云、華為云等少數(shù)頭部廠商選擇堅持這一路徑,并形成了從底層算力到上層應用的高效閉環(huán)。

回溯他們脫穎而出的路徑,一個關鍵問題浮現(xiàn)出來:領先,究竟源于什么?

根據(jù)報告來看,答案并非某個單點技術的突破,而是一整套關于自研芯片、集群規(guī)模、云服務能力的長期實踐。

以百度智能云為例,從硬件底層開始,其就選擇從自研AI芯片昆侖芯切入,為整個算力體系預留了持續(xù)演進的空間。算力架構不再被通用硬件鎖定,而是能圍繞真實模型需求動態(tài)優(yōu)化。值得注意的是,昆侖芯的研發(fā)起源于十余年前百度對大規(guī)模搜索場景下FPGA加速器的深度探索,其從誕生之初,就帶有為AI基礎設施服務的強烈基因。目前,昆侖芯已完成數(shù)萬卡的規(guī)模化部署,服務于招商銀行、南方電網(wǎng)、中國鋼研等上百家行業(yè)客戶。



目前昆侖芯不僅能大規(guī)模支撐百度內(nèi)部的推理業(yè)務,在訓練層面也取得了一定的成績,而前不久發(fā)布的全新一代AI芯片,在面向大規(guī)模推理場景進行深度優(yōu)化的同時,也將推出更適配多模態(tài)模型超大規(guī)模訓推的產(chǎn)品,為后續(xù)的算力演進預留空間。

芯片只是起點,要釋放規(guī)模算力的真正價值,還需要更高維度的系統(tǒng)整合。為此,在節(jié)點層,百度智能云進一步構建了百度天池超節(jié)點,通過更高密度的算力組織與更低延遲的互聯(lián),為大規(guī)模并行計算提供穩(wěn)定基礎。根據(jù)百度智能云官方披露,相比上一代產(chǎn)品,天池256超節(jié)點的整體性能提升50%,天池512超節(jié)點單個超節(jié)點即可支撐萬億參數(shù)模型訓練,大幅降低跨節(jié)點通信開銷與任務碎片化。



單節(jié)點的強悍能夠進一步提升算力使用的性價比,也讓集群的建設更加快速。2025年4月,百度智能云就已經(jīng)點亮了昆侖芯三萬卡集群,在去年11月的百度世界大會上,百度智能云表示還將不斷擴大集群規(guī)模,未來目標推向百萬級。

隨著算力規(guī)模邁過萬卡向更高層次進發(fā),挑戰(zhàn)也從"有沒有算力"轉向"能不能用好算力"。

面對大規(guī)模的模型訓推需求,在高并發(fā)、高負載的情況下保持可預期的性能表現(xiàn)至關重要。在最上層,上述那些分散在芯片,超節(jié)點與集群層面的能力被百度百舸AI計算平臺上進一步整合、放大,并以云服務的形式高效輸出。

據(jù)悉,百度百舸5.0在深度適配昆侖芯的同時,也支持多款國內(nèi)外主流芯片,在超大規(guī)模集群上的有效訓練時長超過95%,從結果來看,其在異構算力調度和集群穩(wěn)定性方面已相當成熟。不只是穩(wěn)定性,百度百舸定位面向大模型訓推一體化的AI基礎設施,能夠通過領先的AI工程加速能力,覆蓋企業(yè)在模型開發(fā)、訓練、部署及推理的全流程需求,為AI落地提供高效易用的服務。



這種多維度、全棧式的能力建設,顯著提升了對客戶多樣化、復雜化AI需求的支撐能力。目前,百度智能云已服務超過65%的央企、全部系統(tǒng)重要性銀行、95%的主流車企、一半以上的頭部游戲公司,以及眾多走在前沿的具身智能企業(yè)。這些對穩(wěn)定性、安全性和效率要求極高的客戶,用真金白銀投出了信任票。

可以說,百度智能云的全棧優(yōu)勢再次證明了研發(fā)為王、底層自研這種長期主義邏輯。在技術深水區(qū),沒有捷徑可走。唯有堅持底層自研、系統(tǒng)思維與工程落地三者合一,才能構筑真正難以逾越的競爭壁壘。如今市場份額位居第一,本質上就是對這條路線已然跑通的有力驗證。



站在產(chǎn)業(yè)演進的高度回望,GPU云的競爭早已超越技術參數(shù)與市場份額的表層較量,其真正價值在于,能否成為千行百業(yè)智能化轉型的可靠底座。

隨著模型智能的進一步提升,大規(guī)模推理需求開始對GPU云提出了更高的要求。各行各業(yè)正在將AI融入業(yè)務流程,具身智能、AI Agent等新興應用的發(fā)展,對AI基礎設施提出了更為苛刻的需求。這不僅僅是峰值算力,還包括低延遲響應、高通信效率、確定性調度以及長期可用性。

過去幾年,大模型從實驗室走向工廠、電網(wǎng)、銀行和汽車生產(chǎn)線。但當 AI 從“試驗性能力”進入“業(yè)務基礎設施”階段,產(chǎn)業(yè)側提出的要求發(fā)生了本質變化。

產(chǎn)業(yè)客戶要的從來都不只是最強算力,更是穩(wěn)定、安全、可預期、可負擔的智能服務。他們無法承受因調度抖動導致訓練中斷,不能接受因芯片斷供而業(yè)務停擺,更難以承擔高昂且不可控的推理成本。在這樣的現(xiàn)實需求面前,單純堆砌英偉達GPU的“快餐式”方案顯得力不從心。硬件再強,若缺乏底層協(xié)同與長期演進能力,終究難以支撐產(chǎn)業(yè)級AI的持續(xù)運行。

也正是在這一現(xiàn)實約束下,國產(chǎn)GPU云的縱深價值開始顯現(xiàn),云廠商需要通過從芯片到超節(jié)點,再到集群與云服務的全棧布局,構建高度協(xié)同、自主可控的AI基礎設施體系。這種系統(tǒng)性能力,不僅降低了大規(guī)模AI應用的工程門檻,更讓企業(yè)在面對快速演進的技術環(huán)境時,擁有了更強的適應力與確定性。



例如,百度天池超節(jié)點可將單卡性能提升95%,單實例推理性能提升高達8倍;華為昇騰910B的FP16算力達到256 TFLOPS,寒武紀思元590在邊緣端推理能跑出128 TOPS。這些性能優(yōu)勢使得國產(chǎn)芯片在實際應用中展現(xiàn)出強大的競爭力。

實際業(yè)務中,國產(chǎn)AI云已經(jīng)深度結合進產(chǎn)業(yè)之中,百度智能云以昆侖芯P800為核心,結合百度百舸AI計算平臺5.0,為招商銀行提供高效、穩(wěn)定的算力支持,推動大模型在金融場景的深度應用;百度智能云與長安汽車共建長安汽車智算中心,為深藍汽車等在售全系車型提供實時推理算力支持,總算力規(guī)模已超1000PFLOPs。

對企業(yè)和開發(fā)者而言,選擇GPU云,本質上是在選擇未來數(shù)年AI演進的底座。從自研芯片,到超節(jié)點算力組織,再到云平臺級的統(tǒng)一調度與服務輸出,這種縱向一體化能力,決定了這一底座是否穩(wěn)定、可控、可持續(xù)。它降低的不只是技術門檻,更是產(chǎn)業(yè)在使用AI過程中面臨的不確定性成本。

一個經(jīng)過全棧優(yōu)化、具備長期演進能力的基礎設施,不僅能支撐當前模型訓練與推理需求,更能為未來的架構升級、成本優(yōu)化和業(yè)務創(chuàng)新預留空間。底座越牢固,底層加持越顯著,在應用層和模型層構建的差異化優(yōu)勢也就越難以被復制。



更重要的是,這種自研路徑為中國產(chǎn)業(yè)保留了技術主動權。在全球供應鏈高度不確定的背景下,一個能同時駕馭國產(chǎn)芯片與國際硬件、并實現(xiàn)高效調度的平臺,意味著企業(yè)不必在安全與性能之間做痛苦取舍。AI由此真正從可選項變?yōu)楸剡x項。

因此,GPU云的競爭終局,不是資源規(guī)模的簡單比拼,而是系統(tǒng)效率與長期價值的較量。在這場比耐力、比深度、比工程定力的長跑中,真正能將算力轉化為穩(wěn)定生產(chǎn)力的一方,才有望笑到最后,托起最廣闊的產(chǎn)業(yè)未來。



聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
英國宣布參與對伊朗軍事行動 戰(zhàn)機已升空

英國宣布參與對伊朗軍事行動 戰(zhàn)機已升空

桂系007
2026-02-28 23:56:12
上海一女子回老家過年,把兩只寵物鴨留在公園“放養(yǎng)”10天,回來一看兩只鴨毫發(fā)無損,當事人:公園管理很好,上海市民的素質都很高

上海一女子回老家過年,把兩只寵物鴨留在公園“放養(yǎng)”10天,回來一看兩只鴨毫發(fā)無損,當事人:公園管理很好,上海市民的素質都很高

南國今報
2026-03-02 20:07:02
伊朗領袖一死以色列也不裝了,以方高級內(nèi)線,就在哈梅內(nèi)伊身邊?

伊朗領袖一死以色列也不裝了,以方高級內(nèi)線,就在哈梅內(nèi)伊身邊?

滄海旅行家
2026-03-03 13:42:38
封神!OpenClaw接入微信,不用切換APP,AI助手24小時隨叫隨到

封神!OpenClaw接入微信,不用切換APP,AI助手24小時隨叫隨到

冒泡泡的魚兒
2026-03-03 01:08:30
深夜,集體飆升!暴漲50%!黃金、白銀,卻突然跳水!發(fā)生了什么?

深夜,集體飆升!暴漲50%!黃金、白銀,卻突然跳水!發(fā)生了什么?

證券時報
2026-03-02 23:59:06
電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

社會醬
2026-03-01 20:43:29
為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

帶你領略快樂真諦
2026-03-03 03:40:28
浴缸陪睡只是冰山一角,多位助理服務明星方式曝光,一個個太離譜

浴缸陪睡只是冰山一角,多位助理服務明星方式曝光,一個個太離譜

離離言幾許
2026-03-02 15:53:17
頭號援軍已到,伊朗扛得住!特朗普咬牙說了一句話,臺當局天塌了

頭號援軍已到,伊朗扛得住!特朗普咬牙說了一句話,臺當局天塌了

探源歷史
2026-03-03 11:16:03
伊朗前王儲巴列維宣布將返回伊朗領導革命

伊朗前王儲巴列維宣布將返回伊朗領導革命

一種觀點
2026-01-19 19:36:11
他接受紀律審查和監(jiān)察調查

他接受紀律審查和監(jiān)察調查

錫望
2026-03-02 12:47:11
美軍在中東被捆住手腳,解放軍組織??毡ΓM入菲美日澳巡航區(qū)

美軍在中東被捆住手腳,解放軍組織海空兵力,進入菲美日澳巡航區(qū)

面包夾知識
2026-03-02 19:06:41
中國95%的房子,其實已經(jīng)沒有任何投資價值

中國95%的房子,其實已經(jīng)沒有任何投資價值

流蘇晚晴
2026-03-01 16:56:00
再見,崔龍海!

再見,崔龍海!

IN朝鮮
2026-03-02 15:47:57
與孔令輝分手12年,馬蘇坦白:那晚被黑人馱肩照,終為人生買個單

與孔令輝分手12年,馬蘇坦白:那晚被黑人馱肩照,終為人生買個單

喜歡歷史的阿繁
2026-03-03 07:26:03
3分鐘4失誤!哈登替身首秀鬧麻了…

3分鐘4失誤!哈登替身首秀鬧麻了…

柚子說球
2026-03-03 14:26:50
男子一夜輸?shù)羰畮兹f,走投無路喝下整瓶百草枯,妻子選擇放棄治療

男子一夜輸?shù)羰畮兹f,走投無路喝下整瓶百草枯,妻子選擇放棄治療

趣味萌寵的日常
2026-03-02 20:13:50
還沒翻紅就翻車了!《你好星期六》這人證明,有人不火是有原因的

還沒翻紅就翻車了!《你好星期六》這人證明,有人不火是有原因的

一娛三分地
2026-03-02 14:46:11
特朗普沒想到:哈梅內(nèi)伊雖然死了,但臨終前的一項安排會這么厲害

特朗普沒想到:哈梅內(nèi)伊雖然死了,但臨終前的一項安排會這么厲害

健身狂人
2026-03-01 13:53:47
年賺334億卻被嚴查!攜程高管集體離場,外資控股下的資產(chǎn)外逃

年賺334億卻被嚴查!攜程高管集體離場,外資控股下的資產(chǎn)外逃

米果說識
2026-03-03 10:24:25
2026-03-03 14:43:00
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3603文章數(shù) 167335關注度
往期回顧 全部

科技要聞

手機AI在MWC上卷出了新高度

頭條要聞

特朗普:不擔心美領土遭受襲擊威脅 這是戰(zhàn)爭的一部分

頭條要聞

特朗普:不擔心美領土遭受襲擊威脅 這是戰(zhàn)爭的一部分

體育要聞

35輪后積分-7,他們遭遇史上最早的降級

娛樂要聞

謝娜霸氣護夫:喊話薛之謙給張杰道歉

財經(jīng)要聞

借殼上市納斯達克?小楊哥海外"洗白"之路

汽車要聞

長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

態(tài)度原創(chuàng)

游戲
親子
藝術
數(shù)碼
軍事航空

《戰(zhàn)神》新作回歸動作本源?風格更接近《鬼泣》

親子要聞

本來只準備留一條,收到手后決定都留下來,畢竟兩條也不到80塊錢 楊雪呀

藝術要聞

Nihad Aghazada:當代阿塞拜疆畫家

數(shù)碼要聞

古爾曼爆蘋果兩大新品:iPad Pro將引入均熱板散熱,18英寸折疊屏定價三倍于現(xiàn)款

軍事要聞

美國中央司令部透露對伊朗動武全部武器裝備清單

無障礙瀏覽 進入關懷版