国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)GPU迎戰(zhàn)英偉達(dá)H200

0
分享至



給國產(chǎn)芯片多一些時間

文/林書

編輯/劉宇翔

2025年12月17日,沐曦股份在科創(chuàng)板上市,首日收盤價829.90元,較發(fā)行價104.66元上漲725.24%,沐曦專注于高性能GPU芯片研發(fā),產(chǎn)品覆蓋人工智能計(jì)算、通用計(jì)算及圖形渲染領(lǐng)域。

就在不到兩周前的12月5日,摩爾線程正式登陸科創(chuàng)板,成為“國產(chǎn)GPU第一股”,是2025年科創(chuàng)板募資額最大的IPO,從受理到過會僅用88天,發(fā)行價為114.28元/股,上市首日漲幅達(dá)425.46%。

國產(chǎn)GPU 廠商的密集上市并備受市場追捧,某種程度上,對“狼又回來了”的回應(yīng)。據(jù)媒體報道,2025年12月8日,美國總統(tǒng)特朗普在社交媒體宣布:美國將允許英偉達(dá)向中國"經(jīng)批準(zhǔn)的客戶"出口H200人工智能芯片,但需將銷售收入的25%上繳美國政府。

美國智庫進(jìn)步研究所報告顯示,H200的性能幾乎是H20的六倍,但仍與最新的Blackwell芯片存在代際差距——這恰好卡在"能用但不先進(jìn)"的甜蜜點(diǎn)上。因此美國解禁 H200其實(shí)是其"溫水煮青蛙"策略的延續(xù)——“傾銷”性能相對落后但仍具競爭力的H200芯片,試圖延緩中國國產(chǎn)替代的進(jìn)程。

更有意思的是,黃仁勛曾直言不諱地表示,增加對華芯片銷售額既能讓中國企業(yè)依賴其技術(shù),又能為公司帶來更多研發(fā)資金。這種"以戰(zhàn)養(yǎng)戰(zhàn)"的思路,與美國鷹派的"技術(shù)依賴論"不謀而合。

但這場"溫水煮青蛙"的意圖能否得逞,還要看我國接不接招。從加快國產(chǎn) GPU 廠商上市來看,顯然,我國并不上鉤。

01

沒有H200的日子

2022年至2025年,美國對華半導(dǎo)體出口管制政策層層加碼。2025年4月,美國進(jìn)一步收緊管制,導(dǎo)致英偉達(dá)為中國市場定制的特供版H20芯片被迫停售,公司因此承受了約45億美元的庫存損失及80億美元的潛在收入損失。英偉達(dá)CEO黃仁勛在2025年10月公開表示,受出口管制影響,英偉達(dá)在中國的市場份額從95%驟降至0%,公司"100%離開了中國市場"。

這三年,被業(yè)界稱為中國AI芯片產(chǎn)業(yè)的"至暗時刻",但也正是這三年,催生了國產(chǎn)芯片的加速崛起。面對外部封鎖,國產(chǎn)GPU廠商采取了"三管齊下"的突圍策略:

在單卡性能暫時無法與英偉達(dá)匹敵的情況下,國產(chǎn)廠商通過堆面積、堆晶體管、堆芯片的方式來彌補(bǔ)性能差距。華為昇騰910C采用雙Die設(shè)計(jì),F(xiàn)P16算力達(dá)到800 TFLOPS,性能逼近英偉達(dá)H100的80%;寒武紀(jì)思元590綜合性能達(dá)到英偉達(dá)A100的70-80%;海光信息深算二號FP16算力達(dá)1024 TFLOPS,接近A100的90%。

由于能效比較差,國產(chǎn)卡普遍采用"電力+工程能力"硬頂?shù)姆绞浇鉀Q功耗問題。摩爾線程的"平湖"架構(gòu)支持單芯片最高1000W TDP動態(tài)功耗管理,通過液冷等工程手段確保穩(wěn)定運(yùn)行。雖然每瓦性能仍落后英偉達(dá)約30%,但國產(chǎn)卡低功耗版已經(jīng)正流片。

說白了,在這段時期,國產(chǎn)卡往往采用用更密集的液冷,堆更多服務(wù)器機(jī)架,試圖以更強(qiáng)的工程能力來補(bǔ)落后的能效。

最后是"生態(tài)兼容+編譯層hack"。面對英偉達(dá)CUDA生態(tài)的壟斷地位,國產(chǎn)廠商采取了兼容策略。海光DCU通過ROCm生態(tài)實(shí)現(xiàn)對CUDA的"軟兼容",實(shí)測遷移效率可達(dá)85%。華為CANN架構(gòu)采用"指令翻譯+動態(tài)調(diào)度"技術(shù),實(shí)現(xiàn)對CUDA API的80%覆蓋。

這里的“兼容 CUDA”,從技術(shù)上來說,相當(dāng)于做了一層翻譯器,讓國內(nèi) GPU 能跑英偉達(dá)的指令語言,例如英偉達(dá)的函數(shù)叫 CUDA_X,國產(chǎn)的函數(shù)叫 BR_X(比如壁仞),→ 相當(dāng)于就做一張“對應(yīng)關(guān)系表”,代碼調(diào)用 CUDA_X 時自動轉(zhuǎn)成 BR_X。就像查字典一樣,把“英偉達(dá)語”翻譯成“國產(chǎn)語”,通過合并算子、分拆算子、調(diào)整執(zhí)行順序等一系列手段,將CUDA中的算式變得更適合本地語法。

但問題也顯而易見:永遠(yuǎn)慢半拍——因?yàn)閷Ψ讲粩喔抡Z言,你永遠(yuǎn)要追新詞,英偉達(dá)每次更新CUDA、更新架構(gòu),國產(chǎn)廠商立刻要做新的翻譯器,這在戰(zhàn)略上十分被動。

H200 被擋在門口的三年,國產(chǎn) GPU 技術(shù)路線呈現(xiàn)出非常鮮明的“中國式風(fēng)格”——在工藝受限的情況下,通過“架構(gòu)取巧、集群堆疊、算子融合、軟件兼容”這些工程學(xué)上的努力,硬生生把落后的硬件打磨到可用、能上規(guī)模、適配大模型訓(xùn)練的程度。

這套路線不是工程上的最優(yōu)解,但在封鎖環(huán)境下,是現(xiàn)實(shí)可行的最優(yōu)解。

02

差距到底在哪?

要評估國產(chǎn)GPU與英偉達(dá)H200的技術(shù)差距,需要用統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行量化對比。根據(jù)美國商務(wù)部工業(yè)與安全局(BIS)定義的"總處理性能"(TPP)指標(biāo),可以對主流AI芯片進(jìn)行橫向比較,作為參考。

這里的TPP指標(biāo),指的是解析:TPP = 2 × MacTOPS × 操作位長,通常以TFLOPS(FP16)× 16計(jì)算。根據(jù)伯恩斯坦研究2025年12月發(fā)布的報告,各芯片TPP性能對比如下:

- 英偉達(dá)H200:60,000 TPP(基于Hopper架構(gòu),141GB HBM3e,4.8TB/s帶寬)

- 英偉達(dá)H20:15,832 TPP(特供版,性能僅為H200的26%)

- 華為昇騰910C:36,912 TPP(性能約為H200的61.5%,國產(chǎn)最高)

- 寒武紀(jì)思元590:29,360 TPP(性能約為H200的49%)

- 海光BW1000/DCU3:14,688 TPP(性能約為H200的24.5%)

- 摩爾線程S4000:約20,000 TPP(性能約為H200的33%)

從公開數(shù)據(jù)可以看出,國產(chǎn)頂級芯片在單卡性能上仍落后H200約1.6-2倍,但已經(jīng)超越了H20,達(dá)到了"可用"的水平。

然而,在訓(xùn)練能力方面,國產(chǎn)卡單卡仍落后2-3倍,但所幸的是,集群層面可通過"堆卡+高速互聯(lián)"彌補(bǔ)部分差距。

華為CloudMatrix 384集群(384張昇騰910C)性能接近英偉達(dá)GB200 NVL72,在部分大模型訓(xùn)練任務(wù)中表現(xiàn)良好。但需要注意的是,由于工藝制程限制(國產(chǎn)芯片普遍采用7nm,H200采用4nm),每瓦性能仍落后30%左右。

推理能力方面,國產(chǎn)Top卡已持平甚至超越閹割版H20。華為昇騰910B2的INT8算力達(dá)到762 TOPS,在推理階段處理低精度數(shù)據(jù)效率較高;寒武紀(jì)思元590在推理場景中也表現(xiàn)優(yōu)異,KV-Cache放得下、帶寬夠用。沐曦曦云C550的顯存帶寬達(dá)到1600-1800GB/s,超越H200的4.8TB/s,在大規(guī)模推理任務(wù)中具有優(yōu)勢。

成本和功耗方面,目前海光BW100采購價格約10萬元/張,寒武紀(jì)590價格從最初8.5萬元降至6-7萬元,華為910C約18萬元,均顯著低于H200的30-40萬元。更重要的是,H200還需額外支付25%的"美國稅",使得國產(chǎn)卡在成本上具有約50%的優(yōu)勢。功耗方面,雖然國產(chǎn)卡單卡功耗較高,但考慮到H200的700W TDP,實(shí)際差距并不懸殊。

生態(tài)進(jìn)度是國產(chǎn)芯片最大的短板,但也是進(jìn)步最快的領(lǐng)域。

目前,華為昇騰的CANN 工具鏈已支持與 MindSpore 深度協(xié)同和 PyTorch 一鍵遷移。其他國產(chǎn)平臺也在做類似深度編譯器與中間表示 (IR) 適配,讓開發(fā)者可以更少手動改代碼地運(yùn)行大模型。



其中的主要原因,在于不同國產(chǎn)芯片廠商、云廠商、軟件團(tuán)隊(duì)、科研院校都在合作推動生態(tài)規(guī)范標(biāo)準(zhǔn)化、工具共享、適配案例共享。

這種產(chǎn)業(yè)協(xié)同在生態(tài)建設(shè)上是少見優(yōu)勢。

綜合來看,國產(chǎn)芯片與H200在訓(xùn)練方面的差距依舊存在,但在推理方面,已收斂到"能用+成本更低+可控"的水平。

現(xiàn)階段,國產(chǎn)芯片正從"勉強(qiáng)及格"向"好用"的爬坡階段邁進(jìn),根據(jù)根據(jù)伯恩斯坦的推測,預(yù)計(jì)2026-2027年,將在部分場景實(shí)現(xiàn)與H200的全面競爭。

03

未來的較量

在產(chǎn)業(yè)方面,從技術(shù)演進(jìn)來看,英偉達(dá)剛剛發(fā)布的Blackwell Ultra系列仍延續(xù)"堆料漲性能"的路線,賭的是摩爾定律(或"黃氏定律")尚未終結(jié)。所謂“黃氏定律”,不是什么物理學(xué)定律,而是英偉達(dá)CEO黃仁勛提出的'GPU性能每兩年翻一倍'的經(jīng)驗(yàn)法則。

這種“定律”與其說是自然規(guī)律,不如說是英偉達(dá)研發(fā)投入和市場策略的體現(xiàn)——每年投入超過70億美元的研發(fā)費(fèi)用,讓競爭對手望塵莫及。

但國產(chǎn)芯片沒有直接硬碰硬,而是采用"架構(gòu)取巧+多芯片封裝+集群堆疊"的迂回戰(zhàn)術(shù)。華為昇騰采用雙Die設(shè)計(jì),通過先進(jìn)封裝技術(shù)提升集成度;摩爾線程"平湖"架構(gòu)實(shí)現(xiàn)Chiplet可擴(kuò)展架構(gòu),支持計(jì)算Die、HBM3e存儲Die與IODie靈活配置;沐曦曦云C700系列進(jìn)一步擴(kuò)展對FP4等低精度的計(jì)算支持,對標(biāo)H100。

總體上來看,在先進(jìn)工藝受限的情況下,國產(chǎn)芯片通過架構(gòu)創(chuàng)新實(shí)現(xiàn)了性能突破。華為昇騰910C采用達(dá)芬奇架構(gòu)3.0,集成32個自研AI Core,支持原生CANN異構(gòu)計(jì)算;寒武紀(jì)思元590采用MLUarch架構(gòu),通過指令集優(yōu)化提升計(jì)算效率;海光深算三號采用x86+GPGPU的Chiplet封裝,通過2.5D封裝實(shí)現(xiàn)HBM2e內(nèi)存直連,帶寬達(dá)1.6TB/s。

這些技術(shù)創(chuàng)新使得國產(chǎn)芯片在特定場景下能夠?qū)崿F(xiàn)與英偉達(dá)相媲美的性能表現(xiàn)。

并且從應(yīng)用層面看,國產(chǎn)AI芯片已經(jīng)找到了自己的"舒適區(qū)",而且干得相當(dāng)不錯。

例如智算中心這類場景,現(xiàn)在已經(jīng)成了華為的“主場”。截至2025年,全國600多個智算中心項(xiàng)目中,超過300套Atlas 900超節(jié)點(diǎn)已經(jīng)商用部署,華為昇騰在智算中心領(lǐng)域可以說是"一枝獨(dú)秀"。涵蓋互聯(lián)網(wǎng)、電信、制造等多個行業(yè)。中國電信粵港澳大灣區(qū)的智算昇騰超節(jié)點(diǎn),更是成為全球首個商用的超節(jié)點(diǎn)項(xiàng)目。

同樣地,在面向國內(nèi)大生態(tài)的專用場景,例如智能安防、金融風(fēng)控、OCR / 文本語義檢索、音視頻內(nèi)容處理(如自動剪輯、AI 轉(zhuǎn)碼)等任務(wù)中,國產(chǎn)卡可針對特定算法做深度定制優(yōu)化。

通過自研編譯器和算子庫直接對接國內(nèi)框架如MindSpore,在“我只要這個任務(wù)跑得快就夠了”的場景下,專用定制往往比通用 GPU 效率更高。

而在低延遲/ 小規(guī)模邊緣場景,例如邊緣 AI、工控設(shè)備、機(jī)器人本地推理等場景,國產(chǎn) NPU/ASIC 方案比通用 GPU 效率更高。因?yàn)榧軜?gòu)從一開始就針對推理做到低功耗,不依賴重型 CUDA 生態(tài)



說到底,國產(chǎn)芯片的優(yōu)勢場景都有一個共同點(diǎn):對成本、功耗、供應(yīng)鏈安全敏感。在這些場景,性能不是唯一指標(biāo),性價比和自主可控才是王道。

總結(jié)而言,H200的有限解禁是美國"技術(shù)依賴"策略的體現(xiàn),試圖通過提供次高端產(chǎn)品維持中國對美國技術(shù)的依賴。但這一策略為時已晚——在H200“斷供”的封鎖期內(nèi),中國AI芯片產(chǎn)業(yè)已經(jīng)建立起從硬件到軟件、從單卡到集群的完整解決方案。

而這套日益牢固的基本盤,不是一塊H200 就能輕易“打回原形”的。

更重要的是,大模型越來越穩(wěn)定,訓(xùn)練次數(shù)變少的當(dāng)下,最貴的訓(xùn)練不再那么頻繁,但推理量是每天都在爆炸,國產(chǎn)卡能不能吃掉訓(xùn)練,短期不重要,只要把推理吃死,整個產(chǎn)業(yè)也就立住了。

在進(jìn)入“戰(zhàn)略相持”階段的當(dāng)下,倘若再多給國產(chǎn)芯片一些時間,假以時日,國產(chǎn)訓(xùn)練卡也將"上桌掰手腕"。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗“目擊者”構(gòu)成重大挑戰(zhàn),美以欲借鑒烏攔截?zé)o人機(jī)經(jīng)驗(yàn)

伊朗“目擊者”構(gòu)成重大挑戰(zhàn),美以欲借鑒烏攔截?zé)o人機(jī)經(jīng)驗(yàn)

參考消息
2026-03-11 15:44:04
戰(zhàn)事升溫,朝鮮開始上場,多國對美發(fā)出檄文,伊朗導(dǎo)彈發(fā)射率變了

戰(zhàn)事升溫,朝鮮開始上場,多國對美發(fā)出檄文,伊朗導(dǎo)彈發(fā)射率變了

人間放映廳
2026-03-12 13:28:25
蔚來給李斌發(fā)823億激勵!解鎖條件:市值1200億+凈利412億

蔚來給李斌發(fā)823億激勵!解鎖條件:市值1200億+凈利412億

商悟社
2026-03-13 16:29:03
2007年孫道臨病危,王文娟探望留罕見照

2007年孫道臨病危,王文娟探望留罕見照

吃青菜長高
2026-03-13 20:44:09
以色列兩大死穴暴露!一不小心,就可能亡國

以色列兩大死穴暴露!一不小心,就可能亡國

毛豆論道
2026-03-13 18:45:32
滴滴發(fā)布Q4財報: 中國出行業(yè)務(wù)連續(xù)12個季度保持訂單雙位數(shù)增長、國際出行業(yè)務(wù)連續(xù)2年盈利

滴滴發(fā)布Q4財報: 中國出行業(yè)務(wù)連續(xù)12個季度保持訂單雙位數(shù)增長、國際出行業(yè)務(wù)連續(xù)2年盈利

封面新聞
2026-03-13 17:57:04
我的媽呀!楊冪又變臉了?這也太像謝娜了吧!

我的媽呀!楊冪又變臉了?這也太像謝娜了吧!

章眽八卦
2026-03-10 12:14:10
老外對中國蔬菜消費(fèi)感到震驚,竟認(rèn)為是特權(quán)!

老外對中國蔬菜消費(fèi)感到震驚,竟認(rèn)為是特權(quán)!

特約前排觀眾
2026-02-24 00:15:08
2026年,事業(yè)單位職務(wù)職級并行改革正加速推行,來了解下

2026年,事業(yè)單位職務(wù)職級并行改革正加速推行,來了解下

戶外阿毽
2026-03-13 20:45:03
如何才能一輩子遠(yuǎn)離腦梗?記好這5個不花錢的方法,養(yǎng)出健康血管

如何才能一輩子遠(yuǎn)離腦梗?記好這5個不花錢的方法,養(yǎng)出健康血管

藥師方健
2026-01-28 21:51:09
親戚可以無恥到什么地步?網(wǎng)友:張口八十萬,說做生意缺資金

親戚可以無恥到什么地步?網(wǎng)友:張口八十萬,說做生意缺資金

另子維愛讀史
2026-03-09 22:04:42
趙一曼兒子曾寫諷刺信給毛主席,55歲選擇自縊,他經(jīng)歷了什么?

趙一曼兒子曾寫諷刺信給毛主席,55歲選擇自縊,他經(jīng)歷了什么?

微野談寫作
2026-03-13 15:15:07
特朗普搞砸了!美國將迎來最致命的戰(zhàn)略反噬

特朗普搞砸了!美國將迎來最致命的戰(zhàn)略反噬

云石
2026-03-13 20:36:10
華為剛發(fā)狠貨!2499元+12000mAh,這配置太頂了

華為剛發(fā)狠貨!2499元+12000mAh,這配置太頂了

小柱解說游戲
2026-03-13 16:00:28
加納喬又作妖,切爾西首發(fā)陣容泄露 ,離隊(duì)后曼聯(lián)泄密少了很多

加納喬又作妖,切爾西首發(fā)陣容泄露 ,離隊(duì)后曼聯(lián)泄密少了很多

卡靈頓分析師
2026-03-13 20:58:00
6部薩德連夜撤走!當(dāng)著全體高層的面,李在明喊出句掏心窩子的話

6部薩德連夜撤走!當(dāng)著全體高層的面,李在明喊出句掏心窩子的話

云舟史策
2026-03-12 19:34:36
不用頻繁加油充電!3月13日吉利全新SUV來了,滿油滿電跑1730km!

不用頻繁加油充電!3月13日吉利全新SUV來了,滿油滿電跑1730km!

小李子體育
2026-03-12 19:43:24
全新雷克薩斯ES將于3月20日正式開啟預(yù)售

全新雷克薩斯ES將于3月20日正式開啟預(yù)售

車質(zhì)網(wǎng)
2026-03-13 15:04:45
8強(qiáng)只剩王楚欽、溫博瑞!梁靖崑2-0領(lǐng)先輸球原因曝光,懷念林高遠(yuǎn)

8強(qiáng)只剩王楚欽、溫博瑞!梁靖崑2-0領(lǐng)先輸球原因曝光,懷念林高遠(yuǎn)

曹說體育
2026-03-13 19:40:35
吳彥祖“誤闖”浙江素人婚禮,化身親友團(tuán)忙忙碌碌找婚鞋,伴娘:早知道就不堵門了

吳彥祖“誤闖”浙江素人婚禮,化身親友團(tuán)忙忙碌碌找婚鞋,伴娘:早知道就不堵門了

臺州交通廣播
2026-03-13 15:24:02
2026-03-13 21:36:49
最話Funtalk
最話Funtalk
不寫平庸的故事
570文章數(shù) 597關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

特朗普鼓動油輪"大膽"過霍爾木茲海峽:伊朗沒有海軍

頭條要聞

特朗普鼓動油輪"大膽"過霍爾木茲海峽:伊朗沒有海軍

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財經(jīng)要聞

中小銀行定存利率落入“1”時代

汽車要聞

置換補(bǔ)貼價8.68萬 五菱繽果S 525km旗艦款上市

態(tài)度原創(chuàng)

房產(chǎn)
手機(jī)
旅游
教育
游戲

房產(chǎn)要聞

不容易??!海口終于又要賣地了!

手機(jī)要聞

vivo X300 Ultra搭載全新1697上揚(yáng)聲器、0.8cc大腔體

旅游要聞

F1期間限定!來安亭老街“逛吃逛吃”→(附美食購物娛樂攻略)

教育要聞

家長稱8天假期打印了60多頁作業(yè)

一個月就打折?《仁王3》開啟首場促銷 光榮吆喝宣傳

無障礙瀏覽 進(jìn)入關(guān)懷版