国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek V4省73%算力 中國AI走出第二條路

0
分享至


2026年4月,DeepSeek發(fā)布了V4版本。

總參數(shù)1.6T,激活參數(shù)49B,首次將百萬token上下文做到了"標配"。Agent Coding交付質(zhì)量按內(nèi)部評測,已經(jīng)接近Anthropic Claude Opus 4.6的非思考模式。技術(shù)圈刷屏,朋友圈刷屏。

大眾媒體的解讀集中在三件事上:

一是性能再上一檔,對標海外頭部模型。二是開源繼續(xù),國產(chǎn)替代再下一城。三是API限時優(yōu)惠5月5日截止,緩存命中價格低到一杯咖啡都買不起。

但這次V4發(fā)布,最值得注意的,或許不是上面這些。

而是DeepSeek官方公告里的一行小字——"每token算力消耗僅為V3.2的27%"。

27%。換個說法,新模型只用舊模型27%的算力,就能跑同樣規(guī)模的token。

"這有什么?不就是模型架構(gòu)升級,效率提升一些嗎?過去幾代模型都在做這件事。"

其實,不是的。

上一代V3.2是2025年9月發(fā)布的,到V4只過了半年。在僅僅半年里,把每token的算力消耗砍掉73%,幅度遠高于行業(yè)平均。更關(guān)鍵的是,DeepSeek這次沒有等英偉達B200、H200在國內(nèi)放量,沒有等更高級的進口算力到位,而是選擇了一條幾乎反方向的路:在現(xiàn)有的算力規(guī)模上,讓模型自己學會"省"。

這中間,發(fā)生了什么?

老規(guī)矩,我爭取用一篇文章,幫你讀明白。

01 一個token的算力,到底是怎么花掉的?

要看懂"省了73%"是什么概念,得先看懂一個token的算力是怎么花掉的。

簡單說,大模型推理的成本主要由兩部分組成:

第一,參數(shù)計算。模型有多少參數(shù),每生成一個token就要"過"多少次參數(shù)。GPT-4據(jù)傳是1.8T參數(shù),Claude 4級別相近。DeepSeek V4總參數(shù)1.6T,但用了MoE(混合專家)架構(gòu),每次只激活其中49B——也就是說,1.6T參數(shù)里有1500B左右"待機",每個token只過49B。

第二,KV緩存。模型生成每個token都要"記住"前文,前文越長,需要緩存的數(shù)據(jù)越多。這部分緩存通常占用GPU顯存最多,也是百萬token長上下文的瓶頸所在。

換一個生活場景。

想象你給朋友講一個長故事。講到第3萬字時,你需要回憶前面提過的人名、地點、時間、伏筆——這些就是"KV緩存"。如果你能整理出一個簡潔的"故事梗概+人物關(guān)系圖",把30000字壓縮成5000字摘要,你的"工作內(nèi)存"就輕了。

再換一個工作場景。

你做一份PPT,每翻一頁都要回看前面的邏輯鏈。如果你只翻"標題頁+關(guān)鍵圖表頁"就能記住整體節(jié)奏,你的效率會高得多。

DeepSeek V4做的,就是這件事。1.6T參數(shù)+百萬上下文,KV緩存占用降到了10%——把"故事梗概+關(guān)鍵頁"做到了極致。

02 DeepSeek為什么必須省,而不是必須快?

全球AI實驗室都在做模型架構(gòu)優(yōu)化。但路徑有兩條。

第一條是"做更聰明的模型"。OpenAI、Anthropic走的是這條——參數(shù)更大、推理鏈更長、Agent能力更強。前提是算力管夠,至少能用上H200/B200級別的最新GPU。

第二條是"在現(xiàn)有算力上做更高效的模型"。DeepSeek走的是這條——把每token的成本壓到極低,讓模型在已有的硬件上跑出最大產(chǎn)出。

這不是一道"哪條路更聰明"的題,而是"哪條路更現(xiàn)實"的題。

過去兩年,英偉達對中國市場的特供版從H800、H20一路降配,到2026年初才有限度地恢復部分供應。中國AI廠商面對的問題,不是"用最先進的算力做最強的模型",而是"用受限的算力做最有用的模型"。

回到DeepSeek。它的訓練和推理,絕大多數(shù)跑在國產(chǎn)算力(華為昇騰系列)+少量H800/H20混合集群上。在這種條件下,"每token消耗減少73%"翻譯過來就是:同樣的國產(chǎn)卡集群,可以跑3倍以上的請求量。

——這是用算法的進步,去補硬件的代差。

03 昇騰950PR,能不能接得?。?/strong>

5月初,華為給了第二個動作。

華為昇騰950PR,基于中芯國際7nm工藝,單卡推理算力較英偉達對華特供版H20提升約2.87倍。采購價為H200的1/3至1/4。阿里、字節(jié)、騰訊已下數(shù)十萬顆訂單。中國移動2026-2027年AI超節(jié)點采購20.6億元,全線華為CANN生態(tài)。

華為徐直軍2025年9月規(guī)劃的產(chǎn)品序列依次是:950PR、950DT、960、970。950PR負責推理Prefill階段,950DT針對訓練優(yōu)化。

這兩件事——DeepSeek把每token算力壓到27%、華為把單卡算力翻到H20的2.87倍——放在一起,是一道很簡單的乘法。

如果說V3.2時代每張H20卡只能服務X個并發(fā)請求,到V4時代+昇騰950PR時代,同樣的卡數(shù)能服務的并發(fā)請求數(shù)變成了:X × (1/27%) × 2.87 ≈ 10.6X。

◆ DeepSeek V4:總參數(shù)1.6T,激活49B,每token算力消耗為V3.2的27%(來源:DeepSeek官方,2026年4月)

◆ DeepSeek V4:KV緩存占用降至10%,百萬token上下文標配(來源:DeepSeek技術(shù)文檔)

◆ 華為昇騰950PR:單卡推理算力較H20提升約2.87倍,采購價為H200的1/3至1/4(來源:華為公開資料)

◆ Atlas 950 SuperPoD:8192張950昇騰加速卡,160機柜規(guī)模,2026年Q4上市(來源:華為)

◆ 中國移動AI超節(jié)點采購:20.6億元,全線華為CANN生態(tài)(來源:中國移動招標公告)

◆ OpenRouter數(shù)據(jù):2026年3月30日-4月5日,中國AI模型周調(diào)用量12.96萬億token,是美國的4.3倍

一張卡的能力漲2.87倍,每token的成本降至27%。疊加之后,原本"3張H200才能服務的請求",現(xiàn)在"1張昇騰950PR + DeepSeek V4"就能服務。

代差被悄悄補回了一截。

04 可帶走資產(chǎn):硬件代差 × 軟件優(yōu)化 = 有效算力

有效算力 = 單卡硬件能力 × 算法效率

這個乘數(shù)公式是看懂中國AI產(chǎn)業(yè)過去三年和未來三年的鑰匙。當硬件被卡脖子(左側(cè)因子下降),算法的提升(右側(cè)因子放大)可以部分補回;當算法到了極限(右側(cè)因子收斂),硬件的釋放(左側(cè)因子放大)就成了下一階段的關(guān)鍵。一頭被壓住,可以靠另一頭補;兩頭同時打開,就是產(chǎn)業(yè)拐點。

這個乘數(shù)模型,可以解釋過去三年中國AI產(chǎn)業(yè)的幾乎所有大事件。

一是2024年初DeepSeek V2發(fā)布。當時英偉達對華制裁剛剛收緊,左側(cè)因子(單卡能力)被壓低。DeepSeek用MoE+架構(gòu)創(chuàng)新拉高右側(cè)因子(算法效率),有效算力得到部分補償。

二是2024年底DeepSeek V3發(fā)布震動硅谷。同一規(guī)模的訓練成本只有同行約1/10,本質(zhì)上是右側(cè)因子(算法效率)的另一次跳躍。

三是2026年4月V4發(fā)布+昇騰950PR路線圖明確。兩邊因子同時打開——算法效率再降73%(V4),單卡能力漲到H20的2.87倍(950PR)——一道乘法把"有效算力"拉到一個新臺階。

05 這個公式,怎么用在你不太熟的地方?

這個乘數(shù)公式不只是講AI的。

換一個最普通的家用場景。

你在租房,月租3000元(硬件預算被卡)。但你愿意花兩個周末把家里收納系統(tǒng)重做一遍——把雜物分門別類、把垂直空間用滿、把不常用的東西歸到儲物間——結(jié)果是同樣3000元的房子,住起來體驗有6000元的水平。這就是"每平米實用面積"的算法優(yōu)化。

再換一個工作場景。

你的團隊預算有限,無法增加2個工程師(硬件被卡)。但你引入了AI輔助代碼評審、把重復勞動自動化、讓每個工程師從一周寫3個feature變成一周寫7個feature——同樣5個人的團隊,產(chǎn)出是10個人的。這就是"每個工位的有效產(chǎn)出"的算法優(yōu)化。

回到DeepSeek。

華為昇騰950PR單卡能力是H20的2.87倍,但仍然不及H200。中國AI實驗室沒法等"和H200一樣的卡"放進國產(chǎn)服務器,那是2027-2028年的事。怎么辦?把V3.2的算力消耗砍到27%,讓同樣的卡多干3倍的活。

這是一道完全相同的題。

——硬件被卡,算法補回;算法收斂,硬件放開。

06 為什么這是"通關(guān)券",不只是"省錢"?

如果只是"省錢",DeepSeek V4也就是一次尋常的產(chǎn)品迭代。

但"省73%"在2026年這個時間點,意義遠不止省錢。

OpenRouter公開數(shù)據(jù)顯示,2026年3月30日至4月5日的一周,中國AI模型的總調(diào)用量達到12.96萬億token,是美國同期的4.3倍。

這個數(shù)字第一次出現(xiàn)時,硅谷許多人不相信。

但只要把"有效算力 = 單卡硬件能力 × 算法效率"這個公式套進去,就能解釋——美國靠左側(cè)因子(最強GPU)跑出大基數(shù),中國靠右側(cè)因子(最優(yōu)化的算法+開源生態(tài))拉出大乘數(shù)。兩條路徑匯合,就形成了"調(diào)用量上中國是美國4.3倍"的奇觀。

對開發(fā)者而言,DeepSeek API限時優(yōu)惠的價格已經(jīng)讓"做應用"的門檻降到極低——Pro 2.5折,F(xiàn)lash緩存命中0.02元/百萬tokens。這意味著任何一個獨立開發(fā)者,可以在一個咖啡的錢里,跑出一個完整的應用Demo。

對企業(yè)而言,"昇騰950PR + V4"組合讓"私有化部署一個大模型"從"采購3000萬一套"降到"采購1000萬一套"。中型企業(yè)第一次有能力把大模型部署在自己的機房里。

07 你以為的"國產(chǎn)替代",可能是個誤會

講到這里,需要糾正一個常見的理解。

許多讀者把"DeepSeek+昇騰"理解為"國產(chǎn)替代英偉達+OpenAI"。但這個表達,可能稀釋了真正發(fā)生的事情。

真正的事情是:中國AI找到了一條不必跟著英偉達走的路。

過去十年,全球AI產(chǎn)業(yè)的算力霸權(quán)由英偉達定義。"想做更大的模型,就要更多的H100/H200"是默認前提。所有國家、所有公司都在這條路上跑。

"算法補硬件"不是替代,而是繞開。

用更高效的算法+開源生態(tài)+受限但夠用的硬件,跑出和"無限堆卡"路線相近的產(chǎn)業(yè)產(chǎn)出。這條路的價值不在于"我們也有H200",而在于"我們不需要等H200才能往前走"。

它的代價是中國AI實驗室必須比美國同行做得更聰明、更精細。它的紅利是中國可以在被卡脖子的環(huán)境里,仍然做出全球級別的產(chǎn)品。

引DeepSeek官方在V4發(fā)布說明里引用的那句《荀子·非十二子》——"不誘于譽,不恐于誹,率道而行,端然正己"。

08 產(chǎn)業(yè)鏈的真實位置:昇騰、CANN、A股

這條路徑上的產(chǎn)業(yè)鏈,正在被重新定價。

4月27日A股半導體板塊爆發(fā):覆銅板指數(shù)+5.82%、半導體設(shè)備+5.68%、GPU+3.91%。芯源微+17.81%、富創(chuàng)精密+16.03%、長川科技+10.77%。這一輪上漲的邏輯,正是市場對"國產(chǎn)算力放量+下游模型放量"雙向定價的反應。

華為Atlas 950 SuperPoD(8192張950昇騰加速卡)將于2026年Q4上市。和英偉達NVL144對照——卡規(guī)模56.8倍、總算力6.7倍、內(nèi)存容量15倍——這是"超節(jié)點"級別的算力堆疊。

中國信通院已啟動DeepSeek-V4國產(chǎn)化適配測試。這個測試的結(jié)果,會直接影響到"昇騰+DeepSeek"組合在2026年下半年的政企招標中的滲透率。

Bernstein預測,2026年華為昇騰為首的國產(chǎn)AI芯片市占率有望首次超過50%。這是一個"硬件代差被算法部分補回"之后的結(jié)果。

09 最后的話

我做完這次研究,有這么幾條收獲,供你參考。

一,硬件代差不是世界末日。任何一項硬件被卡的產(chǎn)業(yè),都可以用"算法/工藝/流程"上的進步去部分補償。補償?shù)拇鷥r是必須做得更聰明,紅利是不依賴外部供給。

二,AI產(chǎn)業(yè)的護城河不是"最強模型",是"硬件×算法的乘數(shù)"。當你看一家AI公司是否有長期價值,不要只看它的模型在某個榜單上是第幾名,要看它在"既定硬件條件"下的有效算力是多少。

三,開源生態(tài)在算力受限的環(huán)境里,比閉源生態(tài)更有價值。DeepSeek之所以能成為這一輪中國AI的代表,不僅是因為它的模型好,更因為它把模型開源出來,讓整個生態(tài)的"右側(cè)因子"被反復推高。

當然,現(xiàn)實沒有這么簡單。"每token降到27%"是模型在內(nèi)部測試的數(shù)據(jù),實際部署中受任務類型、緩存命中率、并發(fā)量影響,差異會很大。"昇騰950PR的2.87倍"是單卡推理算力,訓練側(cè)的差距仍在。中國AI追趕英偉達和OpenAI的路,不會是一條直線。

V4比V3.2節(jié)省73%算力——這看起來是技術(shù)細節(jié),實際上是中國AI拿到的最重要的一張通關(guān)券。

但有一件事是清楚的:當一個產(chǎn)業(yè)被告知"用最差的硬件做最好的產(chǎn)品"時,能做到的國家不多。中國是其中一個。

DeepSeek官方公告里的那行小字,藏著的就是這件事。

免責聲明

本文僅為信息分享與行業(yè)分析,不構(gòu)成任何投資建議、投資分析意見或交易邀約。市場有風險,投資需謹慎。任何人依據(jù)本文內(nèi)容作出的投資決策,風險與盈虧自行承擔,作者及發(fā)布平臺不承擔任何法律責任。

主要信源

1. DeepSeek官方公告,《DeepSeek V4模型發(fā)布說明》,2026年4月

2. DeepSeek API限時優(yōu)惠公告,2026年4月-5月,截至2026年5月5日

3. 華為公司公開資料,《昇騰AI芯片產(chǎn)品路線圖》,徐直軍,2025年9月

4. 華為Atlas 950 SuperPoD技術(shù)規(guī)格,2026年公開發(fā)布

5. 中國移動招標公告,2026-2027年AI超節(jié)點采購,20.6億元

6. OpenRouter公開數(shù)據(jù),2026年3月30日-4月5日全球AI模型調(diào)用量統(tǒng)計

7. A股半導體板塊行情數(shù)據(jù),2026年4月27日盤面,公開市場數(shù)據(jù)

8. Bernstein研究報告,2026年中國AI芯片市占率預測,2026年初發(fā)布

9. 中國信通院公開信息,DeepSeek-V4國產(chǎn)化適配測試啟動消息

聲明:內(nèi)容由AI生成

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
賴清德已登機返臺,路線的選擇出人意料,臺媒:比想象中還要狼狽

賴清德已登機返臺,路線的選擇出人意料,臺媒:比想象中還要狼狽

阿傖說事
2026-05-05 04:36:52
最新放假通知!連休3天,不調(diào)休

最新放假通知!連休3天,不調(diào)休

魯中晨報
2026-05-04 12:29:05
砸2600億!武漢存儲擴產(chǎn)計劃曝光:長江存儲產(chǎn)能翻番 劍指全球第三

砸2600億!武漢存儲擴產(chǎn)計劃曝光:長江存儲產(chǎn)能翻番 劍指全球第三

三言四拍
2026-05-04 16:16:39
深圳光明龍湖觀萃苑項目首開售罄 成為區(qū)域年內(nèi)首個“日光盤”

深圳光明龍湖觀萃苑項目首開售罄 成為區(qū)域年內(nèi)首個“日光盤”

觀點機構(gòu)
2026-05-05 10:27:16
事發(fā)廠區(qū)還有兩個黑火藥庫,有相當大的危險!直擊瀏陽煙花廠爆炸事故現(xiàn)場,附近樓房房頂瓦片被掀翻、鋁合金窗破碎,當?shù)匾逊謨杉壒芸?>
    </a>
        <h3>
      <a href=都市快報橙柿互動
2026-05-05 11:22:14
“加價”門票、落石區(qū)爬墻拍照 總臺記者獨家調(diào)查懸空寺景區(qū)亂象

“加價”門票、落石區(qū)爬墻拍照 總臺記者獨家調(diào)查懸空寺景區(qū)亂象

極目新聞
2026-05-04 22:08:41
28死48傷!五一多起事故通報

28死48傷!五一多起事故通報

峰哥跑交通
2026-05-05 09:35:22
我為什么毫不擔心央視真會拒買世界杯轉(zhuǎn)播權(quán)

我為什么毫不擔心央視真會拒買世界杯轉(zhuǎn)播權(quán)

人格志
2026-05-04 22:52:41
一家快倒閉的公司,"垃圾堆"中撿到36.9克拉藍鉆,估價超過2.7億!

一家快倒閉的公司,"垃圾堆"中撿到36.9克拉藍鉆,估價超過2.7億!

燕梳樓頻道
2026-05-04 21:44:17
博主教邏輯學竟被網(wǎng)友舉報,說“居心叵測”

博主教邏輯學竟被網(wǎng)友舉報,說“居心叵測”

蔥哥說
2026-05-04 22:43:36
“全國電動自行車淘汰賽”是謠言 官方明確:已買車輛不強制淘汰

“全國電動自行車淘汰賽”是謠言 官方明確:已買車輛不強制淘汰

新京報
2026-05-04 10:59:17
河北航空機組提供飲用水標注產(chǎn)自“路邊”?航司及廠家回應:“路邊”系地名

河北航空機組提供飲用水標注產(chǎn)自“路邊”?航司及廠家回應:“路邊”系地名

上游新聞
2026-05-04 17:53:28
湖人官宣!湖人vs雷霆西部半決賽G1,東契奇能不能上有定論了!

湖人官宣!湖人vs雷霆西部半決賽G1,東契奇能不能上有定論了!

仰臥撐FTUer
2026-05-05 09:36:45
美國軍艦遭襲?伊朗稱兩枚導彈直接命中!特朗普警告要將伊朗抹掉

美國軍艦遭襲?伊朗稱兩枚導彈直接命中!特朗普警告要將伊朗抹掉

妙知
2026-05-05 10:14:12
美軍在霍爾木茲護航?只是在安全水域指路!美油企賺歡:單日出口量創(chuàng)520萬桶歷史新高

美軍在霍爾木茲護航?只是在安全水域指路!美油企賺歡:單日出口量創(chuàng)520萬桶歷史新高

紅星新聞
2026-05-04 18:35:19
擊中俄軍導彈艦,空襲莫斯科!“勝利日?;稹睖y試美烏關(guān)系

擊中俄軍導彈艦,空襲莫斯科!“勝利日?;稹睖y試美烏關(guān)系

鷹眼Defence
2026-05-04 18:17:10
“預言帝”墨菲惜敗吳宜澤后自嘲:我現(xiàn)在很討厭自己

“預言帝”墨菲惜敗吳宜澤后自嘲:我現(xiàn)在很討厭自己

封面新聞
2026-05-05 10:24:05
酒局持續(xù)4小時,從下廚招待到拿刀拼命,妻子到底經(jīng)歷了什么

酒局持續(xù)4小時,從下廚招待到拿刀拼命,妻子到底經(jīng)歷了什么

笑談歷史阿晡
2026-05-04 12:02:08
上億級油田現(xiàn)世,中國賭贏了,歐盟兩手空空,全球能源格局巨變!

上億級油田現(xiàn)世,中國賭贏了,歐盟兩手空空,全球能源格局巨變!

近史博覽
2026-05-04 14:40:47
遼寧男籃今日早報!烏戈卸任總教練職位,趙繼偉新工作安排,楊鳴接觸新下家

遼寧男籃今日早報!烏戈卸任總教練職位,趙繼偉新工作安排,楊鳴接觸新下家

凱豐侃球
2026-05-05 09:26:17
2026-05-05 12:16:49
BT財經(jīng) incentive-icons
BT財經(jīng)
亞洲有影響力的金融信息服務傳播平臺
3632文章數(shù) 9909關(guān)注度
往期回顧 全部

科技要聞

OpenAI/Anthropic同日被曝拉攏華爾街建合資公司

頭條要聞

牛彈琴:中東又出大事 最倒霉的是三個國家

頭條要聞

牛彈琴:中東又出大事 最倒霉的是三個國家

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

英皇25周年演唱會 張敬軒被救護車拉走

財經(jīng)要聞

五一假期,中國年輕人的“首爾病”犯了

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

游戲
教育
時尚
親子
軍事航空

13年了!《使命召喚》終于要放棄登陸PS4和Xbox One

教育要聞

2026成都高三三診分數(shù)線出爐,本科物理410,歷史440……附全科試卷及參考答案

參觀了設(shè)計師花7年打磨的家,太開眼了!

親子要聞

人類為什么大多一胎一個?35歲后更易生雙胞胎?多項研究表明:人類生娃是一場精妙算法,越難懷上時,卻越容易生雙胞胎

軍事要聞

特朗普回絕伊朗新方案

無障礙瀏覽 進入關(guān)懷版