国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)芯片,能否解決智譜和MiniMax的算力荒問題

0
分享至


4月24日,DeepSeek正式發(fā)布新模型V4,以開源、低價、高性能給市場帶來沖擊,智譜與MiniMax雙雙跳水,市值一度跌超10%和12%。有網(wǎng)友戲稱,DeepSeek果然是國產(chǎn)大模型最嚴(yán)厲的父親。

無論是新模型V4,還是近期DeepSeek的融資消息,無疑都會給智譜和MiniMax的股價帶來較大波動。4月23日,我們獨(dú)家報道DeepSeek最新估值達(dá)到3000億元,目前這個數(shù)字已經(jīng)得到一位DeepSeek內(nèi)部人士的確認(rèn)。

當(dāng)前真正卡住智譜和MiniMax的不是別的,而是年初龍蝦火爆后帶來的算力荒。

一位頭部大廠算法人員算了一筆賬,在同一個項目里改幾行代碼,不搭skills,AI先得讀完整套系統(tǒng)的上下文,工程文件、依賴聲明和類定義統(tǒng)統(tǒng)加載,單次任務(wù)幾十萬Token可能一下就燒完了。去年底同樣花10塊錢能跑完的任務(wù),今年賬單上變成了近20塊。

“真到了需要復(fù)雜推理還原問題的時候,真不如自己手寫,AI的性價比不如大學(xué)生,好用還便宜?!苯衲暌詠?,智譜API價格連漲三次,4月發(fā)布GLM-5.1后Token價格再度上調(diào)10%,外版Coding Plan月付價格幾乎翻倍,算下來,第一季度智譜的API定價累計上調(diào)約83%。MiniMax則將之前的Coding Plan全面升級為Token Plan,新增免費(fèi)額度減少。

做出同樣動作的還有阿里和騰訊,他們都將Coding Plan下架換成Token Plan。4月,阿里云四天內(nèi)連發(fā)三條產(chǎn)品漲價公告,部分項目漲幅最高達(dá)34%。更早的3月,騰訊云部分模型價格漲幅高達(dá)463%。這意味著,哪怕成為高階會員,Token量大管飽的日子也已經(jīng)一去不復(fù)返了。

智譜CEO張鵬上個月在內(nèi)部會議表示,“未來12個月最大問題是算力,不是需求?!倍鵀榱嗽谟邢薜馁Y源下求生存,MiniMax創(chuàng)始人閆俊杰表示,雖然公司同期收入增長了158.9%,但公司內(nèi)部已經(jīng)不再盲目追求用戶量的絕對值,并宣布,截至2月,M2系列模型的百萬Token推理成本已較2025年12月下降了超50%。

摩根大通最近將智譜與MiniMax同列為“中國AI采用周期的結(jié)構(gòu)性受益者”,面對同樣的算力擠兌,智譜和MiniMax交出了截然不同的答卷。

01

算力成了大模型廠商的生死線

春節(jié)以來,開發(fā)者社區(qū)的投訴帖幾乎沒有停過。Kimi自2月起高峰期?,F(xiàn)算力不足,智譜更是一連遭遇了多輪危機(jī),2月GLM-5上線后調(diào)用量暴增,API排隊蔓延,部分開發(fā)者的長鏈代碼生成任務(wù)直接中斷。

智譜不得不公開致歉,承認(rèn)“規(guī)則透明度不夠、GLM-5灰度節(jié)奏太慢、老用戶升級機(jī)制設(shè)計粗糙”,甚至開啟全額退款通道。

4月12日,MiniMax正式開源M2.7模型,首日完成華為昇騰、摩爾線程、沐曦等多款國產(chǎn)GPU的Day-0適配,宣布通過MoE架構(gòu)優(yōu)化顯著降低了推理成本。但即便如此,用戶們吐槽MiniMax服務(wù)器繁忙、連續(xù)掉線、限流的帖子也不在少數(shù)。

這種算力短缺的根源在兩端的同時失控。需求端,OpenClaw等智能體應(yīng)用將Token消耗量推高了不止一個數(shù)量級。傳統(tǒng)對話場景一篇文章消耗幾千Token,一個典型的Openclaw自動化任務(wù),其Token消耗量是傳統(tǒng)對話場景的3至5倍,在文件整理、代碼生成、多輪工具調(diào)用等環(huán)節(jié),單次任務(wù)的上下文攜帶量成倍增長。

根據(jù)智譜發(fā)布的2025年度財報,公司全年實現(xiàn)營業(yè)收入7.24億元,同比增長131.9%。但營收增速背后是更驚人的虧損擴(kuò)大,年內(nèi)虧損達(dá)到47.18億元,同比擴(kuò)大59.5%,經(jīng)調(diào)整凈虧損31.82億元,同比擴(kuò)大29.1%。研發(fā)開支高達(dá)31.80億元,其中支付給第三方算力供應(yīng)商的計算服務(wù)費(fèi)用占據(jù)大頭。

張鵬在一次AI開源前沿論壇上說:“所有的技術(shù),包括智能體框架,在很多場景下可以帶來十倍級的效率提升,但前提是算力充足。”在2026中關(guān)村論壇上,他再次強(qiáng)調(diào):“大模型未來12個月面臨的最大問題可能是算力?!?/p>

這種“增收巨虧”的局面并非智譜獨(dú)有。閆俊杰也不止一次公開表示,用戶量的增長和模型廠商收入的增長間并不存在正相關(guān)。這恰好解釋了當(dāng)下大模型公司“增收不增利”的窘境來源。

供給端則被死死卡住。2025年5月,美國商務(wù)部升級芯片出口限制,英偉達(dá)H20被納入禁售名單。雖然后續(xù)H20有望重返中國市場,但配額大幅縮減。據(jù)SemiAnalysis數(shù)據(jù),H100一年期租賃價格從2025年10月的約1.70美元/小時/GPU漲至2026年3月的約2.35美元/小時,漲幅近40%。

我們獨(dú)家獲悉,某頭部大廠更是拿出數(shù)百億的預(yù)算從年初就開始求卡,但仍然買卡無門。

據(jù)中國信通院數(shù)據(jù),2025年英偉達(dá)在中國數(shù)據(jù)中心市場的份額已從2022年的95%下滑至50%,而國產(chǎn)AI芯片份額從12%增長至25%。華為昇騰以約81.2萬塊的出貨量位居國產(chǎn)第一,市場份額約49.2%,但與英偉達(dá)剩余份額相加仍難以滿足爆發(fā)式增長的算力需求。

這種供給失衡,讓Token市場出現(xiàn)了K型分化。低成本“閑聊型”Token價格一降再降,阿里通義千問一度壓至0.0005元/千Tokens,字節(jié)豆包0.0008元/千Tokens。這些面向基礎(chǔ)場景的Token,成了黃仁勛口中類似“水電煤”的基礎(chǔ)設(shè)施。

而另一端的“黃金型”Token——長鏈推理、復(fù)雜代碼生成、企業(yè)私有化部署,價格卻一路走高。智譜的API定價去年以來已累計提價83%,而市場需求非但沒有減弱,API調(diào)用量反而增長了400%。算力這把達(dá)摩克利斯之劍,落在了所有廠商的脖子上。

02

智譜選保毛利,MiniMax選保份額

算力短缺如同一道共同的緊箍咒,但智譜和MiniMax選擇了兩種截然不同的解脫路徑。智譜的打算很清楚,漲價,篩選,保利潤。

張鵬在3月的一次活動中表示,低價競爭不利于行業(yè)發(fā)展,上調(diào)API價格是成本變化的結(jié)果。而從今年2月至4月,智譜用連續(xù)三次上調(diào)API價格來回應(yīng)了這個判斷:Coding Plan套餐漲30%,旗艦API服務(wù)漲20%,GLM-5上線后漲10%,GLM-5.1再漲10%。

Anthropic在海外已經(jīng)劃出了一條清晰的參考線。最近,Anthropic調(diào)整了企業(yè)版Claude Enterprise的定價模式,從每月最高200美元的固定費(fèi)用,改為每月20美元基礎(chǔ)費(fèi)加按實際算力消耗收費(fèi)。而在漲價的同時,Anthropic年化收入從2025年1月的約10億美元,一年后,AnthropicARR突破300億美元,超過OpenAI同期約250億美元的規(guī)模。

如今,Anthropic估值已突破1萬億美元,超過了OpenAI(同期約8800億美元)。

智譜選擇跟上。通過連續(xù)漲價篩選出高付費(fèi)意愿的客戶,將有限的算力集中在Vibe Coding(氛圍編程)向Agentic Engineering(智能體工程)演進(jìn)的高價值場景。

2026年一季度,智譜API定價累計上調(diào)83%,同期調(diào)用量卻暴增400%,云端API業(yè)務(wù)毛利率從3.3%升至18.9%。在剛結(jié)束的2025年財報電話會上,張鵬將智譜定位為 “中國的Anthropic”,并提出:“大模型公司商業(yè)價值取決于Token消耗的規(guī)模,而定價權(quán)完全取決于模型的智能上界?!?/p>

在張鵬看來,能高效處理長鏈復(fù)雜推理任務(wù)的高端Token永遠(yuǎn)是稀缺品,而誰掌握了高端Token的定價權(quán),誰就能在下一代競爭中占住入口。這正是智譜在毛利率從56.3%降至41%的背景下,仍堅持聚焦高價值場景的邏輯所在。

MiniMax則走了一條完全相反的路線,開源、優(yōu)化、搶規(guī)模。2025年10月以來,MiniMax在不到半年的時間內(nèi)完成了M2、M2.1、M2.5和M2.7四代模型迭代。2026年4月12日,M2.7在全球開源。這款2300億參數(shù)的MoE模型在推理時僅激活100億參數(shù),激活率約4.3%,極大降低了推理成本。

為了降本,MiniMax與華為昇騰、摩爾線程、沐曦、昆侖芯等海內(nèi)外芯片廠商在開源首日完成了Day-0適配。摩爾線程基于MUSA架構(gòu)實現(xiàn)了深度調(diào)優(yōu),在MTT S5000上完成高性能推理部署。沐曦曦云C系列GPU依托全棧自研的MXMACA軟件棧實現(xiàn)了“模型發(fā)布即算力就緒”。

MiniMax已經(jīng)拿到了成果。模型調(diào)用量爆發(fā),M2系列文本模型單日Token消耗量在2026年前兩個月較2025年12月激增6倍以上,2月ARR已突破1.5億美元。經(jīng)調(diào)整凈虧損約2.5億美元,虧損率顯著收窄。

但這也是一場危險的賭注。MiniMaxAPI客單價明顯低于智譜,單位算力的盈利空間被極度壓縮。MiniMax打的是“以規(guī)模換生態(tài)”的算盤,閆俊杰的策略是先讓Token足夠便宜,讓開發(fā)者習(xí)慣它的生態(tài),再通過增值服務(wù)完成商業(yè)閉環(huán)??扇绻_源生態(tài)變現(xiàn)的進(jìn)度趕不上研發(fā)投入的增長,這條路就可能被高成本堵死。

而低價策略能否支撐Minimax在下一代模型研發(fā)上與智譜、阿里等巨頭競爭,仍是未知數(shù)。

03

破局關(guān)鍵在國產(chǎn)芯片和時間窗口

2025年度智譜研發(fā)開支為31.8億元,算力成本占研發(fā)總開支的七成以上,但仍無法滿足需求。GLM-5單次推理的算力消耗是前代GLM-4.7的3倍,而國產(chǎn)GPU的適配優(yōu)化尚在推進(jìn)中。

盡管智譜已完成與華為昇騰、寒武紀(jì)等7大國產(chǎn)芯片的深度優(yōu)化,長序列部署成本下降50%,整體算力缺口依然巨大。

海外巨頭同樣承受著巨大算力緊缺的重壓。OpenAI放棄Sora視頻生成應(yīng)用,將算力集中到核心模型開發(fā)中。Anthropic用鎖定AWS旗下Trainium芯片高達(dá)5吉瓦的算力資源來換取客戶穩(wěn)定性,不只是傳統(tǒng)的風(fēng)險投資。

算力的“絞索”正在勒緊每一位玩家的脖頸。而在算力的“絞索”被解除之前,智譜和MiniMax各自的探索都只是權(quán)宜之計,真正的變數(shù)是國產(chǎn)芯片的時間窗口。

2025年,英偉達(dá)在中國市場的AI加速卡占有率從2022年的約95%大幅下滑到約55%。國產(chǎn)AI加速卡總出貨量約165萬張,市占率約41%。華為昇騰以約81.2萬張的出貨量斷層領(lǐng)跑,占國產(chǎn)份額約49.2%。阿里平頭哥、百度昆侖芯、寒武紀(jì)、海光信息緊隨其后。

在智譜發(fā)布的GLM-5中,華為昇騰、摩爾線程、寒武紀(jì)等國產(chǎn)芯片平臺已完成深度推理適配與算子級優(yōu)化。

更關(guān)鍵的一步可能在2026年到來。2026年3月,華為在合作伙伴大會上正式發(fā)布了搭載全新昇騰950PR的AI訓(xùn)練推理加速卡Atlas 350。這款芯片性能據(jù)估計可達(dá)英偉達(dá)H20的近三倍,并且對CUDA體系的兼容性已大幅提升,字節(jié)跳動、阿里巴巴等大廠都計劃采用。

這意味著通往國產(chǎn)GPU的高質(zhì)量替代之路已不是紙上談兵。這次DeepSeek V4跳過英偉達(dá)CUDA生態(tài),適配的是華為昇騰平臺,可能動搖英偉達(dá)在AI算力市場的主導(dǎo)地位,打破其軟件生態(tài)壟斷。這也正是黃仁勛最近預(yù)言的“災(zāi)難”。

不過當(dāng)前DeepSeek自身也卡算力。V4發(fā)布時官方明確坦言,V4-Pro當(dāng)前高端算力吞吐有限,自身都受高端芯片供給約束,無法向外大規(guī)模輸出富余算力。

未來的錨點在于,昇騰950PR能否在實際部署中兌現(xiàn)百萬級高吞吐與低延遲的承諾,國產(chǎn)芯片是否能在2026年實現(xiàn)大規(guī)模、穩(wěn)定的ToB商用。假設(shè)國產(chǎn)芯片能做到大規(guī)模穩(wěn)定商用,讓算力成本驟降,屆時低價、規(guī)?;穆窂綗o疑將占據(jù)上風(fēng)。

留給國內(nèi)大模型廠商的問題已然清晰,那就是能否在國產(chǎn)算力芯片全面成熟之前,搶先跑通一條脫離英偉達(dá)依賴獨(dú)立發(fā)展的路徑。

撰寫|馬文佩、馬舒葉

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
《教父》柯里昂臨終前的頓悟:男人可以囂張,可以蠻橫,可以得罪權(quán)貴,唯獨(dú)這兩類人,碰了就是給自己種下禍端

《教父》柯里昂臨終前的頓悟:男人可以囂張,可以蠻橫,可以得罪權(quán)貴,唯獨(dú)這兩類人,碰了就是給自己種下禍端

心理觀察局
2026-05-08 09:32:04
王皓變陣破韓國戰(zhàn)術(shù)!王楚欽林詩棟互相感謝,國乒復(fù)仇晉級四強(qiáng)

王皓變陣破韓國戰(zhàn)術(shù)!王楚欽林詩棟互相感謝,國乒復(fù)仇晉級四強(qiáng)

排球黃金眼
2026-05-08 23:28:34
任敏連搭“頂流”6連撲:被強(qiáng)捧的“小花”們,會成為資本棄兒嗎

任敏連搭“頂流”6連撲:被強(qiáng)捧的“小花”們,會成為資本棄兒嗎

扒點半吃瓜
2026-05-08 07:00:12
他汀天天吃,哪種更安全?一文講出實情

他汀天天吃,哪種更安全?一文講出實情

李藥師談健康
2026-05-08 13:12:29
TVB老戲骨自爆不被公司續(xù)約,兒子出面澄清:全是父親的無奈計策

TVB老戲骨自爆不被公司續(xù)約,兒子出面澄清:全是父親的無奈計策

TVB劇評社
2026-05-08 18:54:28
在迪拜工作華人感慨:別信媒體吹牛,迪拜就相當(dāng)于我國二線城市

在迪拜工作華人感慨:別信媒體吹牛,迪拜就相當(dāng)于我國二線城市

蜉蝣說
2026-05-06 15:25:25
峨眉山男子推猴后續(xù):正臉曝光已社死,官方下場,工作恐保不住

峨眉山男子推猴后續(xù):正臉曝光已社死,官方下場,工作恐保不住

淺色夏么
2026-05-08 12:21:46
受賄1.34億余元!國家能源局原綜合司司長被判死緩!

受賄1.34億余元!國家能源局原綜合司司長被判死緩!

老楊說光伏
2026-05-08 21:09:36
美國和以色列花了幾十年成功,沒想到被伊朗兩個月就給辦成了

美國和以色列花了幾十年成功,沒想到被伊朗兩個月就給辦成了

麓谷隱士
2026-05-09 00:06:22
8000億城投再掀“反腐風(fēng)暴”,旗下地產(chǎn)項目擱淺十年

8000億城投再掀“反腐風(fēng)暴”,旗下地產(chǎn)項目擱淺十年

中國房地產(chǎn)報官方號
2026-05-08 15:44:04
兩次將妻子捉奸在床,情夫:睡你老婆怎樣!丈夫絕望,喝下百草枯

兩次將妻子捉奸在床,情夫:睡你老婆怎樣!丈夫絕望,喝下百草枯

黑哥講現(xiàn)代史
2026-04-26 06:00:24
調(diào)查發(fā)現(xiàn):起床后馬上吸煙的人,用不了多久,身體會有4個改變

調(diào)查發(fā)現(xiàn):起床后馬上吸煙的人,用不了多久,身體會有4個改變

醫(yī)學(xué)原創(chuàng)故事會
2026-05-04 23:24:14
北大畢業(yè)留德醫(yī)生是暗網(wǎng)犯罪頭目?疑教唆數(shù)萬同伙下藥侵害“獵物”,庭審曝捂臉照!

北大畢業(yè)留德醫(yī)生是暗網(wǎng)犯罪頭目?疑教唆數(shù)萬同伙下藥侵害“獵物”,庭審曝捂臉照!

英國報姐
2026-05-07 21:09:56
著名衛(wèi)視宣布停播

著名衛(wèi)視宣布停播

中國經(jīng)濟(jì)網(wǎng)
2026-05-07 18:05:06
中國高校200強(qiáng)名單出爐!哈工大第10,西電第34,深圳大學(xué)第59

中國高校200強(qiáng)名單出爐!哈工大第10,西電第34,深圳大學(xué)第59

教育導(dǎo)向分享
2026-05-08 21:25:29
CNN:種種跡象表明穆帥即將回歸皇馬;他本人已完全做好準(zhǔn)備

CNN:種種跡象表明穆帥即將回歸皇馬;他本人已完全做好準(zhǔn)備

懂球帝
2026-05-09 00:16:12
費(fèi)爾南德斯或成英超本賽季杰出球員,賴斯、哈蘭德仍有爭冠機(jī)會

費(fèi)爾南德斯或成英超本賽季杰出球員,賴斯、哈蘭德仍有爭冠機(jī)會

體壇觀察猿
2026-05-09 01:15:01
哈佛提醒:防肌肉流失別只補(bǔ)蛋白!這6種營養(yǎng)才是關(guān)鍵

哈佛提醒:防肌肉流失別只補(bǔ)蛋白!這6種營養(yǎng)才是關(guān)鍵

橘子約定
2026-05-05 20:49:53
皇馬亂了!曝更衣室成內(nèi)鬼窩+派系林立 主帥撒手不管 老佛爺失職

皇馬亂了!曝更衣室成內(nèi)鬼窩+派系林立 主帥撒手不管 老佛爺失職

我愛英超
2026-05-08 08:02:43
文章面館正式開業(yè),免費(fèi)送汽水喝,馬伊琍帶著兩女兒低調(diào)支持!

文章面館正式開業(yè),免費(fèi)送汽水喝,馬伊琍帶著兩女兒低調(diào)支持!

老吳教育課堂
2026-05-08 20:15:22
2026-05-09 01:44:49
白鯨實驗室one incentive-icons
白鯨實驗室one
記錄 AI改變世界的瞬間
133文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

SK海力士平均獎金600萬 工服成相親神器

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內(nèi)幕解密

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內(nèi)幕解密

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經(jīng)要聞

估值3000億 DeepSeek尋求500億元融資

汽車要聞

MG 4X實車亮相 將于5月11日開啟盲訂

態(tài)度原創(chuàng)

游戲
藝術(shù)
旅游
健康
教育

PS未發(fā)售重磅獨(dú)占要完!同類項目崩盤 新作懸了

藝術(shù)要聞

砸22億!OPPO在東莞建了一批“O字樓”

旅游要聞

社評:中國的“Country Walk”何以吸引西方年輕人

干細(xì)胞能讓人“返老還童”嗎

教育要聞

摒棄打壓式教育,皮格馬利翁效應(yīng)

無障礙瀏覽 進(jìn)入關(guān)懷版