国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek過了算力的河,美團LongCat正在彎腰造船

0
分享至



「核心提示」
國產(chǎn)算力迎來“DeepSeek+LongCat”節(jié)點。

作者 | 張經(jīng)緯

編輯 | 邢昀

Token,是未來數(shù)字世界最核心、最值錢的大宗商品。

2026年GTC大會上,黃仁勛這樣定義AI時代的底層通貨,而數(shù)據(jù)中心就是生產(chǎn)智能的工廠。

過去幾年,全球絕大多數(shù)這樣的“工廠”都依賴同一套設(shè)備:英偉達的GPU與CUDA生態(tài)。當霍爾木茲海峽的開放與關(guān)閉,影響地緣政治與能源安全格局,全球AI市場的Token供給也需要回答:算力供應(yīng)鏈出現(xiàn)單點依賴,如何保障Token的穩(wěn)定產(chǎn)出?

4月24日上午,DeepSeek V4正式發(fā)布,其官方技術(shù)報告明確將華為昇騰950PR寫入硬件驗證清單,實現(xiàn)了從英偉達CUDA到國產(chǎn)算力的全棧遷移。下午,美團LongCat-2.0-Preview開放測試,這是目前唯一公開確認由國產(chǎn)算力完成萬億參數(shù)預(yù)訓(xùn)練的大模型,訓(xùn)練全程動用了5萬至6萬張國產(chǎn)算力卡,其訓(xùn)練規(guī)模是迄今為止最大的。

兩款模型在同一天跨入“萬億參數(shù)俱樂部”,更關(guān)鍵的是,這意味著一條自主的“國產(chǎn)Token”供應(yīng)鏈,正在英偉達體系之外加速接通。

理解這一天意味著什么,需要拆開來看。

1、萬億參數(shù)俱樂部的新玩家

過去一段時間里,萬億參數(shù)如同大模型的“珠峰”。玩家們想登頂,需要刷美國技術(shù)棧的“裝備”,尤其離不開英偉達。

Open AI、Anthropic等硅谷獨角獸,無不是英偉達H100/A100集群上的“付費玩家”。憑借軟硬一體的CUDA生態(tài)系統(tǒng),英偉達在全球AI訓(xùn)練負載市場中占據(jù)了90%以上的絕對壟斷地位。

對中國AI企業(yè)而言,這有諸多不確定性。近年來,美國對華高端AI芯片的出口管制持續(xù)收緊,從最初的A100、H100禁售,延伸至特供版H20的許可限制,到今年4月,美國高端芯片實質(zhì)對華禁售。即便通過其他渠道拿到芯片,也隨時面臨升級路徑被切斷的風險。

至此,算力不再只是支出成本,也是生存成本。

2026年4月24日,備受關(guān)注的DeepSeek V4發(fā)布,同日美團LongCat-2.0-Preview啟動開放測試,雙雙加入了“萬億參數(shù)模型”的行列。這兩個大模型用不同方式,實現(xiàn)了國產(chǎn)算力替代的進展。

DeepSeek V4的早期訓(xùn)練基于英偉達CUDA架構(gòu)和GPU硬件,之后全棧遷移至華為芯片。V4適配的華為昇騰950PR推理芯片,甚至在低精度推理中展現(xiàn)出超越通用GPU的效率。

同期進行測試的LongCat-2.0-Preview選擇了另一種方式,這是目前唯一由國產(chǎn)算力訓(xùn)練的萬億參數(shù)大模型。其訓(xùn)練與推理全程依托國產(chǎn)算力集群獨立完成,動用的國產(chǎn)算力卡數(shù)量在5萬至6萬張之間,是國產(chǎn)算力上完成的規(guī)模最大的訓(xùn)練任務(wù)。

從技術(shù)層面來看,DeepSeek V4和LongCat-2.0-Preview均采用MoE架構(gòu),支持1M(100萬token)超長上下文窗口,單次推理可處理數(shù)百萬字輸入,處理量級與GPT-5.5處于同一水平。兩款模型在知識容量、長文本理解及復(fù)雜邏輯推理的上限上,已正式跨入全球第一梯隊。

沒有采取行業(yè)通行的“堆算力”路線,DeepSeek V4和LongCat-2.0-Preview都是通過架構(gòu)優(yōu)化,對每一張國產(chǎn)卡算力進行極致榨取,同時它們也用實踐證明,極致優(yōu)化算力效率,可以抵消硬件的賬面差距。

V4通過混合注意力架構(gòu)(CSA + HCA)、Muon優(yōu)化器等底層架構(gòu)創(chuàng)新,在上下文長度放大8倍的前提下,算力消耗比V3.2降低七成以上。LongCat-2.0-Preview每token激活參數(shù)約48B,從一些測試反饋來看,在保持較高性能的同時,實現(xiàn)了不錯的推理效率。

效率革命最終轉(zhuǎn)化為顛覆性的商業(yè)定價。DeepSeek V4最新的API定價,V4 Flash每百萬tokens輸入(緩存命中)價格為0.02元,V4 Pro為0.025元。海外社交媒體上,有網(wǎng)友表示,這是從Claude或者GPT遷移到DeepSeek的最佳窗口期。

兩款模型的發(fā)布,引發(fā)了國產(chǎn)算力適配的連鎖反應(yīng),國產(chǎn)算力替代逐漸成為趨勢。

從華為昇騰、百度昆侖芯、寒武紀思元、海光信息DCU到阿里平頭哥,國產(chǎn)AI芯片在性能與生態(tài)上持續(xù)迭代;摩爾線程、壁仞科技、沐曦股份等創(chuàng)業(yè)企業(yè)也在加速追趕。

TrendForce預(yù)測,2026年國產(chǎn)芯片在高端市場的份額將增長到70%,行業(yè)對國產(chǎn)算力的期待,不再停留在“可用”層面。

2、算力突圍前后

中國AI廠商們加速布局國產(chǎn)替代,除了此前說到的美國高端芯片出口管制等政策壓力,還有一個重要的考量:算力荒傳導(dǎo)至價格端,導(dǎo)致算力變得越來越貴。

中信證券指出,Token調(diào)用量井噴帶來的是算力需求極大爆發(fā),與此同時供給側(cè)受到各類硬約束短期邊際增量有限,目前國內(nèi)外均出現(xiàn)了嚴重的算力荒。

而中國AI用戶的算力消耗極其巨大,根據(jù)OpenRouter的數(shù)據(jù), 2026年3月30日-4月5日,中國AI模型的周調(diào)用量突破12.96萬億Token,是同期美國的4.3倍。如此龐大的需求, 如果長期高度依賴單一的“英偉達+臺積電”供應(yīng)鏈,將面臨供應(yīng)受限與價格持續(xù)上漲的雙重風險。

這種結(jié)構(gòu)性矛盾,使得國產(chǎn)算力替代不再只是 “備選題”,而是 “必答題”。然而,替代之路向來艱難。

其難點在于拋棄現(xiàn)成的代碼庫、編譯和調(diào)試工具,從“零”開始。英偉達CUDA經(jīng)過20年積累,擁有超400萬開發(fā)者和成熟的cuBLAS、cuDNN、NCCL庫。國產(chǎn)算力平臺的算子庫覆蓋度、優(yōu)化深度以及測試工具都不完整,需要工程團隊進行大量底層開發(fā)與調(diào)試工作。

另一個難點在于硬件的并行計算。由于單卡性能存在差距,國產(chǎn)芯片想要實現(xiàn)同樣的計算性能,勢必要并行更多硬件,而算力硬件并行容易帶來故障。

在大模型訓(xùn)練中,集群規(guī)模一旦擴大至萬卡級別,故障概率呈指數(shù)級上升,任何微小的計算錯誤、通信延遲或數(shù)值精度偏差,都會在并行運算中指數(shù)級放大,導(dǎo)致整個訓(xùn)練任務(wù)中斷或模型收斂失敗。

LongCat-2.0-Preview在5、6萬張國產(chǎn)集群上完成萬億參數(shù)MoE模型的穩(wěn)定訓(xùn)練,意味著團隊必須在并行策略、通信拓撲、混合精度訓(xùn)練及容錯機制上進行深度自研與調(diào)優(yōu)。這是對國產(chǎn)算力系統(tǒng)工程能力的一次高強度的壓力測試。

工程能力還只是冰山一角,芯片設(shè)計制造、軟件棧乃至應(yīng)用,需要更多產(chǎn)業(yè)力量的長期投入。來自互聯(lián)網(wǎng)巨頭、產(chǎn)業(yè)資本與風險投資的資金,成為這些長期進化背后的重要支撐。

以美團為例,近幾年在算力、科技硬件和大模型等領(lǐng)域進行了廣泛的早期投資。芯片方面,美團投資了摩爾線程、沐曦股份、紫光展銳、愛芯元智、榮芯半導(dǎo)體等眾多企業(yè),覆蓋了多家國產(chǎn)GPU頭部和“國家隊”級別的半導(dǎo)體公司。

這些企業(yè)的技術(shù)方向各有側(cè)重:摩爾線程與沐曦股份聚焦通用GPU設(shè)計;紫光展銳在移動通信與物聯(lián)網(wǎng)芯片領(lǐng)域根基深厚,為端側(cè)AI提供底層連接能力;愛芯元智專注邊緣算力、AI視覺芯片;榮芯半導(dǎo)體則涉足晶圓代工,立足于芯片的產(chǎn)能提升。

美團還同時投資了包括宇樹科技、銀河通用、星海圖在內(nèi)的多家具身智能公司和科技硬件公司。從大模型上游的芯片設(shè)計制造、到大模型研發(fā),再到AI在各個領(lǐng)域的應(yīng)用,用王興的話來說,美團將AI視為戰(zhàn)略機遇。

美團的密集投資并非孤例,它所折射的,是中國科技資本對國產(chǎn)算力賽道乃至未來科技發(fā)展的系統(tǒng)性布局。

3、模型在國產(chǎn)算力上跑通了,然后呢?

當國產(chǎn)芯片鋪開、萬億參數(shù)模型跑通,本土AI能否走向“更好用”階段,面臨著數(shù)據(jù)層面的挑戰(zhàn)。

一方面,是工程反饋數(shù)據(jù)。

當超大規(guī)模AI模型在國產(chǎn)芯片集群上訓(xùn)練時,會暴露出各種問題,比如某些計算環(huán)節(jié)精度有誤差、芯片之間數(shù)據(jù)傳輸太慢、軟件編譯優(yōu)化不到位、多卡并行時通信通道擁堵、低精度計算時數(shù)值丟失等。

技術(shù)團隊逐一攻克這些問題的過程,本身就是一場對國產(chǎn)芯片軟硬件的大規(guī)模測試。每一個被修復(fù)的bug、每一段被調(diào)優(yōu)的通信協(xié)議,都會反饋給國產(chǎn)芯片廠商,推動下一代硬件的改進和軟件棧的成熟。

對LongCat-2.0-Preview這樣的“原生國產(chǎn)模型”來說,從訓(xùn)練階段起便全程依托國產(chǎn)算力集群完成,產(chǎn)生的工程反饋較為完整和真實。這種“模型反哺芯片”的閉環(huán),有利于國產(chǎn)算力生態(tài)向下扎根。

另一方面,大模型需要物理底座,和具體任務(wù)、真實世界產(chǎn)生高質(zhì)量的數(shù)據(jù)互動。

特斯拉憑借全球最大的真實駕駛數(shù)據(jù)庫,構(gòu)建了其自動駕駛的核心基石,從真實世界采集、到仿真訓(xùn)練、再到算法迭代的“Real-to-Sim-to-Real”飛輪,同時驅(qū)動了自動駕駛汽車與人形機器人的進化。

同樣的邏輯,正在一個更復(fù)雜高頻,貼近日常生活的場景展開,那不是加州的高速公路,而是中國城市的街頭巷尾。美團擁有全國2800多個市縣的即時配送網(wǎng)絡(luò),覆蓋中國最復(fù)雜的物理環(huán)境。美團無人機已累計完成商業(yè)訂單超78萬筆,國內(nèi)外開通70條航線。美團無人車已至少已完成550萬單配送任務(wù),自動駕駛總里程突破1900萬公里。

無人機在樓宇間穿行時的視覺避障數(shù)據(jù)、無人車在復(fù)雜路況下的實時決策軌跡、騎手與機器協(xié)同調(diào)度中的動態(tài)優(yōu)化樣本,都是高價值、高密度的真實世界數(shù)據(jù)。這些是LongCat大模型持續(xù)進化的養(yǎng)料,也是國產(chǎn)算力芯片在嚴苛環(huán)境中驗證可靠性、能效比的真實環(huán)境。

同一天里先后發(fā)布和開放測試的DeepSeek V4與LongCat-2.0-Preview,構(gòu)成了國產(chǎn)算力進化的一體兩面。前者以開源、低價與通用能力,證明了國產(chǎn)算力可支撐全球頂尖的基礎(chǔ)模型;后者以原生國產(chǎn)訓(xùn)練、萬億參數(shù)規(guī)模與物理世界閉環(huán),證明了國產(chǎn)算力集群可獨立完成極限的工程任務(wù)。

這不僅僅是算力焦慮下的替代敘事,更是一場 “主動定義”的轉(zhuǎn)身,獨立生長、正向循環(huán)的中國AI產(chǎn)業(yè)鏈,還需要長期努力,但正在加速成型。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
過氣明星多可憐?四處欠債,朋友絕交,41歲靠苦力謀生,渴求復(fù)出

過氣明星多可憐?四處欠債,朋友絕交,41歲靠苦力謀生,渴求復(fù)出

林輕吟
2026-04-21 07:31:49
深圳機器人坐地鐵送貨,全球首例在中國跑通了

深圳機器人坐地鐵送貨,全球首例在中國跑通了

我不叫阿哏
2026-05-05 14:39:01
遼寧男籃今日早報!烏戈卸任總教練職位,趙繼偉新工作安排,楊鳴接觸新下家

遼寧男籃今日早報!烏戈卸任總教練職位,趙繼偉新工作安排,楊鳴接觸新下家

凱豐侃球
2026-05-05 09:26:17
化痰第一名!吃三天掃光肺里臟東西,比梨湯管用多了!

化痰第一名!吃三天掃光肺里臟東西,比梨湯管用多了!

寶哥精彩賽事
2026-05-03 21:36:21
47年孟良崮,敵機投物資到華野陣地上,粟裕打開一看:張靈甫完了

47年孟良崮,敵機投物資到華野陣地上,粟裕打開一看:張靈甫完了

浩渺青史
2026-05-05 17:52:29
張雪攜兒子一同參加國內(nèi)越野賽 張雪車隊最新越野車型MX250亮相

張雪攜兒子一同參加國內(nèi)越野賽 張雪車隊最新越野車型MX250亮相

快科技
2026-05-05 15:26:32
陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

杰絲聊古今
2026-05-03 13:35:27
19位兵團司令員,行政級別達到副國級的,是哪八位?

19位兵團司令員,行政級別達到副國級的,是哪八位?

雍親王府
2026-05-05 06:00:07
李德生任總政治部主任后,林彪約見:你知道你的職務(wù)是怎么來的嗎

李德生任總政治部主任后,林彪約見:你知道你的職務(wù)是怎么來的嗎

我不是沃神
2026-05-05 07:25:03
釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關(guān)系

釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關(guān)系

漢史趣聞
2025-07-30 09:57:38
暴雨、大暴雨!大范圍降雨要來

暴雨、大暴雨!大范圍降雨要來

環(huán)球網(wǎng)資訊
2026-05-05 19:52:34
毛主席緊急離開武漢,空軍竟不放行,楊成武:不認我這個代總長?

毛主席緊急離開武漢,空軍竟不放行,楊成武:不認我這個代總長?

驚視
2026-04-24 07:32:15
贏球概率71.6%!美媒看好活塞,追夢談騎士也攤牌,哈登會2-4出局

贏球概率71.6%!美媒看好活塞,追夢談騎士也攤牌,哈登會2-4出局

巴叔體育
2026-05-05 16:30:02
2026五一檔票房7.56億

2026五一檔票房7.56億

界面新聞
2026-05-05 21:06:12
倫敦世乒賽:中國男乒今開啟淘汰賽征程,贏或回家,“死亡半?yún)^(qū)”步步驚心

倫敦世乒賽:中國男乒今開啟淘汰賽征程,贏或回家,“死亡半?yún)^(qū)”步步驚心

上觀新聞
2026-05-05 09:46:22
U17女足亞洲杯3-0血洗越南! 沒想到賽后日媒這樣報道 6個字定義我們

U17女足亞洲杯3-0血洗越南! 沒想到賽后日媒這樣報道 6個字定義我們

林子說事
2026-05-05 07:44:20
醫(yī)生說,凡是得大病的人,都有這幾個共性,句句都是大實話,很準

醫(yī)生說,凡是得大病的人,都有這幾個共性,句句都是大實話,很準

蟬吟槐蕊
2026-05-05 09:19:38
投資被騙近千萬,給娃報8個補習(xí)班,汪涵老婆為何讓人無法共情?

投資被騙近千萬,給娃報8個補習(xí)班,汪涵老婆為何讓人無法共情?

鹿楠
2026-05-01 19:05:06
明明只是戲子,卻把自己當大腕,論“耍大牌”,這5位明星夠丟人

明明只是戲子,卻把自己當大腕,論“耍大牌”,這5位明星夠丟人

做一個合格的吃瓜群眾
2026-04-21 16:14:06
布科夫斯基:蘇聯(lián)最偉大的發(fā)明就是把精神病院變成異見者的集中營

布科夫斯基:蘇聯(lián)最偉大的發(fā)明就是把精神病院變成異見者的集中營

南極狼人
2026-05-05 20:05:21
2026-05-05 21:27:00
豹變
豹變
最具穿透力洞察力的商業(yè)觀察
2133文章數(shù) 20985關(guān)注度
往期回顧 全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設(shè)備處理器

頭條要聞

伊朗發(fā)射導(dǎo)彈襲擊美軍艦船和商船及阿聯(lián)酋 特朗普表態(tài)

頭條要聞

伊朗發(fā)射導(dǎo)彈襲擊美軍艦船和商船及阿聯(lián)酋 特朗普表態(tài)

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

內(nèi)娛真情誼!楊紫為謝娜演唱會送花籃

財經(jīng)要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

健康
時尚
藝術(shù)
房產(chǎn)
公開課

干細胞治燒燙傷面臨這些“瓶頸”

女人會不會穿衣區(qū)別很大,記住這“三要三不”原則,得體大方

藝術(shù)要聞

有多少人知道,它曾是亞洲第一高樓?

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版