国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)算力機會來了!DeepSeek V4全量開源,華為寒武紀贏麻了

0
分享至

雷科技(ID:leitech)算了下,距離DeepSeek上一次大版本更新已經(jīng)過去484天,雖然期間一直有小版本更新,也引發(fā)了不少討論,但這終究不是大家期待的V4。



圖源:DeepSeek

不過,好消息是我們終于不用再等了,DeepSeek V4在4月24日早上10:56正式發(fā)布,首發(fā)就有Flash和Pro兩個版本。這個消息很快就在海外刷屏,DeepSeek V4發(fā)布的推文,短時間內(nèi)就收獲了數(shù)萬點贊和數(shù)百萬次瀏覽,評論區(qū)也是擠滿了人。



圖源:X

DeepSeek V4的關(guān)注度實在太高,以至于DeepSeek不得不在官方推文下留言:

請僅以我們官方賬號發(fā)布的 DeepSeek 新聞為準。其他渠道的聲明并不代表我們的觀點。

DeepSeek發(fā)布這個聲明的原因,是此前有人謠傳DeepSeek迫于壓力將不會開源V4版本(或僅開源小參數(shù)版本)。這個謠言甚至在一定程度上引發(fā)了開源AI社區(qū)的恐慌,不過現(xiàn)在這些謠言都被DeepSeek V4的全模型全量開源擊碎了,而且還是大家熟悉的Apache 2.0許可證。

有外國網(wǎng)友直接在底下留言:開源人工智能之王回歸了。



圖源:X

對的,DeepSeek,回來了。

開源王者,以怎樣的姿勢歸來?

此次發(fā)布的DeepSeek V4預(yù)覽版本分為Pro和Flash兩個模型,其中Pro面向復(fù)雜推理、高階Agent和高強度任務(wù),F(xiàn)lash則面向高頻調(diào)用、低成本部署和快速響應(yīng)場景。

其中V4-Pro采用1.6T總參數(shù)、49B激活參數(shù)的MoE架構(gòu),V4-Flash則為284B總參數(shù)、13B激活參數(shù),兩者都支持100萬 token 的上下文長度。雖然參數(shù)差距巨大,但是根據(jù)官方的說法,他們借助算法優(yōu)化了兩個模型的參數(shù)調(diào)用,使得兩個模型在日常任務(wù)中的表現(xiàn)幾乎相同。



圖源:DeepSeek

在小雷看來,這也揭示了DeepSeek對下一階段大模型競爭方向的判斷:模型不只是要更強,還要更便宜、更開放,這樣才能更容易被企業(yè)和開發(fā)者真正用起來。如果你深度使用過OpenClaw,云端Token的消耗速度肯定會讓你印象深刻,隨著AI的用途越發(fā)廣泛、能力越發(fā)強大,Token成本已經(jīng)成為所有人都必須面對的問題。

但是,很多任務(wù)其實并不需要Pro級的AI模型去處理,比如辦公輔助、內(nèi)容摘要、數(shù)據(jù)整理等場景,更需要的是速度、穩(wěn)定性和成本控制。所以將模型一分為二,然后讓Flash版在輕量化任務(wù)中保持Pro的性能,就足以讓使用者和企業(yè)節(jié)省大量的Token費用。

聊回DeepSeek V4,小雷覺得最值得關(guān)注的就是百萬級 token 上下文。對普通用戶來說,這意味著更長的文檔、更復(fù)雜的對話、更完整的項目資料,可以被一次性納入模型處理,不用再拆分成多個片段分階段完成。



圖源:DeepSeek

而且DeepSeek V4的Agent及推理能力也得到了大幅度增強,配合更長的上下文,足以讓其具備出色的連貫操作能力,這也是為未來的“Claw”生態(tài)大爆發(fā)提前做好準備。小雷認為,DeepSeek趕在如今的時間段發(fā)布V4版本,肯定也是有這方面的考量。

更關(guān)鍵的是,DeepSeek V4延續(xù)了DeepSeek一貫的高性價比路線。過去很多大模型競爭喜歡強調(diào)參數(shù)規(guī)模和榜單成績,但DeepSeek卻更強調(diào)工程效率和使用門檻,因為它真正想解決的不是讓少數(shù)人看到技術(shù)上限,而是讓更多人承擔(dān)得起AI成本。



圖源:DeepSeek

這種思路對國產(chǎn)AI非常關(guān)鍵,中國市場有龐大的中小企業(yè)、垂直行業(yè)和內(nèi)容生產(chǎn)需求,但它們不可能長期承受高昂的海外模型調(diào)用成本。DeepSeek V4如果能在性能和價格之間繼續(xù)保持平衡,就會成為更廣泛應(yīng)用場景里的基礎(chǔ)模型。

更何況單論開源模型的話,在目前的各項測試中DeepSeek V4都幾乎拿到了第一,并且媲美海外閉源模型的最新版本(不過V4測試時GPT 5.5和Opus 4.7都還沒發(fā)布)。開源意味著你只需要投入前期的硬件成本,就能夠近乎零成本使用該模型,這對于不少大型企業(yè)來說也極具誘惑力。

國產(chǎn)算力,終于等來主場

既然聊到硬件成本,那么就不得不提DeepSeek V4對國產(chǎn)算力卡的支持了。在V4版本的開發(fā)過程中,華為、寒武紀等中國芯片企業(yè)都深度參與其中,并且與DeepSeek一起基于國產(chǎn)芯片重構(gòu)AI大模型的算法邏輯并進行生態(tài)適配。

其實,在過去很長一段時間里,國產(chǎn)AI芯片面臨的最大問題,并不是沒有產(chǎn)品,而是缺少足夠強、足夠主流的真實業(yè)務(wù)負載,去測試國產(chǎn)算力芯片是否真正能夠穩(wěn)定運行主流大模型。

當然,你要拿Qwen、kimi、豆包等AI模型去跑也確實可行,但是因為模型都是基于CUDA生態(tài)研發(fā)的,想在昇騰等芯片上跑通就需要借助兼容層來運行,相當于犧牲效率來換取低廉的硬件成本(某種程度上來說也是不得已而為之),也很難展示國產(chǎn)芯片的真正性能。

而DeepSeek V4的出現(xiàn)就解決了這個問題,它既有長上下文需求,又有復(fù)雜推理需求,還會被大量開發(fā)者和企業(yè)調(diào)用。如果國產(chǎn)芯片能在這樣的模型上跑出穩(wěn)定表現(xiàn),肯定會比單純公布硬件規(guī)格更有說服力,同時也能證明基于國產(chǎn)芯片深度適配后的國產(chǎn)模型,在性能和性價比上依然能夠躋身全球前列。



圖源:雷科技

對華為昇騰來說,DeepSeek V4應(yīng)該是今年最重磅的項目了。雖然昇騰過去已經(jīng)在政企、運營商、云計算和AI訓(xùn)練推理場景里積累了不少案例,但要真正形成生態(tài),還需要更多頭部模型和開發(fā)框架的支持。

除了華為昇騰,還有另一個值得注意的企業(yè)——寒武紀,作為另一家在首日就宣布支持DeepSeek V4的芯片企業(yè),它也受到了很多關(guān)注,只有少數(shù)在開發(fā)階段就已經(jīng)開始進行優(yōu)化的芯片,能夠在首日直接適配DeepSeek,適配的國產(chǎn)AI芯片數(shù)量超過了英偉達芯片。雖然早前傳聞DeepSeek會放棄對CUDA生態(tài)的支持,但現(xiàn)在看來顯然是誤傳。

事實上,DeepSeek的早期版本仍然是在英偉達的硬件上訓(xùn)練出來的,后續(xù)才逐漸轉(zhuǎn)向華為昇騰,并且首批硬件訪問權(quán)限僅提供給華為,等于是拉著華為一起搞“聯(lián)合研發(fā)”。



圖源:雷科技

這種做法的效果是顯著的,基于昇騰950超節(jié)點,DeepSeek V4-Pro在8K輸入場景下可實現(xiàn)約20ms的單token解碼時延,單卡Decode吞吐約4700 TPS,V4-Flash則可實現(xiàn)約10ms的時延,單卡Decode吞吐約1600 TPS,是英偉達此前可公開出口給中國的H20算力卡的2.87倍。

這些數(shù)字的意義,不是說讓國產(chǎn)芯片的海報上又增添幾串數(shù)字,而是讓市場第一次可以用更接近真實應(yīng)用的方式去評估國產(chǎn)AI算力。而且也告訴市場,大模型推理不是簡單看芯片峰值算力,還要看顯存訪問、并行調(diào)度、低精度計算、通信效率和推理框架的協(xié)同。

雖然英偉達的算力卡性能確實稱得上全球最強,但是其真正的核心是CUDA生態(tài),所以國產(chǎn)芯片想要追趕英偉達,就不能只靠堆硬件參數(shù)(制程限制下一時半會兒也追不上),而是要讓模型、框架和應(yīng)用一起遷移過去,打造真正的軟硬件協(xié)同。

可以說,DeepSeek V4給Qwen、豆包、kimi等國產(chǎn)頂級大模型提前蹚了路,告訴大家:國產(chǎn)芯片是真的行。

CPU也被DeepSeek重新點燃

在寫這篇文章查詢資料的時候,小雷還看到了一則新聞:英特爾財報發(fā)布,Q1營收超預(yù)期,盤前股價飆升近30%。在英特爾的財報中,最值得關(guān)注的就是數(shù)據(jù)中心與人工智能業(yè)務(wù)部門(DCAI)營收達51億美元,同比增長22%。



圖源:百度股票

AI的需求,正在從GPU逐漸轉(zhuǎn)移到CPU上。有讀者可能好奇,小雷為什么要在DeepSeek的文章里提這個?因為DeepSeek恰恰是CPU需求增長的主要推手之一,其V4版本就引入了年初曝光的mHC架構(gòu),該架構(gòu)的核心邏輯是“查算分離”。

舉個例子,以前的AI大模型,查資料和推算都是在GPU上完成的,不僅擠占算力,也占用大量顯存;而mHC架構(gòu)則是將模型中靜態(tài)數(shù)據(jù)(即非調(diào)用數(shù)據(jù))存儲在CPU的系統(tǒng)內(nèi)存中,GPU僅需處理推理所需的數(shù)據(jù)即可。

這種設(shè)計,直接將大參數(shù)模型對顯存的壓力轉(zhuǎn)移到了CPU的系統(tǒng)內(nèi)存上,而CPU即使是消費級的產(chǎn)品,也可以輕松掛載128GB乃至256GB的內(nèi)存。這使得萬億參數(shù)規(guī)模的DeepSeek V4無需堆疊昂貴的顯卡陣列就可以完成本地化部署。

不過,CPU也因此需要更深度地介入到AI模型推理中,這使得高性能、高能效且高內(nèi)存帶寬支持的處理器更受歡迎。而英特爾此前發(fā)布的至強6最高可支持12通道內(nèi)存,單內(nèi)存規(guī)格最高為256GB,意味著一顆CPU最高可掛載3TB的系統(tǒng)內(nèi)存(在英特爾的產(chǎn)品線中,甚至有支持4TB的特化版本)。

某種程度上,mHC架構(gòu)也算是降低了市場對HBM內(nèi)存(VRAM)的需求,卻讓壓力回到了DRAM上。短期來看,可能確實讓內(nèi)存的價格稍微回落(畢竟DRAM的制造難度比HBM小很多),但是長期來看,估計會讓所有內(nèi)存都處于持續(xù)的緊缺狀態(tài),消費電子行業(yè)接下來可能還要繼續(xù)承壓。



圖源:veer

而且,隨著類“OpenClaw”應(yīng)用的普及,PC對CPU的要求也更高,因為AI需要一個高效的CPU在端側(cè)進行指令處理和執(zhí)行。這也使得英特爾的新處理器備受關(guān)注,酷睿Ultra 300系列的高能效+高端側(cè)算力設(shè)計,恰好滿足此類應(yīng)用的需求。

在開源模型+開源AI應(yīng)用的雙重推動下,英特爾的營收估計還會持續(xù)上漲,這也讓雷科技(ID:leitech)意識到,如今的AI浪潮中,如何最大程度地利用現(xiàn)有的計算硬件生態(tài),將會是未來AI生態(tài)需要優(yōu)先考慮的事情。

寫在最后

在雷科技(ID:leitech)看來,DeepSeek V4的意義其實已經(jīng)不只是“又一個強大的國產(chǎn)大模型發(fā)布”這么簡單,而是告訴我們,模型能力固然重要,但模型能不能被更多人用起來,能不能跑在更便宜、更容易獲得的硬件上,才是下一階段AI競爭的關(guān)鍵。

這不禁讓我想到了當年macOS與Windows的競爭,同為最早的圖形界面操作系統(tǒng),前者雖然性能更強,但是因為僅支持蘋果的硬件,導(dǎo)致其在后續(xù)的幾十年里份額僅有Windows的十分之一甚至更低。而在AI領(lǐng)域也是如此,閉源AI模型雖然能力強大,但是普通開發(fā)者和小型企業(yè)卻面臨用不起、難以部署等問題。

而DeepSeek V4其實恰好解決了這些問題。首先開源就意味著免費,其次100萬 token 上下文和更強的 Agent 能力,又讓其真正成為生產(chǎn)力工具,而對國產(chǎn)芯片生態(tài)的支持,也讓其能夠適應(yīng)不同的硬件環(huán)境,相當于給全球的AI開發(fā)者們開辟了一條新的康莊大道。

只能說,484天的等待沒有白費,DeepSeek這次帶回來的,不只是一個更強的V4,而是一個更開放、更低成本、更接近普通人的AI世界。

2026第十九屆北京國際汽車展覽會將于4月24日至5月3日在北京?中國國際展覽中心(順義館)和首都國際會展中心(新國展二期)舉行,本屆車展以“領(lǐng)時代·智未來”為主題,集中展現(xiàn)汽車工業(yè)的更多黑科技。
比亞迪、小米、鴻蒙智行(問界等)、小鵬、蔚來、嵐圖等頭部品牌集結(jié),多款重磅新車首秀;地平線、Momenta、卓馭等供應(yīng)商集體秀肌肉,AI大模型深度賦能,高階智駕、動力電池、超快充技術(shù)等前沿科技集中亮相,看點拉滿!
雷科技旗下「電車通」將派出報道團直擊現(xiàn)場,以“關(guān)注電動車,更懂智能化”的專業(yè)視角,帶來一線獨家報道,敬請關(guān)注!



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
死了這條心!人民日報表態(tài):中國不會救菲律賓,馬科斯投機到頭了

死了這條心!人民日報表態(tài):中國不會救菲律賓,馬科斯投機到頭了

風(fēng)干迷茫人
2026-04-24 16:01:23
大齡剩女可以破防到什么程度?發(fā)朋友圈且通知媒人,還向家人告狀

大齡剩女可以破防到什么程度?發(fā)朋友圈且通知媒人,還向家人告狀

丫頭舫
2026-04-24 20:40:08
第一集就全裸出鏡,女神新劇太生猛了

第一集就全裸出鏡,女神新劇太生猛了

來看美劇
2026-04-24 22:03:11
男子網(wǎng)上訂酒店因“長時間瀏覽頁面不下單”,被列為異常后限制使用,客服稱解除限制需要一個月,無法人工解除,平臺回應(yīng):被“風(fēng)控”

男子網(wǎng)上訂酒店因“長時間瀏覽頁面不下單”,被列為異常后限制使用,客服稱解除限制需要一個月,無法人工解除,平臺回應(yīng):被“風(fēng)控”

北青網(wǎng)-北京青年報
2026-04-24 11:16:04
才播了三期,就說他倆一定會離?

才播了三期,就說他倆一定會離?

橘子娛樂
2026-04-24 21:14:22
中央紀委國家監(jiān)委公開通報八起違反中央八項規(guī)定精神典型問題

中央紀委國家監(jiān)委公開通報八起違反中央八項規(guī)定精神典型問題

新華社
2026-04-24 17:05:33
美官方確認:“一塊英偉達芯片也沒賣出去,中國想搞自己的”!網(wǎng)友:當初是你不愿賣,不賣就不賣

美官方確認:“一塊英偉達芯片也沒賣出去,中國想搞自己的”!網(wǎng)友:當初是你不愿賣,不賣就不賣

大白聊IT
2026-04-23 15:40:40
閉關(guān)2個月!39歲丁俊暉讓趙心童狂點贊:2人都428分 全場觀眾致敬

閉關(guān)2個月!39歲丁俊暉讓趙心童狂點贊:2人都428分 全場觀眾致敬

風(fēng)過鄉(xiāng)
2026-04-25 06:25:15
觀察|團結(jié)還是分裂?新舊秩序交疊下的伊朗政權(quán)謎題

觀察|團結(jié)還是分裂?新舊秩序交疊下的伊朗政權(quán)謎題

澎湃新聞
2026-04-25 07:16:34
中國第四艘核動力航母官宣:舷號19,命名江蘇號

中國第四艘核動力航母官宣:舷號19,命名江蘇號

透視到底
2026-04-25 04:20:20
女司機與保安“和好”?畫面低俗,回應(yīng)來了

女司機與保安“和好”?畫面低俗,回應(yīng)來了

都市快報橙柿互動
2026-04-24 18:14:22
經(jīng)濟觀察報:中國羽協(xié)主席、兩屆奧運冠軍張軍失聯(lián)十余日

經(jīng)濟觀察報:中國羽協(xié)主席、兩屆奧運冠軍張軍失聯(lián)十余日

懂球帝
2026-04-25 00:06:57
特朗普用關(guān)稅搜刮的錢填補軍費!是對伊戰(zhàn)爭吃虧了還是唯恐落后中俄?

特朗普用關(guān)稅搜刮的錢填補軍費!是對伊戰(zhàn)爭吃虧了還是唯恐落后中俄?

網(wǎng)易新聞出品
2026-04-24 10:23:05
觸碰紅線,華晨宇撫仙湖演唱會被立刻叫停,原因被扒,令人唏噓

觸碰紅線,華晨宇撫仙湖演唱會被立刻叫停,原因被扒,令人唏噓

許三歲
2026-04-24 22:36:22
播放量破5億,孫楊和張豆豆這一吵,讓芒果這檔新綜藝徹底封神了

播放量破5億,孫楊和張豆豆這一吵,讓芒果這檔新綜藝徹底封神了

糊咖娛樂
2026-04-24 11:47:38
亞冠官宣擴軍至32隊!中超獲2席+國安海港出戰(zhàn) 沙特日本或5隊參賽

亞冠官宣擴軍至32隊!中超獲2席+國安海港出戰(zhàn) 沙特日本或5隊參賽

我愛英超
2026-04-24 22:28:23
提前起飛10分鐘,大學(xué)生把海航告了

提前起飛10分鐘,大學(xué)生把海航告了

中國新聞周刊
2026-04-24 18:21:10
布達諾夫撂出狠話:我們將很快讓俄國人大吃一驚!

布達諾夫撂出狠話:我們將很快讓俄國人大吃一驚!

史政先鋒
2026-04-24 11:28:28
美正考慮暫停西班牙北約成員國資格

美正考慮暫停西班牙北約成員國資格

財聯(lián)社
2026-04-24 22:52:23
“14歲少年手搓渦輪噴氣發(fā)動機”翻車  網(wǎng)友:哪家少爺?

“14歲少年手搓渦輪噴氣發(fā)動機”翻車 網(wǎng)友:哪家少爺?

可達鴨面面觀
2026-04-24 15:36:05
2026-04-25 07:52:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36928文章數(shù) 812047關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

兩屆奧運冠軍、中國羽協(xié)主席張軍"失聯(lián)" 知情人士發(fā)聲

頭條要聞

兩屆奧運冠軍、中國羽協(xié)主席張軍"失聯(lián)" 知情人士發(fā)聲

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經(jīng)要聞

LG財閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

本地
房產(chǎn)
旅游
公開課
軍事航空

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!?,開始瘋狂建學(xué)校!

旅游要聞

朔州崇福寺:金代遺構(gòu),塞北千年佛殿

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美防長:戰(zhàn)事不會“沒完沒了”

無障礙瀏覽 進入關(guān)懷版