国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek-V4發(fā)布!邁入百萬上下文時代 華為昇騰超節(jié)點全面支持

0
分享至

《科創(chuàng)板日報》4月24日訊(記者 黃心怡)DeepSeek-V4的預覽版本今日上線并同步開源。DeepSeek-V4模型上下文處理長度由原有的128K顯著擴展至1M,支持百萬字超長上下文。同時,輸出長度最大為384Ktokens。首次增加了KV Cache滑窗和壓縮算法,減少Attention計算和訪存開銷,并通過模型架構創(chuàng)新更好地支持了Agent和Coding場景。


華為昇騰、天數(shù)智芯、寒武紀等國產(chǎn)芯片廠商已經(jīng)支持DeepSeek-V4新模型。華為昇騰超節(jié)點全系列產(chǎn)品支持DeepSeek V4系列模型,實現(xiàn)DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低時延推理。

DeepSeek方面稱,受限于高端算力,目前V4-Pro的服務吞吐仍有限,預計下半年昇騰950超節(jié)點批量上市后,Pro價格會大幅下調。

▍百萬上下文成標配

DeepSeek-V4模型按大小分為兩個版本:DeepSeek-V4-Pro(1.6T參數(shù),49B激活)和DeepSeek-V4-Flash(284B參數(shù),13B激活),且同時支持“非思考模式”與“思考模式”,均擁有百萬字超長上下文的能力。

據(jù)介紹,V4系列采用DSA稀疏注意力機制,實現(xiàn)token維度壓縮,讓1M(一百萬字)超長上下文成為標配,降低了長文本處理對計算和顯存的需求,為復雜長程任務提供了支撐。

其中,DeepSeek-V4-Pro,相比前代模型,DeepSeek-V4-Pro的Agent能力有所增強。

在Agentic Coding評測中,V4-Pro已達到當前開源模型最佳水平,并在其他Agent相關評測中同樣表現(xiàn)優(yōu)異。據(jù)評測反饋使用體驗優(yōu)于Sonnet 4.5,交付質量接近Opus4.6非思考模式,但仍與Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知識測評中,大幅領先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。

在數(shù)學、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的成績。

DeepSeek-V4-Flash模型參數(shù)下降至284B,推理成本進一步降低,模型參數(shù)和激活更小。

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識儲備方面稍遜一籌,但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小,相較之下V4-Flash能夠提供更加快捷、經(jīng)濟的API服務。

在Agent測評中,DeepSeek-V4-Flash在簡單任務上與DeepSeek-V4-Pro旗鼓相當,但在高難度任務上仍有差距。

▍華為昇騰、天數(shù)智芯、寒武紀等國產(chǎn)芯片支持DeepSeek-V4

目前,華為昇騰超節(jié)點全系列產(chǎn)品已支持DeepSeek V4系列模型,實現(xiàn)DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低時延推理。

據(jù)了解,昇騰950、昇騰A3超節(jié)點對DeepSeek V4系列模型全面適配。同時為便于用戶快速微調,提供了基于昇騰A3超節(jié)點的訓練參考實現(xiàn)。

基于DeepSeekV4-Pro模型,在8K輸入場景,昇騰950超節(jié)點可實現(xiàn)TPOT約20ms時單卡Decode吞吐4700TPS。DeepSeek V4-Flash模型,8K長序列輸入場景下可實現(xiàn)TPOT約10ms時單卡Decode吞吐1600TPS。

基于昇騰A3 64卡超節(jié)點結合大EP模式部署,DeepSeek V4-Flash模型,8K/1K輸入輸出場景,基于vLLM推理引擎可實現(xiàn)2000+TPS的單卡Decode吞吐。針對DeepSeek V4-Pro模型,昇騰A3同步支持推理部署,性能持續(xù)優(yōu)化中。

國產(chǎn)GPU廠商天數(shù)智芯完成了與DeepSeek-V4的Day 0級適配。據(jù)悉,天數(shù)智芯以天垓系列訓練芯片與智鎧系列推理芯片為核心,承接DeepSeek-V4的全場景應用。

而寒武紀基于vLLM推理框架完成了對此次285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro兩個版本的Day 0適配,適配代碼已開源到GitHub社區(qū)。

▍下半年昇騰950超節(jié)點將批量支持DeepSeek V4

根據(jù)DeepSeep官方文檔介紹,DeepSeek V4并不是只在英偉達體系內做優(yōu)化,而是將細粒度專家并行(EP)方案同時在英偉達GPU和華為昇騰NPU上完成驗證,這說明其推理路徑已經(jīng)具備跨算力平臺的適配能力。但在開源層面,當前釋放的仍主要是基于CUDA的MegaMoE和DeepGEMM,底層實現(xiàn)深度綁定英偉達工具鏈。

從價格看,DeepSeek V4-Pro輸入(緩存命中)是1元/百萬tokens,輸入(緩存未命中)是12元,輸出是24元;V4-Flash輸入(緩存命中)是0.2元/百萬tokens,輸入(緩存未命中)是1元,輸出是2元。

值得一提的是,官方API頁面在小字中提到,受限于高端算力,目前V4-Pro的服務吞吐仍有限,預計下半年昇騰950超節(jié)點批量上市后,Pro價格會大幅下調。這意味著,DeepSeek正嘗試把模型運行時從單一硬件依賴中解耦出來。


此外,華為云首發(fā)適配了DeepSeek-V4模型。華為云MaaS模型即服務平臺已為開發(fā)者提供免部署、一鍵調用DeepSeek-V4-Flash API的Tokens服務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
亞馬爾受傷警鐘,距離梅西有多遠不得而知,成為第二個法蒂并不遠

亞馬爾受傷警鐘,距離梅西有多遠不得而知,成為第二個法蒂并不遠

95帕爾馬
2026-04-24 08:29:39
最適合中國人體質的減肥法,靠“窮”火遍互聯(lián)網(wǎng)

最適合中國人體質的減肥法,靠“窮”火遍互聯(lián)網(wǎng)

十點讀書
2026-04-23 18:57:30
Coco又曝猛料!謝賢冬天解衣讓她取暖,把女兒珠寶讓她戴,太會了

Coco又曝猛料!謝賢冬天解衣讓她取暖,把女兒珠寶讓她戴,太會了

橙星文娛
2026-04-24 12:12:33
東鵬飲料的“0糖特飲”是商標

東鵬飲料的“0糖特飲”是商標

南方都市報
2026-04-24 16:03:32
以色列襲擊已致黎巴嫩2483人死亡

以色列襲擊已致黎巴嫩2483人死亡

每日經(jīng)濟新聞
2026-04-24 08:37:07
賣完80多個廣場,還欠6000多億!萬達的債為何還不完?

賣完80多個廣場,還欠6000多億!萬達的債為何還不完?

芳華青年
2026-04-24 16:24:53
洗腦、性侵、亂倫,全球頭號變態(tài)復出了

洗腦、性侵、亂倫,全球頭號變態(tài)復出了

獨立魚
2026-04-23 22:35:39
印度下最后通牒,要求中方必須賣尿素,中國:抱歉,沒有義務

印度下最后通牒,要求中方必須賣尿素,中國:抱歉,沒有義務

涵豆說娛
2026-04-24 12:10:09
官方:馬寧以四官身份執(zhí)法亞冠精英賽決賽,周飛擔任邊裁

官方:馬寧以四官身份執(zhí)法亞冠精英賽決賽,周飛擔任邊裁

懂球帝
2026-04-24 11:23:16
有點慘!燃油車再迎大降價:最大跌幅50%,豪華車帶頭“跳水”

有點慘!燃油車再迎大降價:最大跌幅50%,豪華車帶頭“跳水”

小怪吃美食
2026-04-24 16:42:18
一場120-107讓西部季后賽大亂!雷霆巨星傷退,湖人沖擊決賽有望

一場120-107讓西部季后賽大亂!雷霆巨星傷退,湖人沖擊決賽有望

古史青云啊
2026-04-24 11:53:35
此論調不可。赫麄北約打不過俄羅斯?把德國逼下場會讓俄軍絕望

此論調不可。赫麄北約打不過俄羅斯?把德國逼下場會讓俄軍絕望

寰球經(jīng)緯所
2026-04-24 15:00:27
人民日報發(fā)文,揭張桂梅真實現(xiàn)狀,卸任華坪女高校長傳聞早有真相

人民日報發(fā)文,揭張桂梅真實現(xiàn)狀,卸任華坪女高校長傳聞早有真相

歲暮的歸南山
2026-04-23 16:31:58
里程碑之戰(zhàn)拖后腿,哈登18+4+4+8失誤,騎士雙槍啞火客場不敵猛龍

里程碑之戰(zhàn)拖后腿,哈登18+4+4+8失誤,騎士雙槍啞火客場不敵猛龍

釘釘陌上花開
2026-04-24 10:34:17
內存漲價了,安卓終于想起要管流氓 APP 了

內存漲價了,安卓終于想起要管流氓 APP 了

互聯(lián)網(wǎng)放大鏡
2026-04-23 13:34:06
女演員自曝:曾流產(chǎn)5次失去7個寶寶,如今43歲仍努力拼二胎!

女演員自曝:曾流產(chǎn)5次失去7個寶寶,如今43歲仍努力拼二胎!

豬小艷吖
2026-04-24 13:49:15
內塔被上百國通緝,中方打破沉默,在安理會動手,明牌清算以色列

內塔被上百國通緝,中方打破沉默,在安理會動手,明牌清算以色列

愛意隨風起呀
2026-04-24 13:30:09
薩姆納與杜鋒說再見!

薩姆納與杜鋒說再見!

體育哲人
2026-04-24 19:08:49
忠縣驚現(xiàn)特大謀殺案!副縣長辦公室內慘遭殺害,真相引人深思!

忠縣驚現(xiàn)特大謀殺案!副縣長辦公室內慘遭殺害,真相引人深思!

人生錄
2026-04-24 09:13:06
注意!5月1日起全面嚴查,這8種行為直接入刑,普通人千萬別大意

注意!5月1日起全面嚴查,這8種行為直接入刑,普通人千萬別大意

芳姐侃社會
2026-04-23 17:24:10
2026-04-24 20:24:49
財聯(lián)社 incentive-icons
財聯(lián)社
以“準確、快速、權威、專業(yè)”為新聞準則,為投資者提供專業(yè)的投資資訊。
712423文章數(shù) 1020401關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

參與英國研究的50萬名患者信息在中國售賣 外交部回應

頭條要聞

參與英國研究的50萬名患者信息在中國售賣 外交部回應

體育要聞

里程碑之戰(zhàn)拖后腿,哈登18分8失誤

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經(jīng)要聞

LG財閥內斗:百億美元商業(yè)帝國爭奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

親子
本地
藝術
健康
公開課

親子要聞

為了讓孩子少看電視,給他安排了這個點珠貼畫,鍛煉孩子動手能力和專注力#益智玩具 #親子手工 #手工d...

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統(tǒng)文化

藝術要聞

父親住酒店順走一瓶礦泉水,兒子喝后離奇死亡

干細胞如何讓燒燙傷皮膚"再生"?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版