国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

刷屏!DeepSeek V4成本暴降73%,梁文鋒聯(lián)手華為寒武紀(jì),源神歸位全體起立

0
分享至


智東西
作者 江宇 陳駿達(dá)
編輯 心緣

智東西4月24日報道,今日,DeepSeek正式發(fā)布并開源DeepSeek-V4系列預(yù)覽版本,這是其繼V3.2之后的新一代旗艦?zāi)P腕w系,智東西第一時間上手實測。

DeepSeek V4“源神”回歸影響力果然不同凡響,幾乎瞬間刷屏,在微博熱搜榜前五占三,僅次于小米YU7GT。


本次發(fā)布包含兩款模型:DeepSeek-V4-Pro與DeepSeek-V4-Flash,分別采用MoE架構(gòu),總參數(shù)規(guī)模達(dá)到1.6T(激活49B)與284B(激活13B),并統(tǒng)一支持最長100萬token上下文。

DeepSeek官方同時說明,受限于高端算力,目前DeepSeek-V4-Pro的服務(wù)吞吐十分有限,預(yù)計下半年昇騰950超節(jié)點批量上市后,其價格會大幅下調(diào)。此外,DeepSeek-V4已獲得寒武紀(jì)Day 0適配支持,相關(guān)適配代碼已開源至GitHub社區(qū)。


DeepSeek-V4-Pro主打性能上限,對標(biāo)閉源旗艦?zāi)P?/strong>;而DeepSeek-V4-Flash則在參數(shù)規(guī)模與激活規(guī)模上大幅縮小,換取更低延遲與更低成本


相比上一代模型,其在Agent能力、世界知識與復(fù)雜推理任務(wù)上進(jìn)一步抬升,并首次將“百萬上下文”作為默認(rèn)能力開放。

在Agent能力方面,DeepSeek-V4-Pro的Agent能力顯著增強。其在Agentic Coding等評測中進(jìn)入開源第一梯隊,內(nèi)部評測顯示交付質(zhì)量已接近Claude Opus 4.6非思考模式,但與其思考模式仍存在差距。

DeepSeek-V4-Pro在數(shù)學(xué)、STEM及競賽型代碼等高難度任務(wù)中已超過當(dāng)前已公開評測的開源模型,整體表現(xiàn)接近甚至比肩GPT-5.4、Claude Opus 4.6-Max等頂級閉源模型。

與此同時,DeepSeek-V4在長上下文效率上給出了一組更激進(jìn)的優(yōu)化:在100萬token場景下,其單token推理計算量僅為V3.2的27%,KV Cache占用降至約10%,顯著降低長鏈路任務(wù)的算力與顯存成本。


同時,官方公布了DeepSeek-V4系列的API定價:DeepSeek-V4-Pro在輸入命中緩存的情況下為1元/百萬tokens,輸入未命中緩存則為12元/百萬tokens,輸出為24元/百萬tokens;DeepSeek-V4-Flash在輸入命中緩存僅0.2元/百萬tokens,未命中輸入1元/百萬tokens,輸出2元/百萬tokens


目前,DeepSeek-V4系列已上線官網(wǎng)與App,并同步開放API與模型權(quán)重。

體驗地址:chat.deepseek.com或DeepSeek官方APP
API文檔:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
開源鏈接:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
技術(shù)報告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

一、Agentic編程能力提升明顯,讀《三體》三部曲燒了54萬token

我們初步感受了下DeepSeek-V4的變化,主要測試的模型是DeepSeek-V4-Pro。

在前端網(wǎng)頁one-shot案例中,DeepSeek-V4-Pro展現(xiàn)出很高的執(zhí)行效率。由于我們的需求不復(fù)雜,模型僅用了5秒鐘進(jìn)行思考,之后迅速進(jìn)行開發(fā),這與之前DeepSeek模型在思考上浪費很多token的模式明顯不同。

進(jìn)入到實際生成過程后,DeepSeek-V4-Pro的輸出長度要明顯長于其他DeepSeek模型。其生成速度較快,基本能做到以5行代碼為單位輸出。

最終,DeepSeek-V4-Pro的生成結(jié)果如下,可以看到其網(wǎng)頁的完成度要比DeepSeek-V3.2高一些,設(shè)計更為豐富。


▲DeepSeek-V4-Pro打造的網(wǎng)站

網(wǎng)站鏈接:https://mcp.edgeone.site/share/9pD1cRzY1QA8bmmBLDZ8S

不過,這樣簡單的編程題目已經(jīng)難不住DeepSeek-V4-Pro,我們試著讓它完成一個結(jié)合Agent能力與編程的任務(wù):規(guī)劃一次去上海的旅行,然后把所有相關(guān)信息整合為一個旅行網(wǎng)站,附上對應(yīng)的景點定位。

執(zhí)行過程中,可以看到DeepSeek-V4-Pro可以進(jìn)行復(fù)雜多輪工具調(diào)用,聯(lián)網(wǎng)搜索的條目數(shù)量也和之前模型的數(shù)量相比有增加,信息收集得更為全面了。


最終,DeepSeek-V4-Pro收集到了完整的行程信息,規(guī)劃合理,并且配上了每個景點的定位,點開后就可以直接在導(dǎo)航App里使用,十分便捷。在Agent任務(wù)中,可以觀察到它的行動十分果斷,工具調(diào)用、思考都在幾秒鐘內(nèi)解決,token效率不錯。


▲DeepSeek使用Agent能力和編程能力規(guī)劃的旅行方案

網(wǎng)站鏈接:https://mcp.edgeone.site/share/4TxFYOy24bgaEwxFoxisj

我們的下一個案例與長文本有關(guān),DeepSeek-V4系列模型常常掛在嘴邊的就是它能一口氣吃下《三體》三部曲,而我們?nèi)缢干蟼髁送暾摹度w》。

上傳這樣的超長文件后,DeepSeek能夠迅速定位我們指定的內(nèi)容,成功實現(xiàn)大海撈針。不過,這種超長上下文能力是有代價的,僅僅輸出這一點內(nèi)容就燒掉了54萬個token。


我們還用“OpenAI更新到了哪一個模型”這一問題,試了試模型的知識截至日期,可以看到,DeepSeek-V4-Pro的知識截止日期目前仍然停在2025年。


此外,這一模型應(yīng)該暫時還不支持視覺能力,上傳圖像后還是會進(jìn)行文字提取,沒有文字的圖像會顯示無法處理。


二、百萬上下文成標(biāo)配,新架構(gòu)把“長任務(wù)成本”壓下來

這一代V4最直接的變化,是把“長上下文”變成默認(rèn)能力。

不同于傳統(tǒng)通過簡單擴展窗口的方式,DeepSeek-V4-Pro引入了全新的混合注意力架構(gòu),將Compressed Sparse Attention與高壓縮注意力(HCA)結(jié)合,同時配合DSA稀疏注意力,在token維度進(jìn)行壓縮。

此外,模型引入了流形約束超連接(mHC)增強傳統(tǒng)殘差連接,并使用Muon優(yōu)化器提升收斂速度和訓(xùn)練穩(wěn)定性。這一系列設(shè)計,使得模型在“記得更長”的同時,有效控制計算成本。

從官方給出的數(shù)據(jù)來看,在100萬token上下文下,DeepSeek-V4-Pro單token推理TFLOPs相比DeepSeek-V3.2下降約3.7倍至9.8倍區(qū)間KV Cache占用下降9.5倍至13.7倍。


這意味著,過去難以實際運行的超長鏈路任務(wù)(如多輪Agent規(guī)劃、長文檔處理),開始進(jìn)入可執(zhí)行范圍。

三、推理、知識、代碼三線抬升,開源模型逼近閉源上限

從能力結(jié)構(gòu)來看,DeepSeek-V4-Pro的提升是推理、知識與Agent能力的同步抬升。

在知識與推理類任務(wù)中,其在SimpleQA、Apex、Codeforces等評測中均超過當(dāng)前主流開源模型,并在多項任務(wù)上接近GPT-5.4與Gemini 3.1 Pro。例如在Apex Shortlist中達(dá)到90.2分,已經(jīng)超越頂級閉源模型;在Codeforces等競賽類任務(wù)中,也維持在第一梯隊水平。

在Agent能力相關(guān)任務(wù)中,DeepSeek-V4-Pro在SWE Verified、Terminal Bench等指標(biāo)上表現(xiàn)穩(wěn)定,SWE Verified達(dá)到80.6,接近Claude Opus 4.6,明顯高于多數(shù)開源模型。其表現(xiàn)同樣超過GLM-5.1 Thinking、Kimi K2.6 Thinking等模型


整體來看,DeepSeek-V4-Pro已是目前開源模型的“天花板”。

四、Agent能力專項優(yōu)化,開始圍繞真實工作流打磨

這一代DeepSeek-V4明顯強化了對Agent場景的適配。其針對Claude Code、OpenClaw、CodeBuddy等主流Agent框架進(jìn)行了專項優(yōu)化,在代碼生成、文檔生成等多步驟任務(wù)中表現(xiàn)更穩(wěn)定。下圖為DeepSeek-V4-Pro在某 Agent框架下生成的PPT內(nèi)頁示例:


從實際定位來看,DeepSeek-V4-Pro已經(jīng)被DeepSeek內(nèi)部作為Agentic Coding模型使用,側(cè)重點在于“完成任務(wù)”。在簡單任務(wù)上,V4-Flash已可與Pro版本接近,而在復(fù)雜任務(wù)中仍存在明顯差距。

本質(zhì)上是在為Agent應(yīng)用提供兩種“算力檔位”。DeepSeek-V4-Flash在簡單Agent任務(wù)中已經(jīng)能夠與Pro“旗鼓相當(dāng)”,但在復(fù)雜任務(wù)中仍有差距。這種差異,本質(zhì)上是推理深度與上下文利用能力的差別。

結(jié)語:DeepSeek-V4亮相,國產(chǎn)算力與開源路線的落地之光

DeepSeek-V4的發(fā)布不僅展現(xiàn)了團隊在技術(shù)和架構(gòu)上的積淀,也標(biāo)志著開源大模型在國產(chǎn)算力生態(tài)下的實際落地能力。

經(jīng)過對華為昇騰、寒武紀(jì)等國產(chǎn)芯片的適配優(yōu)化,DeepSeek-V4系列實現(xiàn)了百萬token上下文的穩(wěn)定支持和高效推理,使長鏈路任務(wù)與多步Agent執(zhí)行成為可能。

這一版本將Pro與Flash的不同定位落到實處,在性能上逼近閉源旗艦?zāi)P?,在成本上保持高性價比,為國內(nèi)開發(fā)者提供了前所未有的開放選項。

更重要的是,這次發(fā)布顯示出開源模型不僅能在全球競爭中站穩(wěn)腳跟,也能夠借助國產(chǎn)算力和優(yōu)化架構(gòu),將技術(shù)潛力轉(zhuǎn)化為實際可用的生產(chǎn)力。DeepSeek-V4或許是中國開源力量在高性能AI賽道上邁出的關(guān)鍵一步,也為國內(nèi)AI生態(tài)的創(chuàng)新和落地提供了明確指引。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會審查

美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會審查

魯中晨報
2026-05-02 18:03:06
聞泰科技“帶帽”首日一字跌停 封單超41億元

聞泰科技“帶帽”首日一字跌停 封單超41億元

財聞
2026-05-06 11:08:36
1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

阿器談史
2026-04-26 14:13:38
新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機”

新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機”

發(fā)現(xiàn)新西蘭
2026-05-06 13:20:33
提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

雪狼侃體育
2026-05-06 19:18:33
蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

倫倫媽愛歷史
2026-05-02 10:01:48
斯洛伐克擬派F-16戰(zhàn)機參加北約防空任務(wù),從2028年起計劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

斯洛伐克擬派F-16戰(zhàn)機參加北約防空任務(wù),從2028年起計劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

魯中晨報
2026-05-06 19:54:03
1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

興趣知識
2026-05-05 17:43:16
牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

柏銘銳談
2026-05-04 20:40:53
小鹿好局痛失,淚灑賽場,中韓女團五強對決,韓國3:1獲勝

小鹿好局痛失,淚灑賽場,中韓女團五強對決,韓國3:1獲勝

月滿大江流
2026-05-06 16:58:31
妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

千秋文化
2026-03-25 21:49:57
估值數(shù)億美元,A.O.史密斯中國要賣了

估值數(shù)億美元,A.O.史密斯中國要賣了

融資中國
2026-05-05 09:59:32
以色列死局已定,無人能救!

以色列死局已定,無人能救!

大國觀察眼
2026-04-28 06:05:05
賈斯汀·比伯:一場音樂節(jié)如何讓播放量暴漲18倍

賈斯汀·比伯:一場音樂節(jié)如何讓播放量暴漲18倍

熱搜摘要官
2026-05-05 18:09:18
內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

夜白侃球
2026-05-06 15:19:02
伊斯蘭革命衛(wèi)隊:如果美國再犯錯誤,就燒毀報廢他們的巨型戰(zhàn)艦!

伊斯蘭革命衛(wèi)隊:如果美國再犯錯誤,就燒毀報廢他們的巨型戰(zhàn)艦!

混沌錄
2026-04-30 00:12:11
“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

美芽
2026-05-06 18:30:49
森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

羅說NBA
2026-05-06 05:52:40
官宣:杰倫·布朗因公開批評裁判將被處以5萬美元罰款

官宣:杰倫·布朗因公開批評裁判將被處以5萬美元罰款

北青網(wǎng)-北京青年報
2026-05-06 19:59:03
吳宜澤:奧沙利文在決賽關(guān)鍵時刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

吳宜澤:奧沙利文在決賽關(guān)鍵時刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

懂球帝
2026-05-05 21:25:07
2026-05-06 20:35:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11749文章數(shù) 117061關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財經(jīng)要聞

最新GDP!全國30強城市,又變了

汽車要聞

領(lǐng)克10/領(lǐng)克10+ 無論能源形式 領(lǐng)克都要快樂

態(tài)度原創(chuàng)

本地
數(shù)碼
親子
房產(chǎn)
公開課

本地新聞

用青花瓷的方式,打開西溪濕地

數(shù)碼要聞

消息稱三星蘇州家電生產(chǎn)繼續(xù),傳聞此前未能與塞夫就國行銷售談妥

親子要聞

童心寄星河,這份航天熱愛太珍貴。

房產(chǎn)要聞

遙遙領(lǐng)先!這個澄邁頂流紅盤,憑什么持續(xù)霸榜

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版