国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek V4爆春節(jié)登場(chǎng)!四大殺招突襲全球編程王座,Claude危

0
分享至

  

  新智元報(bào)道

  編輯:桃子 定慧

  【新智元導(dǎo)讀】DeepSeek春節(jié)憋大招,V4要當(dāng)「編程之神」!一個(gè)月后代碼圈變天?

  每逢假期,必發(fā)新品。

  Information爆料稱,DeepSeek將計(jì)劃在2月中旬,也正是春節(jié)前后,正式發(fā)布下一代V4模型

  

  而這一次,所有目光都聚焦在同一維度上——編程能力。

  目標(biāo):編程之王。

  據(jù)稱,DeepSeek V4編程實(shí)力可以趕超Claude、GPT系列等頂尖閉源模型。

  要知道,如今Claude是全網(wǎng)公認(rèn)的編程王者,真要擊敗了它,那可真不是小事兒。

  

  毫無(wú)疑問(wèn),V4是繼去年12月V3的重大迭代版,但內(nèi)部測(cè)試者普遍反饋:

  這不是一次常規(guī)的升級(jí),而是一次質(zhì)的跨越。

  復(fù)刻R1春節(jié)核爆,全網(wǎng)期待值拉滿

  此次發(fā)布時(shí)間的選擇,同樣意味深長(zhǎng)。

  還記得,去年1月20日,恰逢春節(jié)前夕,DeepSeek R1重磅出世,在全網(wǎng)掀起了巨震。

  R1的上線,最終被證明是教科書級(jí)的節(jié)奏:討論密度、傳播強(qiáng)度、社區(qū)反饋,全部被拉到了峰值。

  或許這一次,DeepSeek希望再次復(fù)刻這種「時(shí)間窗口效應(yīng)」。

  回看過(guò)去一年,DeepSeek的發(fā)展軌跡,其實(shí)已經(jīng)給出一條清晰的敘事線:

  DeepSeek V3嶄露頭角,讓國(guó)際開發(fā)者第一次正眼看這個(gè)來(lái)自中國(guó)的團(tuán)隊(duì)。

  DeepSeek R1才是真正引爆的那個(gè)點(diǎn)。

  一款開源「推理」模型,把「先思考、再作答」變成顯性過(guò)程,用相對(duì)克制的訓(xùn)練成本,實(shí)現(xiàn)了復(fù)雜問(wèn)題上的驚人穩(wěn)定性。

  這種「性價(jià)比反差」,直接擊中了硅谷最敏感的那根神經(jīng)。

  

  隨后,DeepSeek在國(guó)內(nèi),推出了由R1+V3加持的聊天應(yīng)用,短時(shí)間內(nèi)成為了現(xiàn)象級(jí)應(yīng)用。

  接下來(lái)的一年中,DeepSeek進(jìn)行了多次模型版本迭代,比如V3.1、V3.2,智能體能力植入等等。

  進(jìn)入2025年,開源早已成為整個(gè)行業(yè)最大共識(shí)。

  中國(guó)大廠與初創(chuàng)公司密集發(fā)布和開源,中國(guó)AI的存在感被整體抬升了一個(gè)量級(jí),被視為全球開源AI領(lǐng)導(dǎo)力量之一。

  上個(gè)月,DeepSeek V3.2出世,在部分基準(zhǔn)測(cè)試上碾壓GPT-5、Gemini 3.0 Pro。

  這是DeepSeek在一直未推出真正意義上的重大換代模型的情況下,實(shí)現(xiàn)的反超。

  

  也正因如此,V4被賦予了比以往任何一次迭代都更高的期待。

  劍指編程王座,四大突破曝光

  從目前流出的信息來(lái)看,DeepSeek V4在以下四個(gè)關(guān)鍵方向上,實(shí)現(xiàn)了核心突破,或?qū)⒏淖冇螒蛞?guī)則。

  編程能力:劍指Claude王座

  2025開年,Claude一夜之間成為公認(rèn)的編程之王。無(wú)論是代碼生成、調(diào)試還是重構(gòu),幾乎沒(méi)有對(duì)手。

  但現(xiàn)在,這個(gè)格局可能要變了。

  知情人士透露,DeepSeek內(nèi)部的初步基準(zhǔn)測(cè)試顯示,V4在編程任務(wù)上的表現(xiàn)已經(jīng)超越了目前的主流模型,包括Claude系列、GPT系列。

  如果消息屬實(shí),DeepSeek將從追趕者一步躍升為領(lǐng)跑者——至少在編程這個(gè)AI應(yīng)用最核心的賽道上。

  超長(zhǎng)上下文代碼處理:工程師的終極利器

  V4的另一個(gè)技術(shù)突破在于,處理和解析極長(zhǎng)代碼提示詞的能力。

  對(duì)于日常寫幾十行代碼的用戶來(lái)說(shuō),這可能感知不強(qiáng)。但對(duì)于真正在大型項(xiàng)目中工作的軟件工程師來(lái)說(shuō),這是一個(gè)革命性的能力。

  想象一下:你有一個(gè)幾萬(wàn)行代碼的項(xiàng)目,你需要AI理解整個(gè)代碼庫(kù)的上下文,然后在正確的位置插入新功能、修復(fù)bug或者進(jìn)行重構(gòu)。以前的模型往往會(huì)忘記之前的代碼,或者在長(zhǎng)上下文中迷失方向。

  V4在這個(gè)維度上取得了技術(shù)突破,能夠一次性理解更龐大的代碼庫(kù)上下文。

  這對(duì)于企業(yè)級(jí)開發(fā)來(lái)說(shuō),是真正的生產(chǎn)力革命。

  算法提升,不易出現(xiàn)衰減

  據(jù)透露,V4在訓(xùn)練過(guò)程的各個(gè)階段,對(duì)數(shù)據(jù)模式的理解能力也得到了提升,并且不容易出現(xiàn)衰減。

  AI訓(xùn)練需要模型從海量數(shù)據(jù)集中反復(fù)學(xué)習(xí),但學(xué)到的模式/特征可能會(huì)在多輪訓(xùn)練中逐漸衰減。

  通常來(lái)說(shuō),擁有大量AI芯片儲(chǔ)備的開發(fā)者可以通過(guò)增加訓(xùn)練輪次來(lái)緩解這一問(wèn)題。

  推理能力提升:更嚴(yán)密、更可靠

  知情人士還透露了一個(gè)關(guān)鍵細(xì)節(jié):用戶會(huì)發(fā)現(xiàn)V4的輸出在邏輯上更加嚴(yán)密和清晰。

  這不是一個(gè)小改進(jìn)。這意味著模型在整個(gè)訓(xùn)練流程中對(duì)數(shù)據(jù)模式的理解能力有了質(zhì)的提升,而且更重要的是——性能沒(méi)有出現(xiàn)退化。

  在AI模型的世界里,沒(méi)有退化是一個(gè)非常高的評(píng)價(jià)。很多模型在提升某些能力時(shí),會(huì)不可避免地犧牲其他維度的表現(xiàn)。

  V4似乎找到了一個(gè)更優(yōu)的平衡點(diǎn)。

  最近一周,CEO梁文鋒參與合著的一篇論文,也透露出一些線索:

  他們提出了一種全新的訓(xùn)練架構(gòu),在無(wú)需按比例增加芯片數(shù)量的情況下,可以Scaling更大規(guī)模的模型。

  

  論文地址:https://arxiv.org/pdf/2512.24880

  技術(shù)溯源

  從V3到V4,DeepSeek做對(duì)了什么?

  要理解V4可能有多強(qiáng),我們需要先回顧DeepSeek過(guò)去一年的技術(shù)積淀。

  MoE架構(gòu):用更少的計(jì)算做更多的事

  DeepSeek-V3的核心技術(shù)優(yōu)勢(shì)在于其創(chuàng)新的MoE(混合專家)架構(gòu)。

  V3擁有高達(dá)6710億的總參數(shù),但推理時(shí)每個(gè)token只激活約370億參數(shù)。

  這種稀疏激活機(jī)制讓模型在保持超大規(guī)模的同時(shí),維持了極高的推理效率。

  更重要的是,DeepSeek改進(jìn)了傳統(tǒng)MoE模型的訓(xùn)練方法,采用「細(xì)粒度專家+通才專家」的策略——使用大量小型專家而非少數(shù)大型專家,更好地逼近連續(xù)的多維知識(shí)空間。

  

  MLA:讓推理更快、更省內(nèi)存

  另一個(gè)關(guān)鍵技術(shù)是MLA(多頭潛在注意力)機(jī)制

  這項(xiàng)技術(shù)從V2就開始引入,通過(guò)將鍵(Key)和值(Value)張量壓縮到低維空間,大幅減少推理時(shí)的KV緩存和內(nèi)存占用。

  

  研究表明,MLA在建模性能上優(yōu)于傳統(tǒng)的分組查詢注意力(GQA),這是DeepSeek能夠在有限硬件條件下實(shí)現(xiàn)高性能的關(guān)鍵。

  R1強(qiáng)化學(xué)習(xí)經(jīng)驗(yàn)

  2025年1月發(fā)布的DeepSeek-R1是一個(gè)由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的推理模型,其核心技術(shù)后來(lái)被融合到了更新版的V3中。

  這里有一個(gè)關(guān)鍵信息:V4很可能繼承了R1在強(qiáng)化學(xué)習(xí)方面的所有優(yōu)化經(jīng)驗(yàn)。

  如果說(shuō)V3是「基礎(chǔ)能力」,R1是「推理能力」,那么V4很可能是兩者的完美融合——基礎(chǔ)能力+強(qiáng)化學(xué)習(xí)優(yōu)化+編程專項(xiàng)突破。

  而且不要忘了剛剛發(fā)布的新論文mHC。

  mHC:解決大模型訓(xùn)練的根本性約束

  就在2025年12月31日,也就是V4爆料前不久,DeepSeek悄悄發(fā)布了一篇重磅論文:《mHC:Manifold-Constrained Hyper-Connections》(流形約束超連接)

  

  這篇論文解決了一個(gè)困擾AI行業(yè)十年之久的難題:大模型訓(xùn)練的不穩(wěn)定性問(wèn)題。

  核心思想是什么?

  在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,信號(hào)在層與層之間傳遞時(shí)會(huì)出現(xiàn)放大效應(yīng)——在不受約束的情況下,信號(hào)可能被放大3000倍

  這種失控的放大會(huì)導(dǎo)致訓(xùn)練崩潰、梯度爆炸等一系列問(wèn)題,是阻礙大模型規(guī)?;母拘云款i之一。

  mHC的解決方案是:利用Sinkhorn-Knopp算法,將神經(jīng)網(wǎng)絡(luò)的連接矩陣投影到一個(gè)數(shù)學(xué)流形上,從而精確控制信號(hào)放大。結(jié)果:信號(hào)放大被壓縮到僅1.6倍。

  實(shí)際效果有多強(qiáng)?

  - 在BIG-BenchHard推理基準(zhǔn)上提升了2.1%

  - 僅增加6.7%的訓(xùn)練開銷

  - 在高達(dá)270億參數(shù)的模型上得到驗(yàn)證

  業(yè)內(nèi)專家評(píng)價(jià):這項(xiàng)研究可能重塑整個(gè)行業(yè)構(gòu)建基礎(chǔ)模型的方式。它解決了一個(gè)限制大語(yǔ)言模型架構(gòu)創(chuàng)新的根本性約束。

  可以看出,DeepSeek一直在進(jìn)行底層算法優(yōu)化、數(shù)學(xué)工程優(yōu)化,但不要忘了更重要的一件事:

  這些優(yōu)化都是在「限制之下」完成的,這也正是DeepSeek的厲害之處。

  硬件限制下的算法突破

  這才是真正的故事

  在討論V4時(shí),有一個(gè)背景不能忽視:芯片出口限制。

  外媒的報(bào)道特別提到,盡管面臨芯片出口限制,DeepSeek依然在算法效率上取得了進(jìn)展。這與其V3/R1系列的高性價(jià)比路線一致。

  還記得V3的訓(xùn)練成本嗎?約557.6萬(wàn)美元。

  這個(gè)數(shù)字在當(dāng)時(shí)震驚了整個(gè)AI行業(yè),因?yàn)樗h(yuǎn)低于其他同級(jí)別模型——OpenAI和Google的訓(xùn)練成本往往是這個(gè)數(shù)字的幾十倍。

  DeepSeek用更少的資源做出更好的模型,這不是偶然,而是算法、框架和硬件協(xié)同優(yōu)化的結(jié)果。

  V4很可能延續(xù)這一路線:不拼硬件數(shù)量,而是拼算法效率。

  如果V4真的在受限硬件條件下實(shí)現(xiàn)了超越Claude的編程能力,這將是一個(gè)極具象征意義的里程碑——

  證明在AI競(jìng)賽中,聰明的算法可以彌補(bǔ)硬件的不足。

  懸念:V4還會(huì)有哪些驚喜?

  根據(jù)目前的信息,我們已經(jīng)知道V4在編程能力、長(zhǎng)上下文處理、推理嚴(yán)密性三個(gè)維度上有顯著提升。

  但DeepSeek向來(lái)有低調(diào)憋大招的傳統(tǒng)。

  以下是幾個(gè)值得關(guān)注的懸念:

  1.是否會(huì)有蒸餾版本?

  DeepSeek-R1發(fā)布時(shí),同時(shí)推出了一系列蒸餾版本,讓更多用戶可以在消費(fèi)級(jí)硬件上體驗(yàn)強(qiáng)化學(xué)習(xí)推理模型。

  V4是否會(huì)延續(xù)這一策略?

  2.多模態(tài)能力如何?

  目前的報(bào)道主要聚焦于編程能力,但V4在多模態(tài)(圖像、音頻等)方面是否有提升?這是一個(gè)未知數(shù)。

  3.API定價(jià)會(huì)有驚喜嗎?

  DeepSeek一直走極致性價(jià)比路線。

  如果V4的編程能力真的超越Claude,但價(jià)格只有Claude的幾分之一,那將是對(duì)整個(gè)市場(chǎng)的巨大沖擊。

  4.開源策略會(huì)變嗎?

  V3和R1都在MIT許可下開源。

  V4是否會(huì)延續(xù)這一策略?V5、V6呢,DeepSeek會(huì)一直開源下去嗎?

  考慮到編程領(lǐng)域的商業(yè)價(jià)值,這是一個(gè)值得觀察的變量。

  LMArena上的神秘身影:V4已經(jīng)在野測(cè)了?

  如果說(shuō)以上都是內(nèi)部消息,那么有一個(gè)線索可能暗示V4比我們想象的更接近:

  有用戶在LMArena(大模型競(jìng)技場(chǎng))上發(fā)現(xiàn)了匿名模型,據(jù)說(shuō)就是V4。

  有人已經(jīng)在LMArena上發(fā)現(xiàn)匿名模型,據(jù)說(shuō)就是V4。

  

  但由于模型會(huì)「撒謊」,還無(wú)法最終確認(rèn)。

  

  這是一個(gè)值得密切關(guān)注的信號(hào)。

  如果The Information的報(bào)道屬實(shí),那么我們只需要再等不到一個(gè)月的時(shí)間。

  屆時(shí),它是否能真正超越Claude成為編程之王?

  敬請(qǐng)期待。

  參考資料:

  https://x.com/jukan05/status/2009616683607179726

  https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability?rc=lx3hes

  https://www.reddit.com/r/LocalLLaMA/comments/1q88hdc/the_information_deepseek_to_release_next_flagship/

  https://www.reddit.com/r/LocalLLaMA/comments/1q89g1i/deepseek_v4_coming/

  https://x.com/jukan05/status/2009617025933656436?s=20

  https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability

  https://economictimes.indiatimes.com/tech/artificial-intelligence/deepseek-to-launch-new-ai-model-focused-on-coding-in-february-report/articleshow/126438150.cms?from=mdr

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
買洗碗機(jī)丈夫砸家后續(xù):知情人曝內(nèi)幕,女子作精愛花錢欠外債20萬(wàn)

買洗碗機(jī)丈夫砸家后續(xù):知情人曝內(nèi)幕,女子作精愛花錢欠外債20萬(wàn)

青梅侃史啊
2026-01-10 08:58:19
炸裂!切爾西新帥激活 3700 萬(wàn)水貨,庫(kù)庫(kù)雷利亞主力位置告急

炸裂!切爾西新帥激活 3700 萬(wàn)水貨,庫(kù)庫(kù)雷利亞主力位置告急

瀾歸序
2026-01-11 06:21:24
船員柬埔寨轉(zhuǎn)機(jī)后失聯(lián)超十天,與妻子通話中疑似暗示報(bào)警

船員柬埔寨轉(zhuǎn)機(jī)后失聯(lián)超十天,與妻子通話中疑似暗示報(bào)警

大象新聞
2026-01-11 10:01:13
52票贊成47票反對(duì)!美國(guó)投票結(jié)果公布;美國(guó)或?qū)⑹ヂ?lián)大投票權(quán)

52票贊成47票反對(duì)!美國(guó)投票結(jié)果公布;美國(guó)或?qū)⑹ヂ?lián)大投票權(quán)

南宗歷史
2026-01-09 10:24:03
1968年,林彪想換北京軍區(qū)司令,毛主席只問(wèn)了一句話,林彪徹底啞火

1968年,林彪想換北京軍區(qū)司令,毛主席只問(wèn)了一句話,林彪徹底啞火

老杉說(shuō)歷史
2026-01-09 22:00:17
“深圳成全國(guó)首個(gè)電動(dòng)車停車收費(fèi)城市”系不實(shí)信息

“深圳成全國(guó)首個(gè)電動(dòng)車停車收費(fèi)城市”系不實(shí)信息

上觀新聞
2026-01-10 19:14:14
蘋果正式官宣:1月9日,全面官降!

蘋果正式官宣:1月9日,全面官降!

科技堡壘
2026-01-09 11:45:41
飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時(shí)間吃藥才最好

飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時(shí)間吃藥才最好

路醫(yī)生健康科普
2025-12-16 12:45:03
禁令執(zhí)行第四天,中國(guó)電路板廠商不再向日本發(fā)貨,日本廠商天塌了

禁令執(zhí)行第四天,中國(guó)電路板廠商不再向日本發(fā)貨,日本廠商天塌了

卷史
2026-01-10 14:02:40
炸裂!曼聯(lián)世界級(jí)巨星或?qū)㈦x隊(duì),阿莫林下課成導(dǎo)火索?

炸裂!曼聯(lián)世界級(jí)巨星或?qū)㈦x隊(duì),阿莫林下課成導(dǎo)火索?

奶蓋熊本熊
2026-01-11 03:11:54
伊能靜參觀清真寺!包著頭巾不敢大聲說(shuō)話,秦昊把她拍得像130斤

伊能靜參觀清真寺!包著頭巾不敢大聲說(shuō)話,秦昊把她拍得像130斤

林木體育解說(shuō)
2026-01-10 21:59:58
對(duì)話“死了么”APP創(chuàng)始人:開發(fā)成本1000多元,計(jì)劃出售10%股份,即將上線短信通知功能

對(duì)話“死了么”APP創(chuàng)始人:開發(fā)成本1000多元,計(jì)劃出售10%股份,即將上線短信通知功能

藍(lán)鯨新聞
2026-01-11 09:04:24
廣東今日早報(bào)!杜鋒深夜發(fā)聲,胡明軒拒絕輪休,崔永熙更新康復(fù)

廣東今日早報(bào)!杜鋒深夜發(fā)聲,胡明軒拒絕輪休,崔永熙更新康復(fù)

多特體育說(shuō)
2026-01-11 07:20:03
美防長(zhǎng)“飄了”,先嘲諷俄羅斯,再將矛頭對(duì)準(zhǔn)中國(guó)

美防長(zhǎng)“飄了”,先嘲諷俄羅斯,再將矛頭對(duì)準(zhǔn)中國(guó)

空天力量
2026-01-10 20:07:38
名哨腿筋拉傷無(wú)限期休戰(zhàn)!昨日坐輪椅離場(chǎng) 有望常規(guī)賽結(jié)束前回歸

名哨腿筋拉傷無(wú)限期休戰(zhàn)!昨日坐輪椅離場(chǎng) 有望常規(guī)賽結(jié)束前回歸

羅說(shuō)NBA
2026-01-11 06:30:58
閆學(xué)晶的拼搏:20歲嫁30歲小老板,給8歲小妹妹當(dāng)后媽

閆學(xué)晶的拼搏:20歲嫁30歲小老板,給8歲小妹妹當(dāng)后媽

小小河
2026-01-10 20:21:22
張學(xué)良晚年直言:我這輩子不后悔"西安捉蔣",后悔的是殺了楊宇霆

張學(xué)良晚年直言:我這輩子不后悔"西安捉蔣",后悔的是殺了楊宇霆

嘮叨說(shuō)歷史
2026-01-05 14:12:05
果然是你!名記:東契奇是施羅德在走廊尋找并且想揍的人

果然是你!名記:東契奇是施羅德在走廊尋找并且想揍的人

懂球帝
2026-01-11 10:32:00
“性蕭條”才是這個(gè)時(shí)代真正的危機(jī)

“性蕭條”才是這個(gè)時(shí)代真正的危機(jī)

深藍(lán)夜讀
2025-09-24 16:00:09
85%的血管淤堵,根本不用過(guò)度治療!醫(yī)生:做好3件事,比吃藥管用

85%的血管淤堵,根本不用過(guò)度治療!醫(yī)生:做好3件事,比吃藥管用

孟大夫之家1
2026-01-09 15:47:05
2026-01-11 11:12:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14306文章數(shù) 66452關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

牛彈琴:特朗普沒(méi)想到 抓馬杜羅后全球情緒總體很穩(wěn)定

頭條要聞

牛彈琴:特朗普沒(méi)想到 抓馬杜羅后全球情緒總體很穩(wěn)定

體育要聞

詹皇曬照不滿打手沒(méi)哨 裁判報(bào)告最后兩分鐘無(wú)誤判

娛樂(lè)要聞

網(wǎng)友偶遇賈玲張小斐崇禮滑雪

財(cái)經(jīng)要聞

外賣平臺(tái)"燒錢搶存量市場(chǎng)"迎來(lái)終局?

汽車要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

時(shí)尚
本地
家居
房產(chǎn)
手機(jī)

動(dòng)物紋回潮,那很狂野了

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

家居要聞

木色留白 演繹現(xiàn)代自由

房產(chǎn)要聞

66萬(wàn)方!4755套!三亞巨量房源正瘋狂砸出!

手機(jī)要聞

恭喜小米17 Pro系列!恭喜華為Mate 80!友商加油

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版