国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

寒武紀(jì)Day 0適配DeepSeek V4意味著什么

0
分享至


經(jīng)濟(jì)觀察報(bào) 記者 錢玉娟 任曉寧

4月24日,深度求索(DeepSeek)發(fā)布了旗艦?zāi)P蚔4的預(yù)覽版本并同步開源。

已經(jīng)上線的DeepSeek V4模型分為Pro和Flash兩個(gè)版本,Pro版本的參數(shù)為1.6萬億,激活490億,預(yù)訓(xùn)練數(shù)據(jù)33萬億;而Flash版本的參數(shù)為2840億,激活130億,預(yù)訓(xùn)練數(shù)據(jù)32萬億。兩個(gè)版本模型的上下文都是1M(百萬詞元)。

經(jīng)歷了長達(dá)15個(gè)月的“靜默期”和多次更新傳聞,DeepSeek V4終于亮相。然而,這并非一次輕盈的亮相。

在V4兩個(gè)版本模型對API訪問的價(jià)格介紹中,DeepSeek用一行小字表明了現(xiàn)實(shí)的骨感:受限于高端算力,目前V4 Pro的服務(wù)吞吐能力有限,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價(jià)格會大幅下調(diào)。

隨后,華為計(jì)算發(fā)文表示,昇騰一直同步支持DeepSeek系列模型,本次雙方更是通過芯模技術(shù)協(xié)同,實(shí)現(xiàn)了昇騰超節(jié)點(diǎn)的全系列產(chǎn)品支持DeepSeek V4系列模型。

由華為昇騰代表的國產(chǎn)高端算力,與DeepSeek的模型算法進(jìn)行協(xié)同適配,不再猶抱琵琶半遮面。

DeepSeek在同步發(fā)出的V4技術(shù)報(bào)告中稱:“我們在英偉達(dá)GPU和華為昇騰NPU兩個(gè)平臺上均驗(yàn)證了細(xì)粒度EP(專家并行)方案?!边@是DeepSeek第一次在正式文檔中把華為昇騰和英偉達(dá)并列寫進(jìn)硬件驗(yàn)證清單。

一位從事大模型研究的高校學(xué)者還是從DeepSeek的小字說明中判斷:“國產(chǎn)算力支持下的DeepSeek V4大規(guī)模商用仍需時(shí)間?!?/p>

該學(xué)者早就發(fā)現(xiàn)DeepSeek在產(chǎn)品端的算力緊缺。2026年初至今,DeepSeek曾突發(fā)多次服務(wù)中斷,備受關(guān)注的便是3月30日—31日的連續(xù)宕機(jī)事件。

在他看來,DeepSeek在一眾國產(chǎn)大模型廠商中,以底層工程極限優(yōu)化著稱,即便在產(chǎn)品服務(wù)出現(xiàn)宕機(jī)風(fēng)險(xiǎn)時(shí),也未公開提及其在芯片等物理設(shè)備方面的缺口問題,而今在新模型亮相之初就袒露算力受限,一定程度上揭示了國產(chǎn)模型廠商在國產(chǎn)算力適配上存在著陣痛。

Day 0適配

一位與DeepSeek有模型服務(wù)合作的供應(yīng)商人士認(rèn)為,V4之所以姍姍來遲,深層原因在于算力架構(gòu)的重構(gòu)。

AI開源社區(qū)與模型托管平臺Hugging Face的亞太生態(tài)負(fù)責(zé)人王鐵震指出,目前各家國產(chǎn)大模型都在積極展開國產(chǎn)算力適配,而DeepSeek在過去超一年時(shí)間的V4研發(fā)中,也在試圖大規(guī)模采用國產(chǎn)芯片替代方案。眼下,DeepSeek除了持續(xù)推進(jìn)與華為昇騰算力的適配,還與包括寒武紀(jì)、沐曦等在內(nèi)的眾多國產(chǎn)算力廠商展開適配。

王鐵震透露,行業(yè)內(nèi)尤其關(guān)注國產(chǎn)大模型與國產(chǎn)算力是否達(dá)到“Day 0”適配。

“Day 0 相當(dāng)于大模型上線的當(dāng)天,算力已完成全鏈路兼容、性能優(yōu)化、穩(wěn)定性驗(yàn)證。開發(fā)者開箱即用,零等待、零額外適配即可直接訓(xùn)練/推理該模型?!币晃粐a(chǎn)芯片廠商內(nèi)部人士透露,過去只有英偉達(dá)的算力芯片能做到與各家模型的Day 0適配,其他GPU往往要滯后數(shù)月。

就在DeepSeek V4官方信息發(fā)布后,寒武紀(jì)通過其官方公眾號表示,已基于vLLM 推理框架完成對DeepSeek V4已上線兩個(gè)模型版本的Day 0適配。

寒武紀(jì)與DeepSeek最新模型完成Day 0適配,意味著國產(chǎn)GPU已經(jīng)具備了與英偉達(dá)高端算力芯片同等的生態(tài)響應(yīng)速度。而前述國產(chǎn)芯片廠商內(nèi)部人士表示,其所在廠商也在與DeepSeek V4進(jìn)行產(chǎn)品適配。在此之前,已經(jīng)完成與十幾個(gè)國產(chǎn)大模型的Day 0適配。

今年初,電信天翼云自主研發(fā)的“息壤”智算平臺宣布完成了國產(chǎn)算力芯片與DeepSeek V3系列大模型的深度適配優(yōu)化,伴隨DeepSeek的模型迭代與更新,智算平臺的優(yōu)化適配也在進(jìn)行中。

聚焦中國AI市場,國產(chǎn)大模型此前多依賴英偉達(dá)CUDA生態(tài),而今算法要全面適配國產(chǎn)算力,需要對底座架構(gòu)進(jìn)行重構(gòu)。

前述大模型研究學(xué)者與國產(chǎn)芯片廠商內(nèi)部人士有個(gè)共識,算力自主可控是必然趨勢,他們將上述芯模技術(shù)底層的重構(gòu)理解為“算力平替”的過程。從DeepSeek V4耗時(shí)長達(dá)一年多的研發(fā)進(jìn)程,不難窺見這個(gè)過程的艱難。

“不只是簡單的代碼遷移,MoE(混合專家模型)架構(gòu)在國產(chǎn)芯片上的通信延遲優(yōu)化是世界級難題?!蹦愁^部模型廠商的技術(shù)工程師分析,DeepSeek選擇在此時(shí)坦承吞吐有限,本質(zhì)上也是在等待國產(chǎn)芯片“超節(jié)點(diǎn)”范式的成熟。

多模態(tài)缺失

4月24日上午,在DeepSeek V4預(yù)覽版上線后,不僅半導(dǎo)體芯片國產(chǎn)替代板塊個(gè)股大漲,與國產(chǎn)算力及DeepSeek相關(guān)的概念股均出現(xiàn)異動(dòng)。

截至收盤,寒武紀(jì)(688256.SH)報(bào)1352.5元/股,漲超2.2%。同步走強(qiáng)的還有相關(guān)概念股,像龍芯中科(688047.SH)收盤報(bào)153.86元/股,同樣漲超2個(gè)點(diǎn)。以主營大數(shù)據(jù)服務(wù)及數(shù)據(jù)安全的拓爾思(300229.SZ),作為DeepSeek概念股,在24日午前漲至18.9元/股,僅短短5分鐘后便出現(xiàn)下跌,跌幅超過2%?。收盤報(bào)18.34元/股,較當(dāng)日開盤價(jià)漲幅不及1%。

前述頭部模型廠商技術(shù)工程師認(rèn)為,此前傳聞DeepSeek V4會有多模態(tài)版本,可以具備支持圖片、視頻理解與生成等能力,而今上線的預(yù)覽版本能力,依然固守文本生成與推理領(lǐng)域。

形成鮮明對比的是,就在DeepSeek V4上線的前幾個(gè)小時(shí),OpenAI發(fā)布了新一代大模型GPT-5.5,其能力展示中特別突出了對工具調(diào)用的多模態(tài)視覺理解能力。

即使不對標(biāo)GPT、Gemini等海外頭部模型,在2026年的國產(chǎn)大模型戰(zhàn)場上,阿里千問、騰訊混元等均已實(shí)現(xiàn)“全模態(tài)一體化”。而V4已上線的兩個(gè)模型版本仍走單模態(tài)路線,前述頭部模型廠商技術(shù)工程師推測,DeepSeek在多模態(tài)識別能力上或出現(xiàn)短板。

“多模態(tài)需要指數(shù)級的算力和更復(fù)雜的數(shù)據(jù)工程?!彼J(rèn)為,這極為考驗(yàn)?zāi)P蛷S商的生態(tài)布局。他所在的頭部大廠不斷挖角DeepSeek的技術(shù)人才?!拔覀儓F(tuán)隊(duì)的數(shù)據(jù)負(fù)責(zé)人就來自DeepSeek?!?/p>

這種核心人才的流失是令人擔(dān)憂的。多位受訪者確信DeepSeek在國產(chǎn)模型第一梯隊(duì)中的技術(shù)護(hù)城河,但也提出,繼核心科學(xué)家羅福莉入職小米、郭達(dá)雅轉(zhuǎn)投字節(jié)跳動(dòng)后,內(nèi)部負(fù)責(zé)核心數(shù)據(jù)工程、多模態(tài)預(yù)訓(xùn)練的關(guān)鍵人士流失,或令其模型在多模態(tài)能力開發(fā)創(chuàng)新方面遇到更大困難。

前述模型技術(shù)工程師分析,模型缺乏多模態(tài)識別能力或?qū)⒁馕吨搹S商錯(cuò)失大量實(shí)時(shí)視頻交互、視覺分析等高價(jià)值商業(yè)場景。

V4預(yù)覽版的發(fā)布,讓市場看到了國產(chǎn)模型與算力在底層架構(gòu)上的協(xié)同進(jìn)展,但這并不意味著DeepSeek可以松口氣。在大模型萬億參數(shù)和全模態(tài)競爭的當(dāng)下,它還需要交出一份答卷,在下半年昇騰950超節(jié)點(diǎn)到位前,頂著多模態(tài)應(yīng)用技術(shù)的壓力,它的模型服務(wù)、產(chǎn)品迭代,甚至是人才組織架構(gòu),能否保持穩(wěn)定。

前述模型技術(shù)工程師透露,在騰訊、阿里等巨頭有意與DeepSeek接洽首輪外部融資事宜外,近期數(shù)家推動(dòng)國產(chǎn)替代相關(guān)動(dòng)作的國資型產(chǎn)業(yè)投資基金,也在與DeepSeek展開深度洽談。在其看來,研發(fā)進(jìn)度緩慢的DeepSeek,在算力資源之外,也對外來資金表現(xiàn)出極度渴求。

(作者 錢玉娟)

免責(zé)聲明:本文觀點(diǎn)僅代表作者本人,供參考、交流,不構(gòu)成任何建議。


錢玉娟

TMT新聞部記者 長期關(guān)注并報(bào)道TMT領(lǐng)域的重大事件,時(shí)刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢。擅長企業(yè)模式、人物專訪及行業(yè)深度報(bào)道。 重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn 微信號:EstherQ138279

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
倒閉13年的以色列公司,指控蔚來侵犯專利并索要2.5億美元

倒閉13年的以色列公司,指控蔚來侵犯專利并索要2.5億美元

墨印齋
2026-04-25 15:01:21
世錦賽戰(zhàn)報(bào):競逐八強(qiáng)6-10,連爆大冷預(yù)警,世界第2第6都落后了

世錦賽戰(zhàn)報(bào):競逐八強(qiáng)6-10,連爆大冷預(yù)警,世界第2第6都落后了

不想長大的莫扎特
2026-04-25 18:44:03
河北偷狗姐已社會性死亡:人被拘了,名聲臭了,更惡心的還在后面

河北偷狗姐已社會性死亡:人被拘了,名聲臭了,更惡心的還在后面

寒士之言本尊
2026-04-25 16:17:01
美軍還沒打贏,“第二個(gè)伊朗”冒頭?解放軍“滅國艦隊(duì)”開進(jìn)南海

美軍還沒打贏,“第二個(gè)伊朗”冒頭?解放軍“滅國艦隊(duì)”開進(jìn)南海

近史博覽
2026-04-25 05:08:38
哈里王子正式官宣!獨(dú)立掌握王室權(quán)限,逼迫查爾斯國王出“狠招”

哈里王子正式官宣!獨(dú)立掌握王室權(quán)限,逼迫查爾斯國王出“狠招”

榮亭小吏
2026-04-25 15:13:48
王治郅和二婚妻子近照,亮相名人堂,為他生2娃,依舊美麗動(dòng)人

王治郅和二婚妻子近照,亮相名人堂,為他生2娃,依舊美麗動(dòng)人

大西體育
2026-04-24 21:59:33
燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個(gè)

燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個(gè)

匹夫來搞笑
2026-04-20 13:24:51
僅播2小時(shí),熱度破18000,評分9.5,終于有值得熬夜追的古裝劇

僅播2小時(shí),熱度破18000,評分9.5,終于有值得熬夜追的古裝劇

星宿影視鴨
2026-04-25 16:24:00
太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

橙星文娛
2026-04-17 13:19:56
炸鍋!全國充電樁集體漲價(jià)!每度電狂漲,電車省錢神話徹底破滅?

炸鍋!全國充電樁集體漲價(jià)!每度電狂漲,電車省錢神話徹底破滅?

藍(lán)色海邊
2026-04-24 08:08:58
普京支持率跌破戰(zhàn)后最低后被“消音”:克宮直接下令媒體不準(zhǔn)報(bào)道

普京支持率跌破戰(zhàn)后最低后被“消音”:克宮直接下令媒體不準(zhǔn)報(bào)道

桂系007
2026-04-25 17:24:36
“擺酒前一天我跟別人在一起”,離婚后第4天,男子收到前妻《我的情感經(jīng)歷》,經(jīng)鑒定養(yǎng)了14年的兒子并非親生,起訴前妻獲賠17萬

“擺酒前一天我跟別人在一起”,離婚后第4天,男子收到前妻《我的情感經(jīng)歷》,經(jīng)鑒定養(yǎng)了14年的兒子并非親生,起訴前妻獲賠17萬

大風(fēng)新聞
2026-04-25 11:23:04
蘭姐徹底看開,笑到停不下來,小玥兒生日只字不提,原因太現(xiàn)實(shí)

蘭姐徹底看開,笑到停不下來,小玥兒生日只字不提,原因太現(xiàn)實(shí)

陳意小可愛
2026-04-25 17:46:55
連空氣都被凍結(jié),位于太陽系邊緣冥王星,究竟有多恐怖?

連空氣都被凍結(jié),位于太陽系邊緣冥王星,究竟有多恐怖?

觀察宇宙
2026-04-24 18:28:18
李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級骨相美到發(fā)光完全不像55歲

李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級骨相美到發(fā)光完全不像55歲

喜歡歷史的阿繁
2026-04-24 11:57:41
悲催!37歲名牌大學(xué)畢業(yè)、年薪30萬女醫(yī)生被技術(shù)男嫌棄,當(dāng)場崩潰

悲催!37歲名牌大學(xué)畢業(yè)、年薪30萬女醫(yī)生被技術(shù)男嫌棄,當(dāng)場崩潰

火山詩話
2026-04-24 06:14:58
冰箱里的凍肉,超過這個(gè)時(shí)間直接扔?。ǜ奖鋬?nèi)各類食物保存期)

冰箱里的凍肉,超過這個(gè)時(shí)間直接扔!(附冰箱內(nèi)各類食物保存期)

齊魯壹點(diǎn)
2026-04-02 23:14:06
司馬遷果然沒瞎說,考古隊(duì)再次勘測秦始皇陵時(shí),真的挖出兩只銅鶴

司馬遷果然沒瞎說,考古隊(duì)再次勘測秦始皇陵時(shí),真的挖出兩只銅鶴

大運(yùn)河時(shí)空
2026-04-25 15:10:03
48歲中國羽協(xié)主席被查!失聯(lián)十多天+原因曝光 曾衛(wèi)冕奧運(yùn)混雙冠軍

48歲中國羽協(xié)主席被查!失聯(lián)十多天+原因曝光 曾衛(wèi)冕奧運(yùn)混雙冠軍

念洲
2026-04-25 06:12:48
現(xiàn)代級魔改,估計(jì)俄羅斯娘家也看傻眼了吧

現(xiàn)代級魔改,估計(jì)俄羅斯娘家也看傻眼了吧

三叔的裝備空間
2026-04-24 23:53:16
2026-04-25 21:15:00
經(jīng)濟(jì)觀察報(bào) incentive-icons
經(jīng)濟(jì)觀察報(bào)
經(jīng)濟(jì)觀察報(bào)是專注于財(cái)經(jīng)新聞與經(jīng)濟(jì)分析的全國性綜合財(cái)經(jīng)類媒體。聚焦商道、商技和商機(jī)。
114292文章數(shù) 1606745關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

頭條要聞

男童7歲18斤被當(dāng)腦癱治多年 父母查其出生病歷發(fā)現(xiàn)問題

頭條要聞

男童7歲18斤被當(dāng)腦癱治多年 父母查其出生病歷發(fā)現(xiàn)問題

體育要聞

火箭0-3觸發(fā)百分百出局定律:本季加時(shí)賽9戰(zhàn)8敗

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財(cái)經(jīng)要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

手機(jī)
教育
數(shù)碼
旅游
公開課

手機(jī)要聞

iPhone18ProMax再爆料!厚度近 14mm,堪稱史上最厚蘋果手機(jī)!

教育要聞

我國“就業(yè)率逼近100%”的5所雙非大學(xué),500多分就能上!

數(shù)碼要聞

雷達(dá)感應(yīng)自動(dòng)開關(guān)燈,Yeelight新品來了

旅游要聞

從“中國游”到“中式生活”:外國人眼中的中國魅力與巨變

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版