国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek-V3.1震撼發(fā)布,全球開源編程登頂!R1/V3首度合體,訓(xùn)練量暴增10倍

0
分享至

智能體時代的序幕拉開

AI 領(lǐng)域又一里程碑發(fā)布——DeepSeek-V3.1 正式上線,標志著 AI 從單一功能模型向多功能智能體演進的序幕正式拉開。作為邁向智能體時代的第一步,這款 671B 參數(shù)模型不僅具備強大的工具使用能力和多步驟任務(wù)處理能力,更支持多種 Code Agent 框架,讓開發(fā)者能自主搭建專屬智能體。


核心突破:DeepSeek-V3.1 重新定義 AI 能力邊界,從「被動執(zhí)行指令」轉(zhuǎn)向「主動規(guī)劃任務(wù)」,為智能體時代奠定技術(shù)基石。

核心亮點:重新定義大模型能力邊界

DeepSeek-V3.1 通過三大技術(shù)突破重新定義大模型能力邊界,實現(xiàn)效率與性能的跨越式提升。其核心創(chuàng)新采用“技術(shù)突破+數(shù)據(jù)支撐”雙輪驅(qū)動,構(gòu)建起更智能、更高效的 AI 能力體系。

首先是混合推理模式的突破性設(shè)計,實現(xiàn)“思考(Think)”與“非思考(Non Thinking)”模式的自主切換,達成“一個模型兩種能力”的創(chuàng)新性平衡——既能在復(fù)雜任務(wù)中深度推理,又能在簡單問答中高速響應(yīng),無需為不同場景切換模型。

其次是參數(shù)效率的極致優(yōu)化,671B 總參數(shù)中僅 37B 為激活參數(shù),通過精細化參數(shù)管理顯著提升運行效率,在保持模型規(guī)模優(yōu)勢的同時,大幅降低計算資源消耗。

第三是上下文長度擴展至 128k,可流暢處理超長文檔、多輪對話等復(fù)雜場景,為法律分析、學(xué)術(shù)研究等長文本需求提供強大支持。

速度對比:在混合推理模式下,V3.1-Think 較前代 R1-0528 展現(xiàn)出明顯的推理速度優(yōu)勢,實現(xiàn)“思考效率飆升,反應(yīng)快如閃電”的用戶體驗升級,真正做到“一個模型,兩種能力,效率精度雙突破”。

這三大亮點的有機結(jié)合,使 DeepSeek-V3.1 在保持回答質(zhì)量與前代相當?shù)幕A(chǔ)上,實現(xiàn)了推理效率與場景適應(yīng)性的全面進化。

技術(shù)解析:訓(xùn)練與架構(gòu)的雙重革新

DeepSeek-V3.1的性能突破源于訓(xùn)練與架構(gòu)的雙重革新,核心聚焦數(shù)據(jù)規(guī)模擴張格式優(yōu)化兩大技術(shù)支柱。模型采用「兩階段長上下文擴展策略」,通過階梯式訓(xùn)練實現(xiàn)上下文窗口從32k到128k的跨越:首先在32k階段將訓(xùn)練量提升10倍至6300億Token,構(gòu)建基礎(chǔ)語義理解能力;隨后在128k階段進一步擴展3.3倍,達到2090億Token,強化超長文本處理能力。

兩階段訓(xùn)練量躍升:32k階段達6300億Token(較前代提升10倍),128k階段增至2090億Token(擴展3.3倍),形成覆蓋多尺度文本的訓(xùn)練數(shù)據(jù)底座。

格式優(yōu)化方面,DeepSeek-V3.1采用UE8M0 FP8縮放數(shù)據(jù)格式,通過精準的數(shù)值壓縮技術(shù),在保證微尺度數(shù)據(jù)兼容性與計算精度的同時,有效降低訓(xùn)練過程中的內(nèi)存占用與算力消耗。這種"數(shù)據(jù)-格式"協(xié)同優(yōu)化的架構(gòu)設(shè)計,為671B參數(shù)模型實現(xiàn)高效訓(xùn)練與性能突破提供了底層支撐。

性能突破:全面碾壓競品的基準成績單

DeepSeek-V3.1 在多項權(quán)威基準測試中展現(xiàn)出顛覆性性能,其 671B 參數(shù)模型的實力通過編程、數(shù)學(xué)推理與工具調(diào)用三大核心領(lǐng)域的成績單得到充分驗證,全面超越前代模型及行業(yè)競品。


在編程能力測試中,DeepSeek-V3.1-Thinking 版本在 Aider 編碼測試中斬獲 76.3% 的高分,這一成績不僅顯著領(lǐng)先于 Claude 4 Opus 的 68.2%,還超越了 Gemini 2.5 Pro(0325)等主流閉源模型,凸顯了開源大模型在高難度編碼任務(wù)上的強勁競爭力。

數(shù)學(xué)推理領(lǐng)域,DeepSeek-V3.1 實現(xiàn)了突破性進展,刷新該領(lǐng)域 SOTA(State-of-the-Art)成績,在人類的最后考試 HLE 中拿下 29.8 分的高分,同時在數(shù)學(xué)任務(wù)中全面超越推理模型 R1,進一步鞏固了其在復(fù)雜邏輯運算領(lǐng)域的行業(yè)領(lǐng)先地位。

工具調(diào)用能力方面,該模型在 BrowseComp 基準測試中表現(xiàn)尤為突出,實力“粉碎”前代模型 R1,展現(xiàn)出對多輪搜索任務(wù)的高效處理能力,證明其在真實世界場景中整合外部工具解決復(fù)雜問題時的可靠性。

三大核心能力亮點

  • 編程優(yōu)勢

    :Aider 測試 76.3% 得分,開源模型首次在該場景超越 Claude 4

  • 數(shù)學(xué)突破

    :HLE 29.8 分+SOTA 成績,重構(gòu)行業(yè)推理能力標準

  • 工具整合

    :BrowseComp 測試碾壓競品,多輪任務(wù)處理效率行業(yè)領(lǐng)先

綜合來看,DeepSeek-V3.1 的基準測試結(jié)果不僅驗證了其參數(shù)規(guī)模的優(yōu)勢,更體現(xiàn)了模型在算法優(yōu)化與場景適配層面的深度突破,為 AI 技術(shù)在專業(yè)領(lǐng)域的落地提供了更強有力的支持。

應(yīng)用場景:從代碼助手到智能體開發(fā)

DeepSeek-V3.1 圍繞開發(fā)者核心需求,實現(xiàn)了從單一代碼助手到多功能智能體開發(fā)平臺的跨越,兩大場景展現(xiàn)顯著價值。在代碼智能體領(lǐng)域,其創(chuàng)新的 Non Thinking 模式較 R1 版本效率提升 30%+,配合對多種 Code Agent 框架的原生支持,開發(fā)者可快速搭建個性化編碼智能體,顯著縮短開發(fā)周期。

面對依賴外部信息的復(fù)雜任務(wù),Search Agent 功能成為關(guān)鍵突破。當處理實時數(shù)據(jù)查詢等需要最新知識的場景時,V3.1 能自動觸發(fā)多輪工具調(diào)用流程,通過用戶提供的搜索工具動態(tài)獲取外部信息,解決傳統(tǒng)模型“知識滯后”痛點。這種“AI 自主決策 + 工具協(xié)同”的模式,讓智能體具備處理開放域問題的能力,為開發(fā)者構(gòu)建更強大的應(yīng)用生態(tài)奠定基礎(chǔ)。

核心價值:30%+ 的編碼效率提升直接轉(zhuǎn)化為開發(fā)者的時間節(jié)省,而多輪工具調(diào)用能力則讓 AI 從“被動響應(yīng)”升級為“主動解決問題”,推動開發(fā)范式向智能化邁進。

開發(fā)者資源:開源與API雙重支持

DeepSeek-V3.1為開發(fā)者提供"即開即用"的資源配置,兼顧開源靈活性與API便捷性。開源方面,在Hugging Face平臺發(fā)布兩個版本:Base版在V3基礎(chǔ)上完成8400億token持續(xù)預(yù)訓(xùn)練并擴展上下文支持,項目地址為https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base;另一版本項目地址為https://huggingface.co/deepseek-ai/DeepSeek-V3.1。

API服務(wù)提供兩種調(diào)用模式適配不同場景:deepseek-chat(非思考模式)側(cè)重快速響應(yīng),deepseek-reasoner(思考模式)擅長復(fù)雜推理,兩者均支持128k上下文長度。

成本優(yōu)化方面,新定價策略將于9月5日正式實施,進一步降低開發(fā)者使用門檻,助力快速接入與應(yīng)用落地。

API模式對比

  • 非思考模式(deepseek-chat):適用于即時問答、信息檢索等輕量場景

  • 思考模式(deepseek-reasoner):適配邏輯推理、代碼生成等復(fù)雜任務(wù)
    共同特性:均支持128k超長上下文

重新定義AI能力邊界的里程碑

DeepSeek-V3.1的發(fā)布標志著AI發(fā)展的關(guān)鍵轉(zhuǎn)折點,其三大突破性進展共同重塑了大模型的能力邊界。在參數(shù)效率上,671B總參數(shù)僅37B激活的創(chuàng)新設(shè)計,重新定義了資源利用的極限;推理模式上,混合推理技術(shù)實現(xiàn)效率與精度的動態(tài)平衡;開源生態(tài)上,通過開源模型與API服務(wù)構(gòu)建協(xié)同發(fā)展體系。這些突破不僅讓AI更高效、更靈活,更推動行業(yè)向智能體時代加速邁進,為未來AI與人類協(xié)作開辟了無限可能。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
牡丹花下死,做鬼也風(fēng)流,75歲的王石,這輩子就栽在田樸珺身上

牡丹花下死,做鬼也風(fēng)流,75歲的王石,這輩子就栽在田樸珺身上

阿訊說天下
2026-01-02 12:12:21
2026年新能源車一統(tǒng)天下,燃油車兩年內(nèi)趨零已成定局

2026年新能源車一統(tǒng)天下,燃油車兩年內(nèi)趨零已成定局

純科學(xué)
2026-01-01 14:44:31
祝賀!中國男足21歲新星正式加盟英超,已簽訂合同,亞洲杯后官宣

祝賀!中國男足21歲新星正式加盟英超,已簽訂合同,亞洲杯后官宣

國足風(fēng)云
2026-01-02 15:49:16
飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時間吃藥才最好

飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時間吃藥才最好

路醫(yī)生健康科普
2025-12-16 12:45:03
中國海警發(fā)海報,要查扣美國軍火?四國已經(jīng)集結(jié),準備對華出手?

中國海警發(fā)海報,要查扣美國軍火?四國已經(jīng)集結(jié),準備對華出手?

薦史
2026-01-01 10:08:49
2026年初將達成的3筆大交易,涉及10隊!特納去勇士 拉文輔佐字母

2026年初將達成的3筆大交易,涉及10隊!特納去勇士 拉文輔佐字母

毒舌NBA
2026-01-03 10:02:54
170cm森碟全家福驚艷亮相!十年網(wǎng)球練出“初戀臉+力量感”

170cm森碟全家福驚艷亮相!十年網(wǎng)球練出“初戀臉+力量感”

ENEN娛樂地圖
2026-01-03 09:42:10
勇士本賽季被雷霆三殺合計狂輸73分!科爾:學(xué)不到任何有用的東西

勇士本賽季被雷霆三殺合計狂輸73分!科爾:學(xué)不到任何有用的東西

Emily說個球
2026-01-03 14:16:21
厲害了!江蘇這10個縣即將代表中國走向世界!快看有你老家嗎?

厲害了!江蘇這10個縣即將代表中國走向世界!快看有你老家嗎?

別人都叫我阿腈
2026-01-03 11:11:08
深圳一男子跨年夜酒后點燃氣球,已被警方刑事拘留

深圳一男子跨年夜酒后點燃氣球,已被警方刑事拘留

南方都市報
2026-01-03 12:28:09
1983年喬冠華去世,新華社只發(fā)了一句話,胡喬木拍案而起:這也太不像話了

1983年喬冠華去世,新華社只發(fā)了一句話,胡喬木拍案而起:這也太不像話了

源溯歷史
2025-12-31 20:03:15
樓上天天占我車位,我裝了地鎖就出國度假,半個月后警察來電

樓上天天占我車位,我裝了地鎖就出國度假,半個月后警察來電

蕭竹輕語
2025-12-31 10:54:43
波音急了!特朗普萬萬沒想不到,沒有適航證,C919也能飛出國門

波音急了!特朗普萬萬沒想不到,沒有適航證,C919也能飛出國門

趣生活
2026-01-02 14:42:27
期待!上海申花搞定1米95黑又硬射手,身價超2千萬,組超豪華鋒線

期待!上海申花搞定1米95黑又硬射手,身價超2千萬,組超豪華鋒線

國足風(fēng)云
2026-01-03 12:09:19
剛當教育局長,去開家長會被老師罵,我沒吭聲,散會后校長臉都白了

剛當教育局長,去開家長會被老師罵,我沒吭聲,散會后校長臉都白了

黃家湖的憂傷
2025-12-29 16:32:56
女網(wǎng)紅稱睡遍男頂流!喊話檀健次曬聊天記錄,細節(jié)全對上!

女網(wǎng)紅稱睡遍男頂流!喊話檀健次曬聊天記錄,細節(jié)全對上!

古希臘掌管月桂的神
2026-01-03 11:03:34
看到這些明星才知道啥叫斷崖式衰老!張子健和陳小春就像換了個人

看到這些明星才知道啥叫斷崖式衰老!張子健和陳小春就像換了個人

陸盼盼
2025-12-26 04:18:30
天然氣比京津還貴!河北農(nóng)村供暖成難題,有氣不敢開,百姓意見大

天然氣比京津還貴!河北農(nóng)村供暖成難題,有氣不敢開,百姓意見大

眼光很亮
2026-01-02 14:37:34
老婆敗光20億、肝功能受損、發(fā)表遺言?64歲張學(xué)友現(xiàn)狀曝光惹人憂

老婆敗光20億、肝功能受損、發(fā)表遺言?64歲張學(xué)友現(xiàn)狀曝光惹人憂

李大嘴說本尊
2026-01-02 13:05:22
在澳大利亞生活了兩年,說幾句可能很多人不愛聽的大實話

在澳大利亞生活了兩年,說幾句可能很多人不愛聽的大實話

叮當當科技
2025-12-31 08:38:25
2026-01-03 14:56:49
前沿科技學(xué)習(xí)分享圈 incentive-icons
前沿科技學(xué)習(xí)分享圈
朝看花開滿樹紅,暮看花落樹還空。若將花比人間事,花與人間事一同。
1576文章數(shù) 368關(guān)注度
往期回顧 全部

科技要聞

比亞迪銷冠!特斯拉2025年交付量跌逾8%

頭條要聞

蔡正元被判刑3年半 柯文哲致電哽咽:都是因為我

頭條要聞

蔡正元被判刑3年半 柯文哲致電哽咽:都是因為我

體育要聞

快船似乎又行了

娛樂要聞

“國服嫂子”司曉迪,曝與多位男星私照

財經(jīng)要聞

人工智能四問:投資泡沫出現(xiàn)了嗎?

汽車要聞

奕派科技全年銷量275,752輛 同比增長28.3

態(tài)度原創(chuàng)

家居
房產(chǎn)
親子
數(shù)碼
軍事航空

家居要聞

無形有行 自然與靈感詩意

房產(chǎn)要聞

海大譽府新年家年華暨2號樓耀世加推發(fā)布會圓滿落幕

親子要聞

小孩哥:“等我拳頭硬起來第一個打你”

數(shù)碼要聞

曝蘋果春季推平價版MacBook:配12.9英寸屏,售價599 - 899美元

軍事要聞

特朗普稱將干涉伊朗騷亂事件 伊朗政府發(fā)聲明強烈譴責(zé)

無障礙瀏覽 進入關(guān)懷版