網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

給 DeepSeek 的最后一封催更信

2026-04-11 10:10:17　來源: 人人都是產(chǎn)品經(jīng)理社區(qū)

廣東舉報(bào)

分享至

當(dāng)"中國(guó)團(tuán)""中國(guó)鏈""中國(guó)環(huán)"三重?cái)⑹陆豢棾尚危?dāng)編程、多模態(tài)、Agent、OpenClaw四波浪潮過去而無DeepSeek身影，當(dāng)Anthropic按$0.08/小時(shí)出租"數(shù)字勞動(dòng)力"重構(gòu)商業(yè)邏輯，開源生態(tài)與Token經(jīng)濟(jì)都在等待DeepSeek V4的第三次助推。人民想念的不僅是更便宜的Token，更是那個(gè)能用萬億參數(shù)基座、原生多模態(tài)、超強(qiáng)Agent能力"搞個(gè)大的"的破局者，來定義中國(guó)AI的下一步。

———— / BEGIN / ————

前段時(shí)間，刷屏，文章提到一點(diǎn)——DeepSeek推動(dòng)了全球大模型的降本，讓用戶和行業(yè)得以享受更便宜的Token。

關(guān)鍵的問題是，“小龍蝦”這類智能體應(yīng)用的瘋狂“燒Token”，再次推高用戶的使用成本，這種情況下，推動(dòng)全行業(yè)降本增效的重任又落到了DeepSeek的肩上。

算算時(shí)間，DeepSeek V3、R1發(fā)布已一年有余，外界原本預(yù)期DeepSeek V4今年春節(jié)會(huì)來炸場(chǎng)，但最終希望落空。不過，從近期宕機(jī)、專家模式上線等一系列動(dòng)態(tài)來看，感覺DeepSeek V4有可能離我們?cè)絹碓浇恕?/p>

所以，這可能也是最后一次“催更”DeepSeek。

在這封催更信里面，我想和那些想念DeepSeek的朋友，聊聊中國(guó)AI的敘事、技術(shù)進(jìn)化的浪潮、生態(tài)競(jìng)爭(zhēng)、Token經(jīng)濟(jì)學(xué)這些話題。

中國(guó)AI敘事已變

2025年春節(jié)，DeepSeek R1以低成本+高性能+開源亮相，發(fā)布即巔峰。不僅在國(guó)產(chǎn)大模型領(lǐng)域一騎絕塵，而且風(fēng)靡世界，互聯(lián)網(wǎng)平臺(tái)、IT巨頭、各行各業(yè)紛紛接入，且擁抱開源，形形色色的DeepSeek一體機(jī)都嘗試著搶戲。

在那段時(shí)間，談及中國(guó)AI，言必稱DeepSeek，毫不夸張的說，街頭的爺爺奶奶都可能在談?wù)?，甚至使用這款國(guó)產(chǎn)AI助手。

只是，過去一年人工智能產(chǎn)業(yè)和中國(guó)的AI敘事，早已不是一重天：圍繞人工智能的“中國(guó)團(tuán)”“中國(guó)鏈”“中國(guó)環(huán)”——三重?cái)⑹陆豢棾尚?。DeepSeek獨(dú)撐的AI中國(guó)敘事，失去了色彩。

所以，在這個(gè)角度看大模型和人工智能，大家缺的不光是算力、電力，缺的也是時(shí)間窗口。

關(guān)于“中國(guó)團(tuán)”，我把它概括為“（3+1）+6+N”，其中“3+1”是四大廠，對(duì)應(yīng)字節(jié)、阿里、騰訊和百度，后面三家是互聯(lián)網(wǎng)時(shí)代的三巨頭，大家熟知的BAT。而數(shù)字“6”對(duì)應(yīng)的是大模型時(shí)代的“六小虎”——Kimi、智譜、MiniMax、階躍星辰、百川、面壁智能，主要幾家在DeepSeek埋頭自研的時(shí)候，完成了上市或者在沖刺上市。

“六小虎”里面原來是有李開復(fù)的零一萬物的，但在第一次百模大戰(zhàn)中，零一萬物開始掉隊(duì)，所以這里我們把面壁智能放了進(jìn)來，但其實(shí)百川過去一年多，聲量也逐漸微弱。

“N”其實(shí)不單只某一家，它對(duì)應(yīng)的是其他垂類模型和專業(yè)市場(chǎng)的AI企業(yè)。

總計(jì)10家/類企業(yè)構(gòu)成了中國(guó)大模型產(chǎn)業(yè)頭部態(tài)勢(shì)，他們已不是散兵游勇，而是一個(gè)具有集群競(jìng)爭(zhēng)力的產(chǎn)業(yè)軍團(tuán)，也是DeepSeek再次封神之路上，必須要逾越的對(duì)手。

與“中國(guó)團(tuán)”同步成長(zhǎng)的也包括“中國(guó)鏈”——從芯片算力、集群/云、數(shù)據(jù)語料、算法/模型、智能體、AI應(yīng)用開發(fā)生態(tài)，已經(jīng)完成了全鏈貫通，成為全球范圍內(nèi)唯二的智能科技全產(chǎn)業(yè)鏈國(guó)家，有希望為全球智能基礎(chǔ)設(shè)施多提供一種選擇，也有希望以能力經(jīng)濟(jì)的能力輸出為全球智能普惠提供新的公共品。

這一點(diǎn)大家不要懷疑，DeepSeek R1當(dāng)年的確打出了中國(guó)模型在海外的品牌，但現(xiàn)在MiniMax這些廠商，在海外的業(yè)務(wù)一樣做得有聲有色。

而關(guān)于“中國(guó)環(huán)”，覆蓋了產(chǎn)業(yè)、應(yīng)用和投資三個(gè)方面——從AI到AI4S再到現(xiàn)代產(chǎn)業(yè)群的產(chǎn)業(yè)閉環(huán)，從AI科技到千行百業(yè)、億萬家庭的市場(chǎng)應(yīng)用閉環(huán)，從早期投資到上市退出的資本閉環(huán)。閉環(huán)初步成形不僅意味著人工智能在中國(guó)跑通，更意味著智能經(jīng)濟(jì)不同層面的大循環(huán)小循環(huán)由此貫通。

從團(tuán)、鏈到環(huán)，中國(guó)的AI敘事已然發(fā)生改變。

不考慮企業(yè)免費(fèi)的營(yíng)銷策略，2026年初以來，六小虎的模型在OpenRouter等國(guó)際平臺(tái)上的Token消耗量占比接連領(lǐng)先，且總體份額過半，主要是海外用戶。

概括來說，2025年中國(guó)的開源力量改變了全球人工智能發(fā)展格局。到了2026年，中國(guó)人工智能發(fā)展進(jìn)入向外能力輸出階段。

從全球大模型和人工智能產(chǎn)業(yè)的視角來看，技術(shù)路徑的多元化，增強(qiáng)了人才流動(dòng)活力，有利于供應(yīng)鏈韌性。對(duì)于下游的應(yīng)用開發(fā)者而言，多家可選供應(yīng)商的存在意味著更強(qiáng)的議價(jià)能力和更低的鎖定風(fēng)險(xiǎn)。

在中國(guó)的AI敘事里面，還有一個(gè)比較好的現(xiàn)象在于，市場(chǎng)還沒有被少數(shù)寡頭壟斷，這對(duì)于競(jìng)爭(zhēng)創(chuàng)新和人才生態(tài)建設(shè)是好事，也有利于在中美AI競(jìng)爭(zhēng)中形成集群優(yōu)勢(shì)。

四波浪潮已經(jīng)過去

中國(guó)古典神話總說“天上一天，人間一年”，DeepSeek“斷更”的這一年，人工智能已經(jīng)過去了四次浪潮——編程、多模態(tài)、智能體、OpenClaw（小龍蝦）。

當(dāng)GitHub Copilot、Cursor、Claude Code等AI編程工具席卷開發(fā)者社區(qū)時(shí)，在Vibe Coding的故事中，人們很難記得起DeepSeek的存在，盡管它也會(huì)被用到編程場(chǎng)景。

編程，這個(gè)人工智能席卷一切行業(yè)的底層驅(qū)動(dòng)、開發(fā)者最剛需的場(chǎng)景，如今在國(guó)外被Anthropic等牢牢占據(jù)，在國(guó)內(nèi)成了Kimi們跑馬圈地的戰(zhàn)場(chǎng)。

而在多模態(tài)這波浪潮中，Gemini 3 Pro等在視覺理解、圖像生成領(lǐng)域均有不俗表現(xiàn)，大家能夠記得的是Nano Banana，而在視頻生成領(lǐng)域，是字節(jié)的Seedance 2.0。

DeepSeek像是一個(gè)慢熱的選手，直到V3.2才開始灰度測(cè)試百萬Token上下文，多模態(tài)能力更是還沒到來。

有人說，在大模型領(lǐng)域，一旦一代產(chǎn)品技術(shù)路線錯(cuò)了，就會(huì)錯(cuò)過一個(gè)時(shí)代？DeepSeek是卡在這里了嗎，也很難說。

第三波浪潮是Agent-多Agent-蜂群智能。相比AI助手的理解和對(duì)話能力，Agent已經(jīng)進(jìn)化到了執(zhí)行層面，從“答題”轉(zhuǎn)向“解題”——過去是“被動(dòng)應(yīng)答”，現(xiàn)在則是“主動(dòng)執(zhí)行”。在這波浪潮中，Manus等產(chǎn)品的涌現(xiàn)，標(biāo)志著AI Agent正在從概念走向落地，Kimi Agent Swarm則將這一波推向高潮。

DeepSeek在這一波浪潮中，更多只是作為模型被調(diào)用，不是Agent生態(tài)的構(gòu)建者，模型本身對(duì)Agent、工具、代碼的支持水準(zhǔn)也比較有限。

時(shí)間來到2026年，以O(shè)penClaw等各類Claw、Claude Code、Claude Cowork等為代表的行動(dòng)智能浪潮開始出現(xiàn)，它們的能力實(shí)際已經(jīng)超越Agent層面，成為接管型應(yīng)用操作系統(tǒng)——應(yīng)用AI OS。

只不過，OpenClaw這類產(chǎn)品也被戲稱為“Token黑洞”，其單任務(wù)的Token消耗量是傳統(tǒng)對(duì)話AI的幾十倍甚至上百倍。這種高投入低產(chǎn)出的模式，在產(chǎn)業(yè)規(guī)?；瘧?yīng)用中面臨可持續(xù)性難題，產(chǎn)品本身的粗糙、不穩(wěn)定和多次破壞性的版本迭代，像極了毛坯房。

所以有人在喊“人民想念DeepSeek”也不奇怪，畢竟幾波浪潮，都沒了它的影子，畢竟人民需要它來推動(dòng)中國(guó)大模型的降本增效。

但必須要說的是，OpenClaw確認(rèn)應(yīng)用AI OS、通用行動(dòng)智能體的邏輯是成立的，而且時(shí)機(jī)到了。它告訴所有人，AI不再只是工具，而可以是全能的接管型代理。

所以3月“全民養(yǎng)蝦”大潮里面，你看大家抄作業(yè)速度多快，為了推廣本土產(chǎn)品，大家都開始送起了“賽博雞蛋”，因?yàn)镺penClaw讓包括Anthropic在內(nèi)的大廠瞬間看明白，原來包打一切的應(yīng)用OS、行動(dòng)智能就近在眼前，腦子都有了，任務(wù)也能執(zhí)行，長(zhǎng)出個(gè)手腳變成通用智能體還不容易！

也是因?yàn)檫@個(gè)原因，Anthropic反應(yīng)、反制都是最快的，也是對(duì)Claw沖擊最大的。Claude Code包抄OpenClaw后路，其它大廠又紛紛快速抄Claude Code和OpenClaw的作業(yè)。這就是眼前正在發(fā)生的事。

之所以兵家必爭(zhēng)，是因?yàn)檫@件事的入口地位、巨大價(jià)值以及未來的生態(tài)支配地位，不亞于模型，不亞于前三波浪潮。

如果說大模型在積蓄力量，多模態(tài)是拓寬場(chǎng)景，Agent代表撒種子，那么對(duì)生態(tài)進(jìn)行大面積收割要靠應(yīng)用AI OS、通用行動(dòng)智能體，現(xiàn)在已經(jīng)多多少少有些終局的意味和終極形態(tài)的影子。到了EI內(nèi)生智能、II自主智能階段，可能要另當(dāng)別論。

不過，就今天OpenClaw的投入產(chǎn)出比來說，能占據(jù)AI OS、通用行動(dòng)智能體生態(tài)位的可能不是它。

所以在這最后一份致DeepSeek的催更信里面，我們也想提一個(gè)問題：沒有第一時(shí)間跳進(jìn)這四條河流的DeepSeek，是不是在選擇蓄力，希望通過V4以及之后的基座模型“搞個(gè)大的”？

只是，市場(chǎng)從不等待，用戶的注意力、開發(fā)者的熱情、資本的流向，都在一波又一波的浪潮中被分流。這四波浪潮所在的領(lǐng)域，競(jìng)爭(zhēng)門檻都已急劇抬高，生態(tài)化成本也大幅度增加。

DeepSeek的故事，只能停留在2025年的春節(jié)嗎？

全生態(tài)競(jìng)爭(zhēng)到來

之前我的看法是，頭部企業(yè)已經(jīng)到了全生態(tài)競(jìng)爭(zhēng)階段。在這個(gè)階段，全棧AI能力是接下來巨頭角力的基礎(chǔ)，最好的例子就是Google。

Google之所以在Gemini 3 Pro那一波受到高度關(guān)注，源于他們?cè)谒膫€(gè)方面累積的“厚度”優(yōu)勢(shì)逐步顯現(xiàn)：模型原理原力持久進(jìn)化度（Evolutionary Index）、數(shù)據(jù)深度（Data Index）、全鏈生態(tài)廣度（Ecological Index）、智能連接度（Connectivity Index）。

谷歌CEO皮查伊在任差不多10年了，在剛剛的訪談中，他回憶了Transformer被ChatGPT搶跑的這段意難平的往事，但是他不認(rèn)為失去先發(fā)優(yōu)勢(shì)就會(huì)輸，他把谷歌的優(yōu)勢(shì)總結(jié)為全棧垂直整合。

所以到了Gemini 3 Pro，基于這種全棧整合，谷歌打了一個(gè)漂亮的翻身仗。

可以大膽的預(yù)判一下，2026年，美國(guó)人工智能產(chǎn)業(yè)頭部的競(jìng)爭(zhēng)，可能的節(jié)奏是Anthropic先拔得頭籌，Google緊接著全線壓上，而搶跑的OpenAI面臨左右包夾的局面，最終四強(qiáng)變?nèi)龔?qiáng)，掉隊(duì)的那一強(qiáng)是被進(jìn)一步拉開差距的Grok。

2026年的GTC，在前期預(yù)熱環(huán)節(jié)，黃仁勛少有的寫了一篇文章，提出了“五層蛋糕理論”：能源 → 芯片 → AI基礎(chǔ)設(shè)施 → 模型 → 應(yīng)用。

但如果要拆得更細(xì)，人工智能的競(jìng)爭(zhēng)也體現(xiàn)在芯片算力、數(shù)據(jù)語料、模型基座、開發(fā)工具與開發(fā)者、智能體與工具技能、應(yīng)用服務(wù)這些環(huán)節(jié)，每一個(gè)環(huán)節(jié)的失位都可能導(dǎo)致整體競(jìng)爭(zhēng)力下降，而競(jìng)爭(zhēng)、投資的門檻，已經(jīng)成為了百億、千億美元級(jí)的重資產(chǎn)游戲。

創(chuàng)新，不再限于“彎道超車”，更在于系統(tǒng)比拼、體系對(duì)抗。尤其是大模型所依賴的資本、算力、算法和數(shù)據(jù)等要素，成為決定性的關(guān)鍵因素，吃一顆大力丸，吃一碗海參，解決不了太多問題。

全生態(tài)競(jìng)爭(zhēng)的格局中的DeepSeek，原理產(chǎn)生原力——底層突破——雖然還有優(yōu)勢(shì)，但短板也同樣明顯：缺乏IT巨頭的產(chǎn)業(yè)生態(tài)鏈支持，產(chǎn)品應(yīng)用功能相對(duì)單薄，多模態(tài)與Agent生態(tài)建設(shè)有待加強(qiáng)。

Token經(jīng)濟(jì)崛起

Token經(jīng)濟(jì)新年起勢(shì)，Token經(jīng)濟(jì)是智能經(jīng)濟(jì)作為能力經(jīng)濟(jì)的價(jià)值閉環(huán)，這是我在央廣網(wǎng)采訪中的觀點(diǎn)。

過去，在工業(yè)時(shí)代，能源單位是千瓦時(shí)，在數(shù)字時(shí)代的流量單位是GB，智能時(shí)代的能力產(chǎn)品的供給單位就是Token，Token讓AI的“能力”成為可計(jì)量、可定價(jià)、可交易的商品。

你可以這樣理解：Token成為了連接技術(shù)與商業(yè)的“結(jié)算單位”，進(jìn)而使得能力經(jīng)濟(jì)的商業(yè)閉環(huán)正在形成。

Token的消耗量，正在以幾何級(jí)增長(zhǎng)速度膨脹——中國(guó)日均Token調(diào)用量從2024年初的1000億躍升至2026年3月的140萬億，兩年增長(zhǎng)超千倍，消耗的越多，就代表著能力經(jīng)濟(jì)的蓬勃發(fā)展。

對(duì)于企業(yè)來說，通過價(jià)格杠桿實(shí)現(xiàn)毛利率提升，這意味著它的盈利模式局部已經(jīng)跑通。

只不過，Token是計(jì)量單位，不是計(jì)質(zhì)單位。產(chǎn)業(yè)界不能只看Token數(shù)量，更要關(guān)注背后的“能力質(zhì)量”。所以，我覺得未來Token經(jīng)濟(jì)的分化會(huì)很明顯——能力水準(zhǔn)高的Token賺錢，能力水準(zhǔn)低的Token虧錢，后者甚至被淘汰。

所以，小米的羅福莉在給MiMo大模型套餐“帶貨”的時(shí)候說：“當(dāng)前全球算力供給已經(jīng)跟不上Agent創(chuàng)造的token需求。真正的出路不是更便宜的token，而是共同進(jìn)化——更省token的Agent框架與更強(qiáng)大、更高效的模型的協(xié)同?！?/p>

今年有一個(gè)很典型性的趨勢(shì)，用戶一邊在喊Token貴，一邊又在給Token付費(fèi)，本質(zhì)上是消耗的一部分Token轉(zhuǎn)化為了生產(chǎn)力，而當(dāng)Token付費(fèi)成為潮流，企業(yè)就可以獲得營(yíng)收才能投入研發(fā)更高水準(zhǔn)模型，這是在為智能經(jīng)濟(jì)造血。

模型、智能體企業(yè)商業(yè)化最直接的兩條路：要么靠付費(fèi)訂閱回血，要么通過API以Token資費(fèi)套餐造血。OpenAI在AI助手的對(duì)話下面關(guān)聯(lián)廣告這種做法，存在著太多的不確定性，行業(yè)里還沒有第二家跟著出牌。

我認(rèn)為，在推理驅(qū)動(dòng)的Token經(jīng)濟(jì)時(shí)代，率先跑通的場(chǎng)景我認(rèn)為有三類：高價(jià)值高密度場(chǎng)景（如金融風(fēng)控、醫(yī)療診斷，客戶愿為“不出錯(cuò)”支付溢價(jià)）；高頻高剛需場(chǎng)景（如智能客服、代碼生成，靠規(guī)模攤薄成本）；以及Agent智能體廣泛應(yīng)用的場(chǎng)景。

未來，Token會(huì)像水像電一樣成為基礎(chǔ)服務(wù)，薄利、普惠、泛在。單位Token成本會(huì)持續(xù)下降，但Token經(jīng)濟(jì)會(huì)分層：常規(guī)能力水準(zhǔn)的Token趨向薄利，以量取勝；高能力水準(zhǔn)、高價(jià)值的Token可能持續(xù)保持溢價(jià)。

更具象地說，能夠構(gòu)建場(chǎng)景+數(shù)據(jù)+平臺(tái)+模型閉環(huán)、提供高價(jià)值智能體服務(wù)的企業(yè)將獲得溢價(jià)。

量化投資出身的DeepSeek雖不差錢，但從可持續(xù)發(fā)展角度來看，也需要擁抱Token經(jīng)濟(jì)。

開源生態(tài)等待第三次轉(zhuǎn)折

過去一年多時(shí)間，開源生態(tài)格局變了。

2025年初，DeepSeek對(duì)開源生態(tài)完成了第一次引爆。今年初，OpenClaw完成了對(duì)開源生態(tài)的第二次神助攻。第一次引爆使得一些閉源模型也向開源靠攏，國(guó)內(nèi)如百度等巨頭加入開源陣營(yíng)，海外如OpenAI、Google等也在加大開源力度。

根據(jù)OpenRouter平臺(tái)對(duì)100萬億Token調(diào)用數(shù)據(jù)的分析，開源模型的市場(chǎng)份額已攀升至33%。中國(guó)開源模型的異軍突起尤為引人注目，OpenRouter平臺(tái)前六位當(dāng)中一度有五家是中國(guó)的開源模型。

開源模型的崛起，是由技術(shù)迭代、用戶需求和經(jīng)濟(jì)因素共同驅(qū)動(dòng)的結(jié)果。企業(yè)選擇開源模型的核心動(dòng)因變得非常現(xiàn)實(shí)：閉源API成本與調(diào)用規(guī)模強(qiáng)相關(guān)，邊際成本不可控；自托管開源模型在高并發(fā)、長(zhǎng)上下文、Agent場(chǎng)景中，單位成本顯著下降。

用直白的話說，只要能力在線，開源模型在私有化部署場(chǎng)景下，用得越多，就越便宜。作為開源模型生態(tài)的攪局者，DeepSeek在2026年，大概率還會(huì)對(duì)開源業(yè)態(tài)再次助推一波。

這種預(yù)想中的推動(dòng)涵蓋了算力成本的產(chǎn)業(yè)沖擊效應(yīng)、用戶市場(chǎng)的引爆效應(yīng)、開源生態(tài)的激發(fā)效應(yīng)，以及對(duì)于市場(chǎng)信心的提振效應(yīng)等，可能會(huì)再次出現(xiàn)。

這是人民想念DeepSeek的底層邏輯，價(jià)格只是一個(gè)表象。

開源雖好，但建設(shè)仍然任重道遠(yuǎn)。

對(duì)DeepSeek來說，它還需要盡快形成開發(fā)者生態(tài)，支持Agent開發(fā)生態(tài)，建立Apps以及類似Skills的技能封裝與分發(fā)渠道，以提升開放性、靈活性，同時(shí)吸引更多開發(fā)者參與其中。

期待DeepSeek再次成為開源生態(tài)的關(guān)鍵一推。

對(duì)V4的期待不是過去的標(biāo)準(zhǔn)

大洋彼岸的懸念是，OpenAI和Anthropic的下一代模型能打到什么程度，Super App能不能像正在生態(tài)化的Claude Code一樣成為應(yīng)用OS和通用行動(dòng)智能體，以及Coding這把生態(tài)底層尖刀誰最快，這三件事會(huì)影響今年的大風(fēng)向。

從現(xiàn)在的局勢(shì)來看，Anthropic的火已經(jīng)快燒到OpenAI的大本營(yíng)了，這一點(diǎn)可以翻閱華爾街日?qǐng)?bào)披露的兩家財(cái)務(wù)數(shù)據(jù)，Anthropic有可能搶在OpenAI之前扭虧為盈。

在這種背景下，我們期待DeepSeek的什么呢？

把前文的這些觀點(diǎn)總結(jié)一下，它應(yīng)該包括V4、R2實(shí)現(xiàn)代際跨越、100萬Token的上下文窗口（剛剛開始灰度測(cè)試）、原生多模態(tài)能力、萬億參數(shù)級(jí)別的基礎(chǔ)模型應(yīng)該是最基本的起點(diǎn)。

可是，這些都是過去的標(biāo)準(zhǔn)，不應(yīng)該是V4、R2的能力上限。站在今天這個(gè)時(shí)間段，DeepSeek需要的是在多Agent能力、工具使用、電腦操作以及背后超強(qiáng)的代碼能力上實(shí)現(xiàn)突破。

大家也不用過度焦慮，AI Agent雖大熱，但目前仍處于已有能力整合的階段，離真正意義上的自主智能體尚有距離。

未來，AI Agent可能會(huì)出現(xiàn)四種路徑：云端虛擬機(jī)整合、本地與云協(xié)同的端側(cè)混合模式、通過協(xié)議實(shí)現(xiàn)智能互聯(lián)，或以“超級(jí)OS”形式重構(gòu)所有高頻應(yīng)用入口。不管哪一種路徑，它最終都將成為個(gè)人智能服務(wù)的樞紐，成為未來競(jìng)爭(zhēng)的戰(zhàn)略制高點(diǎn)。

舊的標(biāo)準(zhǔn)已不匹配DeepSeek V4，所以在這封催更信里面，我對(duì)它的期待不僅是一個(gè)更強(qiáng)大的語言模型，更是一個(gè)能夠自主執(zhí)行復(fù)雜任務(wù)、整合多種工具、與外部環(huán)境高效交互的智能體基座。

就像前面說的，期待它“搞個(gè)大的”，而DeepSeek實(shí)際進(jìn)行的模型原理探索與產(chǎn)品技術(shù)進(jìn)展，似乎也在印證這個(gè)“大”節(jié)奏。

去年10月以來，DeepSeek在大模型領(lǐng)域的論文發(fā)布與產(chǎn)品局部更新動(dòng)作持續(xù)加速，形成了密集的創(chuàng)新節(jié)奏。

從2025年12月發(fā)布DeepSeek-V3.2，到2026年1月集中放出mHC、Engram、DualPath等三項(xiàng)核心架構(gòu)論文并大幅更新和擴(kuò)展之前發(fā)布的R1技術(shù)報(bào)告，整體研發(fā)呈現(xiàn)出覆蓋架構(gòu)創(chuàng)新、推理效率、多模態(tài)、智能體能力的立體化推進(jìn)態(tài)勢(shì)。這一系列工作被普遍視為下一代旗艦?zāi)Ｐ虳eepSeek-V4的技術(shù)前奏。

DeepSeek并未正式確認(rèn)這些創(chuàng)新將如何融入V4最終架構(gòu)，但論文的作者署名（包括創(chuàng)始人梁文鋒）、代碼泄露以及平臺(tái)可見的變化均指向這一方向。

2025年10月的DeepSeek-OCR系列探索了將文本信息通過視覺表征進(jìn)行壓縮的可能性，顛覆了“文本token比視覺token更高效”的傳統(tǒng)假設(shè)。OCR 2的視覺因果流機(jī)制進(jìn)一步讓模型能夠像人一樣依據(jù)版面邏輯“看懂”文檔，而非機(jī)械掃描。這為多模態(tài)模型理解和處理極其冗長(zhǎng)的文檔（如整本書、整份財(cái)報(bào)）提供了全新的思路，有望將大模型的上下文窗口擴(kuò)展至數(shù)千萬token量級(jí)，而無需承受平方級(jí)的計(jì)算復(fù)雜度增長(zhǎng)。

mHC技術(shù)針對(duì)的是萬億參數(shù)級(jí)模型訓(xùn)練中的根本性難題：信號(hào)爆炸，突破“深層網(wǎng)絡(luò)穩(wěn)定性”這一規(guī)?；l(fā)展的瓶頸，為萬億參數(shù)級(jí)開源模型的訓(xùn)練鋪平道路。也有助于在不依賴先進(jìn)制程芯片的情況下，通過架構(gòu)創(chuàng)新實(shí)現(xiàn)模型深度擴(kuò)展。

Engram面向長(zhǎng)上下文與持續(xù)學(xué)習(xí)的工程化解決，其條件記憶機(jī)制理論上支持跨會(huì)話的持久化記憶，突破當(dāng)前大模型“無狀態(tài)”推理的限制，推理效率不再被知識(shí)密度所拖累。它挑戰(zhàn)了傳統(tǒng)Transformer“以計(jì)算換記憶”的設(shè)計(jì)范式。該方法將靜態(tài)知識(shí)存儲(chǔ)在外部稀疏表中，使模型前饋網(wǎng)絡(luò)專注于動(dòng)態(tài)推理。這種“神經(jīng)-符號(hào)”混合架構(gòu)使模型在保持百萬token級(jí)上下文的同時(shí)，有希望顯著降低推理成本。

2025年12月的V3.2版本已經(jīng)初步展現(xiàn)出“跨工具記憶保持”能力，解決了傳統(tǒng)AI Agent在多工具調(diào)用時(shí)丟失推理鏈的問題，并且通過稀疏注意力機(jī)制使128K長(zhǎng)上下文推理成本降低數(shù)倍，內(nèi)存占用減少70%。

另外，DeepSeek聯(lián)合北大、清華發(fā)布新論文推出的智能體推理框架DualPath，針對(duì)智能體大模型推理的存儲(chǔ)帶寬瓶頸，創(chuàng)新雙路徑KV-Cache加載機(jī)制，讓數(shù)據(jù)讀取與GPU計(jì)算并行，徹底解決傳統(tǒng)架構(gòu)算力空轉(zhuǎn)問題。實(shí)測(cè)離線推理吞吐量最高提升1.87倍，在線Agent運(yùn)行效率提升1.96倍，用純軟件優(yōu)化實(shí)現(xiàn)性能翻倍，堪稱AI基礎(chǔ)設(shè)施的顛覆性突破，提高成本效率的風(fēng)格非常DeepSeek。

種種跡象表明，即將發(fā)布的新一代旗艦?zāi)Ｐ虳eepSeek-V4大概率將整合文本、圖像、視頻生成能力，并采用原生多模態(tài)預(yù)訓(xùn)練而非后期拼接，模型參數(shù)在萬億以上，并且具有較強(qiáng)的記憶、工具、代碼、學(xué)習(xí)能力和對(duì)智能體的良好支持。

國(guó)產(chǎn)模型與國(guó)產(chǎn)算力的雙劍合璧

模型之外，對(duì)DeepSeek V4的另一個(gè)期待，是希望與國(guó)產(chǎn)算力經(jīng)過磨合探索之后雙劍合璧。

現(xiàn)在已經(jīng)有不少報(bào)道在討論，DeepSeek在發(fā)布V4之前，未向英偉達(dá)、AMD等美系芯片商提供預(yù)覽，而是選擇提前數(shù)周向包括華為在內(nèi)的中國(guó)芯片供應(yīng)商開放訪問權(quán)限，以確保模型在國(guó)產(chǎn)算力平臺(tái)上完成深度適配與優(yōu)化。

這也是外界認(rèn)為DeepSeek V4晚點(diǎn)的一個(gè)關(guān)鍵原因。

適配國(guó)產(chǎn)算力，這條路對(duì)國(guó)產(chǎn)模型來說非常艱難，但從更長(zhǎng)遠(yuǎn)的時(shí)間來看又不得不做。一件不得不做的事情，總要有起點(diǎn)，或許DeepSeek V4就是那個(gè)起點(diǎn)。

當(dāng)模型伸出橄欖枝，壓力就給到了國(guó)產(chǎn)算力，它要求效能到產(chǎn)能再到有效供給，都要能夠進(jìn)一步跟上，與模型、智能體發(fā)展形成生態(tài)協(xié)同。

如果DeepSeek V4和R2被實(shí)證從訓(xùn)練到推理能夠在國(guó)產(chǎn)芯片上跑出世界一流的水平，并且成本更低，就有希望大幅度擺脫對(duì)海外算力的依賴，打破黃仁勛借SemiAnalysis給自己貼的那張“Token之王”的標(biāo)簽。

如果大家還有印象，DeepSeek R1問世那一夜，英偉達(dá)暴跌近17%，單日最大市值蒸發(fā)紀(jì)錄5890億美元。

英偉達(dá)暴跌對(duì)科技股投資者來說不是一件好事，但如果是DeepSeek推動(dòng)的，那么我們喜聞樂見這樣的情況再次發(fā)生。

糖水智能與原力智能分層

在這封信的尾聲，如果還要提一個(gè)期待——DeepSeek能夠在另一個(gè)Scaling Law上做出突破。

這種突破不是傳統(tǒng)意義上的“模型越大能力越強(qiáng)”，而是小體量模型不斷Scaling大體量模型的能力。

基于“原理-算法-訓(xùn)練-思考與推理能力的進(jìn)化”以及“智能的壓縮-蒸餾-內(nèi)化”這兩個(gè)技術(shù)路線，每個(gè)階段的小體量模型不斷達(dá)到上一個(gè)階段大體量模型的能力水準(zhǔn)，乃至于不斷接近和達(dá)到日常高可用水平，然后在此基礎(chǔ)上能力-應(yīng)用-場(chǎng)景-價(jià)值逐步分層。

小模型、常規(guī)智能服務(wù)于簡(jiǎn)單基礎(chǔ)日常，以量見長(zhǎng)，開放、端側(cè)、邊緣部署和成本效率更優(yōu)——這是“糖水智能”，是Token經(jīng)濟(jì)里的喝湯部分。

大模型、超級(jí)智能服務(wù)于企業(yè)行業(yè)商業(yè)-生產(chǎn)力-專業(yè)科技-重型任務(wù)，高水準(zhǔn)產(chǎn)生高溢價(jià)——這是“原力智能”，是Token經(jīng)濟(jì)里的吃肉部分。

關(guān)于小模型的能力進(jìn)化，Google Gemma 4是一個(gè)不錯(cuò)的參照系，它包含了2B、4B、26B和31B四個(gè)版本，覆蓋手機(jī)到工作站全場(chǎng)景。其中31B Dense模型在Arena AI開源排行榜排名第三，26B A4B MoE模型排名第六。四款模型均支持圖像和視頻輸入，支持140多種語言，內(nèi)置可開關(guān)的思考模式。這不是簡(jiǎn)單的參數(shù)壓縮，而是智能的蒸餾與內(nèi)化——通過更高效的知識(shí)遷移、更精密的量化剪枝、更先進(jìn)的蒸餾技術(shù)，讓小模型擁有大智慧。

期待DeepSeek能在30B-70B-120B這三檔高質(zhì)量模型，蓋過Gemma-4，企業(yè)級(jí)部署能夠以萬億參數(shù)的開源模型超越“六小虎”曾經(jīng)達(dá)到的水平，開創(chuàng)新的格局。

而在端側(cè)，也期待DeepSeek在1B-8B這一檔的輕量化模型上實(shí)現(xiàn)同樣的突破。當(dāng)端側(cè)模型能夠在消費(fèi)級(jí)顯卡甚至手機(jī)上流暢運(yùn)行，當(dāng)個(gè)人手機(jī)、電腦里的端側(cè)模型數(shù)以億計(jì)，當(dāng)每一個(gè)普通用戶都能擁有較強(qiáng)的AI能力，便是智能平權(quán)、智能經(jīng)濟(jì)的普惠形態(tài)。

2026年是新一代前沿模型和接管型智能體的“跳變式發(fā)展”之年，每家AI企業(yè)都將打出自己的王牌，引發(fā)新一輪的產(chǎn)業(yè)洗牌。

“中國(guó)團(tuán)”需要DeepSeek的回歸，開源生態(tài)需要DeepSeek的推動(dòng)，Token經(jīng)濟(jì)需要DeepSeek的深度原力智能，國(guó)產(chǎn)算力需要DeepSeek的驗(yàn)證。

現(xiàn)在，中美模型能力在日常問答的常規(guī)智能部分幾乎已經(jīng)沒有差距，但在長(zhǎng)程復(fù)雜任務(wù)的深度智能方面還有差距。這種差距，使得大家對(duì)DeepSeek心生期待。

這是最后一次催更，也是最后的召喚。V4與R2身上，肩負(fù)的期待不僅是模型的迭代，更是一個(gè)年代的發(fā)展進(jìn)階。從模型之戰(zhàn)到全生態(tài)之戰(zhàn)，從單點(diǎn)突破到全棧AI競(jìng)爭(zhēng)，從跟隨模仿到自主創(chuàng)新——DeepSeek的下一步，是不是能夠定義中國(guó)人工智能的下一步？

希望DeepSeek這一年多的“沉寂”，是為了更好的爆發(fā)。

本文來自公眾號(hào)：騰訊科技作者：胡延平編輯：蘇楊

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.