国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

給 DeepSeek 的最后一封催更信

0
分享至

當(dāng)"中國(guó)團(tuán)""中國(guó)鏈""中國(guó)環(huán)"三重?cái)⑹陆豢棾尚危?dāng)編程、多模態(tài)、Agent、OpenClaw四波浪潮過去而無DeepSeek身影,當(dāng)Anthropic按$0.08/小時(shí)出租"數(shù)字勞動(dòng)力"重構(gòu)商業(yè)邏輯,開源生態(tài)與Token經(jīng)濟(jì)都在等待DeepSeek V4的第三次助推。人民想念的不僅是更便宜的Token,更是那個(gè)能用萬億參數(shù)基座、原生多模態(tài)、超強(qiáng)Agent能力"搞個(gè)大的"的破局者,來定義中國(guó)AI的下一步。

———— / BEGIN / ————

前段時(shí)間,刷屏,文章提到一點(diǎn)——DeepSeek推動(dòng)了全球大模型的降本,讓用戶和行業(yè)得以享受更便宜的Token。

關(guān)鍵的問題是,“小龍蝦”這類智能體應(yīng)用的瘋狂“燒Token”,再次推高用戶的使用成本,這種情況下,推動(dòng)全行業(yè)降本增效的重任又落到了DeepSeek的肩上。

算算時(shí)間,DeepSeek V3、R1發(fā)布已一年有余,外界原本預(yù)期DeepSeek V4今年春節(jié)會(huì)來炸場(chǎng),但最終希望落空。不過,從近期宕機(jī)、專家模式上線等一系列動(dòng)態(tài)來看,感覺DeepSeek V4有可能離我們?cè)絹碓浇恕?/p>

所以,這可能也是最后一次“催更”DeepSeek。

在這封催更信里面,我想和那些想念DeepSeek的朋友,聊聊中國(guó)AI的敘事、技術(shù)進(jìn)化的浪潮、生態(tài)競(jìng)爭(zhēng)、Token經(jīng)濟(jì)學(xué)這些話題。

中國(guó)AI敘事已變

2025年春節(jié),DeepSeek R1以低成本+高性能+開源亮相,發(fā)布即巔峰。不僅在國(guó)產(chǎn)大模型領(lǐng)域一騎絕塵,而且風(fēng)靡世界,互聯(lián)網(wǎng)平臺(tái)、IT巨頭、各行各業(yè)紛紛接入,且擁抱開源,形形色色的DeepSeek一體機(jī)都嘗試著搶戲。

在那段時(shí)間,談及中國(guó)AI,言必稱DeepSeek,毫不夸張的說,街頭的爺爺奶奶都可能在談?wù)?,甚至使用這款國(guó)產(chǎn)AI助手。

只是,過去一年人工智能產(chǎn)業(yè)和中國(guó)的AI敘事,早已不是一重天:圍繞人工智能的“中國(guó)團(tuán)”“中國(guó)鏈”“中國(guó)環(huán)”——三重?cái)⑹陆豢棾尚?。DeepSeek獨(dú)撐的AI中國(guó)敘事,失去了色彩。

所以,在這個(gè)角度看大模型和人工智能,大家缺的不光是算力、電力,缺的也是時(shí)間窗口。

關(guān)于“中國(guó)團(tuán)”,我把它概括為“(3+1)+6+N”,其中“3+1”是四大廠,對(duì)應(yīng)字節(jié)、阿里、騰訊和百度,后面三家是互聯(lián)網(wǎng)時(shí)代的三巨頭,大家熟知的BAT。而數(shù)字“6”對(duì)應(yīng)的是大模型時(shí)代的“六小虎”——Kimi、智譜、MiniMax、階躍星辰、百川、面壁智能,主要幾家在DeepSeek埋頭自研的時(shí)候,完成了上市或者在沖刺上市。

“六小虎”里面原來是有李開復(fù)的零一萬物的,但在第一次百模大戰(zhàn)中,零一萬物開始掉隊(duì),所以這里我們把面壁智能放了進(jìn)來,但其實(shí)百川過去一年多,聲量也逐漸微弱。

“N”其實(shí)不單只某一家,它對(duì)應(yīng)的是其他垂類模型和專業(yè)市場(chǎng)的AI企業(yè)。

總計(jì)10家/類企業(yè)構(gòu)成了中國(guó)大模型產(chǎn)業(yè)頭部態(tài)勢(shì),他們已不是散兵游勇,而是一個(gè)具有集群競(jìng)爭(zhēng)力的產(chǎn)業(yè)軍團(tuán),也是DeepSeek再次封神之路上,必須要逾越的對(duì)手。

與“中國(guó)團(tuán)”同步成長(zhǎng)的也包括“中國(guó)鏈”——從芯片算力、集群/云、數(shù)據(jù)語料、算法/模型、智能體、AI應(yīng)用開發(fā)生態(tài),已經(jīng)完成了全鏈貫通,成為全球范圍內(nèi)唯二的智能科技全產(chǎn)業(yè)鏈國(guó)家,有希望為全球智能基礎(chǔ)設(shè)施多提供一種選擇,也有希望以能力經(jīng)濟(jì)的能力輸出為全球智能普惠提供新的公共品。

這一點(diǎn)大家不要懷疑,DeepSeek R1當(dāng)年的確打出了中國(guó)模型在海外的品牌,但現(xiàn)在MiniMax這些廠商,在海外的業(yè)務(wù)一樣做得有聲有色。

而關(guān)于“中國(guó)環(huán)”,覆蓋了產(chǎn)業(yè)、應(yīng)用和投資三個(gè)方面——從AI到AI4S再到現(xiàn)代產(chǎn)業(yè)群的產(chǎn)業(yè)閉環(huán),從AI科技到千行百業(yè)、億萬家庭的市場(chǎng)應(yīng)用閉環(huán),從早期投資到上市退出的資本閉環(huán)。閉環(huán)初步成形不僅意味著人工智能在中國(guó)跑通,更意味著智能經(jīng)濟(jì)不同層面的大循環(huán)小循環(huán)由此貫通。

從團(tuán)、鏈到環(huán),中國(guó)的AI敘事已然發(fā)生改變。

不考慮企業(yè)免費(fèi)的營(yíng)銷策略,2026年初以來,六小虎的模型在OpenRouter等國(guó)際平臺(tái)上的Token消耗量占比接連領(lǐng)先,且總體份額過半,主要是海外用戶。

概括來說,2025年中國(guó)的開源力量改變了全球人工智能發(fā)展格局。到了2026年,中國(guó)人工智能發(fā)展進(jìn)入向外能力輸出階段。

從全球大模型和人工智能產(chǎn)業(yè)的視角來看,技術(shù)路徑的多元化,增強(qiáng)了人才流動(dòng)活力,有利于供應(yīng)鏈韌性。對(duì)于下游的應(yīng)用開發(fā)者而言,多家可選供應(yīng)商的存在意味著更強(qiáng)的議價(jià)能力和更低的鎖定風(fēng)險(xiǎn)。

在中國(guó)的AI敘事里面,還有一個(gè)比較好的現(xiàn)象在于,市場(chǎng)還沒有被少數(shù)寡頭壟斷,這對(duì)于競(jìng)爭(zhēng)創(chuàng)新和人才生態(tài)建設(shè)是好事,也有利于在中美AI競(jìng)爭(zhēng)中形成集群優(yōu)勢(shì)。

四波浪潮已經(jīng)過去

中國(guó)古典神話總說“天上一天,人間一年”,DeepSeek“斷更”的這一年,人工智能已經(jīng)過去了四次浪潮——編程、多模態(tài)、智能體、OpenClaw(小龍蝦)。

當(dāng)GitHub Copilot、Cursor、Claude Code等AI編程工具席卷開發(fā)者社區(qū)時(shí),在Vibe Coding的故事中,人們很難記得起DeepSeek的存在,盡管它也會(huì)被用到編程場(chǎng)景。

編程,這個(gè)人工智能席卷一切行業(yè)的底層驅(qū)動(dòng)、開發(fā)者最剛需的場(chǎng)景,如今在國(guó)外被Anthropic等牢牢占據(jù),在國(guó)內(nèi)成了Kimi們跑馬圈地的戰(zhàn)場(chǎng)。

而在多模態(tài)這波浪潮中,Gemini 3 Pro等在視覺理解、圖像生成領(lǐng)域均有不俗表現(xiàn),大家能夠記得的是Nano Banana,而在視頻生成領(lǐng)域,是字節(jié)的Seedance 2.0。

DeepSeek像是一個(gè)慢熱的選手,直到V3.2才開始灰度測(cè)試百萬Token上下文,多模態(tài)能力更是還沒到來。

有人說,在大模型領(lǐng)域,一旦一代產(chǎn)品技術(shù)路線錯(cuò)了,就會(huì)錯(cuò)過一個(gè)時(shí)代?DeepSeek是卡在這里了嗎,也很難說。

第三波浪潮是Agent-多Agent-蜂群智能。相比AI助手的理解和對(duì)話能力,Agent已經(jīng)進(jìn)化到了執(zhí)行層面,從“答題”轉(zhuǎn)向“解題”——過去是“被動(dòng)應(yīng)答”,現(xiàn)在則是“主動(dòng)執(zhí)行”。在這波浪潮中,Manus等產(chǎn)品的涌現(xiàn),標(biāo)志著AI Agent正在從概念走向落地,Kimi Agent Swarm則將這一波推向高潮。

DeepSeek在這一波浪潮中,更多只是作為模型被調(diào)用,不是Agent生態(tài)的構(gòu)建者,模型本身對(duì)Agent、工具、代碼的支持水準(zhǔn)也比較有限。

時(shí)間來到2026年,以O(shè)penClaw等各類Claw、Claude Code、Claude Cowork等為代表的行動(dòng)智能浪潮開始出現(xiàn),它們的能力實(shí)際已經(jīng)超越Agent層面,成為接管型應(yīng)用操作系統(tǒng)——應(yīng)用AI OS。

只不過,OpenClaw這類產(chǎn)品也被戲稱為“Token黑洞”,其單任務(wù)的Token消耗量是傳統(tǒng)對(duì)話AI的幾十倍甚至上百倍。這種高投入低產(chǎn)出的模式,在產(chǎn)業(yè)規(guī)?;瘧?yīng)用中面臨可持續(xù)性難題,產(chǎn)品本身的粗糙、不穩(wěn)定和多次破壞性的版本迭代,像極了毛坯房。

所以有人在喊“人民想念DeepSeek”也不奇怪,畢竟幾波浪潮,都沒了它的影子,畢竟人民需要它來推動(dòng)中國(guó)大模型的降本增效。

但必須要說的是,OpenClaw確認(rèn)應(yīng)用AI OS、通用行動(dòng)智能體的邏輯是成立的,而且時(shí)機(jī)到了。它告訴所有人,AI不再只是工具,而可以是全能的接管型代理。

所以3月“全民養(yǎng)蝦”大潮里面,你看大家抄作業(yè)速度多快,為了推廣本土產(chǎn)品,大家都開始送起了“賽博雞蛋”,因?yàn)镺penClaw讓包括Anthropic在內(nèi)的大廠瞬間看明白,原來包打一切的應(yīng)用OS、行動(dòng)智能就近在眼前,腦子都有了,任務(wù)也能執(zhí)行,長(zhǎng)出個(gè)手腳變成通用智能體還不容易!

也是因?yàn)檫@個(gè)原因,Anthropic反應(yīng)、反制都是最快的,也是對(duì)Claw沖擊最大的。Claude Code包抄OpenClaw后路,其它大廠又紛紛快速抄Claude Code和OpenClaw的作業(yè)。這就是眼前正在發(fā)生的事。

之所以兵家必爭(zhēng),是因?yàn)檫@件事的入口地位、巨大價(jià)值以及未來的生態(tài)支配地位,不亞于模型,不亞于前三波浪潮。

如果說大模型在積蓄力量,多模態(tài)是拓寬場(chǎng)景,Agent代表撒種子,那么對(duì)生態(tài)進(jìn)行大面積收割要靠應(yīng)用AI OS、通用行動(dòng)智能體,現(xiàn)在已經(jīng)多多少少有些終局的意味和終極形態(tài)的影子。到了EI內(nèi)生智能、II自主智能階段,可能要另當(dāng)別論。

不過,就今天OpenClaw的投入產(chǎn)出比來說,能占據(jù)AI OS、通用行動(dòng)智能體生態(tài)位的可能不是它。

所以在這最后一份致DeepSeek的催更信里面,我們也想提一個(gè)問題:沒有第一時(shí)間跳進(jìn)這四條河流的DeepSeek,是不是在選擇蓄力,希望通過V4以及之后的基座模型“搞個(gè)大的”?

只是,市場(chǎng)從不等待,用戶的注意力、開發(fā)者的熱情、資本的流向,都在一波又一波的浪潮中被分流。這四波浪潮所在的領(lǐng)域,競(jìng)爭(zhēng)門檻都已急劇抬高,生態(tài)化成本也大幅度增加。

DeepSeek的故事,只能停留在2025年的春節(jié)嗎?

全生態(tài)競(jìng)爭(zhēng)到來

之前我的看法是,頭部企業(yè)已經(jīng)到了全生態(tài)競(jìng)爭(zhēng)階段。在這個(gè)階段,全棧AI能力是接下來巨頭角力的基礎(chǔ),最好的例子就是Google。

Google之所以在Gemini 3 Pro那一波受到高度關(guān)注,源于他們?cè)谒膫€(gè)方面累積的“厚度”優(yōu)勢(shì)逐步顯現(xiàn):模型原理原力持久進(jìn)化度(Evolutionary Index)、數(shù)據(jù)深度(Data Index)、全鏈生態(tài)廣度(Ecological Index)、智能連接度(Connectivity Index)。

谷歌CEO皮查伊在任差不多10年了,在剛剛的訪談中,他回憶了Transformer被ChatGPT搶跑的這段意難平的往事,但是他不認(rèn)為失去先發(fā)優(yōu)勢(shì)就會(huì)輸,他把谷歌的優(yōu)勢(shì)總結(jié)為全棧垂直整合。

所以到了Gemini 3 Pro,基于這種全棧整合,谷歌打了一個(gè)漂亮的翻身仗。

可以大膽的預(yù)判一下,2026年,美國(guó)人工智能產(chǎn)業(yè)頭部的競(jìng)爭(zhēng),可能的節(jié)奏是Anthropic先拔得頭籌,Google緊接著全線壓上,而搶跑的OpenAI面臨左右包夾的局面,最終四強(qiáng)變?nèi)龔?qiáng),掉隊(duì)的那一強(qiáng)是被進(jìn)一步拉開差距的Grok。

2026年的GTC,在前期預(yù)熱環(huán)節(jié),黃仁勛少有的寫了一篇文章,提出了“五層蛋糕理論”:能源 → 芯片 → AI基礎(chǔ)設(shè)施 → 模型 → 應(yīng)用。

但如果要拆得更細(xì),人工智能的競(jìng)爭(zhēng)也體現(xiàn)在芯片算力、數(shù)據(jù)語料、模型基座、開發(fā)工具與開發(fā)者、智能體與工具技能、應(yīng)用服務(wù)這些環(huán)節(jié),每一個(gè)環(huán)節(jié)的失位都可能導(dǎo)致整體競(jìng)爭(zhēng)力下降,而競(jìng)爭(zhēng)、投資的門檻,已經(jīng)成為了百億、千億美元級(jí)的重資產(chǎn)游戲。

創(chuàng)新,不再限于“彎道超車”,更在于系統(tǒng)比拼、體系對(duì)抗。尤其是大模型所依賴的資本、算力、算法和數(shù)據(jù)等要素,成為決定性的關(guān)鍵因素,吃一顆大力丸,吃一碗海參,解決不了太多問題。

全生態(tài)競(jìng)爭(zhēng)的格局中的DeepSeek,原理產(chǎn)生原力——底層突破——雖然還有優(yōu)勢(shì),但短板也同樣明顯:缺乏IT巨頭的產(chǎn)業(yè)生態(tài)鏈支持,產(chǎn)品應(yīng)用功能相對(duì)單薄,多模態(tài)與Agent生態(tài)建設(shè)有待加強(qiáng)。

Token經(jīng)濟(jì)崛起

Token經(jīng)濟(jì)新年起勢(shì),Token經(jīng)濟(jì)是智能經(jīng)濟(jì)作為能力經(jīng)濟(jì)的價(jià)值閉環(huán),這是我在央廣網(wǎng)采訪中的觀點(diǎn)。

過去,在工業(yè)時(shí)代,能源單位是千瓦時(shí),在數(shù)字時(shí)代的流量單位是GB,智能時(shí)代的能力產(chǎn)品的供給單位就是Token,Token讓AI的“能力”成為可計(jì)量、可定價(jià)、可交易的商品。

你可以這樣理解:Token成為了連接技術(shù)與商業(yè)的“結(jié)算單位”,進(jìn)而使得能力經(jīng)濟(jì)的商業(yè)閉環(huán)正在形成。

Token的消耗量,正在以幾何級(jí)增長(zhǎng)速度膨脹——中國(guó)日均Token調(diào)用量從2024年初的1000億躍升至2026年3月的140萬億,兩年增長(zhǎng)超千倍,消耗的越多,就代表著能力經(jīng)濟(jì)的蓬勃發(fā)展。

對(duì)于企業(yè)來說,通過價(jià)格杠桿實(shí)現(xiàn)毛利率提升,這意味著它的盈利模式局部已經(jīng)跑通。

只不過,Token是計(jì)量單位,不是計(jì)質(zhì)單位。產(chǎn)業(yè)界不能只看Token數(shù)量,更要關(guān)注背后的“能力質(zhì)量”。所以,我覺得未來Token經(jīng)濟(jì)的分化會(huì)很明顯——能力水準(zhǔn)高的Token賺錢,能力水準(zhǔn)低的Token虧錢,后者甚至被淘汰。

所以,小米的羅福莉在給MiMo大模型套餐“帶貨”的時(shí)候說:“當(dāng)前全球算力供給已經(jīng)跟不上Agent創(chuàng)造的token需求。真正的出路不是更便宜的token,而是共同進(jìn)化——更省token的Agent框架與更強(qiáng)大、更高效的模型的協(xié)同?!?/p>

今年有一個(gè)很典型性的趨勢(shì),用戶一邊在喊Token貴,一邊又在給Token付費(fèi),本質(zhì)上是消耗的一部分Token轉(zhuǎn)化為了生產(chǎn)力,而當(dāng)Token付費(fèi)成為潮流,企業(yè)就可以獲得營(yíng)收才能投入研發(fā)更高水準(zhǔn)模型,這是在為智能經(jīng)濟(jì)造血。

模型、智能體企業(yè)商業(yè)化最直接的兩條路:要么靠付費(fèi)訂閱回血,要么通過API以Token資費(fèi)套餐造血。OpenAI在AI助手的對(duì)話下面關(guān)聯(lián)廣告這種做法,存在著太多的不確定性,行業(yè)里還沒有第二家跟著出牌。

我認(rèn)為,在推理驅(qū)動(dòng)的Token經(jīng)濟(jì)時(shí)代,率先跑通的場(chǎng)景我認(rèn)為有三類:高價(jià)值高密度場(chǎng)景(如金融風(fēng)控、醫(yī)療診斷,客戶愿為“不出錯(cuò)”支付溢價(jià));高頻高剛需場(chǎng)景(如智能客服、代碼生成,靠規(guī)模攤薄成本);以及Agent智能體廣泛應(yīng)用的場(chǎng)景。

未來,Token會(huì)像水像電一樣成為基礎(chǔ)服務(wù),薄利、普惠、泛在。單位Token成本會(huì)持續(xù)下降,但Token經(jīng)濟(jì)會(huì)分層:常規(guī)能力水準(zhǔn)的Token趨向薄利,以量取勝;高能力水準(zhǔn)、高價(jià)值的Token可能持續(xù)保持溢價(jià)。

更具象地說,能夠構(gòu)建場(chǎng)景+數(shù)據(jù)+平臺(tái)+模型閉環(huán)、提供高價(jià)值智能體服務(wù)的企業(yè)將獲得溢價(jià)。

量化投資出身的DeepSeek雖不差錢,但從可持續(xù)發(fā)展角度來看,也需要擁抱Token經(jīng)濟(jì)。

開源生態(tài)等待第三次轉(zhuǎn)折

過去一年多時(shí)間,開源生態(tài)格局變了。

2025年初,DeepSeek對(duì)開源生態(tài)完成了第一次引爆。今年初,OpenClaw完成了對(duì)開源生態(tài)的第二次神助攻。第一次引爆使得一些閉源模型也向開源靠攏,國(guó)內(nèi)如百度等巨頭加入開源陣營(yíng),海外如OpenAI、Google等也在加大開源力度。

根據(jù)OpenRouter平臺(tái)對(duì)100萬億Token調(diào)用數(shù)據(jù)的分析,開源模型的市場(chǎng)份額已攀升至33%。中國(guó)開源模型的異軍突起尤為引人注目,OpenRouter平臺(tái)前六位當(dāng)中一度有五家是中國(guó)的開源模型。

開源模型的崛起,是由技術(shù)迭代、用戶需求和經(jīng)濟(jì)因素共同驅(qū)動(dòng)的結(jié)果。企業(yè)選擇開源模型的核心動(dòng)因變得非常現(xiàn)實(shí):閉源API成本與調(diào)用規(guī)模強(qiáng)相關(guān),邊際成本不可控;自托管開源模型在高并發(fā)、長(zhǎng)上下文、Agent場(chǎng)景中,單位成本顯著下降。

用直白的話說,只要能力在線,開源模型在私有化部署場(chǎng)景下,用得越多,就越便宜。作為開源模型生態(tài)的攪局者,DeepSeek在2026年,大概率還會(huì)對(duì)開源業(yè)態(tài)再次助推一波。

這種預(yù)想中的推動(dòng)涵蓋了算力成本的產(chǎn)業(yè)沖擊效應(yīng)、用戶市場(chǎng)的引爆效應(yīng)、開源生態(tài)的激發(fā)效應(yīng),以及對(duì)于市場(chǎng)信心的提振效應(yīng)等,可能會(huì)再次出現(xiàn)。

這是人民想念DeepSeek的底層邏輯,價(jià)格只是一個(gè)表象。

開源雖好,但建設(shè)仍然任重道遠(yuǎn)。

對(duì)DeepSeek來說,它還需要盡快形成開發(fā)者生態(tài),支持Agent開發(fā)生態(tài),建立Apps以及類似Skills的技能封裝與分發(fā)渠道,以提升開放性、靈活性,同時(shí)吸引更多開發(fā)者參與其中。

期待DeepSeek再次成為開源生態(tài)的關(guān)鍵一推。

對(duì)V4的期待不是過去的標(biāo)準(zhǔn)

大洋彼岸的懸念是,OpenAI和Anthropic的下一代模型能打到什么程度,Super App能不能像正在生態(tài)化的Claude Code一樣成為應(yīng)用OS和通用行動(dòng)智能體,以及Coding這把生態(tài)底層尖刀誰最快,這三件事會(huì)影響今年的大風(fēng)向。

從現(xiàn)在的局勢(shì)來看,Anthropic的火已經(jīng)快燒到OpenAI的大本營(yíng)了,這一點(diǎn)可以翻閱華爾街日?qǐng)?bào)披露的兩家財(cái)務(wù)數(shù)據(jù),Anthropic有可能搶在OpenAI之前扭虧為盈。

在這種背景下,我們期待DeepSeek的什么呢?

把前文的這些觀點(diǎn)總結(jié)一下,它應(yīng)該包括V4、R2實(shí)現(xiàn)代際跨越、100萬Token的上下文窗口(剛剛開始灰度測(cè)試)、原生多模態(tài)能力、萬億參數(shù)級(jí)別的基礎(chǔ)模型應(yīng)該是最基本的起點(diǎn)。

可是,這些都是過去的標(biāo)準(zhǔn),不應(yīng)該是V4、R2的能力上限。站在今天這個(gè)時(shí)間段,DeepSeek需要的是在多Agent能力、工具使用、電腦操作以及背后超強(qiáng)的代碼能力上實(shí)現(xiàn)突破。

大家也不用過度焦慮,AI Agent雖大熱,但目前仍處于已有能力整合的階段,離真正意義上的自主智能體尚有距離。

未來,AI Agent可能會(huì)出現(xiàn)四種路徑:云端虛擬機(jī)整合、本地與云協(xié)同的端側(cè)混合模式、通過協(xié)議實(shí)現(xiàn)智能互聯(lián),或以“超級(jí)OS”形式重構(gòu)所有高頻應(yīng)用入口。不管哪一種路徑,它最終都將成為個(gè)人智能服務(wù)的樞紐,成為未來競(jìng)爭(zhēng)的戰(zhàn)略制高點(diǎn)。

舊的標(biāo)準(zhǔn)已不匹配DeepSeek V4,所以在這封催更信里面,我對(duì)它的期待不僅是一個(gè)更強(qiáng)大的語言模型,更是一個(gè)能夠自主執(zhí)行復(fù)雜任務(wù)、整合多種工具、與外部環(huán)境高效交互的智能體基座。

就像前面說的,期待它“搞個(gè)大的”,而DeepSeek實(shí)際進(jìn)行的模型原理探索與產(chǎn)品技術(shù)進(jìn)展,似乎也在印證這個(gè)“大”節(jié)奏。

去年10月以來,DeepSeek在大模型領(lǐng)域的論文發(fā)布與產(chǎn)品局部更新動(dòng)作持續(xù)加速,形成了密集的創(chuàng)新節(jié)奏。

從2025年12月發(fā)布DeepSeek-V3.2,到2026年1月集中放出mHC、Engram、DualPath等三項(xiàng)核心架構(gòu)論文并大幅更新和擴(kuò)展之前發(fā)布的R1技術(shù)報(bào)告,整體研發(fā)呈現(xiàn)出覆蓋架構(gòu)創(chuàng)新、推理效率、多模態(tài)、智能體能力的立體化推進(jìn)態(tài)勢(shì)。這一系列工作被普遍視為下一代旗艦?zāi)P虳eepSeek-V4的技術(shù)前奏。

DeepSeek并未正式確認(rèn)這些創(chuàng)新將如何融入V4最終架構(gòu),但論文的作者署名(包括創(chuàng)始人梁文鋒)、代碼泄露以及平臺(tái)可見的變化均指向這一方向。

2025年10月的DeepSeek-OCR系列探索了將文本信息通過視覺表征進(jìn)行壓縮的可能性,顛覆了“文本token比視覺token更高效”的傳統(tǒng)假設(shè)。OCR 2的視覺因果流機(jī)制進(jìn)一步讓模型能夠像人一樣依據(jù)版面邏輯“看懂”文檔,而非機(jī)械掃描。這為多模態(tài)模型理解和處理極其冗長(zhǎng)的文檔(如整本書、整份財(cái)報(bào))提供了全新的思路,有望將大模型的上下文窗口擴(kuò)展至數(shù)千萬token量級(jí),而無需承受平方級(jí)的計(jì)算復(fù)雜度增長(zhǎng)。

mHC技術(shù)針對(duì)的是萬億參數(shù)級(jí)模型訓(xùn)練中的根本性難題:信號(hào)爆炸,突破“深層網(wǎng)絡(luò)穩(wěn)定性”這一規(guī)?;l(fā)展的瓶頸,為萬億參數(shù)級(jí)開源模型的訓(xùn)練鋪平道路。也有助于在不依賴先進(jìn)制程芯片的情況下,通過架構(gòu)創(chuàng)新實(shí)現(xiàn)模型深度擴(kuò)展。

Engram面向長(zhǎng)上下文與持續(xù)學(xué)習(xí)的工程化解決,其條件記憶機(jī)制理論上支持跨會(huì)話的持久化記憶,突破當(dāng)前大模型“無狀態(tài)”推理的限制,推理效率不再被知識(shí)密度所拖累。它挑戰(zhàn)了傳統(tǒng)Transformer“以計(jì)算換記憶”的設(shè)計(jì)范式。該方法將靜態(tài)知識(shí)存儲(chǔ)在外部稀疏表中,使模型前饋網(wǎng)絡(luò)專注于動(dòng)態(tài)推理。這種“神經(jīng)-符號(hào)”混合架構(gòu)使模型在保持百萬token級(jí)上下文的同時(shí),有希望顯著降低推理成本。

2025年12月的V3.2版本已經(jīng)初步展現(xiàn)出“跨工具記憶保持”能力,解決了傳統(tǒng)AI Agent在多工具調(diào)用時(shí)丟失推理鏈的問題,并且通過稀疏注意力機(jī)制使128K長(zhǎng)上下文推理成本降低數(shù)倍,內(nèi)存占用減少70%。

另外,DeepSeek聯(lián)合北大、清華發(fā)布新論文推出的智能體推理框架DualPath,針對(duì)智能體大模型推理的存儲(chǔ)帶寬瓶頸,創(chuàng)新雙路徑KV-Cache加載機(jī)制,讓數(shù)據(jù)讀取與GPU計(jì)算并行,徹底解決傳統(tǒng)架構(gòu)算力空轉(zhuǎn)問題。實(shí)測(cè)離線推理吞吐量最高提升1.87倍,在線Agent運(yùn)行效率提升1.96倍,用純軟件優(yōu)化實(shí)現(xiàn)性能翻倍,堪稱AI基礎(chǔ)設(shè)施的顛覆性突破,提高成本效率的風(fēng)格非常DeepSeek。

種種跡象表明,即將發(fā)布的新一代旗艦?zāi)P虳eepSeek-V4大概率將整合文本、圖像、視頻生成能力,并采用原生多模態(tài)預(yù)訓(xùn)練而非后期拼接,模型參數(shù)在萬億以上,并且具有較強(qiáng)的記憶、工具、代碼、學(xué)習(xí)能力和對(duì)智能體的良好支持。

國(guó)產(chǎn)模型與國(guó)產(chǎn)算力的雙劍合璧

模型之外,對(duì)DeepSeek V4的另一個(gè)期待,是希望與國(guó)產(chǎn)算力經(jīng)過磨合探索之后雙劍合璧。

現(xiàn)在已經(jīng)有不少報(bào)道在討論,DeepSeek在發(fā)布V4之前,未向英偉達(dá)、AMD等美系芯片商提供預(yù)覽,而是選擇提前數(shù)周向包括華為在內(nèi)的中國(guó)芯片供應(yīng)商開放訪問權(quán)限,以確保模型在國(guó)產(chǎn)算力平臺(tái)上完成深度適配與優(yōu)化。

這也是外界認(rèn)為DeepSeek V4晚點(diǎn)的一個(gè)關(guān)鍵原因。

適配國(guó)產(chǎn)算力,這條路對(duì)國(guó)產(chǎn)模型來說非常艱難,但從更長(zhǎng)遠(yuǎn)的時(shí)間來看又不得不做。一件不得不做的事情,總要有起點(diǎn),或許DeepSeek V4就是那個(gè)起點(diǎn)。

當(dāng)模型伸出橄欖枝,壓力就給到了國(guó)產(chǎn)算力,它要求效能到產(chǎn)能再到有效供給,都要能夠進(jìn)一步跟上,與模型、智能體發(fā)展形成生態(tài)協(xié)同。

如果DeepSeek V4和R2被實(shí)證從訓(xùn)練到推理能夠在國(guó)產(chǎn)芯片上跑出世界一流的水平,并且成本更低,就有希望大幅度擺脫對(duì)海外算力的依賴,打破黃仁勛借SemiAnalysis給自己貼的那張“Token之王”的標(biāo)簽。

如果大家還有印象,DeepSeek R1問世那一夜,英偉達(dá)暴跌近17%,單日最大市值蒸發(fā)紀(jì)錄5890億美元。

英偉達(dá)暴跌對(duì)科技股投資者來說不是一件好事,但如果是DeepSeek推動(dòng)的,那么我們喜聞樂見這樣的情況再次發(fā)生。

糖水智能與原力智能分層

在這封信的尾聲,如果還要提一個(gè)期待——DeepSeek能夠在另一個(gè)Scaling Law上做出突破。

這種突破不是傳統(tǒng)意義上的“模型越大能力越強(qiáng)”,而是小體量模型不斷Scaling大體量模型的能力。

基于“原理-算法-訓(xùn)練-思考與推理能力的進(jìn)化”以及“智能的壓縮-蒸餾-內(nèi)化”這兩個(gè)技術(shù)路線,每個(gè)階段的小體量模型不斷達(dá)到上一個(gè)階段大體量模型的能力水準(zhǔn),乃至于不斷接近和達(dá)到日常高可用水平,然后在此基礎(chǔ)上能力-應(yīng)用-場(chǎng)景-價(jià)值逐步分層。

小模型、常規(guī)智能服務(wù)于簡(jiǎn)單基礎(chǔ)日常,以量見長(zhǎng),開放、端側(cè)、邊緣部署和成本效率更優(yōu)——這是“糖水智能”,是Token經(jīng)濟(jì)里的喝湯部分。

大模型、超級(jí)智能服務(wù)于企業(yè)行業(yè)商業(yè)-生產(chǎn)力-專業(yè)科技-重型任務(wù),高水準(zhǔn)產(chǎn)生高溢價(jià)——這是“原力智能”,是Token經(jīng)濟(jì)里的吃肉部分。

關(guān)于小模型的能力進(jìn)化,Google Gemma 4是一個(gè)不錯(cuò)的參照系,它包含了2B、4B、26B和31B四個(gè)版本,覆蓋手機(jī)到工作站全場(chǎng)景。其中31B Dense模型在Arena AI開源排行榜排名第三,26B A4B MoE模型排名第六。四款模型均支持圖像和視頻輸入,支持140多種語言,內(nèi)置可開關(guān)的思考模式。這不是簡(jiǎn)單的參數(shù)壓縮,而是智能的蒸餾與內(nèi)化——通過更高效的知識(shí)遷移、更精密的量化剪枝、更先進(jìn)的蒸餾技術(shù),讓小模型擁有大智慧。

期待DeepSeek能在30B-70B-120B這三檔高質(zhì)量模型,蓋過Gemma-4,企業(yè)級(jí)部署能夠以萬億參數(shù)的開源模型超越“六小虎”曾經(jīng)達(dá)到的水平,開創(chuàng)新的格局。

而在端側(cè),也期待DeepSeek在1B-8B這一檔的輕量化模型上實(shí)現(xiàn)同樣的突破。當(dāng)端側(cè)模型能夠在消費(fèi)級(jí)顯卡甚至手機(jī)上流暢運(yùn)行,當(dāng)個(gè)人手機(jī)、電腦里的端側(cè)模型數(shù)以億計(jì),當(dāng)每一個(gè)普通用戶都能擁有較強(qiáng)的AI能力,便是智能平權(quán)、智能經(jīng)濟(jì)的普惠形態(tài)。

2026年是新一代前沿模型和接管型智能體的“跳變式發(fā)展”之年,每家AI企業(yè)都將打出自己的王牌,引發(fā)新一輪的產(chǎn)業(yè)洗牌。

“中國(guó)團(tuán)”需要DeepSeek的回歸,開源生態(tài)需要DeepSeek的推動(dòng),Token經(jīng)濟(jì)需要DeepSeek的深度原力智能,國(guó)產(chǎn)算力需要DeepSeek的驗(yàn)證。

現(xiàn)在,中美模型能力在日常問答的常規(guī)智能部分幾乎已經(jīng)沒有差距,但在長(zhǎng)程復(fù)雜任務(wù)的深度智能方面還有差距。這種差距,使得大家對(duì)DeepSeek心生期待。

這是最后一次催更,也是最后的召喚。V4與R2身上,肩負(fù)的期待不僅是模型的迭代,更是一個(gè)年代的發(fā)展進(jìn)階。從模型之戰(zhàn)到全生態(tài)之戰(zhàn),從單點(diǎn)突破到全棧AI競(jìng)爭(zhēng),從跟隨模仿到自主創(chuàng)新——DeepSeek的下一步,是不是能夠定義中國(guó)人工智能的下一步?

希望DeepSeek這一年多的“沉寂”,是為了更好的爆發(fā)。

本文來自公眾號(hào):騰訊科技 作者:胡延平 編輯:蘇楊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國(guó)上周首次申領(lǐng)失業(yè)救濟(jì)人數(shù)為207,000人,預(yù)估為213,000人

美國(guó)上周首次申領(lǐng)失業(yè)救濟(jì)人數(shù)為207,000人,預(yù)估為213,000人

每日經(jīng)濟(jì)新聞
2026-04-16 20:36:07
中國(guó)下嚴(yán)厲通牒,必須退還巴拿馬運(yùn)河港口!魯比奧害怕的事發(fā)生了

中國(guó)下嚴(yán)厲通牒,必須退還巴拿馬運(yùn)河港口!魯比奧害怕的事發(fā)生了

愛史紀(jì)
2026-04-17 09:57:10
英國(guó)灰海豹開始捕食海豚,原因不明,專家推測(cè)是個(gè)別雄海豹自創(chuàng)的

英國(guó)灰海豹開始捕食海豚,原因不明,專家推測(cè)是個(gè)別雄海豹自創(chuàng)的

怪羅
2026-04-15 10:28:17
紀(jì)委不會(huì)查這3種情況,很多人不知道,要切記!

紀(jì)委不會(huì)查這3種情況,很多人不知道,要切記!

細(xì)說職場(chǎng)
2026-04-16 15:27:18
一季度GDP增長(zhǎng)5%,但真正該關(guān)注的是那個(gè)84.7%

一季度GDP增長(zhǎng)5%,但真正該關(guān)注的是那個(gè)84.7%

識(shí)局Insight
2026-04-16 21:31:17
湖人穩(wěn)了?名記曝詹姆斯大概率續(xù)約,原因竟是沒球隊(duì)愿砸錢搶

湖人穩(wěn)了?名記曝詹姆斯大概率續(xù)約,原因竟是沒球隊(duì)愿砸錢搶

仰臥撐FTUer
2026-04-17 07:33:03
手握43個(gè)世界冠軍,25歲嫁百億豪門,7年連生4娃,仍被丈夫?qū)櫝蓪?>
    </a>
        <h3>
      <a href=素衣讀史
2026-04-16 20:01:26
中國(guó)AI正在繞過大模型,直奔Agent時(shí)代

中國(guó)AI正在繞過大模型,直奔Agent時(shí)代

鈦媒體APP
2026-04-16 13:15:06
國(guó)民黨向立院申請(qǐng)鄭麗文480萬訪陸經(jīng)費(fèi),吳思瑤反對(duì),韓國(guó)瑜出手

國(guó)民黨向立院申請(qǐng)鄭麗文480萬訪陸經(jīng)費(fèi),吳思瑤反對(duì),韓國(guó)瑜出手

藍(lán)色海邊
2026-04-16 18:40:34
10個(gè)小時(shí)從北京到廣西,蘇林體驗(yàn)的高鐵,我們?cè)瓉碓缫蚜?xí)以為常!

10個(gè)小時(shí)從北京到廣西,蘇林體驗(yàn)的高鐵,我們?cè)瓉碓缫蚜?xí)以為常!

全城探秘
2026-04-16 14:14:12
吳石直到犧牲也不知道,自己小兒子能美國(guó)留學(xué),竟是“對(duì)頭”幫忙

吳石直到犧牲也不知道,自己小兒子能美國(guó)留學(xué),竟是“對(duì)頭”幫忙

浩渺青史
2026-04-17 01:59:20
雷軍開啟15小時(shí)測(cè)試直播,稱:“最大的心理負(fù)擔(dān)是不能說錯(cuò)話,一說錯(cuò)話可能又會(huì)被黑子抓住拼命黑”

雷軍開啟15小時(shí)測(cè)試直播,稱:“最大的心理負(fù)擔(dān)是不能說錯(cuò)話,一說錯(cuò)話可能又會(huì)被黑子抓住拼命黑”

魯中晨報(bào)
2026-04-17 09:12:07
完成收購!梅西正式成為西班牙科內(nèi)利亞俱樂部老板

完成收購!梅西正式成為西班牙科內(nèi)利亞俱樂部老板

北青網(wǎng)-北京青年報(bào)
2026-04-17 08:40:06
WOW!絕了,勇士絕了!曝又將交易追求倫納德

WOW!絕了,勇士絕了!曝又將交易追求倫納德

籃球?qū)崙?zhàn)寶典
2026-04-16 22:45:14
第13艘船出事,美軍艦攔截成功,難題已拋給中國(guó),俄方準(zhǔn)備救場(chǎng)

第13艘船出事,美軍艦攔截成功,難題已拋給中國(guó),俄方準(zhǔn)備救場(chǎng)

別吵吵
2026-04-17 09:32:25
格力怒斥海信,稱其沒資格用“真銅實(shí)料”四字進(jìn)行宣傳,海信高管回懟:又當(dāng)又立

格力怒斥海信,稱其沒資格用“真銅實(shí)料”四字進(jìn)行宣傳,海信高管回懟:又當(dāng)又立

大風(fēng)新聞
2026-04-15 15:07:03
女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
中年返貧4件套,一個(gè)也不要碰!

中年返貧4件套,一個(gè)也不要碰!

細(xì)說職場(chǎng)
2026-04-13 12:36:59
活久見!保險(xiǎn)公司竟稱沒錢理賠 法官現(xiàn)場(chǎng)放話2小時(shí)不付款就拘留

活久見!保險(xiǎn)公司竟稱沒錢理賠 法官現(xiàn)場(chǎng)放話2小時(shí)不付款就拘留

金融界
2026-04-16 09:22:42
他是新中國(guó)副總理在職時(shí)間最長(zhǎng)的人,妻子透露秘訣:這3點(diǎn)要做好

他是新中國(guó)副總理在職時(shí)間最長(zhǎng)的人,妻子透露秘訣:這3點(diǎn)要做好

簡(jiǎn)史檔案館
2026-04-16 11:05:03
2026-04-17 12:04:49
人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
人人都是產(chǎn)品經(jīng)理社區(qū)
想要成為大牛先從學(xué)做產(chǎn)品開始
64635文章數(shù) 311586關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

牛彈琴:中東好消息來了 特朗普可能要親自去巴基斯坦

頭條要聞

牛彈琴:中東好消息來了 特朗普可能要親自去巴基斯坦

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

埃安N60預(yù)售11.58萬起 標(biāo)配激光雷達(dá)/零重力座椅

態(tài)度原創(chuàng)

旅游
本地
教育
家居
公開課

旅游要聞

好客山東 燃情淄博|4月21日至28日,淄博所有景區(qū)面向全國(guó)游客免門票

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

教育要聞

以愛潤(rùn)成長(zhǎng) 書信話情長(zhǎng)——王樂家教好故事

家居要聞

法式線條 時(shí)光靜淌

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版