網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

梁文鋒推遲V4，是為了根治龍蝦的健忘癥？

2026-03-16 16:42:07　來源: 字母榜

北京舉報

分享至

DeepSeek什么時候發(fā)V4？AI圈所有人都在猜，但正確答案可能只有梁文鋒知道。

豆包、千問、元寶……無論大廠還是小廠，他們都在在春節(jié)期間扎堆發(fā)布新版本，生怕晚一步就被V4的光芒蓋過。

換成任何一個正常的CEO，面對這種全行業(yè)翹首以盼的局面，早就把半成品推出去了。

先占住聲量，再慢慢迭代，這是互聯(lián)網(wǎng)行業(yè)的基本操作。

但梁文鋒偏不。跟他關(guān)系近的同行說了句大實(shí)話：“團(tuán)隊穩(wěn)，底子厚，不會草率發(fā)布?！?/p>

外媒報道，V4是架構(gòu)級重構(gòu)。包含1萬億參數(shù)、百萬上下文、原生多模態(tài)，并且將于4月份發(fā)布。

這次迭代的核心叫做LTM，Long-Term Memory，即長期記憶。

LTM是一套在模型架構(gòu)內(nèi)部實(shí)現(xiàn)持久化記憶的系統(tǒng)。它能讓AI跨對話、跨任務(wù)地記住用戶是誰、聊過什么、偏好什么。像人一樣把重要的東西沉淀下來，而不是每次開機(jī)都從零開始。

而這個能力，恰恰是OpenClaw最缺的東西。

雖然OpenClaw可以替人干活，但它的記憶系統(tǒng)本質(zhì)上只是往本地Markdown文件里寫筆記，工作時會持續(xù)發(fā)送這個筆記到大模型里，這就導(dǎo)致用OpenClaw越久，發(fā)送記憶所消耗的token就越多。

整個社區(qū)都在想方設(shè)法地去解決這個問題，給它打補(bǔ)丁、裝插件、裝Skill，卻沒人能從根上解決問題，因?yàn)閱栴}出在模型本身，它天生不記事。

LTM要做的，就是從架構(gòu)層把這個病治好。

此次更新所帶來的挑戰(zhàn)，遠(yuǎn)超常規(guī)的版本迭代，而且模型的情感交互、個性化記憶等模塊尚未完全遷移，還需要進(jìn)一步調(diào)優(yōu)。

因此梁文鋒不是在拖延，而是在克制。

在一個所有人都在比誰先發(fā)、誰聲量大的行業(yè)里，梁文鋒選擇等所有零件都對了再出手。

R1之所以能一炮封神，靠的不是搶跑，而是一出手就讓對手無話可說。

他顯然打算用同樣的方式對待 V4——要么不發(fā)，要發(fā)就是王炸。

梁文鋒到底在憋什么

OpenClaw的爆火讓大家認(rèn)識到了這樣一個事，當(dāng)AI真的開始替人干活，模型對上下文的理解和記憶能力就不再是加分項，而是決定它能不能用的底線。

一個記不住上文的agent，每隔幾輪就會重復(fù)犯錯、丟失任務(wù)狀態(tài)、忘記你剛才說過的話。

所以過去兩年，業(yè)界也推出了不少的LTM方案。

比如伯克利團(tuán)隊在2023年提出的MemGPT，借鑒虛擬內(nèi)存的思路，讓模型自己決定什么時候把哪些信息從外部存儲調(diào)入上下文窗口、什么時候換出去。

2025年發(fā)布的Mem0，則是把這條路往工程化推了一步，在LOCOMO基準(zhǔn)上比OpenAI內(nèi)置記憶高出26%，token消耗減少90%，這也是現(xiàn)如今OpenClaw社區(qū)用得最多的記憶插件。

前兩天還有用擴(kuò)散激活模擬人類聯(lián)想式記憶提取的SYNAPSE，以及用遞歸語義壓縮解決記憶膨脹的SimpleMem。

但所有這些方案都有一個共同的天花板，那就是它們都是在模型外部運(yùn)行的中間件。

記憶的提取、壓縮、檢索，全部由外掛系統(tǒng)完成，模型本身不參與。因此，記憶的質(zhì)量完全取決于外掛系統(tǒng)的工程水平，模型得到的記憶，也就參差不齊。

并且，所有記憶最終都要通過上下文窗口注入模型，這和OpenClaw碰見的問題一樣，記憶越多，那么token成本也就越高。

還有一點(diǎn)，模型無法在外掛記憶上進(jìn)行“學(xué)習(xí)”。因?yàn)樵谶@個過程中，模型做的事情是在讀別人幫它整理好的筆記，而不是真的把經(jīng)驗(yàn)內(nèi)化成了能力。

梁文鋒要走的，很可能是一條完全不同的路。

從梁文鋒署名的Engram論文和V4架構(gòu)泄露來看，DeepSeek的方向不是在模型外面搭記憶系統(tǒng)，而是把記憶能力直接嵌入模型架構(gòu)本身。

Engram已經(jīng)證明，在Transformer內(nèi)部可以開辟一塊專用的條件記憶空間，用O(1)的哈希查找來存取靜態(tài)知識，在調(diào)用已存好的知識時，還不占用上下文窗口的容量，也不增加推理的計算成本。

更關(guān)鍵的是，Engram 的“無限記憶機(jī)制”實(shí)驗(yàn)表明，這塊記憶空間的容量可以近乎無限地擴(kuò)展，且模型的推理開銷保持恒定。

我說得再直白一點(diǎn)，現(xiàn)在的模型想“記住”一件事，唯一的辦法是把它塞進(jìn)對話窗口里，窗口滿了就得扔?xùn)|西。

Engram相當(dāng)于給模型裝了一塊獨(dú)立的硬盤，你可以把記憶存在這個外部的存儲里，就不用堆在你電腦本身的硬盤中。當(dāng)你想調(diào)取某一個記憶的時候，你把這塊硬盤接上就行。

而且這塊硬盤理論上可以無限擴(kuò)容，查找速度恒定不變。

這條路如果走通，意味著 DeepSeek 跳過了整個“外掛記憶”的技術(shù)范式，直接進(jìn)入了“原生記憶”的時代。

如果你了解OpenClaw，你會發(fā)現(xiàn)梁文鋒他瞄準(zhǔn)的，恰恰是OpenClaw最薄弱的一環(huán)。OpenClaw讓AI有了手腳，卻沒給它一顆能記事的大腦。

OpenClaw 的記憶系統(tǒng)有三個結(jié)構(gòu)性缺陷。

第一個是壓縮損耗。

上下文窗口塞滿后，OpenClaw會自動把舊對話壓縮成一段摘要來騰空間。事實(shí)保留了，但對話的脈絡(luò)，全部丟失，而且不可逆。

換句話說，你們在討論什么、決策的推理鏈條、語氣和優(yōu)先級都沒有了，也都找不回來了。

比如壓縮前，agent記得一套完整的調(diào)試方案，壓縮后只剩一句話，“用戶在調(diào)試一個bug”，具體的排查路徑全沒了。

第二個是檢索失效。

記憶文件用幾周就堆到幾百條，靠向量相似度檢索召回?？墒窍蛄繖z索只能匹配語義相近的片段，無法理解條目之間的邏輯關(guān)系。

比如說我用OpenClaw做了三個方案，這三個方案分散在不同文件里，和客戶敲定的是最后一個方案。當(dāng)我后來想檢索敲定的方案時，由于這三個方案都是用來發(fā)給客戶的，就有可能只檢索命中第一個方案或者第二個方案。

第三個是記憶容量有上限。

OpenClaw的記憶分兩層：核心記憶（MEMORY.md）每次會話啟動時全量注入上下文，日志記憶則通過搜索工具按需召回。

聽起來合理，然而核心記憶有硬性上限，單文件20000字符截斷，所有bootstrap文件合計不超過150000字符。

可是你用得越久，MEMORY.md越長，要么被截斷丟信息，要么每次會話的token消耗線性增長。

還沒完，日志那邊，按需檢索的質(zhì)量完全取決于模型自己的判斷，它覺得不相關(guān)就不召回，哪怕信息確實(shí)存在。很容易就會把重要的信息給丟掉。

說白了，這三個問題是同一件事：窗口就那么大，往里塞的東西越多，要么記錯，要么找不到，要么太貴OpenClaw的記憶不是“記住了”，而是“抄了一堆筆記然后翻不到”。

如果V4真的在架構(gòu)層面跑通了這條路，那它不僅解決OpenClaw的問題，還能讓模型變成“可成長的模型”。

用得越久越懂你。這和當(dāng)前所有大模型的使用體驗(yàn)有本質(zhì)區(qū)別，因?yàn)楝F(xiàn)在的模型無論多強(qiáng)，每次打開都是一張白紙。

騰訊的一項最新研究，從另一個方向印證了這條路的價值。

從OpenAI加入騰訊擔(dān)任首席AI科學(xué)家的姚順雨，在2月份的時候發(fā)布了他入職后的第一篇署名論文。

論文的名字叫CL-bench，全稱Context Learning Benchmark，專門測一件事，就是大模型能不能從上下文里真正學(xué)到東西。

不是考它背了多少知識，而是考它能不能從你給的材料里現(xiàn)學(xué)現(xiàn)用。

結(jié)果很難看。

所有前沿模型的平均正確率只有17.2%。正確率最高的模型是GPT-5.1，可它也只做對了23.7%。換句話說，你精心準(zhǔn)備了一份詳盡的背景資料喂給AI，它有超過八成的概率沒有真正“學(xué)會”。

姚順雨在論文中的判斷是，當(dāng)前 AI與真正智能之間的鴻溝，不在于知識的多少，而在于學(xué)習(xí)的能力。一個裝滿知識卻不會學(xué)習(xí)的AI，就像一個背了整本字典卻不會寫作的人。

他在AGI-Next前沿峰會上也說過類似的觀點(diǎn)，他認(rèn)為大模型邁向高價值應(yīng)用的核心瓶頸，就在于能否“用好上下文”。

如何記憶，很可能成為2026年的核心主題。一旦上下文學(xué)習(xí)與記憶變得可靠，模型或許就能實(shí)現(xiàn)自主學(xué)習(xí)。

梁文鋒不可能不懂這個道理，這就是為什么發(fā)布日期一推再推。

DeepSeek要補(bǔ)的課

愿景歸愿景，現(xiàn)實(shí)歸現(xiàn)實(shí)。

在梁文鋒閉關(guān)的這一年里，對手們沒有停下來等他。DeepSeek要補(bǔ)的課，比外界想象的多。

第一塊短板是多模態(tài)，這也是最大的一塊。

DeepSeek到今天為止，還是一個純文本模型。它沒辦法看圖、看視頻、聽語音。

倒不是說DeepSeek完全沒有視覺能力。在今年1月的時候，他們發(fā)布了OCR 2，這是一個3B參數(shù)的文檔理解小模型。它的核心是用一個叫DeepEncoder V2的編碼器替代了傳統(tǒng)的視覺編碼器，讓模型能像人一樣按閱讀順序理解文檔頁面。

僅在文檔解析的基準(zhǔn)測試上，OCR 2用最少的視覺token戰(zhàn)勝了Qwen3-VL-235B這種千億級選手。

但OCR 2只能做一件事：把文檔里的文字、表格、公式提取出來。本質(zhì)上是“圖像→文本”的單向轉(zhuǎn)換，不是通用的視覺理解。

換句話說，OCR 2證明了DeepSeek有能力做好視覺編碼，但從“能讀文檔”到“能看視頻、聽語音、理解自然場景”，中間隔著的不是一步，而是一整個技術(shù)代際。

與此同時，其他大廠早就進(jìn)入了“全模態(tài)”時代。

字節(jié)的Seedance 2.0證明了優(yōu)秀的多模態(tài)模型有多大的用戶基礎(chǔ)和商業(yè)潛力。GPT-5.4已經(jīng)原生支持音頻、視頻和計算機(jī)操作。

有消息透露，梁文鋒近半年的主要工作之一就是補(bǔ)齊視覺內(nèi)容處理的短板。

第二塊短板是agent能力。

DeepSeek微信公眾號自己置頂?shù)奈恼聵?biāo)題就是“邁向agent時代的第一步”，這就足以說明梁文鋒知道該往哪個方向前進(jìn)。

隨著越來越多的人開始使用OpenClaw，無論是大廠還是小廠，都在強(qiáng)調(diào)自己模型的agent能力。

Kimi K2.5已經(jīng)能自主調(diào)度100個子agent、并行處理1500個步驟。ChatGPT的agent功能可以自動填表、訂機(jī)票、跨網(wǎng)站拉取信息。Claude推出了Agent Teams，多個AI協(xié)同完成復(fù)雜任務(wù)。

第三塊短板是AI編程。

這是2026年發(fā)展最快、商業(yè)化最成熟的賽道。

在編程基準(zhǔn)測試SWE-bench Verified上，Claude Opus 4.6得分80.8%，GPT-5.3 Codex約80%，DeepSeek V3.2只有73.1%。

在更難的基準(zhǔn)SWE-bench Pro上測試，DeepSeek V3.2得分為40.9%，遠(yuǎn)低于GPT-5.4的57.7%。

更關(guān)鍵的是，行業(yè)已經(jīng)從“Vibe Coding”，進(jìn)化到了“Agentic Engineering”，讓AI獨(dú)立完成工程級任務(wù)。

智譜的GLM-5論文標(biāo)題就叫《From Vibe Coding to Agentic Engineering》，它能連續(xù)24小時跑代碼、700次工具調(diào)用、800次上下文切換，從零構(gòu)建出一個GBA模擬器。

此前曾有爆料稱，DeepSeek-V4的內(nèi)部測試結(jié)果，在編程能力上超越了Claude Sonnet 3. ?？扇缃?，Claude Sonnet 3.5已經(jīng)被Anthropic官方完全停用了。

第四塊短板是AI搜索。

現(xiàn)在幾乎所有ChatBot產(chǎn)品都是聯(lián)網(wǎng)的，你已經(jīng)見不到還把模型聯(lián)網(wǎng)單獨(dú)設(shè)為一個開關(guān)的APP了。

OpenAI有ChatGPT Search，Google有Gemini Embedding 2搜索。DeepSeek的搜索能力一直是短板，而且其搜索結(jié)果經(jīng)常會出現(xiàn)幻覺。

Vectara的測試顯示，DeepSeek R1的幻覺率高達(dá)14.3%，是V3（3.9%）的近四倍。

在學(xué)術(shù)引用檢索的測試中，這個數(shù)字更夸張，其引用的結(jié)果中，91.43%都是錯的，包括但不限于捏造論文標(biāo)題、虛構(gòu)DOI、張冠李戴作者。

DeepSeek自己也承認(rèn)，幻覺是當(dāng)前階段“不可避免的”問題。

DeepSeek在它沒有自己的搜索基礎(chǔ)設(shè)施，只能依賴第三方接口，信息源的質(zhì)量不可控。

模型本身的事實(shí)校驗(yàn)?zāi)芰Σ粔驈?qiáng)，即使拿到了正確的檢索結(jié)果，也可能在生成環(huán)節(jié)引入錯誤。這兩個問題疊加在一起，就是用戶體驗(yàn)上的“搜了也不準(zhǔn)”。

在agent時代，搜索不是加分項，而是必選項。

DeepSeek的短板，沒有一塊是小修小補(bǔ)能解決的。梁文鋒不是在做一個更強(qiáng)的V系列模型，他是在同時打四場仗。

4月，箭在弦上。但如果再跳票，也不必意外。對梁文鋒來說，“不發(fā)”永遠(yuǎn)比“發(fā)錯”重要。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

狂攬7.1k Stars！武裝你的龍蝦和“愛馬仕”，YC總裁開源AI記憶外掛

智東西 2026-04-14 21:17:39
0 跟貼 0
Anthropic又“上新”，或本周發(fā)布旗艦?zāi)Ｐ蚈pus 4.7和AI設(shè)計工具

華爾街見聞官方 2026-04-15 06:21:18
0 跟貼 0

博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0

支持遠(yuǎn)程操控和通用GUI操作3

機(jī)器之心Pro 2026-03-02 13:36:13
0 跟貼 0
上海機(jī)器人批量進(jìn)廠，8小時不間斷“打工”，拐點(diǎn)時刻或要等4年

上觀新聞 2026-04-15 06:44:05
1 跟貼 1

打倒Sam Altman！

虎嗅APP 2026-04-15 07:46:09
0 跟貼 0

訓(xùn)練AI只需要跑完前10%，剩下的90%都能在小模型上跑

DeepTech深科技 2026-04-14 17:08:11
0 跟貼 0
機(jī)器人半程馬拉松來了！阿里、榮耀將攜首款具身機(jī)器人征戰(zhàn)

財聯(lián)社 2026-04-15 09:10:19
0 跟貼 0

這小龍蝦餅敢賣38，一個機(jī)器一壓就完事，龍蝦這也沒處理啊

孟夏搞笑 2026-04-13 16:30:30
5 跟貼 5
上一個兄弟離職了，我接手了他的代碼，我承認(rèn)沒憋住

環(huán)亞搞笑 2026-04-14 14:35:36
3 跟貼 3
寫Verilog、調(diào)CUDA，總翻車？工業(yè)代碼大模型開始學(xué)會先想后寫了

機(jī)器之心Pro 2026-04-14 17:09:10
0 跟貼 0
想吃海鮮自己整一個

里德漫剪 2026-04-11 10:32:04
1 跟貼 1
微軟龍蝦計劃曝光！納德拉緊急拉12人精銳，揮刀重組Copilot，與Claude奪市場

智東西 2026-04-14 21:22:25
0 跟貼 0
剛抓上來的龍蝦犀牛蝦，不殺不處理一鍋水煮，太鮮美了

咖辣食味 2026-04-13 01:50:20
1 跟貼 1
2026年防止掉隊，4個好入門的AI技能（別焦慮！

小戴同學(xué)呃 2026-04-12 01:20:08
0 跟貼 0
境外間諜設(shè)連環(huán)計竊取研究所機(jī)密文件，國安與其展開驚險較量

挽衾距離 2026-04-14 02:33:15
0 跟貼 0
【數(shù)學(xué)速成】母子差公式揭秘：學(xué)老師黑板秒懂，公式太直觀！

星際探索站 2026-04-14 13:50:59
1 跟貼 1
MiniMax版龍蝦更新：微信飛書遠(yuǎn)程操控，看屏幕點(diǎn)鼠標(biāo)更溜了

智東西 2026-04-14 21:17:39
0 跟貼 0
原來龍蝦也會怕老婆

睛睛說劇 2026-04-13 15:33:20
1 跟貼 1
我們找到了龍蝦界掌管GUI的神-3

機(jī)器之心Pro 2026-04-13 14:22:51
0 跟貼 0
JiuwenClaw助你一鍵養(yǎng)龍蝦-1

機(jī)器之心Pro 2026-03-12 17:16:55
0 跟貼 0
哈哈，孩子的寵物是龍蝦啊#爸爸帶娃#

浪潮體育匯 2026-04-11 09:34:12
4 跟貼 4
買回家的龍蝦不會處理？不用刷泡一泡就能解放雙手

河南都市頻道 2026-04-14 11:11:45
0 跟貼 0
加沙街頭：一位父親的最后擁抱

硅嶼手記 2026-04-15 08:44:00
0 跟貼 0
團(tuán)隊如何用好、管好一池小龍蝦？

量子位 2026-03-21 22:31:58
0 跟貼 0
我們應(yīng)該把小龍蝦裝在怎樣的池塘？

量子位 2026-03-20 20:36:00
0 跟貼 0
夢夢在塘子里吊不少龍蝦，來做麻辣口味的

老四農(nóng)人啊 2026-04-11 21:08:36
0 跟貼 0
「龍蝦之父」吐槽人類互聯(lián)網(wǎng)后，終于有人把這當(dāng)個事兒辦了

機(jī)器之心Pro 2026-03-31 11:09:26
0 跟貼 0
博主分享小龍蝦最簡單做法，只用電飯鍋就能做，簡單方便鮮美又好吃

理想之聲 2026-04-12 14:36:18
0 跟貼 0
對話元戎啟行CEO周光：Robotaxi模型運(yùn)營能力缺一不可，L4或加速到來

車東西 2026-04-13 20:47:25
0 跟貼 0
最大的“騙局”出現(xiàn)了，看著很大的小龍蝦，結(jié)果去殼后只有一點(diǎn)點(diǎn)

重慶頭條官方 2026-04-13 02:24:52
5 跟貼 5
1個人+龍蝦，1個月漲粉10w+，未來必備老板思維

傅盛 2026-04-10 21:17:53
0 跟貼 0
開了快20年，北京頂流餃子館能用“龍蝦”取號了？曾排號超15000桌

北京商報 2026-04-14 14:34:01
2 跟貼 2
漁民海底捕獲龍蝦，龍蝦直接就被拿捏了

熱血二蛋 2026-04-13 16:48:50
1 跟貼 1
開龍蝦“盲盒”后傻眼了，這么大的殼里這么小的肉

河南都市頻道 2026-04-14 11:11:51
0 跟貼 0
又到了釣龍蝦的好季節(jié)，女子釣了半天就收獲滿滿，網(wǎng)友：用地籠抓得更多

博聞視角 2026-04-14 13:19:21
0 跟貼 0
中國最貴的海鮮，有錢也未必吃過

風(fēng)煙食錄 2026-04-15 06:21:28
0 跟貼 0
卓馭科技沈劭劼：未來存活下來的智駕公司將轉(zhuǎn)型為移動物理AI公司

財經(jīng)汽車 2026-04-14 17:09:51
0 跟貼 0
工作中如何用龍蝦提效？記錄、查詢、做筆記

量子位 2026-03-26 23:23:37
0 跟貼 0
龍蝦軍團(tuán)有了最強(qiáng)「視力」！一眼看圖直接寫代碼-2

機(jī)器之心Pro 2026-04-02 16:57:05
0 跟貼 0

字母榜

讓未來不止于大。

2375文章數(shù) 8058關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

游戲

教育

手機(jī)

親子

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

梁文鋒推遲V4，是為了根治龍蝦的健忘癥？

硬剛馬斯克！亞馬遜擲115億美元收購

特朗普：美國對伊朗的戰(zhàn)爭已經(jīng)結(jié)束

特朗普：美國對伊朗的戰(zhàn)爭已經(jīng)結(jié)束

帶出中超最大黑馬！他讓球迷們“排隊道歉”

網(wǎng)曝鐘麗緹代孕要了個男孩 備孕近10年

特朗普稱美國對伊朗的戰(zhàn)爭已經(jīng)結(jié)束

售12.99萬起/續(xù)航2000km 風(fēng)云T9L上市

態(tài)度原創(chuàng)

壞事做盡的瘋女人，集體翻紅了

《守墓人2》愿望單突破40萬 一代玩家數(shù)也飆升

家庭教育“黃金平衡”：關(guān)愛與紀(jì)律的秘訣

一加官方自曝新形態(tài)設(shè)備：首款掌機(jī)要來了！

你們看我們樂意上幼兒園不

梁文鋒推遲V4，是為了根治龍蝦的健忘癥？

硬剛馬斯克！亞馬遜擲115億美元收購

帶出中超最大黑馬！他讓球迷們“排隊道歉”

網(wǎng)曝鐘麗緹代孕要了個男孩備孕近10年

壞事做盡的瘋女人，集體翻紅了

《守墓人2》愿望單突破40萬一代玩家數(shù)也飆升

一加官方自曝新形態(tài)設(shè)備：首款掌機(jī)要來了！