国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

梁文鋒推遲V4,是為了根治龍蝦的健忘癥?

0
分享至



DeepSeek什么時(shí)候發(fā)V4?AI圈所有人都在猜,但正確答案可能只有梁文鋒知道。

豆包、千問、元寶……無論大廠還是小廠,他們都在在春節(jié)期間扎堆發(fā)布新版本,生怕晚一步就被V4的光芒蓋過。

換成任何一個(gè)正常的CEO,面對這種全行業(yè)翹首以盼的局面,早就把半成品推出去了。

先占住聲量,再慢慢迭代,這是互聯(lián)網(wǎng)行業(yè)的基本操作。

但梁文鋒偏不。跟他關(guān)系近的同行說了句大實(shí)話:“團(tuán)隊(duì)穩(wěn),底子厚,不會(huì)草率發(fā)布。”

外媒報(bào)道,V4是架構(gòu)級重構(gòu)。包含1萬億參數(shù)、百萬上下文、原生多模態(tài),并且將于4月份發(fā)布。

這次迭代的核心叫做LTM,Long-Term Memory,即長期記憶。

LTM是一套在模型架構(gòu)內(nèi)部實(shí)現(xiàn)持久化記憶的系統(tǒng)。它能讓AI跨對話、跨任務(wù)地記住用戶是誰、聊過什么、偏好什么。像人一樣把重要的東西沉淀下來,而不是每次開機(jī)都從零開始。

而這個(gè)能力,恰恰是OpenClaw最缺的東西。

雖然OpenClaw可以替人干活,但它的記憶系統(tǒng)本質(zhì)上只是往本地Markdown文件里寫筆記,工作時(shí)會(huì)持續(xù)發(fā)送這個(gè)筆記到大模型里,這就導(dǎo)致用OpenClaw越久,發(fā)送記憶所消耗的token就越多。

整個(gè)社區(qū)都在想方設(shè)法地去解決這個(gè)問題,給它打補(bǔ)丁、裝插件、裝Skill,卻沒人能從根上解決問題,因?yàn)閱栴}出在模型本身,它天生不記事。

LTM要做的,就是從架構(gòu)層把這個(gè)病治好。

此次更新所帶來的挑戰(zhàn),遠(yuǎn)超常規(guī)的版本迭代,而且模型的情感交互、個(gè)性化記憶等模塊尚未完全遷移,還需要進(jìn)一步調(diào)優(yōu)。

因此梁文鋒不是在拖延,而是在克制。

在一個(gè)所有人都在比誰先發(fā)、誰聲量大的行業(yè)里,梁文鋒選擇等所有零件都對了再出手。

R1之所以能一炮封神,靠的不是搶跑,而是一出手就讓對手無話可說。

他顯然打算用同樣的方式對待 V4——要么不發(fā),要發(fā)就是王炸。

01

梁文鋒到底在憋什么

OpenClaw的爆火讓大家認(rèn)識(shí)到了這樣一個(gè)事,當(dāng)AI真的開始替人干活,模型對上下文的理解和記憶能力就不再是加分項(xiàng),而是決定它能不能用的底線。

一個(gè)記不住上文的agent,每隔幾輪就會(huì)重復(fù)犯錯(cuò)、丟失任務(wù)狀態(tài)、忘記你剛才說過的話。

所以過去兩年,業(yè)界也推出了不少的LTM方案。

比如伯克利團(tuán)隊(duì)在2023年提出的MemGPT,借鑒虛擬內(nèi)存的思路,讓模型自己決定什么時(shí)候把哪些信息從外部存儲(chǔ)調(diào)入上下文窗口、什么時(shí)候換出去。

2025年發(fā)布的Mem0,則是把這條路往工程化推了一步,在LOCOMO基準(zhǔn)上比OpenAI內(nèi)置記憶高出26%,token消耗減少90%,這也是現(xiàn)如今OpenClaw社區(qū)用得最多的記憶插件。

前兩天還有用擴(kuò)散激活模擬人類聯(lián)想式記憶提取的SYNAPSE,以及用遞歸語義壓縮解決記憶膨脹的SimpleMem。

但所有這些方案都有一個(gè)共同的天花板,那就是它們都是在模型外部運(yùn)行的中間件。

記憶的提取、壓縮、檢索,全部由外掛系統(tǒng)完成,模型本身不參與。因此,記憶的質(zhì)量完全取決于外掛系統(tǒng)的工程水平,模型得到的記憶,也就參差不齊。

并且,所有記憶最終都要通過上下文窗口注入模型,這和OpenClaw碰見的問題一樣,記憶越多,那么token成本也就越高。

還有一點(diǎn),模型無法在外掛記憶上進(jìn)行“學(xué)習(xí)”。因?yàn)樵谶@個(gè)過程中,模型做的事情是在讀別人幫它整理好的筆記,而不是真的把經(jīng)驗(yàn)內(nèi)化成了能力。

梁文鋒要走的,很可能是一條完全不同的路。



從梁文鋒署名的Engram論文和V4架構(gòu)泄露來看,DeepSeek的方向不是在模型外面搭記憶系統(tǒng),而是把記憶能力直接嵌入模型架構(gòu)本身。

Engram已經(jīng)證明,在Transformer內(nèi)部可以開辟一塊專用的條件記憶空間,用O(1)的哈希查找來存取靜態(tài)知識(shí),在調(diào)用已存好的知識(shí)時(shí),還不占用上下文窗口的容量,也不增加推理的計(jì)算成本。

更關(guān)鍵的是,Engram 的“無限記憶機(jī)制”實(shí)驗(yàn)表明,這塊記憶空間的容量可以近乎無限地?cái)U(kuò)展,且模型的推理開銷保持恒定。

我說得再直白一點(diǎn),現(xiàn)在的模型想“記住”一件事,唯一的辦法是把它塞進(jìn)對話窗口里,窗口滿了就得扔?xùn)|西。

Engram相當(dāng)于給模型裝了一塊獨(dú)立的硬盤,你可以把記憶存在這個(gè)外部的存儲(chǔ)里,就不用堆在你電腦本身的硬盤中。當(dāng)你想調(diào)取某一個(gè)記憶的時(shí)候,你把這塊硬盤接上就行。

而且這塊硬盤理論上可以無限擴(kuò)容,查找速度恒定不變。

這條路如果走通,意味著 DeepSeek 跳過了整個(gè)“外掛記憶”的技術(shù)范式,直接進(jìn)入了“原生記憶”的時(shí)代。

如果你了解OpenClaw,你會(huì)發(fā)現(xiàn)梁文鋒他瞄準(zhǔn)的,恰恰是OpenClaw最薄弱的一環(huán)。OpenClaw讓AI有了手腳,卻沒給它一顆能記事的大腦。

OpenClaw 的記憶系統(tǒng)有三個(gè)結(jié)構(gòu)性缺陷。

第一個(gè)是壓縮損耗。

上下文窗口塞滿后,OpenClaw會(huì)自動(dòng)把舊對話壓縮成一段摘要來騰空間。事實(shí)保留了,但對話的脈絡(luò),全部丟失,而且不可逆。

換句話說,你們在討論什么、決策的推理鏈條、語氣和優(yōu)先級都沒有了,也都找不回來了。

比如壓縮前,agent記得一套完整的調(diào)試方案,壓縮后只剩一句話,“用戶在調(diào)試一個(gè)bug”,具體的排查路徑全沒了。

第二個(gè)是檢索失效。

記憶文件用幾周就堆到幾百條,靠向量相似度檢索召回??墒窍蛄繖z索只能匹配語義相近的片段,無法理解條目之間的邏輯關(guān)系。

比如說我用OpenClaw做了三個(gè)方案,這三個(gè)方案分散在不同文件里,和客戶敲定的是最后一個(gè)方案。當(dāng)我后來想檢索敲定的方案時(shí),由于這三個(gè)方案都是用來發(fā)給客戶的,就有可能只檢索命中第一個(gè)方案或者第二個(gè)方案。

第三個(gè)是記憶容量有上限。

OpenClaw的記憶分兩層:核心記憶(MEMORY.md)每次會(huì)話啟動(dòng)時(shí)全量注入上下文,日志記憶則通過搜索工具按需召回。

聽起來合理,然而核心記憶有硬性上限,單文件20000字符截?cái)啵衎ootstrap文件合計(jì)不超過150000字符。

可是你用得越久,MEMORY.md越長,要么被截?cái)鄟G信息,要么每次會(huì)話的token消耗線性增長。

還沒完,日志那邊,按需檢索的質(zhì)量完全取決于模型自己的判斷,它覺得不相關(guān)就不召回,哪怕信息確實(shí)存在。很容易就會(huì)把重要的信息給丟掉。

說白了,這三個(gè)問題是同一件事:窗口就那么大,往里塞的東西越多,要么記錯(cuò),要么找不到,要么太貴OpenClaw的記憶不是“記住了”,而是“抄了一堆筆記然后翻不到”。

如果V4真的在架構(gòu)層面跑通了這條路,那它不僅解決OpenClaw的問題,還能讓模型變成“可成長的模型”。

用得越久越懂你。這和當(dāng)前所有大模型的使用體驗(yàn)有本質(zhì)區(qū)別,因?yàn)楝F(xiàn)在的模型無論多強(qiáng),每次打開都是一張白紙。

騰訊的一項(xiàng)最新研究,從另一個(gè)方向印證了這條路的價(jià)值。

從OpenAI加入騰訊擔(dān)任首席AI科學(xué)家的姚順雨,在2月份的時(shí)候發(fā)布了他入職后的第一篇署名論文。

論文的名字叫CL-bench,全稱Context Learning Benchmark,專門測一件事,就是大模型能不能從上下文里真正學(xué)到東西。

不是考它背了多少知識(shí),而是考它能不能從你給的材料里現(xiàn)學(xué)現(xiàn)用。

結(jié)果很難看。

所有前沿模型的平均正確率只有17.2%。正確率最高的模型是GPT-5.1,可它也只做對了23.7%。換句話說,你精心準(zhǔn)備了一份詳盡的背景資料喂給AI,它有超過八成的概率沒有真正“學(xué)會(huì)”。

姚順雨在論文中的判斷是,當(dāng)前 AI與真正智能之間的鴻溝,不在于知識(shí)的多少,而在于學(xué)習(xí)的能力。一個(gè)裝滿知識(shí)卻不會(huì)學(xué)習(xí)的AI,就像一個(gè)背了整本字典卻不會(huì)寫作的人。

他在AGI-Next前沿峰會(huì)上也說過類似的觀點(diǎn),他認(rèn)為大模型邁向高價(jià)值應(yīng)用的核心瓶頸,就在于能否“用好上下文”。

如何記憶,很可能成為2026年的核心主題。一旦上下文學(xué)習(xí)與記憶變得可靠,模型或許就能實(shí)現(xiàn)自主學(xué)習(xí)。

梁文鋒不可能不懂這個(gè)道理,這就是為什么發(fā)布日期一推再推。

02

DeepSeek要補(bǔ)的課

愿景歸愿景,現(xiàn)實(shí)歸現(xiàn)實(shí)。

在梁文鋒閉關(guān)的這一年里,對手們沒有停下來等他。DeepSeek要補(bǔ)的課,比外界想象的多。

第一塊短板是多模態(tài),這也是最大的一塊。

DeepSeek到今天為止,還是一個(gè)純文本模型。它沒辦法看圖、看視頻、聽語音。

倒不是說DeepSeek完全沒有視覺能力。在今年1月的時(shí)候,他們發(fā)布了OCR 2,這是一個(gè)3B參數(shù)的文檔理解小模型。它的核心是用一個(gè)叫DeepEncoder V2的編碼器替代了傳統(tǒng)的視覺編碼器,讓模型能像人一樣按閱讀順序理解文檔頁面。

僅在文檔解析的基準(zhǔn)測試上,OCR 2用最少的視覺token戰(zhàn)勝了Qwen3-VL-235B這種千億級選手。

但OCR 2只能做一件事:把文檔里的文字、表格、公式提取出來。本質(zhì)上是“圖像→文本”的單向轉(zhuǎn)換,不是通用的視覺理解。

換句話說,OCR 2證明了DeepSeek有能力做好視覺編碼,但從“能讀文檔”到“能看視頻、聽語音、理解自然場景”,中間隔著的不是一步,而是一整個(gè)技術(shù)代際。

與此同時(shí),其他大廠早就進(jìn)入了“全模態(tài)”時(shí)代。

字節(jié)的Seedance 2.0證明了優(yōu)秀的多模態(tài)模型有多大的用戶基礎(chǔ)和商業(yè)潛力。GPT-5.4已經(jīng)原生支持音頻、視頻和計(jì)算機(jī)操作。

有消息透露,梁文鋒近半年的主要工作之一就是補(bǔ)齊視覺內(nèi)容處理的短板。

第二塊短板是agent能力。

DeepSeek微信公眾號自己置頂?shù)奈恼聵?biāo)題就是“邁向agent時(shí)代的第一步”,這就足以說明梁文鋒知道該往哪個(gè)方向前進(jìn)。



隨著越來越多的人開始使用OpenClaw,無論是大廠還是小廠,都在強(qiáng)調(diào)自己模型的agent能力。

Kimi K2.5已經(jīng)能自主調(diào)度100個(gè)子agent、并行處理1500個(gè)步驟。ChatGPT的agent功能可以自動(dòng)填表、訂機(jī)票、跨網(wǎng)站拉取信息。Claude推出了Agent Teams,多個(gè)AI協(xié)同完成復(fù)雜任務(wù)。

第三塊短板是AI編程。

這是2026年發(fā)展最快、商業(yè)化最成熟的賽道。

在編程基準(zhǔn)測試SWE-bench Verified上,Claude Opus 4.6得分80.8%,GPT-5.3 Codex約80%,DeepSeek V3.2只有73.1%。

在更難的基準(zhǔn)SWE-bench Pro上測試,DeepSeek V3.2得分為40.9%,遠(yuǎn)低于GPT-5.4的57.7%。

更關(guān)鍵的是,行業(yè)已經(jīng)從“Vibe Coding”,進(jìn)化到了“Agentic Engineering”,讓AI獨(dú)立完成工程級任務(wù)。

智譜的GLM-5論文標(biāo)題就叫《From Vibe Coding to Agentic Engineering》,它能連續(xù)24小時(shí)跑代碼、700次工具調(diào)用、800次上下文切換,從零構(gòu)建出一個(gè)GBA模擬器。

此前曾有爆料稱,DeepSeek-V4的內(nèi)部測試結(jié)果,在編程能力上超越了Claude Sonnet 3. 。可如今,Claude Sonnet 3.5已經(jīng)被Anthropic官方完全停用了。

第四塊短板是AI搜索。

現(xiàn)在幾乎所有ChatBot產(chǎn)品都是聯(lián)網(wǎng)的,你已經(jīng)見不到還把模型聯(lián)網(wǎng)單獨(dú)設(shè)為一個(gè)開關(guān)的APP了。

OpenAI有ChatGPT Search,Google有Gemini Embedding 2搜索。DeepSeek的搜索能力一直是短板,而且其搜索結(jié)果經(jīng)常會(huì)出現(xiàn)幻覺。

Vectara的測試顯示,DeepSeek R1的幻覺率高達(dá)14.3%,是V3(3.9%)的近四倍。

在學(xué)術(shù)引用檢索的測試中,這個(gè)數(shù)字更夸張,其引用的結(jié)果中,91.43%都是錯(cuò)的,包括但不限于捏造論文標(biāo)題、虛構(gòu)DOI、張冠李戴作者。

DeepSeek自己也承認(rèn),幻覺是當(dāng)前階段“不可避免的”問題。

DeepSeek在它沒有自己的搜索基礎(chǔ)設(shè)施,只能依賴第三方接口,信息源的質(zhì)量不可控。

模型本身的事實(shí)校驗(yàn)?zāi)芰Σ粔驈?qiáng),即使拿到了正確的檢索結(jié)果,也可能在生成環(huán)節(jié)引入錯(cuò)誤。這兩個(gè)問題疊加在一起,就是用戶體驗(yàn)上的“搜了也不準(zhǔn)”。

在agent時(shí)代,搜索不是加分項(xiàng),而是必選項(xiàng)。

DeepSeek的短板,沒有一塊是小修小補(bǔ)能解決的。梁文鋒不是在做一個(gè)更強(qiáng)的V系列模型,他是在同時(shí)打四場仗。

4月,箭在弦上。但如果再跳票,也不必意外。對梁文鋒來說,“不發(fā)”永遠(yuǎn)比“發(fā)錯(cuò)”重要。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中東再生變數(shù),美股連跌5周!明天,A股會(huì)怎么走?

中東再生變數(shù),美股連跌5周!明天,A股會(huì)怎么走?

每經(jīng)牛眼
2026-03-29 12:32:49
俄向中東沖突各方提出斡旋方案

俄向中東沖突各方提出斡旋方案

參考消息
2026-03-28 13:22:10
A股:信號已表明,不出所料,3月30日,周一將迎來更大的暴風(fēng)雨?

A股:信號已表明,不出所料,3月30日,周一將迎來更大的暴風(fēng)雨?

云鵬敘事
2026-03-29 09:24:02
比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺(tái)灣領(lǐng)導(dǎo)人,我軍必定收臺(tái)?

比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺(tái)灣領(lǐng)導(dǎo)人,我軍必定收臺(tái)?

甜檸聊史
2026-03-29 01:38:18
林青霞親口爆料:當(dāng)年我全裸給他看,他卻嚇得扭頭就跑!

林青霞親口爆料:當(dāng)年我全裸給他看,他卻嚇得扭頭就跑!

達(dá)文西看世界
2026-03-04 15:07:30
快觀察 | 緩炸10天、增兵1萬,特朗普想用“急轉(zhuǎn)彎”掩蓋什么?

快觀察 | 緩炸10天、增兵1萬,特朗普想用“急轉(zhuǎn)彎”掩蓋什么?

上觀新聞
2026-03-28 21:06:07
長春升溫時(shí)間確定

長春升溫時(shí)間確定

魯中晨報(bào)
2026-03-28 21:21:43
楊振寧離世5個(gè)月,翁帆遠(yuǎn)赴英國真相曝光,藏21年的秘密瞞不住了

楊振寧離世5個(gè)月,翁帆遠(yuǎn)赴英國真相曝光,藏21年的秘密瞞不住了

離離言幾許
2026-03-13 22:38:05
蒙古朝鮮越南這三大鄰國,面對中國都做出了同一個(gè)抉擇

蒙古朝鮮越南這三大鄰國,面對中國都做出了同一個(gè)抉擇

凡知
2026-03-27 18:31:34
原來精神小妹的生活方式這么離譜!看完網(wǎng)友分享,大開眼界了

原來精神小妹的生活方式這么離譜!看完網(wǎng)友分享,大開眼界了

另子維愛讀史
2026-03-02 19:55:07
薩巴倫卡奪冠登頂積分榜,高芙升至第三,鄭欽文排名第26

薩巴倫卡奪冠登頂積分榜,高芙升至第三,鄭欽文排名第26

老癘體育解說
2026-03-29 06:11:45
華為新機(jī)曝光:搭載麒麟9030 Pro+超大直屏!

華為新機(jī)曝光:搭載麒麟9030 Pro+超大直屏!

科技堡壘
2026-03-28 11:41:02
做教培的閨蜜:張雪峰身價(jià)8億,為啥還吃外賣?她的回答讓我沉默

做教培的閨蜜:張雪峰身價(jià)8億,為啥還吃外賣?她的回答讓我沉默

藍(lán)色海邊
2026-03-27 18:08:02
一定要記?。翰灰ソo別人買你舍不得買的東西,?別把人情當(dāng)恩典

一定要記?。翰灰ソo別人買你舍不得買的東西,?別把人情當(dāng)恩典

木言觀
2026-03-29 10:50:51
越南政壇大洗牌,總理卸任前訪問俄羅斯,不僅僅是告別,更是布局

越南政壇大洗牌,總理卸任前訪問俄羅斯,不僅僅是告別,更是布局

安珈使者啊
2026-03-28 14:38:43
2026中國新型儲(chǔ)能公司潛力TOP100

2026中國新型儲(chǔ)能公司潛力TOP100

新浪財(cái)經(jīng)
2026-03-28 16:40:48
全球語言統(tǒng)計(jì),世界范圍內(nèi)有5個(gè)國家說韓語,33個(gè)國家說中文

全球語言統(tǒng)計(jì),世界范圍內(nèi)有5個(gè)國家說韓語,33個(gè)國家說中文

南書房
2026-03-12 16:30:09
農(nóng)村家長曬5個(gè)兒子,被網(wǎng)友群嘲:送外賣都費(fèi)勁,還為國效力呢?

農(nóng)村家長曬5個(gè)兒子,被網(wǎng)友群嘲:送外賣都費(fèi)勁,還為國效力呢?

今朝牛馬
2026-03-27 18:23:13
65歲男人和37歲女人再婚,女人:他老折騰我,男人:夫妻就這樣

65歲男人和37歲女人再婚,女人:他老折騰我,男人:夫妻就這樣

惟來
2026-03-28 11:12:08
把水賣給酒鬼?河南一藥企“不務(wù)正業(yè)”,一年掙了40億

把水賣給酒鬼?河南一藥企“不務(wù)正業(yè)”,一年掙了40億

毒sir財(cái)經(jīng)
2026-01-28 15:27:05
2026-03-29 13:47:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2326文章數(shù) 8054關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

網(wǎng)約車司機(jī)被騙網(wǎng)貸后車內(nèi)輕生:我不想死 但扛不住了

頭條要聞

網(wǎng)約車司機(jī)被騙網(wǎng)貸后車內(nèi)輕生:我不想死 但扛不住了

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂要聞

張凌赫事件持續(xù)升級!官方點(diǎn)名怒批

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

健康
數(shù)碼
教育
藝術(shù)
親子

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

數(shù)碼要聞

曝華為多品類紫色新品將陸續(xù)推出 “幻影紫”平板已開售

教育要聞

江蘇鹽城建湖:沉浸式學(xué)安全 護(hù)航成長路

藝術(shù)要聞

2025江南如畫——中國油畫作品展 | 入選作品選刊(二)

親子要聞

睡著的兩個(gè)姐妹,不安分的小樣,媽媽在旁邊心被萌化!

無障礙瀏覽 進(jìn)入關(guān)懷版