国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Karpathy開源第二大腦方案,有望替代向量數(shù)據(jù)庫,讓AI永不失憶

0
分享至

你以為 AI 在學(xué)習(xí),實際上,每次對話它都在重學(xué)一遍。

你或許也有這樣的體驗:在 NotebookLM、ChatGPT 上傳一系列文件,LLM 處理并生成答案。但每次 LLM 都要“從 0 開始”挖掘知識,尤其是當(dāng)達(dá)到使用上限或結(jié)束會話時,就像給項目做了一次“記憶清空”。

其本質(zhì)仍然是檢索增強生成(RAG)。為了讓它記住建立的架構(gòu)細(xì)節(jié),只能用更多的 token 和時間來重建 AI 的上下文。

現(xiàn)在,OpenAI 創(chuàng)始成員之一、特斯拉前 AI 總監(jiān) Andrej Karpathy 通過構(gòu)建一個持久的、由 LLM 維護(hù)的項目記錄,提出了一套全新的知識庫方案 LLM Wiki。

該方案比典型的企業(yè)級解決方案(向量數(shù)據(jù)庫和 RAG 管道)更簡單,也更優(yōu)雅,能夠復(fù)制粘貼到個人 Agent 中(例如 OpenAI Codex、Claude Code、OpenCode/Pi 等)。在這個系統(tǒng)中,LLM 本身充當(dāng)?shù)慕巧侨殹爸R庫管理員”:積極編譯、檢查和鏈接類 Markdown(.md)維基百科式文檔。


(來源:https://gist.github.com/karpathy/442a6bf555914893e9)

Karpathy 將大量 token 預(yù)算用于結(jié)構(gòu)化知識構(gòu)建,而非重復(fù)生成樣板代碼,從而為“第二大腦”的下一階段繪制藍(lán)圖:一個能夠自我修復(fù)、可審計且完全人類可讀的知識體系。

Karpathy 指出,“該方法在約 100 篇文章、40 萬字規(guī)模下的效率顯著優(yōu)于傳統(tǒng) RAG,且完全人類可讀、可審計,基本擺脫了供應(yīng)商鎖定。”

盡管 Karpathy 稱這套方案現(xiàn)在還處于靠“一堆蹩腳腳本”實現(xiàn)的階段,但已有企業(yè)家嗅到了商機,有企業(yè)家稱:誰能把這個功能打包成普通用戶都能用的東西,誰就把握了巨大商機。一款應(yīng)用即可與你常用工具、書簽、閱讀應(yīng)用、播客應(yīng)用及社交媒體優(yōu)質(zhì)討論內(nèi)容同步。


(來源:https://x.com/karpathy/status/2039805659525644595)

在 LLM Wiki 方案中,LLM 并非僅僅在查詢時從原始文檔中檢索信息,而是逐步構(gòu)建并維護(hù)一個持久化的維基:一個結(jié)構(gòu)化的、相互鏈接的 Markdown 文件集合,它位于用戶和原始數(shù)據(jù)源之間。

當(dāng)用戶添加新的數(shù)據(jù)源時,LLM 不僅會為其進(jìn)行索引以便后續(xù)檢索,還會讀取、提取關(guān)鍵信息,并將其整合到現(xiàn)有的 Wiki 中更新頁面,修訂主題摘要,指出新數(shù)據(jù)與舊說法相矛盾之處,從而不斷修正或強化已有知識體系。知識被編譯后可持續(xù)復(fù)用,無需在每次查詢時重新推導(dǎo)。

關(guān)鍵在于,LLM Wiki 是一個持續(xù)更新、不斷完善的資源。交叉引用已然建立,矛盾之處已被標(biāo)記,綜合信息則反映了用戶閱讀過的所有內(nèi)容。你添加的每個來源、提出的每個問題都會讓 LLM Wiki 的內(nèi)容更加豐富。

這樣做的好處是,用戶幾乎從不(或很少)親自編寫 Wiki,所有內(nèi)容都由 LLM(知識庫管理員)編寫和維護(hù),其一次可處理約 15 個文件。你只需要尋找資料、主動探索和提出正確的問題;而 LLM 則負(fù)責(zé)所有繁瑣的工作:總結(jié)、交叉引用、歸檔和信息整理,這些工作使知識庫能夠長期發(fā)揮作用。

Karpathy 稱,他一邊打開 Agent,一邊打開 Obsidian。LLM 會根據(jù)他們的對話進(jìn)行編輯,用戶能夠?qū)崟r瀏覽結(jié)果,包括點擊鏈接、查看圖表視圖、閱讀更新后的頁面。在這種情景下,Obsidian 是集成開發(fā)環(huán)境(IDE);LLM 是程序員;維基則是代碼庫。

綜合來看,系統(tǒng)架構(gòu)分三個不同的階段運行。

數(shù)據(jù)導(dǎo)入:原始資料,例如研究論文、GitHub 代碼庫、數(shù)據(jù)集和網(wǎng)絡(luò)文章被導(dǎo)入到 raw/ 目錄中。為了將網(wǎng)頁文章轉(zhuǎn)換為 .md 文件,Karpathy 使用了 Obsidian Web Clipper 擴(kuò)展,他還設(shè)置了一個快捷鍵,將所有相關(guān)的圖片下載到本地,以便 LLM 可通過視覺功能引用它們。

編譯步驟:這是架構(gòu)中的核心創(chuàng)新點。LLM 不僅僅是對文件進(jìn)行索引,而是對文件進(jìn)行“編譯”。它讀取原始數(shù)據(jù)并生成結(jié)構(gòu)化的維基百科頁面,包括生成摘要、識別關(guān)鍵概念、撰寫百科全書式條目,以及在相關(guān)概念之間創(chuàng)建“反向鏈接”。

主動維護(hù)(代碼校對):該系統(tǒng)并非一成不變。Karpathy 描述了運行“健康檢查”或“代碼校對”的過程,LLM 會掃描 Wiki 以查找不一致之處、缺失數(shù)據(jù)或新連接。這相當(dāng)于一個更動態(tài)的、能夠“自我修復(fù)”的知識庫。


(來源:https://x.com/himanshustwts/status/2039811786602607)

LLM Wiki 的應(yīng)用場景廣泛,競爭分析、盡職調(diào)查、旅行計劃、課程筆記、興趣愛好深度研究……任何需要持續(xù)積累知識,并且希望有序整理的場景都可以用到它。

個人成長:追蹤個人目標(biāo)、健康、心理、自我提升,可記錄日記、文章、播客筆記,并隨著時間的推移構(gòu)建一個結(jié)構(gòu)化的自我形象。

深度研究:對某個主題進(jìn)行為期數(shù)周或數(shù)月的深入研究,例如閱讀論文、文章、報告,并逐步構(gòu)建一個包含不斷發(fā)展的論點的綜合維基。

讀書筆記:邊讀邊整理章節(jié),創(chuàng)建頁面記錄人物、主題、情節(jié)線索以及它們之間的聯(lián)系。最終,你將擁有一個內(nèi)容豐富的配套維基。以托爾金百科(Tolkien Gateway)為例,其歷經(jīng)數(shù)年由志愿者社區(qū)構(gòu)建而成,涵蓋人物、地點、事件、語言等。你可以一邊閱讀,一邊構(gòu)建類似的內(nèi)容,而 LLM 則負(fù)責(zé)所有的交叉引用和維護(hù)工作。

業(yè)務(wù)/團(tuán)隊:一個由 LLM 維護(hù)的內(nèi)部 Wiki,內(nèi)容來源于 Slack 消息、會議記錄、項目文檔和客戶電話,可能也會有人工參與審核更新。Wiki 之所以能保持更新狀態(tài),是因為 LLM 承擔(dān)了重要使命——那些團(tuán)隊中其他人都不愿意做的維護(hù)工作。

目前,已有開發(fā)者將 LLM Wiki 模式擴(kuò)展到 OpenClaw 管理的 10 個 Agent 系統(tǒng)中,通過 Hermes(由 Nous Research 訓(xùn)練用于結(jié)構(gòu)化評估)作為獨立審核關(guān)卡對編譯后的文章進(jìn)行評分驗證,以確保只有準(zhǔn)確的內(nèi)容進(jìn)入永久知識庫,再生成簡報回饋給各個 Agent,從而形成了一個“產(chǎn)生-整理-驗證-反饋”的閉環(huán)。


(來源:X)

Karpathy 將 Markdown 文件看作“真理之源”,其可避免向量嵌入的“黑箱”問題。AI 給出的每一條結(jié)論都可以追溯到特定的 .md 文件,而這些文件可以由人閱讀、編輯或刪除。

LLM Wiki 方案探索的未來目標(biāo)是合成數(shù)據(jù)生成和微調(diào)。隨著 Wiki 的增長,數(shù)據(jù)通過持續(xù)的 LLM 代碼校對變得越來越“純凈”,有望成為更完美的數(shù)據(jù)訓(xùn)練集。

LLM 不再僅僅讀取 Wiki 的上下文窗口,在此基礎(chǔ)上,用戶最終有望在 Wiki 本身上對模型進(jìn)行微調(diào),從而構(gòu)建一個更小、更高效的模型。這將使 LLM 通過模型權(quán)重掌握個人知識庫,把研究項目真正轉(zhuǎn)化為專屬的定制化智能。

總體來說,這種方案是一種新的理念:通過擁有自身記憶的主動智能體,避免了以往“單次”人工智能交互的局限性。

對于個人研究人員而言,這意味著有望告別 LLM“失憶”,轉(zhuǎn)而建立更長期的關(guān)系。對企業(yè)而言,這預(yù)示著原始數(shù)據(jù)湖正在向編譯后的知識資產(chǎn)轉(zhuǎn)變?;蛟S,這也意味著我們正在進(jìn)入 AI 自主知識庫時代。

參考資料:

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

https://x.com/karpathy/status/2039805659525644595

https://x.com/himanshustwts/status/2039811786602607052

https://x.com/jumperz/status/2040166448492900356

https://venturebeat.com/data/karpathy-shares-llm-knowledge-base-architecture-that-bypasses-rag-with-an

排版:劉雅坤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
丟掉一哥寶座的阿爾卡拉斯繼續(xù)保衛(wèi)積分,下一站是去年獲得亞軍的巴塞羅那

丟掉一哥寶座的阿爾卡拉斯繼續(xù)保衛(wèi)積分,下一站是去年獲得亞軍的巴塞羅那

云隱南山
2026-04-13 18:02:13
特朗普威脅中國:若軍援伊朗,再加50%關(guān)稅!外交部一句話回懟

特朗普威脅中國:若軍援伊朗,再加50%關(guān)稅!外交部一句話回懟

魚語昱雨軒
2026-04-13 19:41:39
53歲董卿近況曝光!在上海與父母同住,離婚傳聞背后真相浮出水面

53歲董卿近況曝光!在上海與父母同住,離婚傳聞背后真相浮出水面

起喜電影
2026-04-12 10:06:46
52歲男子一年后血管斑塊消失!養(yǎng)成6個習(xí)慣,斑塊或可慢慢消失

52歲男子一年后血管斑塊消失!養(yǎng)成6個習(xí)慣,斑塊或可慢慢消失

岐黃傳人孫大夫
2026-03-28 20:35:03
美48架F-35直撲東北,解放軍警告:敢動就全殲

美48架F-35直撲東北,解放軍警告:敢動就全殲

老沮系戲精北鼻
2026-04-13 15:07:38
尤文花3.3M租來"飲水機管理員",4000萬買斷條款已自動觸發(fā)

尤文花3.3M租來"飲水機管理員",4000萬買斷條款已自動觸發(fā)

熱血體育社
2026-04-13 18:19:08
封鎖霍爾木茲海峽?伊議長:享受現(xiàn)在的油價吧,很快你就會懷念的

封鎖霍爾木茲海峽?伊議長:享受現(xiàn)在的油價吧,很快你就會懷念的

清沐執(zhí)筆
2026-04-13 20:15:48
快訊!伊朗革命衛(wèi)隊明確宣布了!

快訊!伊朗革命衛(wèi)隊明確宣布了!

達(dá)文西看世界
2026-04-13 09:35:22
忍無可忍!25萬捷克人上街怒吼:我們拒絕成為下一個匈牙利

忍無可忍!25萬捷克人上街怒吼:我們拒絕成為下一個匈牙利

阿鳧愛吐槽
2026-03-24 17:59:04
孕婦買200水果被丈夫罵后選擇打胎,還稱這是及時止損

孕婦買200水果被丈夫罵后選擇打胎,還稱這是及時止損

映射生活的身影
2026-04-13 20:08:53
1462萬!科大訊飛有人中彩票贏麻了!

1462萬!科大訊飛有人中彩票贏麻了!

天天開柒
2026-04-12 11:48:28
紀(jì)委監(jiān)委大數(shù)據(jù)監(jiān)督有多強?違紀(jì)行為早已被模型精準(zhǔn)鎖定

紀(jì)委監(jiān)委大數(shù)據(jù)監(jiān)督有多強?違紀(jì)行為早已被模型精準(zhǔn)鎖定

奇思妙想生活家
2026-04-13 16:41:56
大陸之行結(jié)束,鄭麗文下飛機后講出3句話,賴清德終于怕了

大陸之行結(jié)束,鄭麗文下飛機后講出3句話,賴清德終于怕了

阿柒的訊
2026-04-13 12:57:04
一滴水放大400萬倍后,我們會看到什么?

一滴水放大400萬倍后,我們會看到什么?

心中的麥田
2026-04-12 19:08:36
巴西前模特:17歲就坐過愛潑斯坦飛機,如今要特朗普老婆身敗名裂

巴西前模特:17歲就坐過愛潑斯坦飛機,如今要特朗普老婆身敗名裂

芭比衣櫥
2026-04-13 19:26:10
行程結(jié)束,鄭麗文返回臺灣,下飛機后講出3句話,賴清德終于怕了

行程結(jié)束,鄭麗文返回臺灣,下飛機后講出3句話,賴清德終于怕了

風(fēng)流女漢
2026-04-13 08:12:13
中國籃協(xié)致信:感謝湖北!

中國籃協(xié)致信:感謝湖北!

湖報體育
2026-04-13 20:01:53
13號午評:創(chuàng)業(yè)板指沖高回落,所有人都注意,大盤后市開始這樣看

13號午評:創(chuàng)業(yè)板指沖高回落,所有人都注意,大盤后市開始這樣看

春江財富
2026-04-13 11:53:05
歐陽妮妮被質(zhì)疑針對妹妹,曝光歐陽娜娜素顏,自己全妝叫對方保姆

歐陽妮妮被質(zhì)疑針對妹妹,曝光歐陽娜娜素顏,自己全妝叫對方保姆

萌神木木
2026-04-13 17:57:47
輸不起!李添榮賽后和場邊球迷擊掌,被北京工作人員粗暴推搡+爆粗

輸不起!李添榮賽后和場邊球迷擊掌,被北京工作人員粗暴推搡+爆粗

818體育
2026-04-13 09:39:11
2026-04-13 20:51:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16573文章數(shù) 514868關(guān)注度
往期回顧 全部

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

初代“跑男團(tuán)”合體,鄧超、鹿晗缺席

財經(jīng)要聞

今夜,出大事了,3種結(jié)果

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

旅游
游戲
本地
親子
軍事航空

旅游要聞

免費、出片、治愈系!這片月見草花海才是春日頂配

EWC電競世界杯: LPL的仇,EWC報!JDG三局擊敗BLG

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

親子要聞

以為只是小小的不舒服 這么小就要遭這份罪,當(dāng)媽滿心心疼,婆婆

軍事要聞

特朗普:今晚10點封鎖伊朗 對北約非常失望

無障礙瀏覽 進(jìn)入關(guān)懷版