国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

進(jìn)化Dify!還支持MCP,這款開(kāi)源AI數(shù)據(jù)庫(kù)絕了~【附喂飯級(jí)教程】

0
分享至

大家好,我是袋鼠帝。

最近我在折騰本地AI知識(shí)庫(kù)的時(shí)候,在Github發(fā)現(xiàn)了一個(gè)特別有意思的新項(xiàng)目,叫seekdb。

它是一款開(kāi)源的AI原生混合搜索數(shù)據(jù)庫(kù)。

https://github.com/oceanbase/seekdb


seekdb的配置要求,低到離譜,最低只需要1核CPU,2GB內(nèi)存,就能跑起來(lái)。

它是All In One的AI原生數(shù)據(jù)庫(kù),一個(gè)庫(kù)包圓了向量、文本、結(jié)構(gòu)化/半結(jié)構(gòu)化數(shù)據(jù)。

PS:也就是既可以做向量數(shù)據(jù)庫(kù)(實(shí)現(xiàn)RAG),又能存儲(chǔ)業(yè)務(wù)數(shù)據(jù)(傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù))非常全能~

支持 MySQL協(xié)議,Navicat直接連(Navicat是一款非常經(jīng)典的數(shù)據(jù)庫(kù)可視化管理工具)


還能當(dāng)MCP Server用,可以接入Trae、Claude Code、Cursor等任何支持MCP的工具或平臺(tái)。


另外,還可以接入Dify,不是當(dāng)作外部知識(shí)庫(kù)接入哦,是可以直接掌管Dify的元數(shù)據(jù)和AI知識(shí)庫(kù),因?yàn)镈ify官方的最新版本在底層對(duì)它做了兼容。

當(dāng)下大多數(shù)團(tuán)隊(duì)在真正落地Agentic RAG應(yīng)用的時(shí)候,或多或少應(yīng)該都會(huì)遇到一個(gè)問(wèn)題:底層數(shù)據(jù)架構(gòu)過(guò)于復(fù)雜。

為了讓檢索足夠精準(zhǔn),通常需要處理三種完全不同的數(shù)據(jù)形態(tài):

一是業(yè)務(wù)元數(shù)據(jù),比如Agent的創(chuàng)建時(shí)間、作者、權(quán)限,工作流的各種節(jié)點(diǎn)數(shù)據(jù)。這需要關(guān)系型數(shù)據(jù)庫(kù)來(lái)存,因?yàn)樗蠼^對(duì)的事務(wù)安全。

二是語(yǔ)義向量,這是把文字變成數(shù)學(xué)向量,讓AI能理解語(yǔ)義。這需要向量數(shù)據(jù)庫(kù)來(lái)存。

三是全文檢索,也就是關(guān)鍵詞匹配,因?yàn)橛袝r(shí)候向量搜索會(huì)想太多、或者理解有偏差,反而搜不到一些具體的專有名詞,這時(shí)候就需要傳統(tǒng)的全文檢索來(lái)兜底。

在過(guò)去,為了實(shí)現(xiàn)這三者的混合搜索(Hybrid Search),不得不采用一種拼圖式的分布式架構(gòu):比如裝一個(gè)MySQL或PostgreSQL存元數(shù)據(jù),再裝一個(gè)Milvus或Chroma存向量,為了搜得準(zhǔn),甚至還得再掛一個(gè)Elasticsearch做全文檢索。

你得維護(hù)三套完全不同的成熟系統(tǒng),還要自己處理它們之間的數(shù)據(jù)同步。最要命的是,這種跨系統(tǒng)的寫(xiě)入,很難保證事務(wù)一致性。比如網(wǎng)絡(luò)一抖動(dòng),向量庫(kù)寫(xiě)入失敗了,但元數(shù)據(jù)寫(xiě)入成功了,你的知識(shí)庫(kù)就精分了,一邊告訴你文檔在,一邊又搜不到內(nèi)容。

系統(tǒng)越復(fù)雜,人力投入就越大,風(fēng)險(xiǎn)越高..

但seekdb的思路非常清晰,就做減法:把向量、文本、結(jié)構(gòu)化/半結(jié)構(gòu)化數(shù)據(jù),全部塞進(jìn)了一個(gè)數(shù)據(jù)庫(kù)里。

這意味著,你不需要再去維護(hù)那一堆亂七八糟的中間件了

一個(gè)seekdb,全搞定。

它的核心能力也是混合搜索


seekdb直接在數(shù)據(jù)庫(kù)內(nèi)核層面,支持了向量、全文和標(biāo)量過(guò)濾的混合查詢。一條SQL語(yǔ)句,就能完成多路召回和精排。

它還內(nèi)置了AI函數(shù)


你可以在數(shù)據(jù)庫(kù)里,直接調(diào)用大模型或者向量模型,完成數(shù)據(jù)的嵌入和推理。

這就是,AI原生數(shù)據(jù)庫(kù),自己帶了個(gè)腦子

這是seekdb和其他開(kāi)源數(shù)據(jù)庫(kù)的對(duì)比


我覺(jué)得,這玩意兒特別適合幾個(gè)場(chǎng)景:

一個(gè)是個(gè)人或者小團(tuán)隊(duì)的本地知識(shí)庫(kù)。因?yàn)樗p量,資源占用少,隨便找臺(tái)舊電腦或者便宜的云服務(wù)器就能跑。

另一個(gè)是邊緣設(shè)備上的AI應(yīng)用。比如手機(jī),車機(jī),或者工業(yè)網(wǎng)關(guān),這些設(shè)備的資源有限,跑不動(dòng)那些重型數(shù)據(jù)庫(kù),但seekdb這種輕量級(jí)架構(gòu),正好能派上用場(chǎng)。

當(dāng)然,還有就是作為Agent的記憶體。它能同時(shí)存儲(chǔ)結(jié)構(gòu)化的對(duì)話記錄和非結(jié)構(gòu)化的向量記憶,非常適合用來(lái)給AI Agent做長(zhǎng)期記憶。

好了,話不多說(shuō),我們直接上實(shí)操!

本地部署seekdb(超簡(jiǎn)單)

部署seekdb,簡(jiǎn)單得讓我有點(diǎn)不適應(yīng)。

如果你習(xí)慣用Python,直接pip安裝就行。

pip install pyseekdb

如果你想用Docker,也是一行命令的事。

docker run -d --name seekdb -p 2881:2881 oceanbase/seekdb:latest

啟動(dòng)速度非常快,幾乎是秒級(jí)。

安裝好之后,你可以用Python SDK來(lái)操作,也可以直接用MySQL客戶端(比如Navicat)連接。

也可以接入Dify使用

Dify雖然好用,但它的開(kāi)源版在做AI知識(shí)庫(kù)這塊,檢索效果確實(shí)有點(diǎn)差強(qiáng)人意。

而且Dify的默認(rèn)元數(shù)據(jù)庫(kù)(PostgreSQL)和向量數(shù)據(jù)庫(kù)(Weaviate)是分開(kāi)的,相比seekdb有以下不足:


seekdb通過(guò)粗排?+?精排機(jī)制,能保持毫秒級(jí)響應(yīng),支持百億級(jí)向量檢索。

現(xiàn)在最新的Difyv1.10.1正式兼容了MySQL數(shù)據(jù)庫(kù)

這意味著我們可以把Dify的元數(shù)據(jù)庫(kù)(存儲(chǔ)業(yè)務(wù)數(shù)據(jù))和向量數(shù)據(jù)庫(kù),都切換成seekdb(因?yàn)樗С諱ySQL協(xié)議)。

看能不能提升一下Dify的知識(shí)庫(kù)效果

需要做兩個(gè)地方的改動(dòng):

一個(gè)是在Dify的docker/docker-compose.yaml文件里,把a(bǔ)pi、worker、worker_beat、web服務(wù)的image版本號(hào)改為1.10.1,或main


比如langgenius/dify-api:1.10.1

或者langgenius/dify-api:main

第二個(gè)改動(dòng)是把dify/docker下的.env.example 復(fù)制出來(lái),改名為.env


不過(guò)在文件夾里面,這兩個(gè)文件都是隱藏文件,正常是看不到的。

Mac查看隱藏文件的快捷鍵 command+shift+.

Windows快捷鍵是ctrl+shift+h


在.env里面修改幾個(gè)配置

如果既作為元數(shù)據(jù)庫(kù)又是向量數(shù)據(jù)庫(kù)的話,修改以下配置

COMPOSE_PROFILES=seekdb

如果僅作為元數(shù)據(jù)庫(kù),只需要改下面這些:

COMPOSE_PROFILES=${VECTOR_STORE:-weaviate},seekdb

如果僅作為向量數(shù)據(jù)庫(kù)(只替換知識(shí)庫(kù)功能),只改下面這些配置:

COMPOSE_PROFILES=seekdb,${DB_TYPE:-postgresql}

啟動(dòng)之后,dify會(huì)幫seekdb設(shè)置一個(gè)默認(rèn)密碼:difyai123456

PS:這個(gè)密碼也可以在.env文件里面修改


做完上面這些之后,執(zhí)行docker-compose up -d重新拉取新鏡像,同時(shí)也會(huì)自動(dòng)重啟服務(wù)。


啟動(dòng)之后,seekdb就會(huì)同時(shí)扮演元數(shù)據(jù)庫(kù)、向量數(shù)據(jù)庫(kù)和全文檢索系統(tǒng)的角色

然后我把最近在公眾號(hào)發(fā)布的一些文章通過(guò)Dify打造了一個(gè)知識(shí)庫(kù)


在seekdb里面找到vector_index開(kāi)頭的表,可以看到,已經(jīng)有對(duì)應(yīng)的向量數(shù)據(jù)存儲(chǔ)進(jìn)來(lái)了。


接入GLM-4.6做了一些知識(shí)庫(kù)搜索的測(cè)試,感覺(jué)效果還是不錯(cuò)的:




作為MCP-Server接入本地Agent

seekdb還提供了MCP-Server。

我們可以把它接入本地的Trae、Cursor、Claude Code等工具,作為一個(gè)本地Agent的知識(shí)庫(kù)工具,給Agent補(bǔ)充一些私有的專業(yè)知識(shí),或者讓它記住你的偏好。

接入步驟也很簡(jiǎn)單,分為兩步,不過(guò)需要先滿足以下前置條件:

1.已經(jīng)在本地部署seekdb;

2.本地Python版本在3.11或以上;

3.需要安裝Python包管理器uv:pip install uv,安裝完成后執(zhí)行uv --version驗(yàn)證是否安裝成功。

然后第一步:安裝OceanBase MCP Server

1.克隆項(xiàng)目到本地(也可以去Github下載zip包):

git clone https://github.com/oceanbase/mcp-oceanbase.git

2.進(jìn)入源代碼目錄:

cd mcp-oceanbase

3.安裝依賴:

uv pip install

第二步:接入本地Agent,比如Trae

在Trae里面配置seekdb的MCP-Server


"mcpServers": {

"oceanbase": {

"command": "uv",

"args": [

"--directory",

"/path/to/your/mcp-oceanbase/src/oceanbase_mcp_server",

"run",

"oceanbase_mcp_server"

],

"env": {

"OB_HOST": "127.0.0.1",

"OB_PORT": "2881",

"OB_USER": "root",

"OB_PASSWORD": "difyai123456",

"OB_DATABASE": "test"

注意:路徑替換成自己的oceanbase_mcp_server絕對(duì)路徑

第一次啟動(dòng)的時(shí)候,會(huì)下載MySQL相關(guān)驅(qū)動(dòng),有點(diǎn)慢。

成功后,如下圖,有10個(gè)工具


1. execute_sql:在 OceanBase 服務(wù)器上執(zhí)行任意 SQL 語(yǔ)句。

2. get_ob_ash_report:生成 OceanBase 的 ASH(活躍會(huì)話歷史)報(bào)告,用于性能分析,可指定起止時(shí)間和租戶。

3. get_current_time:獲取 OceanBase 的當(dāng)前系統(tǒng)時(shí)間。

4. get_current_tenant:獲取當(dāng)前連接會(huì)話所屬的 tenant(租戶)名稱。

5. get_all_server_nodes:列出 OceanBase 集群中所有 server 節(jié)點(diǎn)(需要 sys 租戶權(quán)限)。

6. get_resource_capacity:獲取集群資源(CPU/內(nèi)存等)容量信息(需要 sys 租戶權(quán)限)。

7. search_oceanbase_document:基于關(guān)鍵字從 OceanBase 官方文檔里自動(dòng)檢索相關(guān)內(nèi)容,為 LLM 提供上下文知識(shí)。

8. oceanbase_text_search:在 OceanBase 表里做全文檢索,可指定文本列、搜索詞、WHERE 條件和返回列。

9. oceabase_vector_search:對(duì)表中的向量列執(zhí)行向量相似度搜索,可指定距離算法、是否返回距離、TopK 等。

10. oceanbase_hybrid_search:同時(shí)結(jié)合「結(jié)構(gòu)化過(guò)濾(如年齡>20)」和「向量相似度」進(jìn)行多模態(tài)混合搜索。

OceanBase MCP的使用方式還是有挺多的,我給大家展示兩種:

一種是傳統(tǒng)數(shù)據(jù)庫(kù)的增刪改查:



另外一種是混合檢索(全文檢索+語(yǔ)義檢索)。

不過(guò)AI并不清楚混合檢索的sql語(yǔ)句,所以需要給上下文(也就是sql示例,我這里寫(xiě)在了輸入框,后續(xù)可以放到Trae的規(guī)則,或者作為一個(gè)文件,放在當(dāng)前文件夾下)

sql示例可以在seekdb官方文檔找到:

https://www.oceanbase.ai/docs/zh-CN/

向量表的表名也得給對(duì)(可以去navicat里面找vector_index開(kāi)頭的)

這里的提問(wèn):搜索一下PaddleOCR-VL是什么


這樣AI就能通過(guò)OceanBase MCP進(jìn)行語(yǔ)義搜索,找到我通過(guò)Dify向量化存儲(chǔ)到seekdb的PaddleOCR-VL文章的相關(guān)信息,并整理回答。



更多信息可以在seekdb官方文檔里面查看:

https://www.oceanbase.ai/docs/zh-CN/

我感覺(jué),數(shù)據(jù)庫(kù)這個(gè)行業(yè),終于也開(kāi)始被AI重塑了。

過(guò)去,我們?yōu)榱诉m應(yīng)數(shù)據(jù)庫(kù),不得不把數(shù)據(jù)拆開(kāi),去適應(yīng)不同的存儲(chǔ)引擎。

現(xiàn)在,seekdb把向量、文本、結(jié)構(gòu)化數(shù)據(jù)重新融合在了一起,用一種更符合AI的使用方式,來(lái)存儲(chǔ)和檢索數(shù)據(jù)。

而且能無(wú)縫兼容MySQL協(xié)議,意味著很容易遷移/切換

我查了一下seekdb,還是螞蟻旗下的OceanBase團(tuán)隊(duì)開(kāi)源的項(xiàng)目

如果你正在為AI項(xiàng)目的數(shù)據(jù)架構(gòu)頭疼,或者只是想在本地快速搭個(gè)好用的知識(shí)庫(kù),可以去試試這款全新的AI數(shù)據(jù)庫(kù)--seekdb

能看到這里的都是鳳毛麟角的存在!

如果覺(jué)得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧~

如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?

謝謝你耐心看完我的文章~

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普沒(méi)想到:美伊大戰(zhàn)打醒兩個(gè)國(guó)家,一個(gè)是越南,一個(gè)是菲律賓

特朗普沒(méi)想到:美伊大戰(zhàn)打醒兩個(gè)國(guó)家,一個(gè)是越南,一個(gè)是菲律賓

探索新高度
2026-03-07 23:24:06
AI折騰三年,終于輪到普通人了!為什么99%的人用不上的“大龍蝦”,卻讓整個(gè)互聯(lián)網(wǎng)突然興奮?

AI折騰三年,終于輪到普通人了!為什么99%的人用不上的“大龍蝦”,卻讓整個(gè)互聯(lián)網(wǎng)突然興奮?

翔說(shuō)航天
2026-03-07 19:59:23
地面戰(zhàn)爭(zhēng)開(kāi)始,伊朗擊落F-15E

地面戰(zhàn)爭(zhēng)開(kāi)始,伊朗擊落F-15E

西樓飲月
2026-03-05 20:46:17
馬斯克評(píng)比亞迪:產(chǎn)能跌破50%是"巨大痛苦",BYD連續(xù)六個(gè)月銷量下滑

馬斯克評(píng)比亞迪:產(chǎn)能跌破50%是"巨大痛苦",BYD連續(xù)六個(gè)月銷量下滑

新浪財(cái)經(jīng)
2026-03-07 20:46:51
0-2大冷!中國(guó)球員單打全出局,鄭欽文輸球原因曝光,3個(gè)環(huán)節(jié)拉胯

0-2大冷!中國(guó)球員單打全出局,鄭欽文輸球原因曝光,3個(gè)環(huán)節(jié)拉胯

侃球熊弟
2026-03-08 09:52:58
廣告翻車、丑聞纏身,美國(guó)“芭比部長(zhǎng)”被直播解雇!

廣告翻車、丑聞纏身,美國(guó)“芭比部長(zhǎng)”被直播解雇!

新民周刊
2026-03-08 11:26:13
偷往帽子倒螺螄粉湯的女子已經(jīng)社死,正面照遭網(wǎng)友Ai修復(fù)后瘋傳

偷往帽子倒螺螄粉湯的女子已經(jīng)社死,正面照遭網(wǎng)友Ai修復(fù)后瘋傳

映射生活的身影
2026-03-08 02:42:07
“穿靴子的一看就是窮養(yǎng)女”,大學(xué)女寢視頻火了,4號(hào)深不可測(cè)

“穿靴子的一看就是窮養(yǎng)女”,大學(xué)女寢視頻火了,4號(hào)深不可測(cè)

澤澤先生
2026-03-06 21:45:15
18歲亞馬爾復(fù)制梅西經(jīng)典:彩虹球進(jìn)死角 對(duì)手倒下!生涯50球

18歲亞馬爾復(fù)制梅西經(jīng)典:彩虹球進(jìn)死角 對(duì)手倒下!生涯50球

葉青足球世界
2026-03-08 08:32:15
廣東主持毛琳45歲未婚未育,財(cái)富自由坦然生活

廣東主持毛琳45歲未婚未育,財(cái)富自由坦然生活

春風(fēng)詠歌
2026-03-07 11:44:52
特朗普:美軍在與伊朗沖突中可能還會(huì)出現(xiàn)更多傷亡

特朗普:美軍在與伊朗沖突中可能還會(huì)出現(xiàn)更多傷亡

界面新聞
2026-03-08 07:13:38
伊朗客商冒戰(zhàn)火轉(zhuǎn)賬,義烏老板拒收:“錢(qián)別轉(zhuǎn),你留著,希望你平安”

伊朗客商冒戰(zhàn)火轉(zhuǎn)賬,義烏老板拒收:“錢(qián)別轉(zhuǎn),你留著,希望你平安”

新民晚報(bào)
2026-03-08 09:05:08
女子相親帶男閨蜜蹭飯,狂點(diǎn)8000元海鮮,男方逃單失聯(lián),警方介入

女子相親帶男閨蜜蹭飯,狂點(diǎn)8000元海鮮,男方逃單失聯(lián),警方介入

離離言幾許
2026-03-07 15:52:24
伊朗稱俘獲數(shù)名美軍士兵

伊朗稱俘獲數(shù)名美軍士兵

閃電新聞
2026-03-08 10:32:20
中國(guó)駐伊朗女記者:爆炸中躲進(jìn)衛(wèi)生間趕稿,不是最窘的事

中國(guó)駐伊朗女記者:爆炸中躲進(jìn)衛(wèi)生間趕稿,不是最窘的事

上觀新聞
2026-03-07 15:07:07
究竟遜尼派與什葉派的區(qū)別是什么?

究竟遜尼派與什葉派的區(qū)別是什么?

難得君
2026-03-07 09:53:43
央視官宣孫悟空扮演者執(zhí)導(dǎo)翻拍新版

央視官宣孫悟空扮演者執(zhí)導(dǎo)翻拍新版

歪歌社團(tuán)
2026-03-08 04:07:48
“頂住強(qiáng)大外國(guó)施壓”,斯里蘭卡庇護(hù)另一艘伊朗軍艦

“頂住強(qiáng)大外國(guó)施壓”,斯里蘭卡庇護(hù)另一艘伊朗軍艦

觀察者網(wǎng)
2026-03-06 13:18:44
伊朗戰(zhàn)術(shù)奏效了,再對(duì)林肯號(hào)航母發(fā)射導(dǎo)彈,這個(gè)武器成美軍數(shù)學(xué)題

伊朗戰(zhàn)術(shù)奏效了,再對(duì)林肯號(hào)航母發(fā)射導(dǎo)彈,這個(gè)武器成美軍數(shù)學(xué)題

書(shū)紀(jì)文譚
2026-03-07 15:19:19
英國(guó)考慮向中東地區(qū)派遣航母后,特朗普再批斯塔默:英國(guó)沒(méi)有第一時(shí)間支持

英國(guó)考慮向中東地區(qū)派遣航母后,特朗普再批斯塔默:英國(guó)沒(méi)有第一時(shí)間支持

環(huán)球網(wǎng)資訊
2026-03-08 09:09:07
2026-03-08 12:52:49
袋鼠帝 incentive-icons
袋鼠帝
持續(xù)分享AI實(shí)踐干貨,走超級(jí)個(gè)體崛起之路
55文章數(shù) 65關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚(yú)和小紅書(shū)

頭條要聞

英國(guó)考慮向中東地區(qū)派遣航母 特朗普批評(píng):不需要

頭條要聞

英國(guó)考慮向中東地區(qū)派遣航母 特朗普批評(píng):不需要

體育要聞

大傷后被交易,他說(shuō):22歲的我已經(jīng)死了

娛樂(lè)要聞

周迅新戀情曝光,李亞鵬等人已成過(guò)去

財(cái)經(jīng)要聞

油價(jià)要失控?

汽車要聞

9分鐘充飽 全新騰勢(shì)Z9GT首搭閃充技術(shù)26.98萬(wàn)起

態(tài)度原創(chuàng)

教育
時(shí)尚
家居
健康
軍事航空

教育要聞

父母留給子女最好的財(cái)富是什么?

2026春夏一定要擁有的6只包,好看又百搭

家居要聞

暖棕撞色 輕法奶油風(fēng)

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車上班嗎?

軍事要聞

美第三個(gè)航母打擊群據(jù)稱準(zhǔn)備部署至中東

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版