国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“我可能不再建議學計算機”!圖靈獎得主炮轟半個行業(yè),并斷言:AI Agent最后全是數(shù)據(jù)庫問題

0
分享至


編譯 | Tina

“如果今天重新開始,我不確定還會不會建議 18 歲的人去學計算機?!?/p>

說這話的人,是數(shù)據(jù)庫領(lǐng)域的圖靈獎得主 Mike Stonebraker,中文常譯作“石破天”。他是 Ingres 和 Postgres 背后的關(guān)鍵創(chuàng)造者,也是數(shù)據(jù)庫領(lǐng)域最重要的人物之一。在他看來,計算機科學未來很可能不再是一個增長型行業(yè)。

這期訪談里,Stonebraker 把半個數(shù)據(jù)庫行業(yè)都點名罵了一遍。

他罵 Oracle,直接說 Larry Ellison 當年是在“撒謊”:把還沒實現(xiàn)的功能賣給客戶,把未來說成現(xiàn)在,然后讓第一批客戶幫自己 debug。

他罵 Google,說 Google 當年推 MapReduce 和最終一致性,是“愚蠢”的。很多人只是因為“Google 很聰明”,就盲目相信它一定知道自己在干什么。但在 Stonebraker 看來,Hadoop 低效得離譜,最終一致性也只適合極少數(shù)場景。等到 Spanner 出來,Google 自己也等于承認了:事務(wù)、一致性這些數(shù)據(jù)庫老問題,根本繞不過去。

他也罵 AWS:Amazon 同時維護大概 15 種數(shù)據(jù)庫,而他認為真正需要的可能只有 3 種。圖數(shù)據(jù)庫、各種重復功能的數(shù)據(jù)庫,在他看來,很多都沒有足夠性能和市場理由繼續(xù)存在。

但更有意思的是,他對今天這波 AI 的看法。

在他看來,現(xiàn)在所謂的 agentic AI,本質(zhì)上是“大模型 + 一層系統(tǒng)包裝”,而且大多數(shù)還停在“只讀”階段。一旦進入真正的“讀寫”世界——比如轉(zhuǎn)賬、庫存更新——問題立刻回到數(shù)據(jù)庫的老問題:事務(wù)、一致性、原子性。這不是 AI 問題,而是分布式數(shù)據(jù)庫問題。

還有一點,是他對大模型寫 SQL 的判斷。

在公開 benchmark 上,模型已經(jīng)能做到 80%+ 的準確率,看起來只差一步就能上生產(chǎn)。但在他們用真實數(shù)據(jù)倉庫做的測試里,結(jié)果是——0%。即使加上 RAG、甚至把 join 條件直接喂給模型,最多也只能到 35%。而一個熟練的人類工程師,可以做到 90% 以上。所以他直接下了一個結(jié)論:這項技術(shù),至少在可見的未來,還不夠格進入生產(chǎn)環(huán)境。

下面是完整訪談。

1 Postgres:最好用的起點,不是終點

主持人:我想先從 Postgres 的起源講起。不過在那之前,我更想從最開始問:你是怎么進入數(shù)據(jù)庫這個領(lǐng)域的?

Mike Stonebraker:我畢業(yè)之后,很幸運被伯克利錄用。當時我很清楚,如果繼續(xù)做我博士期間的方向,是沒什么前途的,無論當時還是現(xiàn)在都是如此。最好的路徑,是找到一個真正懂行的導師帶你入門。

于是 Gene Wong 把我?guī)г谏磉?,說我們一起做點東西吧。那是 1971 年,也就是 Edgar F. Codd 在 CACM 《美國計算機學會通訊》發(fā)表開創(chuàng)性論文后的第二年。

Gene 說,不如我們研究一下數(shù)據(jù)庫。當時主要有兩個陣營:一個是 Codasyl 提案,你可能沒聽過,它是一個低層的“意大利面式”網(wǎng)絡(luò)結(jié)構(gòu),你需要通過指針去遍歷執(zhí)行查詢;另一個是 IBM 的方案,也就是 IMS,是一種層次化的數(shù)據(jù)結(jié)構(gòu),本質(zhì)是樹。

其實 IBM 當時也意識到,樹結(jié)構(gòu)并不通用,無法解決很多問題,于是他們又加了一些擴展,把它改造成一種受限的網(wǎng)絡(luò)結(jié)構(gòu)。但那明顯是個很糟糕的補丁。

Codasyl 也有很多問題:它非常底層,很難調(diào)試,而且一旦你的 schema(當時還不這么叫)發(fā)生變化,基本就得全部推倒重來,因為它完全綁定在物理層。

相比之下,Codd 的關(guān)系模型非常合理。所以 Gene 說,那我們就來實現(xiàn)這個吧,這是下一步該做的事情。于是我們在 1972 年開始做 Ingres,當時我還是伯克利的助理教授。你也知道,助理教授大概有五年時間證明自己,要么拿 tenure,要么被淘汰。Ingres 就是我拿 tenure 的關(guān)鍵項目,我在 1976 年拿到了終身教職。

事情就是這么開始的。后來又有一些機緣。當時很多人會做原型系統(tǒng),基本就是學生作業(yè)級別的代碼——自己能跑,別人用不了。我們先完成了前 90%,能跑起來;然后不知道為什么,又花了額外的“90%”,把它真正打磨成一個可用系統(tǒng)。

伯克利版本的 Ingres 是真正能用的。接下來幾年,大概有 100 所大學開始用它,因為 Unix 開始流行。這是一個能跑在 Unix 上的免費數(shù)據(jù)庫系統(tǒng),在學術(shù)界非常受歡迎。于是開始有很多人來伯克利參觀,說這東西很酷,你們最大的應(yīng)用場景是什么?但我們只能說,其實并不大。

這個問題在 Arizona State University 的一個項目中被徹底暴露。他們考慮用 Ingres 管理 4 萬名學生的數(shù)據(jù)。他們可以接受用 Bell Labs 的非官方操作系統(tǒng),也可以接受用我們這個“非官方”的數(shù)據(jù)庫系統(tǒng),但最后項目失敗了,因為 Unix 上沒有 COBOL,而他們是一個 COBOL shop。

不支持的操作系統(tǒng)、不支持的數(shù)據(jù)庫系統(tǒng),再加上沒有 COBOL——直接讓我們變得毫無相關(guān)性。

唯一的出路就是創(chuàng)業(yè)。于是 1980 年,我們拿了當時的風投,成立了 Ingres 公司,把系統(tǒng)遷移到 VMS 這樣的“真正操作系統(tǒng)”上,并提供商業(yè)支持,這就是商業(yè)化的開始。

主持人:我看到 Ingres 當時在和 Oracle Corporation 競爭。技術(shù)上你們明顯更好,但 Oracle 還是贏了,他們是怎么做到的?

Mike Stonebraker:Larry Ellison 是個非常厲害的銷售。他會把“現(xiàn)在”和“未來”講得毫無區(qū)別,本質(zhì)上就是對客戶撒謊。

他會把還不能用的功能賣出去,然后讓第一批客戶幫他 debug。我認為這是一種很不正當?shù)纳虡I(yè)行為,對客戶撒謊是不可接受的。

舉個例子,有個功能叫“引用完整性”(referential integrity)。比如你開除了一個員工,而他是某個部門最后一個人,那你是刪除這個部門,還是保留一個“空部門”?類似這種邏輯。

Ingres 實現(xiàn)了這個功能。而 Oracle 當時的做法是:在手冊里寫兩頁文檔,解釋什么是引用完整性(大家都同意這個定義),但在頁面底部寫一句——“尚未實現(xiàn)”

主持人:我采訪過 Sun Microsystems 的人,他們對 Ellison 的評價也差不多。還有一個說法是,當 Oracle 收購 MySQL 后,大家轉(zhuǎn)向了 Postgres,這也讓 Postgres 成為主流開源數(shù)據(jù)庫。那么,從 Ingres 到 Postgres,最大的變化是什么?

Mike Stonebraker:最核心的變化,其實來自一開始的一個需求。當年我們想支持一個 GIS(地理信息系統(tǒng)),需要處理點、線、多邊形等數(shù)據(jù)類型。但 Ingres 只支持整數(shù)、浮點數(shù)、字符串這些標準類型,沒法高效支持 GIS,所以在這個方向上完全失敗。

這件事一直在我腦子里。

后來還有一個例子。大概 1985 年,關(guān)系數(shù)據(jù)庫引入了日期時間標準,Ingres 按照標準實現(xiàn)了公歷時間。結(jié)果有個客戶打電話來說,你們實現(xiàn)錯了。

我說怎么會,我們完全按公歷實現(xiàn)的,日期計算也完全正確。他說,這不是我要的。他做的是債券業(yè)務(wù),在他的世界里,每個月的利息是固定的,不管這個月是 28 天還是 31 天。也就是說,他的“日期減法”規(guī)則和現(xiàn)實世界不一樣。比如 3 月 15 日減 2 月 15 日,他認為是 30 天。但在 Ingres 里,這些邏輯是寫死的。他只能把數(shù)據(jù)取出來,在應(yīng)用層計算,再寫回去,效率直接下降 2 到 3 倍。

他問我,為什么不能自定義減法?這就是問題所在。這是一個你需要“債券時間”的場景,就像你需要點、線、多邊形一樣。于是 Postgres 被設(shè)計成一個可擴展類型系統(tǒng)。你可以定義任意數(shù)據(jù)類型,而且運行效率很高。這就是 Postgres 最核心的思想。

當然,大多數(shù)商業(yè)場景用標準類型就夠了,但數(shù)據(jù)庫逐漸擴展到更多領(lǐng)域,比如抽象數(shù)據(jù)類型、存儲過程等,這些都需要擴展能力。

此外,Postgres 還支持繼承(當時 AI 研究者需要),也支持“時間旅行”(歷史數(shù)據(jù)查詢),不過實現(xiàn)得很糟糕,后來被移除了。但總體來說,它包含了大量非常有意思的特性。

主持人:你提到你很擅長招到優(yōu)秀工程師。你是怎么識別這些“非常厲害的人”的?

Mike Stonebraker:通常一眼就能看出來。我對“難度”是有感覺的。如果一個學生完成的工作量是我認為合理水平的三倍,那他就是非常優(yōu)秀。

主持人:你還有一句話挺有意思:“我受不了那些不夠聰明的人,很難和他們交流。”那你怎么判斷一個人不夠聰明?

Mike Stonebraker:很簡單,跟他聊一會兒就知道了。你問他技術(shù)細節(jié),比如他的碩士論文做了什么、具體怎么實現(xiàn)、錯誤處理怎么做、用了多少進程、為什么不用線程——你問這些深入的問題,很快就能看出來。

主持人:你之前提出過一個觀點,叫“One size fits none”,也就是“一套通吃的數(shù)據(jù)庫并不是最優(yōu)解,實際上誰都不適合”。

Mike Stonebraker:對,通用型數(shù)據(jù)庫系統(tǒng)并不是最優(yōu)解。所謂 one size fits all,實際上往往是誰都不適配。你真正需要的,是針對具體需求定制的數(shù)據(jù)庫方案。

主持人:那你現(xiàn)在看到的數(shù)據(jù)庫產(chǎn)品里,哪些還屬于這種“通用型一把梭”?

Mike Stonebraker:我在 2004 年寫那篇論文的時候,我們當時手上正好有一個學術(shù)項目,后來變成了 StreamBase。流處理引擎和關(guān)系型數(shù)據(jù)庫看起來完全不像一回事。與此同時,我們也已經(jīng)有了列式存儲做數(shù)倉的大致思路,后來由 Vertica 把它做火了,而列存和行存看起來也完全不是一類系統(tǒng)。

所以當時其實已經(jīng)擺在眼前了三種差異極大的實現(xiàn),它們彼此幾乎沒有相似性,但在各自場景下,性能都比傳統(tǒng)方案高一個數(shù)量級。這已經(jīng)很能說明問題了。只要數(shù)據(jù)庫系統(tǒng)不是為你的場景設(shè)計的,你就會直接損失一個數(shù)量級的性能。

我覺得今天還是這樣。比如 ClickHouse 就是列存。Pinecone 在基于文本的向量處理上,也比那種用用戶自定義類型硬塞進去的方案更快。所以這件事到今天依然成立。我也不覺得在多個不同實現(xiàn)之上套一層統(tǒng)一 parser 有什么難度。只是 Postgres 到現(xiàn)在也沒這么做,它沒有真正實現(xiàn)列存,所以在大型數(shù)據(jù)倉庫場景里并沒有競爭力。它也沒有多節(jié)點支持,而對于大規(guī)模數(shù)據(jù)倉庫來說,這已經(jīng)是最基本的門檻能力了。所以我覺得,這件事今天和當年一樣成立。

不過,另一件同樣成立的事是,如果你只是想先把事情做起來,手頭有個數(shù)據(jù)庫問題,那答案通常還是選 Postgres。它有一個巨大的開發(fā)者社區(qū),有各種各樣的數(shù)據(jù)類型實現(xiàn),是免費的,也很容易招到懂 Postgres 的人,能很快啟動。

所以我認為,作為滿足最低通用需求的選項,它非常好。只要你不是要做到每秒一百萬次事務(wù),也不是要支撐一個 PB 級的數(shù)據(jù)倉庫,它都完全夠用。也就是說,在低端場景里,那個“通用解”就是 Postgres,絕對沒問題;但到了高端場景,這個結(jié)論就不成立了。

2 索引一出現(xiàn),GPU 就很難發(fā)揮作用

主持人:GPU 會不會給數(shù)據(jù)庫優(yōu)化帶來一些新的機會?

Mike Stonebraker:也許會。但我覺得最大的挑戰(zhàn)在于,GPU 本質(zhì)上是 SIMD,也就是 single instruction, multiple data,單指令多數(shù)據(jù)。而這和索引恰恰是相沖突的。

只要索引是正確答案,GPU 大概率就不是一個好答案。

另外,你還得把整個系統(tǒng)架構(gòu)好,確保從存儲到計算的帶寬不會成為瓶頸。如果 GPU 只是掛在 CPU 旁邊做個附加件,那很多時候 CPU 和 GPU 之間那條總線本身就成了瓶頸。

主持人:你能解釋一下,為什么在 SIMD 這種模式下,索引效果會變差嗎?

Mike Stonebraker:比如說,我現(xiàn)在要查 Ryan 的工資,我手上有一棵 B 樹。你先訪問 B 樹根節(jié)點,找到那個把 Ryan 分到某一邊的分隔鍵,然后沿著指針往下走,這就是一次確定無疑的內(nèi)存訪問。接著再做一遍,再做一遍,通常要重復三四次。

這種過程是很難并行化的。所以答案就是,索引本身就不適合并行化。

主持人:你剛提到 B 樹。那你們最早實現(xiàn) Ingres 第一版的時候,這些東西都是手寫的嗎?我猜那時候應(yīng)該也沒有現(xiàn)成的 B 樹庫可用吧?

Mike Stonebraker:對,Ingres 最早的版本全部都是從零寫的。

主持人:那里面最難實現(xiàn)的部分是什么?

Mike Stonebraker:查詢優(yōu)化器。

主持人:為什么它這么難?

Mike Stonebraker:因為它真的難。這東西在算法層面就很復雜。直到今天,如果你去問任何資深數(shù)據(jù)庫程序員,系統(tǒng)里最難的部分是什么,他們大概率還是會說,優(yōu)化器。

3 Google 是選錯了方向,Amazon 是選太多方向

主持人:MapReduce 在 2000 年代初出來之后,幾乎一下子席卷了整個數(shù)據(jù)領(lǐng)域。很多人都非常震撼,覺得 Google 真懂,覺得這就是最先進的東西。但看你當年的論文和觀點,你似乎非常不認同。你為什么那么強烈反對 MapReduce?

Mike Stonebraker:因為當時有很多其實并不怎么明白的人,會想當然地覺得,Google 很聰明,他們一定知道自己在干什么,所以我們照著做就行了。于是大家就開始搞 Hadoop,或者往 Hadoop 那套上靠。

但 Hadoop 的效率低得離譜。

當時像 Dave DeWitt,還有參與我們 2011 年那篇論文的其他人,我們都懂分布式數(shù)據(jù)庫,也知道用分布式數(shù)據(jù)庫系統(tǒng)可以把 Hadoop 打得很慘。我們 2011 年那篇論文基本上講的就是這件事。后來事實也證明,確實如此。

但 Google 做蠢事不止這一件。

他們當時還認為,eventual consistency,也就是最終一致性,是正確的并發(fā)控制方式。這在那個時期也是 Google 從上往下灌輸?shù)囊惶讝|西。但這根本不對。所有數(shù)據(jù)庫領(lǐng)域的人都在說,你們簡直瘋了,因為它只解決一種非常特定的問題,而且這種問題在真實世界里其實很少見。

主持人:那他們?yōu)槭裁磿プ非?eventual consistency(最終一致性)?

Mike Stonebraker:設(shè)想一下,你有一個東海岸數(shù)據(jù)庫和一個西海岸數(shù)據(jù)庫,它們互為副本,你希望兩邊保持一致。

如果我現(xiàn)在要做一個事務(wù),把西海岸倉庫里某種商品的庫存減一,那在提交事務(wù)之前,我就得把這個更新同步到東海岸,再確認那邊也更新成功。然后為了確保整個提交真正完成,還要再來一次往返通信,確認兩邊都正確提交了。分布式提交就是這么貴,到今天也還是貴。

于是就有人想,那我只在西海岸先把庫存減一,然后異步發(fā)一條消息過去,不把它放在事務(wù)里,這樣東海岸那邊“最終”也會減一。

反過來,如果東海岸那邊也賣掉了一件,它也異步發(fā)消息過去,最后兩邊慢慢收斂成一致。

問題在于,如果系統(tǒng)允許庫存降到 0 以下,那就會出現(xiàn)一種情況:東海岸和西海岸的人同時賣掉最后一件貨。最終系統(tǒng)里的庫存就會變成負一。也就是說,有一個人最終拿不到貨。

如果你像 Amazon 一樣,可以說“通常 24 小時內(nèi)發(fā)貨”,那你也許還能接受一定程度的超賣。但大多數(shù)企業(yè)做不到。所以 eventual consistency 根本行不通。

我們很久以前提到過 referential integrity,參照完整性。其實在銷售系統(tǒng)里,也有類似的完整性約束,比如“庫存必須大于等于 0”。而 eventual consistency 在這種約束下就是會失效。

后來 Google 的 Jeff Dean 終于也意識到了這個問題。等他們做 Spanner 的時候,Spanner 用的就是傳統(tǒng)事務(wù)系統(tǒng)。也就是說,Google 后來徹底放棄了 eventual consistency,也徹底放棄了 MapReduce。

主持人:所以本質(zhì)上的權(quán)衡,就是用正確性換性能?

Mike Stonebraker:對,就是性能和數(shù)據(jù)完整性之間的權(quán)衡。如果你根本不在乎你的數(shù)據(jù),那你當然可以接受這些糟糕的后果。

主持人:那 Google 當年做這些你認為明顯錯誤的事情時,你有沒有和他們團隊交流過?

Mike Stonebraker:我們在 2011 年那篇論文之前找他們聊過。我們說,要不要合作做點東西?但他們沒興趣,直接拒絕了。

主持人:除了 Google,你在別的大科技公司身上,也見過類似你明確不認同的數(shù)據(jù)庫方案嗎?比如 Amazon 或 Facebook?

Mike Stonebraker:我大概三年前去 Amazon 做過一次演講,當時我把我認為他們做錯的地方全都講了一遍。

我覺得 Amazon 的問題在于,他們同時支持大概 15 種不同的數(shù)據(jù)庫系統(tǒng),而這大概多了 12 種。

我覺得這和他們自己的文化有關(guān)。我當時就跟他們說,你們支持的數(shù)據(jù)庫種類太多了。但到現(xiàn)在為止,他們也沒有決定淘汰任何一種。

主持人:為什么你覺得 15 種應(yīng)該縮到 3 種?

Mike Stonebraker:因為他們支持圖數(shù)據(jù)庫,而大家其實早就知道,圖數(shù)據(jù)庫幾乎從來都不是性能最優(yōu)的方案。

如果你喜歡圖那種節(jié)點和邊的用戶界面,沒問題。你完全可以在關(guān)系型數(shù)據(jù)庫上面加一層,把這種用戶模型提供給你。

他們現(xiàn)在很多數(shù)據(jù)庫系統(tǒng),其實都有別的數(shù)據(jù)庫在做同樣的事,而且做得更好。所以結(jié)論就是,那些性能不夠好、市場規(guī)模又不足以支撐維護成本的數(shù)據(jù)庫,都應(yīng)該被淘汰。

主持人:你一直以學術(shù)界的身份,對整個行業(yè)產(chǎn)生了非常大的影響。我有一個問題一直很好奇:你為什么不直接去工業(yè)界工作?比如去 AWS 之類的公司,做一個資深的 distinguished engineer,不是也一樣能施加影響嗎?為什么你更喜歡待在學術(shù)界,用現(xiàn)在這種方式發(fā)揮作用?

Mike Stonebraker:因為那樣你就會有老板。你會被公司的規(guī)則束縛,發(fā)表論文會受限制,去會議上演講會受限制,連去研究競爭對手在做什么也會受限制,因為很多東西公司不會愿意讓你對外談,尤其不會愿意讓你去碰競爭對手不想公開的事。

不過更重要的是,我真的很喜歡待在創(chuàng)業(yè)公司里。Postgres 的商業(yè)版后來被 Informix 收購之后,我曾經(jīng)在 Informix 兼職工作。那是一家兩千人的公司,我完全感覺不到自己能帶來什么變化,因為那里充滿了官僚氣,基本上總裁想怎樣就怎樣。

所以我覺得我大概不適合那種環(huán)境。我不擅長搞辦公室政治,也不擅長和那些我覺得不聰明的人打交道。所以歸根結(jié)底,我和大公司確實有點合不來。

4 把 Linux 上半部分,換成數(shù)據(jù)庫

主持人:我想聊聊 Deboss。我覺得這是個很有意思的技術(shù)模型。你能不能解釋一下,Deboss 到底是什么?

Mike Stonebraker:這個學術(shù)項目大概是 2019 年、2020 年左右開始的。它的緣起,和 Matei Zaharia 有很大關(guān)系。他當時既是斯坦福的教授,也是 Databricks 的聯(lián)合創(chuàng)始人,還是 Spark 最早的作者。

他說,Databricks 當時本質(zhì)上是在云上跑用戶的 Spark 作業(yè)。任何一個時刻,他們都可能在同時調(diào)度上百萬個 Spark 任務(wù)。所以他們必須寫一個能夠在百萬規(guī)模上決定“下一個該跑誰”的調(diào)度器。

他說,他們試過操作系統(tǒng)領(lǐng)域的人寫的各種調(diào)度器,但都擴展不上去。最后他們把所有調(diào)度數(shù)據(jù)都放進了 Postgres 數(shù)據(jù)庫里,本質(zhì)上是由一個 Postgres 應(yīng)用來做調(diào)度。

這件事一下子就點醒了我們。因為歸根結(jié)底,操作系統(tǒng)里大多數(shù)事情,本質(zhì)上都是在大規(guī)模地管理數(shù)據(jù)。而這類事情,本來就應(yīng)該用數(shù)據(jù)庫技術(shù)來做。所以我們的想法就變成了:為什么不干脆把 Linux 至少上半部分,用數(shù)據(jù)庫系統(tǒng)替換掉?

這就是那個學術(shù)項目最初的核心。我們在 2020 年代初,和伯克利、斯坦福一起做這件事,結(jié)果非常成功,清楚地證明了這條路是能走通的。

在這個過程中,斯坦福那邊還給 JavaScript 做了一層擴展,因為你總得有一個編程環(huán)境,能和底層實現(xiàn)通信。如果你上面跑的是某種編程語言,下面承載它的“操作系統(tǒng)”本質(zhì)上又是一個數(shù)據(jù)庫,那最自然的做法,就是把所有狀態(tài)都放進數(shù)據(jù)庫里。他們也正是這么做的。

于是我們手里就同時有了一個新的編程語言模型,和一個新的操作系統(tǒng)模型。接下來很自然的問題就是,能不能把它做成一家公司?后來我們?nèi)フ绎L投,幾乎所有人的回答都一樣:如果你們覺得自己能替代 Linux,那就是在做夢。不過,你們這套編程語言的東西倒是挺有意思。

因為我們實際上做的是一種 JavaScript 擴展,它可以讓任意程序天然擁有數(shù)據(jù)庫系統(tǒng)的很多優(yōu)點。比如狀態(tài)是持久化的,可以有事務(wù),失敗之后可以自動 failover,等等,都是那類非常好用的能力。所以我們在 2023 年拿到了融資,成立了 Deboss 公司。項目一直就叫這個名字,所以公司也沿用了這個名字。不過本質(zhì)上,我們做的其實已經(jīng)更接近編程語言業(yè)務(wù)了。

現(xiàn)在 Deboss 提供了一套 TypeScript、一套 Java、一套 Go 和一套 Python,它們基本是無縫的。你寫出來看起來就像普通原生程序一樣。

在云時代,幾乎所有因素都在推動你把應(yīng)用組織成 workflow。所以我們決定,直接支持工作流系統(tǒng)。Deboss 在這四種語言里提供的 workflow 模型里,每一步,也就是每個小的 micro app,無論你怎么叫它,都是事務(wù)性的。整個 workflow 是持久化的,也就是說一旦某一步完成了,它不會被忘掉。

而且很明顯,如果市場有這個需求,我們也可以把整個 workflow 做成原子性的。也就是說,整個流程要么完整執(zhí)行完,要么看起來就像從來沒發(fā)生過。所以它有很多非常好的性質(zhì),而且速度比現(xiàn)有競品快得多,用起來也容易得多。公司現(xiàn)在就在這個方向上持續(xù)賣產(chǎn)品和做創(chuàng)新。

說白了,就是你要把應(yīng)用的狀態(tài)做成持久化,那就把它放進數(shù)據(jù)庫;然后再想辦法把它做快。我覺得他們現(xiàn)在的商業(yè)模式,和我們前面聊的也很一致,就是先把最底層、最直接使用這些東西的程序員吸引進來。

我們一直在做的事情就是:去問這些一線程序員,你們?nèi)笔裁?,我們還沒有什么;然后盡快把這些能力補上,再說服他們來試。我們在創(chuàng)業(yè)公司這邊已經(jīng)做得非常成功了,因為這些公司只想選最好的東西?,F(xiàn)在我們也開始慢慢打進大公司。

這是一個很有意思的市場。到目前為止,大概三分之二的客戶都在做 agentic AI。也就是說,他們有一個大語言模型,外面再包一層各種組件,給它補充更多信號。

而目前大多數(shù) agentic AI,其實還是只讀型的。比如你要預測 Ryan 會不會是一個好客戶,那么系統(tǒng)只是跑一堆邏輯,最后產(chǎn)出一個結(jié)果交給別人。它本質(zhì)上是 read-only,并不會真的去修改 Ryan 的信用評分之類的東西。

但我覺得很快,整個世界都會轉(zhuǎn)向讓 agent 去做 read-write 的應(yīng)用。一旦到了那一步,這類系統(tǒng)就會變得非?!皵?shù)據(jù)庫化”,而 Deboss 恰恰非常擅長處理這種東西。

比如說,你想寫一個 agent,或者兩個 agent,讓它們把我賬戶里的 100 美元轉(zhuǎn)到你賬戶里。那它們就必須先扣掉我的余額,再給你的余額加上 100,而且兩個 agent 必須就“提交”這件事達成一致,否則就得把一切回滾。

換句話說,這個 workflow 必須是我前面說的 atomic,也就是要么全部發(fā)生,要么看起來從未發(fā)生。

所以我覺得,這個市場里的需求接下來還會繼續(xù)升級,大家會越來越希望這些系統(tǒng)不僅能讀,還能寫。我認為這對整個市場是利好,對 Deboss 也是利好。

主持人:那現(xiàn)在市場上提供給應(yīng)用開發(fā)者的這個產(chǎn)品,和最初那個研究項目已經(jīng)不太一樣了。最初那個項目是真的打算把操作系統(tǒng)內(nèi)部的核心狀態(tài)都替換成數(shù)據(jù)庫。我得說,這真的很酷。我以前從來沒想過,操作系統(tǒng)所有狀態(tài)都能放進數(shù)據(jù)庫里。不過這里面總該有些代價吧?

Mike Stonebraker:其實沒有什么明顯的代價。一個構(gòu)建在 DBMS 之上的文件系統(tǒng),比 Linux 文件系統(tǒng)更快。調(diào)度引擎的性能,也能和其他調(diào)度引擎打平。你還可以讓所有東西都具備 failover 能力,也就是說,你幾乎不用再額外做什么,就能得到高可用。

所以答案是,基本沒什么缺點。

主持人:那 Linux 為什么不把這套東西吸收進去,自己升級掉呢?

Mike Stonebraker:理論上他們應(yīng)該這么做。換句話說,底下那些設(shè)備驅(qū)動之類的臟活累活當然還是應(yīng)該保留,因為那部分東西太多了,也沒人想重寫。但除此之外,其他部分都應(yīng)該被數(shù)據(jù)庫式實現(xiàn)替代。

主持人:你跟 Linux 圈子的人提過這件事嗎?他們通常是什么反應(yīng)?

Mike Stonebraker:在當年的學術(shù)項目階段,只要我把這個想法講給操作系統(tǒng)領(lǐng)域的人聽,他們就會非常有威脅感,覺得這是數(shù)據(jù)庫那幫人要來搶地盤了。

編程語言領(lǐng)域的人也差不多。他們也會覺得,怎么,你現(xiàn)在是說編程環(huán)境的 runtime 也該用數(shù)據(jù)庫來實現(xiàn)?

主持人:這個很有意思。如果它在技術(shù)上真的是對的,那也許遲早會接管掉現(xiàn)有方案。

Mike Stonebraker:Java 花了 10 年才被廣泛接受。我只是覺得,這種事情的時間常數(shù)本來就很大。

5 在真實數(shù)據(jù)倉庫里,LLM 寫 SQL 的準確率是 0%

主持人:我們前面聊了很多數(shù)據(jù)庫的過去。我也很好奇,你怎么看數(shù)據(jù)庫領(lǐng)域那些還沒解決的問題,以及未來會是什么樣子?

Mike Stonebraker:這里我想講兩件事。第一件是,和其他人一樣,大概三年前,我們開始研究大語言模型到底適合做什么。

我們一直在嘗試把現(xiàn)在所謂的 text-to-SQL 用到真實世界的數(shù)據(jù)庫上,尤其是真實世界的數(shù)據(jù)倉庫。我們已經(jīng)在四個真實生產(chǎn)環(huán)境的數(shù)據(jù)倉庫上測試過這項技術(shù)。我們拿到了這些系統(tǒng)里真實的工作負載,也就是實際用戶在系統(tǒng)里跑過的查詢,然后再反向還原出與這些 SQL 對應(yīng)的自然語言描述。

所以我們手里現(xiàn)在有四套 benchmark,每套都同時包含文本和 SQL。

主持人:你說的 text-to-SQL,是指人類用自然語言去提示模型嗎?比如我直接用英文說一句話?

Mike Stonebraker:對,比如“把所有四歲以上的人找出來”,或者“告訴我 MIT 所有拿過圖靈獎的教授”。按這個說法,大語言模型應(yīng)該很擅長做這種事。

現(xiàn)在公開的 text-to-SQL benchmark 里,有一個叫 Spider,另一個叫 Bird。最好的大語言模型系統(tǒng)在這些 benchmark 上表現(xiàn)其實還不錯,準確率大概能到 80% 甚至更高。算不上超人類,但已經(jīng)相當不錯了,已經(jīng)到了你會認真考慮拿來用的程度?,F(xiàn)在排行榜上的成績差不多是 85% 的準確率。也就是說,你會覺得它可能還沒完全 ready for prime time,但看上去已經(jīng)很接近了。

但在我們的 benchmark 上,大語言模型的準確率是 0%。如果你再給它加上 RAG 之類各種增強技巧,準確率能到 10%。如果你在 prompt 里直接把 from clause 給它,也就是把實際要訪問的表、實際要做的 join 條件全都告訴它,那準確率大概能到 35%。

所以,這項技術(shù)按“能不能上生產(chǎn)”這個標準來看,還完全不夠格,而且短時間內(nèi)都看不到真正能上生產(chǎn)的可能,甚至可能永遠都到不了那一步。

主持人:差別到底出在哪里?

Mike Stonebraker:第一,數(shù)據(jù)倉庫里的數(shù)據(jù)并不在大模型的訓練語料里。大語言模型基本是拿公開語料訓練出來的,而數(shù)據(jù)倉庫里的真實業(yè)務(wù)數(shù)據(jù)根本不在里面。有一句老話說得很對:如果模型以前沒見過這些數(shù)據(jù),至少沒反復見過幾次,那它基本不可能把它正確“吐”出來。這是第一點。

第二,Spider 和 Bird 這類 benchmark 里的查詢復雜度,大概也就是 10 到 20 行 SQL。但真實世界的數(shù)據(jù)倉庫里,SQL 往往是 100 行起步,復雜度根本不是一個量級。

第三,Spider 和 Bird 的 schema 很干凈。表名都很直觀,列名也很直觀,沒有冗余。但數(shù)據(jù)倉庫不是這樣。數(shù)據(jù)倉庫里經(jīng)常到處都是物化視圖,這意味著大量冗余;列名也經(jīng)常是那種帶下劃線、縮寫一堆、看起來根本猜不出含義的命名方式,完全不直觀。

這會讓問題變得困難得多。再加上,真實系統(tǒng)里還有大量非?!氨镜鼗钡?、非常特殊的數(shù)據(jù)。比如 MIT 有個 “J-term”,指的是一月份一個月的學期。這并不是 MIT 獨有,但也絕不是那種足夠常見、足夠普及、能出現(xiàn)在訓練語料里的概念。

所以,數(shù)據(jù)不在訓練集里,查詢更復雜,schema 又是一團亂麻,再加上一堆系統(tǒng)特有的數(shù)據(jù),這幾件事疊在一起,就讓這套東西根本跑不起來。而且我知道的每一個數(shù)據(jù)倉庫,基本都符合這些特征。所以我的判斷是,這項技術(shù)現(xiàn)在不行,短期內(nèi)也不會行。

主持人:那你們現(xiàn)在怎么做?

Mike Stonebraker:首先,我們把自己的 benchmark 發(fā)出來了,叫 Beaver。它是那四個真實數(shù)據(jù)倉庫做過匿名化和抽象化處理之后形成的版本。所以,如果有人真覺得自己特別擅長做 text-to-SQL,那就來跑一個真正像樣的 benchmark,不要再拿那些“假的” benchmark 自我感覺良好。

第二,結(jié)合我剛才說的這些問題,如果你沒有 join 條件,沒有 from 子句,那基本就已經(jīng)沒戲了。更進一步,如果你不能把一個復雜查詢拆成更簡單的幾部分,你也還是沒戲。

所以這讓我覺得,真正合理的做法是,把檢索系統(tǒng)拿到的輸入先變成更簡單的片段,而且這些片段里要明確包含 from 子句和 join 條件。這是第一點。

第二點是,一旦你要同時跟兩個不同的結(jié)構(gòu)化數(shù)據(jù)庫打交道,比如一個數(shù)據(jù)倉庫再加一個 CRM 系統(tǒng),那在我看來,用大模型去做結(jié)構(gòu)化數(shù)據(jù)之間的 join,就是個餿主意。你最好還是把它們保留成表,用 SQL 去做 join,這樣靠譜得多。

所以我們現(xiàn)在的思路是,盡量把一切都變成表。比如我們現(xiàn)在在和德國慕尼黑市交通部門合作,他們有六個全職員工,專門回復市民投訴和咨詢。問題五花八門,比如“為什么我家門口那個路口,綠燈時間不夠我走過去?”“為什么有軌電車停站時間不夠我上車?”“為什么這趟電車一小時才來一班?”全是這種問題。

而他們背后的數(shù)據(jù)來源非常雜。電車時刻表是 SQL,紅綠燈時序是 SQL,路口信息是 CAD,德國聯(lián)邦層面的交通法規(guī)是文本,慕尼黑市自己的法規(guī)也是文本。也就是說,你得把 SQL、SQL、CAD、文本、文本,這幾類東西做關(guān)聯(lián)。

我們的思路就是,把它們?nèi)嫁D(zhuǎn)成 SQL,或者說全都轉(zhuǎn)成表,再用一種本質(zhì)上接近查詢優(yōu)化器的方式去做 join。這就是我們現(xiàn)在在做的事情。我相信別人會有別的思路,但我覺得這個方向非常有潛力,因為大家真的非常想把這件事做成。這是第一件事。

第二件事,是我們前面聊過的 agentic AI。只要它從只讀走向可讀可寫,它立刻就會變成一個分布式數(shù)據(jù)庫問題。你需要原子性、一致性,所有這些老問題都會重新回來。我覺得這也是一個非常有意思的方向。所以現(xiàn)在我主要就在做這些事情。

主持人:在你們這個 benchmark 上,大模型現(xiàn)在是 0%。那人類大概能到多少?比如一個真的懂 SQL 的人,平均能做到什么水平?

Mike Stonebraker:只要你先把自然語言里的歧義消掉,一個熟悉 SQL、也看得懂 schema 的程序員,準確率會非常高。

主持人:比如 90% 以上?

Mike Stonebraker:對,至少是這個量級。

主持人:明白了。老實說,我還是有點驚訝,大模型在這種 benchmark 上居然會低成這樣。也許等這期節(jié)目播出去之后,會有 Anthropic 那邊的人聯(lián)系你,說我們來試試看之類的。

Mike Stonebraker:我很愿意知道他們能做到什么程度。因為這對那些真想深入理解數(shù)據(jù)庫的人來說,其實是個很好的機會。

6 計算機科學,可能不再是增長型行業(yè)

主持人:如果有人想系統(tǒng)學習數(shù)據(jù)庫,你會推薦什么技術(shù)書或者論文材料?

Mike Stonebraker:我和 Joe Hellerstein 出過一本“紅皮書”,名字就叫 Readings in Database Systems。雖然現(xiàn)在已經(jīng)是八年前的書了,但如果你想看八年前以及更早那些經(jīng)典材料,我覺得它仍然是一套非常好的閱讀入口。再往后的話,就去看數(shù)據(jù)庫領(lǐng)域后來那些比較重要、比較流行的論文。

主持人:如果你能回到剛畢業(yè)的時候,帶著今天的認知給自己一些建議,你會說什么?

Mike Stonebraker:當年我剛到伯克利任教時,幾乎沒多想,就說那我們來寫一個數(shù)據(jù)庫系統(tǒng)吧??赡菚r候我們對數(shù)據(jù)庫幾乎一無所知,對實現(xiàn)也一無所知,編程能力也不像 Bill Joy 那樣強。所以,一上來就做這么瘋狂的事,其實本身就非常瘋狂。

但人就是這樣,先狠狠干,邊做邊學,邊學邊把事情做出來。所以我覺得答案就是,要跳出框框去想,要敢想一些瘋狂的念頭,然后真的去做。

不過對我來說,現(xiàn)在更值得問的問題其實是:如果你今天才剛開始,你會選什么專業(yè)?

因為我覺得,計算機科學未來很可能不再是一個增長型行業(yè)。我不確定我今天還會不會建議 18 歲的人去學計算機。

醫(yī)療保健和各種建筑、維修這類工種,看起來都還是相對安全的選擇;其他很多方向,風險都大得多。

當然,如果你已經(jīng)快拿到 PhD,正在考慮接下來怎么辦,那事情就簡單多了。去拿你能拿到的最有聲望的工作,找一個愿意帶你的導師,然后挑一個不是順著潮流走的方向。比如我們現(xiàn)在做的這個 Rubicon,就絕對不是順著主流在跑。所以,去找一個不隨大流的方向,想辦法把它做成。

我和我太太以前都跟孩子說過一句話:“去追隨你的熱情,錢總會自己解決。”但說實話,我一點都不信這句話。不過我覺得,你還是只能這么跟孩子說,跟孫子也只能這么說。

主持人:如果你自己并不相信這句話,為什么還要這么說?

Mike Stonebraker:我太太就是個很好的例子。她本科是計算機科學,碩士也是計算機科學,但她其實真正想做的是老師,中小學老師。可她父母當時跟她說,這不行,收入太低了。

我覺得她從那以后,一直都對這個決定有遺憾。她并不是真的熱愛計算機科學,那對她來說只是個謀生手段。

所以我覺得,還是應(yīng)該去找一件你真正有熱情的事。這樣至少你不會挨餓。你可能不會賺很多錢,但大概率會比做一件自己根本沒熱情的事過得更開心。

因為我認識很多人,他們把工作純粹當成工作,真正的生活只發(fā)生在下午 5 點到第二天早上 8 點之間。我完全不是這種感覺。我是真的很喜歡我在做的事。無論我賺很多錢還是沒賺很多錢,這一點都不會變。

原視頻鏈接:

https://www.youtube.com/watch?v=YPObBOwIrHk

聲明:本文為 InfoQ 整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

「AMD AI 開發(fā)者日 2026」定檔,不僅能聽到前沿 AI 技術(shù)分享,更能參與專家指導的實戰(zhàn)工作坊,5 月 19 日上海見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
果然擁抱人民幣是個幌子,阿聯(lián)酋要與美國一起掀起桌子了!

果然擁抱人民幣是個幌子,阿聯(lián)酋要與美國一起掀起桌子了!

瑛派兒老黃
2026-04-30 19:47:01
默多克家族內(nèi)幕:10年后才發(fā)現(xiàn),鄧文迪離婚協(xié)議暗藏5億股權(quán)絕殺

默多克家族內(nèi)幕:10年后才發(fā)現(xiàn),鄧文迪離婚協(xié)議暗藏5億股權(quán)絕殺

星宇共鳴
2026-01-06 10:27:48
人到晚年才明白,有錢有房有兒女,都不如打好晚年的“小九九”

人到晚年才明白,有錢有房有兒女,都不如打好晚年的“小九九”

人間百態(tài)大全
2026-05-01 06:35:03
華為鴻蒙 7.0正式官宣,6月12日,正式發(fā)布

華為鴻蒙 7.0正式官宣,6月12日,正式發(fā)布

科技堡壘
2026-04-30 09:30:00
胃熱是光吃不拉,脾虛是一吃就拉,肝郁是不停放屁,中醫(yī)一招調(diào)理

胃熱是光吃不拉,脾虛是一吃就拉,肝郁是不停放屁,中醫(yī)一招調(diào)理

垚垚分享健康
2026-04-29 11:24:29
日本準備戰(zhàn)爭,要打誰?48小時內(nèi),中國兩大軍媒下場“算總賬”

日本準備戰(zhàn)爭,要打誰?48小時內(nèi),中國兩大軍媒下場“算總賬”

混沌錄
2026-04-30 18:09:25
土耳其、巴西、約旦、巴基斯坦、西班牙等11國,發(fā)表聯(lián)合聲明

土耳其、巴西、約旦、巴基斯坦、西班牙等11國,發(fā)表聯(lián)合聲明

極目新聞
2026-05-01 07:38:52
自稱“上海大哥”的刑滿釋放人員,在某短視頻平臺接受博主采訪時,講述自己當年“用一拳把人打死”以及坐牢32年的經(jīng)歷,被檢察機關(guān)處罰

自稱“上海大哥”的刑滿釋放人員,在某短視頻平臺接受博主采訪時,講述自己當年“用一拳把人打死”以及坐牢32年的經(jīng)歷,被檢察機關(guān)處罰

都市快報橙柿互動
2026-04-30 23:43:47
2026北京車展,杜比將座艙娛樂體驗推向新高度

2026北京車展,杜比將座艙娛樂體驗推向新高度

雷科技
2026-04-30 18:28:10
1947年晉南大捷,陳賡向毛主席要酒喝,被拆穿:別演了,有話直說

1947年晉南大捷,陳賡向毛主席要酒喝,被拆穿:別演了,有話直說

簡史檔案館
2026-04-30 11:05:03
“張雪的機車”,賬號被封禁!

“張雪的機車”,賬號被封禁!

營銷報
2026-04-07 13:54:34
能不能發(fā)生關(guān)系,為何永遠都是女人說了算?

能不能發(fā)生關(guān)系,為何永遠都是女人說了算?

朗威談星座
2026-04-13 10:33:16
5月1日正式實施!鄉(xiāng)鎮(zhèn)衛(wèi)生院全面升級,農(nóng)村看病再也不用跑縣城

5月1日正式實施!鄉(xiāng)鎮(zhèn)衛(wèi)生院全面升級,農(nóng)村看病再也不用跑縣城

老特有話說
2026-04-30 13:13:39
庫克:iPhone17有史以來最受歡迎,供不應(yīng)求!

庫克:iPhone17有史以來最受歡迎,供不應(yīng)求!

果粉之家
2026-05-01 12:30:23
何潤東沒收錢!官方緊急回應(yīng)!

何潤東沒收錢!官方緊急回應(yīng)!

廣告創(chuàng)意
2026-05-01 12:17:42
中央明確了!社保最低繳費年限要提高,70、80后得早做準備

中央明確了!社保最低繳費年限要提高,70、80后得早做準備

云鵬敘事
2026-04-12 16:36:39
相親被姑娘當面說沒看上,臨走偷塞我紙條,打開后我愣在原地

相親被姑娘當面說沒看上,臨走偷塞我紙條,打開后我愣在原地

曉艾故事匯
2025-11-27 08:10:07
王健林時代落幕,輸給了這個靠趙薇起家、截胡許家印的湖北富豪!

王健林時代落幕,輸給了這個靠趙薇起家、截胡許家印的湖北富豪!

八斗小先生
2026-04-30 10:57:23
烏媒:中國拆除所有俄羅斯部件,將“現(xiàn)代”級改造為自己的驅(qū)逐艦

烏媒:中國拆除所有俄羅斯部件,將“現(xiàn)代”級改造為自己的驅(qū)逐艦

素衣讀史
2026-04-28 22:01:12
墨菲談開球K球堆:我堅信,一定有比我們用了100年更好的開球方法

墨菲談開球K球堆:我堅信,一定有比我們用了100年更好的開球方法

天光破云來
2026-05-01 08:00:04
2026-05-01 13:08:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
12328文章數(shù) 51868關(guān)注度
往期回顧 全部

科技要聞

蘋果上季在華收入繼續(xù)大增 iPhone收入新高

頭條要聞

銀行員工轉(zhuǎn)走儲戶1800萬元喝藥輕生 官方最新回應(yīng)

頭條要聞

銀行員工轉(zhuǎn)走儲戶1800萬元喝藥輕生 官方最新回應(yīng)

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發(fā)?

娛樂要聞

鄧超在景德鎮(zhèn)被偶遇,穿黑外套逛茶園

財經(jīng)要聞

GPU神話松動,AI真正的戰(zhàn)場變了

汽車要聞

專訪捷途汪如生:捷途雙線作戰(zhàn) 全球化全面落地

態(tài)度原創(chuàng)

健康
時尚
房產(chǎn)
親子
本地

干細胞治燒燙傷面臨這些“瓶頸”

今年夏天的裙子,長長長長一點更好看!

房產(chǎn)要聞

所有戶型全賣爆!??赥OP級豪宅,景觀樣板間五一全線開放!

親子要聞

科普|孩子為何白天不咳晚上咳

本地新聞

用青花瓷的方式,打開西溪濕地

無障礙瀏覽 進入關(guān)懷版