国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

不再迷信Hackathon,把Agent推翻重做了4次!Notion負(fù)責(zé)人復(fù)盤:做AI產(chǎn)品如何避免“逆流而上”?

0
分享至


撞了 3 年墻才上線 Custom Agents,Notion 的兩位負(fù)責(zé)人認(rèn)為,AI 真正替代的不是人,而是流程。

編譯 | 王啟隆

出品丨AI 科技大本營(yíng)(ID:rgznai100)

很多人現(xiàn)在做 Agent,第一反應(yīng)還是給模型加工具。

工具不夠,就繼續(xù)加工具。system prompt 不夠,就繼續(xù)堆 system prompt。模型不穩(wěn)定,就換一個(gè)更強(qiáng)的模型?勺鲋鲋銜(huì)發(fā)現(xiàn)問題并不只是模型夠不夠聰明,也不只是工具調(diào)不調(diào)得動(dòng),而是這套東西到底要長(zhǎng)在哪兒,它跟原來的產(chǎn)品、權(quán)限、組織和工作流,究竟怎么接上。

這是我最近看 Latent Space 對(duì) Notion 的一場(chǎng)播客時(shí),最強(qiáng)烈的感受。

這期節(jié)目里,主持人找來的是 Notion 負(fù)責(zé) AI engineering 的Sarah Sachs(右2),以及長(zhǎng)期主導(dǎo)產(chǎn)品和原型方向的Simon Last(右1)。背景也很明確,Notion 剛剛上線Custom Agents。表面上看,這像是又一個(gè)大廠把 agent 做進(jìn)辦公軟件里的故事。


他們聊的并不只是一個(gè)新功能怎么發(fā)布,而是 Notion 這幾年怎么把 Agent 這件事推倒重來四五次,才慢慢摸到一條能成立的路。

這里面最有信息量的地方,不是某個(gè) demo 漂不漂亮,也不是 system prompt 寫得多巧,而是他們把幾件原本經(jīng)常被分開談的東西扣在了一起:模型能力、工具抽象、權(quán)限設(shè)計(jì)、評(píng)測(cè)體系、團(tuán)隊(duì)組織,甚至定價(jià)。

換句話說,Notion 想做的并不是一個(gè)掛在軟件外面的會(huì)聊天的助手。

他們更像是在試著把企業(yè)軟件本身,重做成一個(gè)既給人用、也給 agent 用的工作底座。

要點(diǎn)速覽

  • Notion 從 2022 年就開始做 agent,但真正讓他們覺得能往前推的,不是一個(gè)模型突然變聰明了,而是他們重做了四五輪之后,終于把模型、產(chǎn)品和權(quán)限接到了同一套框架里。

  • 編程智能體(Coding Agent)像 AGI 的內(nèi)核,而軟件工廠則是在繼續(xù)把這種能力往團(tuán)隊(duì)協(xié)作和代碼維護(hù)的整條鏈路上推。

  • 應(yīng)用公司做 AI 不是包一層模型就結(jié)束了,而是要判斷自己是不是在逆流而上,要看清模型能力的水流到底往哪邊走。

  • Notion 對(duì) MCP 和 CLI 的態(tài)度也很現(xiàn)實(shí),MCP 更輕、更好控權(quán)限,CLI 更強(qiáng),也更有自舉和自修復(fù)能力。選哪一個(gè),不只是技術(shù)問題,也是能力、權(quán)限和成本怎么對(duì)齊的問題。

  • 比起自己訓(xùn)練一個(gè)基礎(chǔ)模型,Notion 現(xiàn)在更在意的是檢索、排序、搜索這些更貼著 agent 工作流的基礎(chǔ)層,因?yàn)樵絹碓蕉嗨阉髁髁恳呀?jīng)不是人發(fā)起的,而是 agent 發(fā)起的。


不是在追模型熱點(diǎn),而是在等那條河真正改道

主持人(Alessio):恭喜你們最近發(fā)布了自定義智能體。這個(gè)功能折騰了這么久,終于正式上線了,F(xiàn)在回頭看,是什么感覺?

Sarah Sachs:我們的發(fā)布節(jié)奏一直比較穩(wěn)。它其實(shí)已經(jīng)內(nèi)測(cè)了一段時(shí)間。當(dāng)一個(gè)產(chǎn)品走到這個(gè)階段時(shí),一撥人會(huì)盯著怎么把它順利推上線,另一撥人已經(jīng)開始做下一個(gè)版本。所以很多時(shí)候,真正發(fā)布時(shí)的那種成就感,反而會(huì)來得比較晚。


但現(xiàn)在回頭看,還是會(huì)覺得值。大家確實(shí)為它投入了很多力氣,而且今天做 AI 產(chǎn)品,用戶教育也比兩三年前容易多了,大家大致都能看懂你在做什么。這次發(fā)布在免費(fèi)試用和用戶轉(zhuǎn)化上的表現(xiàn),是我們到目前為止最好的一次。三個(gè)月的免費(fèi)試用幫了很大忙。當(dāng)然,后面還有很多東西要繼續(xù)做。

Simon Last:對(duì)我來說,最激動(dòng)的一點(diǎn)是,這套系統(tǒng)大概已經(jīng)被我們重構(gòu)了四次,甚至五次。

主持人(Alessio):畢竟你們從 2022 年就開始做這件事了。

Simon Last:對(duì)。2022 年底,我們剛拿到 GPT-4 的訪問權(quán)限時(shí),腦子里最早冒出來的一個(gè)念頭就是,干脆做一個(gè)智能體,給它 Notion 的全部工具權(quán)限,讓它在后臺(tái)替我們干活。那時(shí)候我們還不怎么叫它智能體,更多還是叫助手。


然后我們?cè)嚵撕芏啻,但那個(gè)時(shí)間點(diǎn)確實(shí)太早了。

主持人(Swyx):你得把這個(gè)“太早了”展開講講。到底哪里不行?

Sarah Sachs:那時(shí)候連函數(shù)調(diào)用都還沒出來。我們?cè)诤颓把貙?shí)驗(yàn)室,還有 Fireworks 這類團(tuán)隊(duì)合作,想微調(diào)一個(gè)能調(diào)用 Notion 函數(shù)的模型。我加入時(shí),這件事已經(jīng)在推進(jìn)了。

Simon Last:對(duì)。我們前后都和 Anthropic、OpenAI 合作過。最開始的時(shí)候,連“工具”這個(gè)概念都還沒有。我們自己設(shè)計(jì)了一套工具調(diào)用框架,然后想辦法去微調(diào)模型,讓它能在多輪對(duì)話里使用這套框架。

但效果并不好。說到底,當(dāng)時(shí)模型還是太笨,上下文窗口也太短。我們?cè)谶@個(gè)問題上磕了很久。中間偶爾也能看到一點(diǎn)希望,但始終沒有到那種既真正能用、又足夠讓人驚艷的程度。

直到去年初 Claude 3 Sonnet 出來,情況才突然有了很大變化。那時(shí)我們開始做去年發(fā)布的那版智能體,之后再一路做到現(xiàn)在的自定義智能體。

不過自定義智能體花的時(shí)間更長(zhǎng),因?yàn)槟悴粌H要讓它能跑,還要讓它足夠可靠,尤其是它在后臺(tái)運(yùn)行的時(shí)候。然后就是權(quán)限、分享、管理界面的設(shè)計(jì)。比如,一個(gè)智能體被分享給某個(gè) Slack 頻道里的一群人,但它又能訪問另一批文檔,這兩批人的權(quán)限邊界怎么解釋清楚,管理員怎么一眼看明白,這些都不是 demo 階段的問題,而是真正做產(chǎn)品一定會(huì)遇到的問題。

Sarah Sachs:歸根結(jié)底,這些問題最后都會(huì)落到同一件事上,角色訪問控制,也就是權(quán)限管理。

主持人(Alessio):我很好奇,在模型能力還不夠的時(shí)候,你們?cè)趺匆?guī)劃路線圖?一方面你得相信模型會(huì)繼續(xù)變強(qiáng),另一方面你們又不是一家零用戶的小公司,你們?cè)?2022 年就已經(jīng)有很大的客戶基礎(chǔ)了。

Simon Last:這始終是一種平衡。你既得有一點(diǎn) AGI 信仰,去為未來布局;你又必須交付當(dāng)下真的有用的東西。我們一直在試著在兩者之間找平衡。

我們的做法更像一個(gè)投資組合。一邊維護(hù)和打磨已經(jīng)發(fā)布、也已經(jīng)跑得不錯(cuò)的功能,一邊始終保留幾個(gè)聽起來有點(diǎn)瘋狂的前沿項(xiàng)目。

主持人(Alessio):那你們現(xiàn)在有哪些這種 AGI 信仰級(jí)別的方向?不用說太細(xì),但我很好奇,有什么是你們現(xiàn)在做著,18 個(gè)月以后大家會(huì)覺得“原來這真的就是答案”的東西?

Simon Last:現(xiàn)在同時(shí)在發(fā)生很多事。一個(gè)越來越清楚的趨勢(shì)是,編程智能體正在變成 AGI 的核心,某種程度上可以說萬物皆可編程智能體。真正讓人興奮的地方,是智能體開始能引導(dǎo)出自己的軟件和能力,然后自己去調(diào)試、維護(hù)它們。

另一個(gè)我特別興奮的方向,是所謂的軟件工廠,F(xiàn)在很多人都在講這個(gè)詞。簡(jiǎn)單說,就是你能不能把開發(fā)、調(diào)試、合并、評(píng)審和維護(hù)代碼庫(kù)、服務(wù)的整個(gè)流程盡可能自動(dòng)化,讓一群智能體在內(nèi)部協(xié)同工作。這套東西到底該怎么設(shè)計(jì),我覺得特別值得做。

Sarah Sachs:如果回到你最開始那個(gè)問題,為什么這件事花了這么久,我覺得大家很容易給出一個(gè)很偷懶的答案,說以前不行,后來推理模型出來了,就行了。

這當(dāng)然是其中一部分,但我覺得真正讓 Notion 每次都能抓住新能力的,是我們一直在練兩種技能。

第一種,是別逆流而上。你得很快判斷清楚,你現(xiàn)在碰到的到底是模型能力本身的天花板,還是因?yàn)槟銢]有給模型正確的信息,沒有搭對(duì)基礎(chǔ)設(shè)施。

第二種,是一旦你確認(rèn)自己不是在逆流而上,就要看清河流真正往哪里走。你要在技術(shù)還沒完全成熟的時(shí)候,就開始搭產(chǎn)品。這樣等它成熟的時(shí)候,你不會(huì)從零開始。

這件事有時(shí)候聽起來很反直覺。比如工具調(diào)用模型還不存在的時(shí)候,我們就在嘗試微調(diào)類似能力。訣竅不是死磕太久,而是意識(shí)到那里有機(jī)會(huì)。

我們其實(shí)有過很多這樣的嘗試。像會(huì)議紀(jì)要功能,在最后正式出來之前,我們?cè)谡Z音轉(zhuǎn)錄上已經(jīng)迭代過很多版了。

Simon Last:那個(gè)我可以講很久。


不是套殼,而是把“怎么工作”重新做一遍

Sarah Sachs:我們和前沿實(shí)驗(yàn)室在模型能力上的合作一直很緊密,但我們自己也必須有一個(gè)很明確的信念,隨著這些能力不斷演進(jìn),Notion 的使命仍然是成為你協(xié)作和工作的最好地方。如果大家的工作方式變了,那 Notion 這個(gè)產(chǎn)品故事也得跟著繼續(xù)往前寫。

主持人(Swyx):對(duì),你之前跟我說過你很喜歡“智能體實(shí)驗(yàn)室”那套理論,其實(shí)就是這個(gè)意思吧。

Sarah Sachs:對(duì)。我給很多候選人看過那套東西。它甚至已經(jīng)成了我 Chrome 里的自動(dòng)補(bǔ)全項(xiàng)。我拿它去解釋,為什么你應(yīng)該來 Notion,而不是去 OpenAI。因?yàn)檫@是兩種完全不同的事情。

這也是為什么我們不是一個(gè)簡(jiǎn)單的套殼公司。雖然說實(shí)話,早期我們做的某些部分,確實(shí)也是在已有能力上做了一層封裝。但那不是推動(dòng)營(yíng)收的核心產(chǎn)品,也不一定是用戶真正需要的東西。

主持人(Alessio):某種意義上,Notion 也可以說是 AWS 的套殼,但這個(gè)殼做得非常精致。

Sarah Sachs:我很喜歡拿 Datadog 和 AWS 來做類比。沒有云存儲(chǔ),Datadog 根本不可能存在,這是它的底座。AWS 自己也有 CloudWatch,但 Datadog 真正懂的是,用戶到底想怎樣監(jiān)控自己的系統(tǒng)。

同樣地,我們真正懂的是,人們希望怎樣協(xié)作。這才是我們的壁壘。

主持人(Alessio):但你們跟 Datadog 又不太一樣。Datadog 面向的是工程團(tuán)隊(duì),用戶比較像;你們是個(gè)平臺(tái),Notion 的終端用戶幾乎可以是任何人。所以這種專業(yè)知識(shí)怎么融進(jìn)產(chǎn)品里?

Simon Last:對(duì),這個(gè)類比到這里就會(huì)有點(diǎn)不一樣。Datadog 這種經(jīng)典垂直 SaaS,理解的是一群相對(duì)窄的人。Notion 一直非常橫向。我們的任務(wù)始終是在兩股有點(diǎn)對(duì)立的力量之間找平衡,一邊是傾聽廣泛客戶群體的需求,一邊是把這些需求拆解成優(yōu)雅、好用的底層原語,同時(shí)還要盡量讓整個(gè)系統(tǒng)保持純粹、易用。

Sarah Sachs:所以我們最后還是會(huì)回到用戶旅程。老實(shí)說,我們團(tuán)隊(duì)最容易跑偏的時(shí)候,往往就是過度關(guān)注“什么工具看起來很酷”。那通常也是我們推進(jìn)最慢的時(shí)候,因?yàn)槟阕罱K總得圍繞某個(gè)真實(shí)用戶旅程來做事。

比如我們每周五都會(huì)坐下來,看那些最消耗 Token 的自定義智能體日志,分析它們?yōu)槭裁幢憩F(xiàn)差,然后砍掉一批不合理的任務(wù)。我們會(huì)堅(jiān)持盯一些必須跑通的場(chǎng)景,比如郵件分類。我們也會(huì)在做聊天功能時(shí)認(rèn)真思考 PDF 導(dǎo)出怎么做好。這里面可能需要構(gòu)建可以訪問計(jì)算機(jī)沙盒、文件系統(tǒng)、還能寫代碼的工具,但我們的出發(fā)點(diǎn)永遠(yuǎn)是“用戶的工作里真的需要導(dǎo)出 PDF”,而不是“哇,做個(gè)計(jì)算機(jī)控制工具好酷,我們來試試”。

如果你不圍繞用戶旅程做事,你的優(yōu)先級(jí)很快就會(huì)失去戰(zhàn)略方向。


真正拉開差距的,不是點(diǎn)子,而是低 ego 的組織能力

主持人(Swyx):你感覺有一套特別鮮明的方法論。你是怎么管理團(tuán)隊(duì)的?

Sarah Sachs:我覺得“怎么和 Sarah 共事”這件事,得看你問誰。團(tuán)隊(duì)成員、合作伙伴、供應(yīng)商的答案可能都不一樣。

但對(duì)我來說,有一個(gè)很重要的轉(zhuǎn)變是,我很早就接受了一點(diǎn),我的工作不是那個(gè)負(fù)責(zé)出最好點(diǎn)子的人,也不是那個(gè)技術(shù)最強(qiáng)的人。我的職責(zé)是,確保每個(gè)人都清楚目標(biāo),有資源去判斷該優(yōu)先做什么,而且有渠道去推進(jìn)他們認(rèn)為重要的事情。

這一點(diǎn)對(duì)所有領(lǐng)導(dǎo)層都成立,但在 AI 團(tuán)隊(duì)里尤其成立。因?yàn)槲覀兒芏嘧詈玫狞c(diǎn)子,都是那些看到了用戶痛點(diǎn),然后自己做出酷炫原型的人提出來的。

如果所有點(diǎn)子都得先經(jīng)過我、產(chǎn)品搭檔,或者 Simon 和 Ivan 的“嗅覺測(cè)試”,那損失會(huì)非常大。因?yàn)槲覀冏龅暮芏嗍拢举|(zhì)上都在探索模型能力邊界。

所以第一點(diǎn),我從不覺得工程領(lǐng)導(dǎo)的角色是層級(jí)式的,F(xiàn)在更不是。我們非常愿意根據(jù)結(jié)果改方向。

第二點(diǎn),當(dāng)你把底層框架重構(gòu)了三四次之后,你就必須建立一個(gè)真正 low-ego 的團(tuán)隊(duì)。能刪自己的代碼,不在乎是不是自己先提的方案,一切以大局為重,也不會(huì)靠寫一堆設(shè)計(jì)文檔來給自己加戲。

在我加入之前,Notion 就已經(jīng)有這種文化了。大家愿意一起上去解決問題,也愿意因?yàn)榍闆r變化而推翻重做。在很多公司里,這種事會(huì)產(chǎn)生巨大摩擦,在 Notion 不會(huì)。

Simon Last:我不像 Sarah 那樣是個(gè)管理者。我的角色更多是盡量把事情想遠(yuǎn)一點(diǎn),確保我們建立在正確的能力基礎(chǔ)上,再去做原型。不斷從頭思考真的非常關(guān)鍵。每次遇到新東西,我都會(huì)問,如果我們從頭來過,會(huì)怎樣。所以我基本上每六個(gè)月就在重復(fù)這個(gè)循環(huán)。

主持人(Alessio):那你們信不信黑客松?

Sarah Sachs:我覺得分兩種情況。

一種是,我們有一批非?煽康馁Y深工程師,他們會(huì)隨時(shí)加入或退出我們內(nèi)部所謂的“Simon 漩渦”,把一些高速變化的東西真正產(chǎn)品化。這種項(xiàng)目不需要黑客松,它需要的是能信任、能快速進(jìn)出的資深工程師。

在這種情況下,組織邊界會(huì)非常松。你可能名義上向這個(gè)人匯報(bào),但現(xiàn)在正在為另一個(gè)人工作。我們?cè)谡泄芾碚邥r(shí),其實(shí)很看重他們能不能接受這種模糊邊界。因?yàn)槲覀兺窃诋a(chǎn)品發(fā)布之后,才慢慢把組織架構(gòu)固化下來。

另一種是,全公司的黑客松。這個(gè)是有的。它更多是為了讓那些平時(shí)不直接做 AI 項(xiàng)目的人,也能停下來學(xué)學(xué)怎么提升自己的生產(chǎn)力,怎么用 Notion 自定義智能體搭東西。黑客松里有一部分內(nèi)容,就是鼓勵(lì)大家從零開始照著教程搭一套自己的工具調(diào)用循環(huán)。

主持人(Swyx):是那個(gè) Compound Engineering 的教程嗎?

Sarah Sachs:對(duì)。我們希望公司里的每個(gè)人都會(huì)用 Claude Code,或者任何他們喜歡的編程智能體,并理解這里面最基礎(chǔ)的原理。所以我們會(huì)專門空出一天半時(shí)間來做這件事。

不過半開玩笑地說,我們做的很多東西在最初都有點(diǎn)像黑客松產(chǎn)物,直到它真正長(zhǎng)大,穿上“大人的衣服”,有了推廣計(jì)劃、數(shù)據(jù)科學(xué)家、完整的產(chǎn)品運(yùn)營(yíng)節(jié)奏。

主持人(Alessio):那也得先過安全審查和企業(yè)合規(guī)吧。

Sarah Sachs:實(shí)際上,安全審查往往是我們最早引入的環(huán)節(jié)之一。因?yàn)槿绻阃系胶竺娌抛,它?huì)嚴(yán)重拖慢進(jìn)度,還會(huì)制造很多矛盾。安全團(tuán)隊(duì)越早進(jìn)來,越能幫我們做出更好的產(chǎn)品。這不是公關(guān)話術(shù),是我們踩過坑之后留下來的傷疤。

Simon Last:我覺得黑客松對(duì)于提升全員素養(yǎng)很重要,但如果那是你們構(gòu)建新東西的唯一方式,那就完蛋了。它必須融入日常流程。在 AI 時(shí)代,杠桿越來越傾向于那些最有好奇心、最有熱情的人。如果有人周末興奮地折騰出一個(gè)原型,而且它真的重要,那它就該立刻變成主線,而不是等到季度黑客松。

Sarah Sachs:對(duì)。我們現(xiàn)在 Notion 里的圖像生成功能就是這么出來的。它一直是那種“有了挺好”的能力,很難進(jìn)最核心的優(yōu)先級(jí),但數(shù)據(jù)庫(kù)團(tuán)隊(duì)的 Jimmy 就非常想做。于是我們說,那你就放手做,我們給資源、給支持、給接口、給 Token 追蹤、給郵件支持。最后它真就變成了完整項(xiàng)目。

Simon Last:這就是為什么作為領(lǐng)導(dǎo)者不能 ego 太強(qiáng)。否則這種事根本不會(huì)發(fā)生。


當(dāng)整個(gè)公司都開始為智能體開發(fā),評(píng)估就不再只是測(cè)試

主持人(Alessio):你們現(xiàn)在團(tuán)隊(duì)大概有多大?

Sarah Sachs:我管的團(tuán)隊(duì)主要負(fù)責(zé)核心 AI 能力和基礎(chǔ)設(shè)施,大概五十人左右。除此之外,還有一些合作團(tuán)隊(duì)負(fù)責(zé)產(chǎn)品層面的包裝,比如決定 AI 最后出現(xiàn)在哪,是角落里的聊天框、自定義智能體,還是會(huì)議紀(jì)要,這部分大概三四十人。

但更重要的是,在 Notion,任何一個(gè)擁有用戶可見產(chǎn)品服務(wù)的團(tuán)隊(duì),都必須負(fù)責(zé)維護(hù)自己那部分被智能體調(diào)用的工具。做編輯器的團(tuán)隊(duì),不僅要考慮人類怎么編輯,還得負(fù)責(zé)兩個(gè)智能體同時(shí)改一塊內(nèi)容時(shí)的沖突問題;做底層 SQL 引擎的團(tuán)隊(duì),也得確保智能體發(fā)起 SQL 查詢時(shí)能高效執(zhí)行。

從這個(gè)角度看,只要你在做產(chǎn)品工程,你的任務(wù)就是同時(shí)服務(wù)人類用戶和智能體。因?yàn)殡S著時(shí)間推移,大量流量都會(huì)來自使用我們界面的智能體,而不是人類。我們的目標(biāo),就是讓整個(gè)產(chǎn)品組織都開始為智能體開發(fā)。

主持人(Alessio):這會(huì)不會(huì)讓原型門檻變得特別低?現(xiàn)在大家很容易就在現(xiàn)有代碼庫(kù)里拼出一個(gè)新原型。那什么樣的原型才算值得認(rèn)真看待?

Simon Last:門檻確實(shí)在很多方面都變低了。我們?cè)O(shè)計(jì)團(tuán)隊(duì)就做了一個(gè)很酷的東西,他們自己建了一個(gè)獨(dú)立 GitHub 倉(cāng)庫(kù),叫“設(shè)計(jì)游樂場(chǎng)”,里面有很多輔助組件可以快速拼 UI,現(xiàn)在甚至內(nèi)置了一個(gè)智能體。

所以他們現(xiàn)在不再交靜態(tài)設(shè)計(jì)圖,而是直接給你一個(gè)能跑的可交互原型。對(duì)工程師來說,門檻其實(shí)也很明確,能做出一個(gè)真正跑通的 feature flag,這就夠了。

Sarah Sachs:Notion 很獨(dú)特的一點(diǎn),也是我為什么會(huì)加入這里,這個(gè)世界上沒有誰比 Notion 自己的員工更頻繁地在工作中使用 Notion。所以任何我們發(fā)布的東西,都會(huì)先被內(nèi)部用起來,并迅速收獲反饋。

有時(shí)候我們內(nèi)部的開發(fā)實(shí)例簡(jiǎn)直亂成一鍋粥,開關(guān)開得到處都是,但這已經(jīng)是常態(tài)了。無論是做 IT 工單、采購(gòu)還是招聘的人,大家都在同一個(gè)開著各種原型功能的 Notion 里工作。

我們團(tuán)隊(duì)的設(shè)計(jì)師 Brian Leven 還一直推一個(gè)理念,叫“Demos over Memos”,演示勝于文檔。這極大推動(dòng)了原型文化。但它也迫使我們必須對(duì)方向有足夠強(qiáng)的信念。因?yàn)槿绻魏螙|西都能被做成 demo,你就更得知道你在堆的是一座塔,而不是一個(gè)平庸的小土丘。

Simon Last:總的來說,這套機(jī)制運(yùn)轉(zhuǎn)得挺好。幾乎所有工程師都有足夠好的品味,知道一個(gè)原型在產(chǎn)品里合不合理。所以我們很少看到那種完全無意義的原型。更多的問題在于,先做哪一個(gè),以及怎么控制它的開關(guān)。

Sarah Sachs:不過從評(píng)估和平臺(tái)角度看,這對(duì)底層團(tuán)隊(duì)確實(shí)帶來了不小壓力。比如你要在 Notion 里做圖像生成,那附件處理方式、模型返回結(jié)果的預(yù)期、合規(guī)要求、供應(yīng)商合同,全都得重做一遍。有時(shí)候一個(gè)功能在開發(fā)環(huán)境里待幾周不能上線,不是因?yàn)樗南敕ú恍校且驗(yàn)槟愕孟劝训讓哟蚍(wěn)。

這也是為什么我們非常強(qiáng)調(diào)“智能體開發(fā)效能”。如果你愿意在平臺(tái)上投資,智能體能力迭代的速度就會(huì)快很多。

Sarah Sachs:所以我們現(xiàn)在其實(shí)有一個(gè)完整的組織,專門圍繞智能體平臺(tái)效能來搭。每個(gè)團(tuán)隊(duì)都可以建立自己的評(píng)估體系,并且在發(fā)布后繼續(xù)維護(hù)它。如果模型變了,比如某個(gè)模型被棄用,我們也得能夠盡快更新。

很多評(píng)估會(huì)直接接進(jìn) CI,或者每晚自動(dòng)運(yùn)行。我們甚至還有一個(gè)自定義智能體,一旦某個(gè)關(guān)鍵能力出現(xiàn)重大失敗,就會(huì)自動(dòng)報(bào)警,把團(tuán)隊(duì)叫去看。

這件事非常重要,因?yàn)楝F(xiàn)在太多不同的產(chǎn)品服務(wù)都跑在同一個(gè)智能體框架上,只是打包方式不同。如果底層一變,你要能很快知道哪里受影響了。

主持人(Alessio):我有個(gè)關(guān)于評(píng)估的問題。你們會(huì)不會(huì)發(fā)現(xiàn)模型供應(yīng)商暗中把模型變差了?

Sarah Sachs:如果你說的是那種高峰期模型突然變笨的情況,我覺得更常見的是不穩(wěn)定性。有些時(shí)候,不同渠道給出來的所謂“同一個(gè)模型”,質(zhì)量其實(shí)并不完全一樣。有時(shí)是量化策略不一樣,有時(shí)就是他們內(nèi)部做了調(diào)整,但你拿到的效果和宣傳并不完全一致。

我們當(dāng)然會(huì)去理解這些變化。比如某些退化如果能換來明顯更好的延遲,而且退化幅度在可接受范圍內(nèi),那對(duì)某些場(chǎng)景未必不能接受。關(guān)鍵是,你得有足夠好的評(píng)估手段去看懂它。

甚至在和實(shí)驗(yàn)室測(cè)試預(yù)發(fā)布模型時(shí),他們會(huì)給我們多個(gè)快照。我們也確實(shí)遇到過,他們先給的版本不是我們真正想要的,但會(huì)根據(jù)我們的反饋繼續(xù)改。因?yàn)槲覀兊姆答伜芏鄷r(shí)候更偏企業(yè)協(xié)作場(chǎng)景,而不是編程智能體場(chǎng)景。

主持人(Alessio):那你們會(huì)不會(huì)有一批用例,長(zhǎng)期過不了,就等著未來哪天模型終于能過?

Sarah Sachs:當(dāng)然有,而且我覺得這里有一個(gè)很大的誤區(qū)。很多人一提評(píng)估,就只是把它等同于質(zhì)量測(cè)試,好像評(píng)估就是另一種單元測(cè)試。但這遠(yuǎn)遠(yuǎn)不夠。

我們大致有三層。

第一層,像單元測(cè)試和回歸測(cè)試,跑在 CI 里,要達(dá)到一定通過率。

第二層,是產(chǎn)品級(jí)評(píng)估。也就是當(dāng)你在做一個(gè)產(chǎn)品時(shí),你會(huì)明確說,這些用例目前還沒通過,所以這個(gè)功能還不能發(fā)。我們內(nèi)部會(huì)有一張成績(jī)單,某些關(guān)鍵用戶旅程必須跑到 80% 或 90% 以上,才算達(dá)到發(fā)布標(biāo)準(zhǔn)。

第三層,是更前沿的評(píng)估,也可以叫天花板評(píng)估。對(duì)于這類評(píng)估,我們甚至?xí)室獍涯繕?biāo)通過率放在 30% 左右。因?yàn)樗哪康牟皇墙裉彀l(fā)版,而是讓我們看清技術(shù)的天花板在哪里。

過去兩三個(gè)月,我們和 Anthropic、OpenAI 合作時(shí),很大一塊工作就在這里。因?yàn)橛幸欢螘r(shí)間我們發(fā)現(xiàn)評(píng)估有點(diǎn)飽和了,我們除了告訴對(duì)方“模型沒變差”,已經(jīng)給不出太有洞察的反饋。這對(duì)他們沒幫助,對(duì)我們自己判斷未來方向也沒幫助。

所以我們花了很多時(shí)間去思考,什么才叫“Notion 的終極考試”。不是人類的終極考試,而是從 Notion 作為產(chǎn)品的角度,什么才是最難、最關(guān)鍵、最能決定未來方向的能力。

主持人(Swyx):你們現(xiàn)在在招模型行為工程師?

Sarah Sachs:對(duì),正在招。

主持人(Swyx):這個(gè)崗位到底是什么?

Sarah Sachs:模型行為工程師。這個(gè)職位剛開始其實(shí)不叫這個(gè)名字。最早的時(shí)候,他們更像數(shù)據(jù)專員。那時(shí)他們跟 Simon 一起看 Google 表格,幫忙判斷哪些結(jié)果好,哪些不好。

當(dāng)時(shí)我們招了很多很特別的人,有語言學(xué)背景的人,也有計(jì)算機(jī)文學(xué)背景的人。他們特別出色,后來幾乎等于自己把這個(gè)崗位定義了出來。

現(xiàn)在這個(gè)角色又在變。以前他們更像人工審閱結(jié)果的人,現(xiàn)在隨著編程智能體出現(xiàn),他們?cè)絹碓蕉嗍窃跇?gòu)建評(píng)估系統(tǒng)本身,比如讓智能體自動(dòng)寫評(píng)估用例、使用 LLM 裁判之類的。

但我覺得這個(gè)角色真正有意思的地方在于,它不是一個(gè)純工程崗位。它其實(shí)混合了數(shù)據(jù)科學(xué)家、產(chǎn)品經(jīng)理、提示工程師的很多能力。你得理解模型能做什么、不能做什么,什么叫合理的天花板,什么叫一個(gè)真正好的用戶旅程。你還得判斷模型到底是變好了,還是只是換了一種方式失敗。

這類工作里有大量定性的判斷,特別依賴直覺和品味,而這不一定來自傳統(tǒng)軟件工程訓(xùn)練。所以我們一直都很歡迎非傳統(tǒng)背景的人。我們非常相信,要在這件事上做得頂尖,不一定需要工程背景。

Simon Last:這也是我最近特別興奮的一件事。我們?cè)谂Π言u(píng)估系統(tǒng)本身當(dāng)成一個(gè)智能體框架來對(duì)待。

理想狀態(tài)是,你應(yīng)該可以讓一個(gè)智能體端到端下載數(shù)據(jù)集、運(yùn)行評(píng)估、分析失敗原因、調(diào)試、修復(fù),最后再重新跑一遍。人類更多是在系統(tǒng)外面看著它,而不是自己手工去串這一整套流程。

我們已經(jīng)在這件事上花了很多力氣,而且效果相當(dāng)不錯(cuò)。本質(zhì)上,你就是把評(píng)估變成了一個(gè)編程智能體要解決的問題。

主持人(Swyx):那是你們自己的編程智能體,還是任何一個(gè)通用智能體都可以?

Simon Last:我覺得應(yīng)該是通用的。把它綁在某一個(gè)特定編程智能體上,反而是錯(cuò)的。說到底,它更像一個(gè) CLI 工具。

Sarah Sachs:當(dāng)然,這里面依然需要很多監(jiān)督。我們只是覺得,這種監(jiān)督不一定非得由軟件工程師來做,因?yàn)槠渲杏泻芏喙ぷ鞅举|(zhì)上更像用戶研究,比如你要對(duì)失敗案例進(jìn)行分類,然后判斷下一步應(yīng)該往哪里打。


軟件工程師不會(huì)消失,但工作的重心會(huì)變

主持人(Alessio):那會(huì)不會(huì)有一天,Notion 里根本不需要軟件工程師了?

Sarah Sachs:這要看你怎么定義軟件工程師。

Simon Last:我更愿意把它看成一條連續(xù)演化的曲線。三年前,人類還在手寫所有代碼;后來有了自動(dòng)補(bǔ)全;再后來有了整段補(bǔ)全;現(xiàn)在則進(jìn)入了智能體可以執(zhí)行長(zhǎng)周期任務(wù)、調(diào)試、修 Bug、驗(yàn)證效果,甚至提交 PR、合并和部署的階段。

我覺得我們只是一直在往更高的抽象層走。人類的角色會(huì)越來越像觀察者和外部系統(tǒng)維護(hù)者。你會(huì)看到一串智能體在跑,然后你關(guān)注哪里偏了,哪些地方需要審批,哪里還缺有效的學(xué)習(xí)機(jī)制或記憶機(jī)制。

所以這仍然是一個(gè)很硬核的工程問題,我們只是在技術(shù)棧上又往上走了一層。

Sarah Sachs:今年夏天,Notion 的很多軟件工程師都經(jīng)歷了一次挺明顯的身份變化。我們內(nèi)部有位工程主管說得很好,每個(gè)軟件工程師都在經(jīng)歷管理者才有的身份認(rèn)同危機(jī)。他們突然發(fā)現(xiàn),自己最重要的能力不再只是寫代碼,而是委派任務(wù)和切換上下文。

從這個(gè)角度看,傳統(tǒng)軟件工程師的角色確實(shí)在被超越。

Simon Last:但這里和管理人類團(tuán)隊(duì)有一個(gè)很大不同,這里面其實(shí)非常技術(shù)化。人類是模糊的、感性的,你不能像調(diào)度一個(gè)嚴(yán)密系統(tǒng)那樣調(diào)度一群人。你不能假設(shè)任務(wù)像 PR 一樣在人與人之間自動(dòng)流轉(zhuǎn)、阻塞、恢復(fù)。

但對(duì)一群智能體,你是可以這么設(shè)計(jì)的。這背后其實(shí)有非常嚴(yán)謹(jǐn)?shù)募夹g(shù)邏輯。歸根結(jié)底,這還是一個(gè)系統(tǒng)設(shè)計(jì)問題。

主持人(Alessio):那你們現(xiàn)在心里的軟件工廠到底長(zhǎng)什么樣?

Simon Last:我們?cè)趪L試很多不同的方向。最終你想要的是一個(gè)盡可能少需要人類干預(yù),但又能維持關(guān)鍵系統(tǒng)不變量的系統(tǒng)。

有幾件事我覺得特別重要。第一,必須有一個(gè)規(guī)范層。你得有某種東西能把任務(wù)、需求、約束寫清楚。直接提交 Markdown 文件就很好,作為 Notion 這當(dāng)然很有意思,因?yàn)?PRD 天然就應(yīng)該活在 Notion 里,它可以是一頁(yè)文檔,也可以是頁(yè)面數(shù)據(jù)庫(kù)。

但它必須首先是人類可讀、可見的。

第二,必須有一個(gè)非常強(qiáng)的自我驗(yàn)證循環(huán)。你基本上需要一層非常強(qiáng)的測(cè)試體系,不然你根本不可能放心讓一群智能體去接手那么多流程。

第三,就是工作流本身的設(shè)計(jì)。Bug 進(jìn)來以后怎么進(jìn)系統(tǒng)?是由某個(gè)子智能體接手嗎?它怎么提交 PR?誰審查?怎么合并?怎么部署?這一整套流轉(zhuǎn),都是你要設(shè)計(jì)的東西。


自定義智能體真正替代的,是那層最煩的人工流程

主持人(Alessio):我們錄節(jié)目之前其實(shí)剛好做了一個(gè)自定義智能體的 demo。我們每次錄節(jié)目都會(huì)試產(chǎn)品。這次我們用它給 Kernel Labs 的共享辦公空間做了一個(gè)申請(qǐng)?zhí)幚碇悄荏w。

以前的流程是,我收到郵件,讀一遍申請(qǐng),想想這個(gè)人值不值得聊,再回郵件,對(duì)方再回。現(xiàn)在我只花了十五分鐘就搭好一個(gè)智能體,我告訴它去檢查收件箱里的申請(qǐng),然后它自動(dòng)給我建數(shù)據(jù)庫(kù)記錄,去網(wǎng)上搜申請(qǐng)人信息,把時(shí)間、背景這些都補(bǔ)全。

這當(dāng)然不是 AGI,但它干掉了我最不想手工做的那部分活。而且我特別喜歡的是,這些信息本來就該放在 Notion 里,而不是逼我再把數(shù)據(jù)搬到別的工具里。

Sarah Sachs:這其實(shí)就是我們看到的最大價(jià)值來源。很多時(shí)候,自定義智能體最大的收益不是替代掉某個(gè)人,而是替代掉流程中那層額外的人工干預(yù)。

像 Bug 分流就是最典型的用例。如果有人在 Slack 里提了問題,你能不能讓一個(gè)駐留在那里的智能體,根據(jù)自己的路由規(guī)則判斷應(yīng)該歸誰處理,然后在任務(wù)數(shù)據(jù)庫(kù)里建卡,再回到 Slack 里回復(fù)。

這其實(shí)是我們內(nèi)部最早做出來的一批東西之一。它真的改變了 Notion 公司內(nèi)部很多事情的運(yùn)行方式。沒有東西會(huì)被遺漏——好吧,大部分不會(huì)被遺漏。畢竟你永遠(yuǎn)不可能知道自己不知道什么。

主持人(Alessio):所以它并不是在替代人,而是在替代繁瑣流程。

Sarah Sachs:對(duì),就是這樣。

主持人(Alessio):我還在做另一個(gè)東西,類似租約填寫器。每當(dāng)有人正式簽約成為租戶,它就去填租約。那是不是再往前一步,應(yīng)該有一個(gè)辦公室經(jīng)理智能體,它負(fù)責(zé)處理請(qǐng)求、制作租約、開門禁之類的?

Simon Last:我覺得這里有兩種組合方式。

一種是通過數(shù)據(jù)原語來組合。比如一個(gè)智能體向數(shù)據(jù)庫(kù)寫數(shù)據(jù),另一個(gè)智能體再去遍歷這個(gè)數(shù)據(jù)庫(kù)繼續(xù)處理。這種解耦協(xié)同的方式就很好。

另一種是讓它們直接耦合起來。一個(gè)功能大概很快就會(huì)上線,在智能體設(shè)置里,你可以允許它調(diào)用別的智能體。這樣它們就可以直接對(duì)話。

主持人(Alessio):那不會(huì)無限遞歸嗎?

Simon Last:代碼里肯定有個(gè)限制數(shù)值。但總會(huì)有人把它玩壞,你可以試試。畢竟一切最后都可能走向回形針制造機(jī)。

不過這個(gè)功能真的很有用。前幾天我就在內(nèi)部幫一個(gè)同事解決了類似的問題。他給市場(chǎng)團(tuán)隊(duì)建了三十多個(gè)自定義智能體,各干各的活,比如收集客戶信息、分類客戶反饋之類。然后他開始天天收到七十多條通知,全是這些智能體卡住了。

我就跟他說,這很明顯,你需要一個(gè)管理者智能體。

于是我們幫他建了一個(gè)可以調(diào)用其他所有智能體的管理者智能體。它像是在上面再加了一層抽象,負(fù)責(zé)監(jiān)控和觀察。結(jié)果他每天收到的通知,從七十多條降到了五條,而且這個(gè)管理者智能體自己還會(huì)幫忙調(diào)試和修復(fù)其他智能體的問題。

主持人(Alessio):聽起來像是它們有一個(gè)內(nèi)部收件箱,彼此可以發(fā)消息。

Simon Last:它們用的其實(shí)還是 Notion 這個(gè)記錄系統(tǒng)。

Sarah Sachs:對(duì),我們其實(shí)沒有發(fā)明什么特別新的概念。與其讓我自己收到那些通知,它們完全可以直接往某個(gè)數(shù)據(jù)庫(kù)里寫任務(wù),讓另一個(gè)智能體監(jiān)聽,或者通過 Webhook 去 @ 它。

Simon Last:我們現(xiàn)在就是盡量先用稍微粗糙一點(diǎn)但能跑通的方法把它做起來。那次我們就是建了一個(gè)記錄智能體 Issue 的新數(shù)據(jù)庫(kù),讓這些智能體都有權(quán)往里提交問題,再給管理者智能體讀這個(gè)庫(kù)的權(quán)限。結(jié)果效果很好。

本質(zhì)上就是給智能體建了一套內(nèi)部 Issue 追蹤系統(tǒng)。如果以后這被證明是個(gè)普遍有用的概念,我們也許會(huì)把它打包成更標(biāo)準(zhǔn)的產(chǎn)品。但總的來說,我們還是盡量通過組合基礎(chǔ)原語來解決問題。

再比如,Notion 本身并沒有所謂“記憶”這個(gè)獨(dú)立概念。記憶就是頁(yè)面和數(shù)據(jù)庫(kù)。你想給智能體記憶,就給它一個(gè)頁(yè)面,再給它編輯權(quán)限。人類能改,智能體也能改。這個(gè)模式特別好用,而且可擴(kuò)展性很高。


郵件、日歷和原生集成,重點(diǎn)在于誰對(duì)體驗(yàn)負(fù)責(zé)

主持人(Alessio):我在搭那個(gè) demo 時(shí),系統(tǒng)問我想接 Gmail 還是 Notion Mail。我當(dāng)時(shí)心想,我其實(shí)哪個(gè)都不關(guān)心,我只想讓你幫我搞定。那你們?cè)趺捶峙溥@類產(chǎn)品精力?Notion Mail、Notion Calendar 這些界面還重要嗎?

Simon Last:我覺得很重要的一點(diǎn)是,你不應(yīng)該被迫使用 Notion Mail 才能接入郵件功能。我們應(yīng)該能直接接 Gmail,或者你喜歡的其他服務(wù)。郵件之所以偉大,很大程度上就是因?yàn)樗貏e適合被智能體驅(qū)動(dòng)。某種意義上,郵件應(yīng)用本身也可以被看成一個(gè)預(yù)先打包好的收件箱自動(dòng)化智能體。

Sarah Sachs:但這里的區(qū)別在于質(zhì)量所有權(quán)。

當(dāng)我們和 Gmail 集成時(shí),我們更多是通過 MCP 或 API 向 Gmail 提供一組工具;而當(dāng)我們接 Notion Mail 時(shí),就會(huì)有專門的 Notion Mail 工程團(tuán)隊(duì)去打造最適合那個(gè)場(chǎng)景的工具,對(duì)延遲、性能和質(zhì)量負(fù)責(zé)。

那邊的產(chǎn)品負(fù)責(zé)人會(huì)直接思考郵件場(chǎng)景下的用戶痛點(diǎn)。所以我們通常會(huì)先做原生集成,再考慮如何把它通用化。因?yàn)橄茸鲈桑菀装洋w驗(yàn)打磨到位。


CLI 和 MCP,不是誰贏誰輸,而是誰更像下一代基礎(chǔ)設(shè)施

主持人(Swyx):說到集成,我必須問一件事,MCP 還是 CLI?

Simon Last:我個(gè)人絕對(duì)非常看好 CLI。它有幾個(gè)特別迷人的地方。第一,它運(yùn)行在終端環(huán)境里,自帶很多力量。比如長(zhǎng)輸出可以分頁(yè),你可以在里面瀏覽。第二,它天然支持漸進(jìn)式呈現(xiàn),你一開始不會(huì)把所有工具都攤給模型,它先看到的是 CLI 外殼,可以用 help,可以讀文件。

最酷的是它的自舉能力。如果出了問題,智能體可以在自己使用工具的那個(gè)環(huán)境里直接調(diào)試和修復(fù)。

我今天早上就看到一條推文,有人說自己的智能體沒有瀏覽器,所以它給自己寫了一個(gè)瀏覽器工具。不到一百行代碼,它就封裝了 Chromium API,給自己搓了個(gè)小瀏覽器。如果這個(gè)工具有 Bug,它還能繼續(xù)修自己。

相反,如果你用的是 Chrome DevTools 的 MCP,而傳輸通道崩了,智能體就徹底失去瀏覽器,也失去了自救能力。我覺得這里有非常根本的差異。

主持人(Swyx):不過話說回來,它的很多問題也不是協(xié)議本身的問題。比如漸進(jìn)式呈現(xiàn)完全可以靠更好的框架來實(shí)現(xiàn)。最開始大家一股腦把所有工具都扔給模型,當(dāng)然不行,但那不一定是 MCP 自身的錯(cuò)。

Simon Last:這點(diǎn)我同意。現(xiàn)在確實(shí)有很多實(shí)現(xiàn)得不太好的 MCP,因?yàn)榇蠹抑岸紱]經(jīng)驗(yàn)。

總的來說,我很看好 CLI。但在某些環(huán)境下,我也仍然很看好 MCP。特別是那種需要輕量、單一能力、權(quán)限邊界極清晰的智能體場(chǎng)景。很多時(shí)候,你不需要一個(gè)擁有完整計(jì)算運(yùn)行時(shí)的編程智能體,你需要的只是一個(gè)只能調(diào)用工具的東西。

MCP 在這件事上天然非常強(qiáng)。而 CLI 的問題在于,它的權(quán)限邊界往往沒那么直觀。它能不能接觸 API Token?Token 有沒有被妥善處理?這些都會(huì)引入很多真實(shí)而棘手的新問題。

所以我會(huì)說,MCP 是那種簡(jiǎn)單、粗暴,但非常管用的好東西。

Sarah Sachs:我從 Notion 的角度補(bǔ)兩個(gè)視角。

第一,Notion 的使命是成為企業(yè)工作里最好的記錄系統(tǒng)。所以只要外部生態(tài)還在使用 MCP,我們就一定會(huì)繼續(xù)支持它。無論我們個(gè)人偏好什么,Notion 已經(jīng)在這上面投入了很多,也有很強(qiáng)的團(tuán)隊(duì)在做。

第二,是成本問題。我最近一直在想一件事,怎么讓定價(jià)真的和模型能力匹配起來。對(duì)于一些確定性很強(qiáng)的任務(wù),如果你還要讓大模型經(jīng)由 MCP 去跟第三方服務(wù)反復(fù)交互,那其實(shí)是一種浪費(fèi)。它不只是貴,而且不夠確定。

尤其是我們的自定義智能體是按使用量計(jì)費(fèi)的。我們把定價(jià)看成用戶使用產(chǎn)品的門檻,所以非常在意別浪費(fèi)用戶的錢。對(duì)客戶不公平,對(duì)商業(yè)上也不是好事。

如果某件事能通過 CLI 確定性地寫代碼執(zhí)行,那可能就是一次性成本;相反,如果它每次都要經(jīng)由模型和 MCP 重復(fù)跑一遍,你就會(huì)不斷燒 Token,甚至緩存一失效又得再來一遍。那沒有必要。

主持人(Swyx):對(duì),開放性是關(guān)鍵。如果我自己能直接寫代碼調(diào) API,我也不會(huì)去用 MCP。但在一些場(chǎng)景里,你知道要調(diào)用什么,又不想每次都從頭開始實(shí)現(xiàn),那 MCP 還是很有價(jià)值。

主持人(Alessio):那你們內(nèi)部到底怎么判斷?什么時(shí)候用簡(jiǎn)單 API,什么時(shí)候用 MCP,什么時(shí)候又要上更開放的智能體,比如帶代碼沙盒的那種?

Sarah Sachs:在 Notion AI 內(nèi)部,我們不會(huì)簡(jiǎn)單說,因?yàn)檫@個(gè)能力太開放,所以我們就不發(fā)布它。

但有很多時(shí)候,我們不選 MCP,是因?yàn)槲覀兿雽?duì)質(zhì)量有更深的控制。搜索和我們所謂的“智能體查找”就是典型例子。

我們?cè)?Notion 里集成了 Slack、Linear、Jira 的搜索,但沒有直接使用這些公司提供的搜索 MCP。因?yàn)槲覀冇X得,想讓一個(gè)智能體工作流真的表現(xiàn)出色,就必須對(duì)搜索旅程本身的細(xì)節(jié)有更多控制。

當(dāng)然,長(zhǎng)尾需求還是很多,所以我們也會(huì)做 MCP 服務(wù)器,讓大家接他們想接的任何東西。但像搜索這種核心入口,以及少數(shù)一些特別關(guān)鍵的集成,我們會(huì)更愿意自己下場(chǎng)來做,因?yàn)槲覀冎雷约旱拿胤皆谀摹?/p>

Simon Last:我覺得這里面其實(shí)沒有真正的沖突,只是技術(shù)棧層級(jí)不同。MCP 提供的是一個(gè)獲取工具訪問權(quán)限的協(xié)議,它是開放協(xié)議,所以很適合覆蓋大量長(zhǎng)尾需求。

但如果你看我們的工具設(shè)置,你會(huì)發(fā)現(xiàn)“觸發(fā)器”根本不在里面,因?yàn)?MCP 做不到觸發(fā)器協(xié)議。這意味著有些東西我們必須自己建。

我們現(xiàn)在有些集成用了 MCP,比如 Linear 和 GitHub;但 Slack、郵件和日歷是內(nèi)部自建的,因?yàn)槲覀儾粌H要把工具打磨得極好,還得加上觸發(fā)器。

所以我更愿意把它理解成,不同層級(jí)在做不同事。關(guān)鍵是你得在對(duì)的時(shí)間,用對(duì)的工具。

主持人(Swyx):你一直在說重構(gòu)。能不能大概回顧一下,你們這幾次重構(gòu)都改了什么?

Simon Last:我試試,這差不多得像做代碼考古一樣。

2022 年底我們最早做的那個(gè)版本,本質(zhì)上其實(shí)是個(gè)編程智能體。我們當(dāng)時(shí)想,與其造一堆工具,不如讓一切都變成 JavaScript。我們給它 JavaScript API,讓它自己寫代碼來完成調(diào)用。

但那時(shí)候模型寫代碼真的太爛了,所以不行。于是我們轉(zhuǎn)向工具調(diào)用。問題是,那時(shí)原生工具調(diào)用功能還沒出現(xiàn),所以我們發(fā)明了一整套 XML 表示法。

那一版最大的教訓(xùn)是,我們太迎合 Notion 自己的數(shù)據(jù)模型了,而忽略了模型真正想要什么。比如我們做了一套能無損映射到 Notion Blocks 的 XML,轉(zhuǎn)換非常方便,也有一整套頁(yè)面編輯的 mutation 操作。但效果很糟。因?yàn)槟P透静欢@套東西,而且你還得在提示詞里把它硬塞進(jìn)去。

主持人(Swyx):對(duì),而且塞進(jìn)去之后模型也用不好。

Simon Last:對(duì)。所以后來我們意識(shí)到,不行,必須上 Markdown。模型懂 Markdown。

于是我們又做了一次大重構(gòu),基本上是造了一種“Notion 風(fēng)格的 Markdown”。核心想法是,底層必須盡量是純 Markdown,然后在上面做增強(qiáng)。它不一定非得做到完全無損。

數(shù)據(jù)庫(kù)這一層也有類似的教訓(xùn)。Notion API 原本的數(shù)據(jù)庫(kù)查詢是很復(fù)雜的 JSON 格式,和內(nèi)部表示能很好對(duì)應(yīng),但模型不喜歡。于是我們把它推翻了,想法變成,一切都做成 SQLite,所有查詢都讓模型像寫 SQLite 一樣去寫。模型對(duì)這個(gè)特別擅長(zhǎng)。

所以我覺得有一個(gè)特別大的教訓(xùn),就是給模型它真正想要的東西。你在設(shè)計(jì)環(huán)境的時(shí)候,必須極其謹(jǐn)慎地想清楚,模型究竟喜歡什么表達(dá)形式。不要把系統(tǒng)里那些沒必要的復(fù)雜性暴露給它。

Sarah Sachs:但這還不是全部。后來又有了原生工具調(diào)用,我們做了研究模式,然后我們徹底拋棄了少樣本提示詞,轉(zhuǎn)向更純粹的工具定義。現(xiàn)在我們又在思考智能體 2.0。

Simon Last:對(duì)。整體的發(fā)展弧線其實(shí)很有意思。一開始你依賴單樣本、少樣本;然后變成給工具,但還要保留很多示例;再后來變成,干脆直接給它一堆工具。

但這又帶來新問題。當(dāng)工具越來越多的時(shí)候,漸進(jìn)式呈現(xiàn)就變得非常關(guān)鍵。我們一度遇到一個(gè)瓶頸,智能體本來工作得很好,但隨著工具不斷增加,整個(gè)系統(tǒng)越來越難繼續(xù)擴(kuò)展,我們開始擔(dān)心新的工具會(huì)把模型搞崩。

主持人(Swyx):就那種,你只是說句“你好”,都要消耗一大堆 Token,而且速度很慢。

Simon Last:對(duì),不只是成本問題,也是質(zhì)量問題。因?yàn)槊總(gè)工程師為了某個(gè)小眾功能引入新工具,都有可能導(dǎo)致模型過度調(diào)用它,最后拖累整體表現(xiàn)。所以我們后面專門做了一輪框架優(yōu)化,把漸進(jìn)式呈現(xiàn)做得優(yōu)雅一點(diǎn)。

Sarah Sachs:我甚至覺得,這可能比推理模型本身帶來的轉(zhuǎn)折還大。因?yàn)閺纳贅颖咎崾巨D(zhuǎn)向以目標(biāo)為導(dǎo)向的工具描述之后,我們終于能把工具所有權(quán)真正分發(fā)給不同團(tuán)隊(duì)。

在過去,大家其實(shí)都在共同編輯同一串系統(tǒng)提示詞,稍微順序不一樣,模型行為就會(huì)變化。那種模式不可能擴(kuò)展,公司根本沒法規(guī);:髞硗ㄟ^評(píng)估體系和更好的工具抽象,我們才終于把工具分出去,讓每個(gè)團(tuán)隊(duì)能擁有自己的工具和定義。

當(dāng)然也會(huì)出事故。比如我們?cè)?jīng)寫出兩個(gè)同名工具,Anthropic 的 Sonnet 就崩了,OpenAI 的模型反而自己想辦法繞過去了。很多教訓(xùn)都不是紙上來的,是一腳踩出來的。


最危險(xiǎn)的誤解,是把自定義智能體做成“誰都能一眼看懂”的玩具

主持人(Swyx):那你們會(huì)把這些工具列表公開嗎?還是這屬于機(jī)密?

Simon Last:完全公開。你直接問智能體,它會(huì)告訴你。

Sarah Sachs:我們不覺得系統(tǒng)提示詞是我們的核心秘密。

Simon Last:而且我覺得,對(duì)操作者來說,理解這些其實(shí)很重要。有哪些工具、工具怎么運(yùn)作、該怎么提示它,都是高級(jí)用戶需要知道的。

我們內(nèi)部有一句話,叫“教班里最聰明的學(xué)生”。我們希望自定義智能體是強(qiáng)大的工具。雖然設(shè)置界面盡量做得簡(jiǎn)單,但它應(yīng)該有深度。操作者得能探到它的工作原理。

Sarah Sachs:甚至可以再說得更絕一點(diǎn),我們其實(shí)并沒有試圖讓它變成一個(gè)任何人都能一下子完全搞懂的產(chǎn)品。因?yàn)槟阍较氚阉?jiǎn)化到那個(gè)程度,你越會(huì)把可解釋性和能力一起抽掉。

我們?cè)谧鲎远x智能體的時(shí)候,大概花了一個(gè)半星期才達(dá)成這個(gè)共識(shí),我們不是在為所有人構(gòu)建這個(gè)產(chǎn)品。一旦大家在這件事上想明白,整個(gè)團(tuán)隊(duì)推進(jìn)速度反而更快了,因?yàn)槟繕?biāo)用戶終于更清晰了。

主持人(Alessio):那個(gè)給智能體生成提示詞的配置過程,到底是怎么工作的?

Simon Last:其實(shí)就是智能體自己在工作。我們?cè)谧远x智能體上做了一件我特別喜歡的事,它可以配置它自己。我們不僅給了它發(fā)郵件之類的工具權(quán)限,也給了它配置和調(diào)試自身的工具。

所以當(dāng)你讓它去寫系統(tǒng)提示詞時(shí),本質(zhì)上就是這個(gè)智能體自己在做這件事。我們并沒有硬塞太多東西,只是給了它一份“怎么做一個(gè)好自定義智能體”的開發(fā)指南。

最棒的地方在于,如果它失敗了,你可以直接問它為什么失敗,再告訴它,更新你的指令,下次別再犯這個(gè)錯(cuò)。這個(gè)閉環(huán)非常自然。

Sarah Sachs:很顯然,這也意味著我們下一步應(yīng)該去做更明確的“自我修復(fù)”功能。

主持人(Alessio):我其實(shí)已經(jīng)體驗(yàn)到了。雖然還不是全自動(dòng),但我有一次配錯(cuò)了東西,點(diǎn)一下“修復(fù)”按鈕,它就會(huì)自己幫我改。

Simon Last:這里其實(shí)牽扯到一個(gè)很關(guān)鍵的權(quán)限問題。自定義智能體默認(rèn)是沒有任何權(quán)限的,你必須顯式授予它所有權(quán)限,這樣你才能放心讓它后臺(tái)運(yùn)行。

比如你知道,它可以讀我的郵件,但不能發(fā)郵件,那你心里就有數(shù)了。如果你讓它完全自動(dòng)修自己,它就會(huì)跨過這個(gè)邊界,因?yàn)樗粦?yīng)該自己偷偷修改自己的權(quán)限。

所以現(xiàn)在的做法更像是,你點(diǎn)擊一個(gè)按鈕,進(jìn)入管理員模式,和它做一段同步對(duì)話。它在改之前也會(huì)先給你確認(rèn)。

主持人(Alessio):而且我很喜歡的一點(diǎn)是,編輯它和使用它是在同一個(gè)聊天框里完成的。不是一個(gè)地方配置、另一個(gè)地方使用。

Sarah Sachs:對(duì)。這個(gè)設(shè)計(jì)我們內(nèi)部叫“Flippy”。

Simon Last:最開始的想法其實(shí)相反,設(shè)置是主界面,旁邊放一個(gè)測(cè)試區(qū)。但如果你真的接受“它就是一個(gè)智能體”這件事,那更合理的設(shè)計(jì)就是翻過來。主視圖應(yīng)該是聊天框,設(shè)置更像一個(gè)側(cè)邊欄,用來預(yù)覽它正在修改什么。我們希望最后做到,你幾乎不需要手動(dòng)去碰那些設(shè)置,而是直接通過對(duì)話完成。

Sarah Sachs:這個(gè)功能其實(shí)是這次發(fā)布里最大的攔路虎之一。因?yàn)楹芏嘣缙谟脩粢呀?jīng)習(xí)慣了舊流程,改他們的認(rèn)知很痛苦。我們甚至為此多拖了一個(gè)月。但所有人最后都覺得,這個(gè)方向太對(duì)了,必須這么做。

主持人(Alessio):現(xiàn)在它是免費(fèi)的,這很好。但以后開始收費(fèi)時(shí),你們?yōu)槭裁磿?huì)選用積分這種方式?

Sarah Sachs:因?yàn)檎鎸?shí)成本不只是 Token。我們確實(shí)是跟 Token 使用量掛鉤,但你不能把所有東西都直接攤平成 Token 價(jià)格。比如有些開源模型跑在 GPU 上,網(wǎng)絡(luò)搜索有自己的成本,沙盒又是另一種成本。再加上高優(yōu)先級(jí)處理、異步處理、緩存命中率,這些全都不一樣。

所以我們必須在 Token 之上再建一個(gè)抽象層。

更重要的是,我們從一開始就想讓客戶得到公平交易。不是說我們想在這里暴利,而是客戶應(yīng)該只為合理的事情付錢。我們賣的本來就是企業(yè)級(jí) SaaS,如果你賣積分包,客戶買得多也更容易做折扣,這在銷售流程上也更順。

主持人(Alessio):但價(jià)值不是均勻的。有人可能拿它去更新食譜,有人可能拿它去回投資人的重要郵件,價(jià)值差距很大。你們內(nèi)部會(huì)討論按價(jià)值收費(fèi)嗎?

Sarah Sachs:我們當(dāng)然想過。但問題是,什么叫“復(fù)雜”或“有價(jià)值”,一旦真要嚴(yán)格定義,就會(huì)非常復(fù)雜。我們最開始也想過按智能體運(yùn)行次數(shù)收費(fèi),但推演一圈之后你會(huì)發(fā)現(xiàn),最終還是繞不開與 Token 吞吐量直接相關(guān)的復(fù)雜性。

所以目前按量計(jì)費(fèi)是最樸素也最現(xiàn)實(shí)的方式。

還有一個(gè)特別現(xiàn)實(shí)的原因,我們的核心智能體一直帶著模型選擇器。為了維持利潤(rùn)率,有些功能我們根本承擔(dān)不起。比如以后數(shù)據(jù)庫(kù)自動(dòng)填充如果都變成智能體驅(qū)動(dòng),而每個(gè)單元格都在跑 Opus 級(jí)別的能力,那這個(gè)產(chǎn)品在商業(yè)上根本不成立。

所以我們需要給那些愿意花錢做更多事的人一個(gè)出口,但又不能把高成本強(qiáng)加給低頻用戶。

而且,不是所有知識(shí)工作都一樣復(fù)雜。很多智能體任務(wù)其實(shí)很快就碰到模型能力天花板,根本不需要一個(gè)特別貴的模型。我們希望用戶自己決定,到底要不要為某個(gè)任務(wù)花那筆錢。甚至現(xiàn)在產(chǎn)品里也會(huì)主動(dòng)提醒你,這個(gè)操作是不是很貴。

主持人(Alessio):有趣的是,大家在這種異步場(chǎng)景里,似乎也沒那么在意速度。

Sarah Sachs:對(duì)。當(dāng)任務(wù)本身是異步的,“更快一點(diǎn)”這個(gè)優(yōu)勢(shì)就沒那么重要了。我們更想做的是把真正有價(jià)值的額外服務(wù)給到用戶,而最好的約束就是讓他們自己掏自己的錢。

主持人(Swyx):那 Auto 呢?很多人會(huì)本能地以為,Auto 只是選最便宜的模型。

Sarah Sachs:這正是我們現(xiàn)在特別努力的一件事,讓大家明白 Auto 不是“最便宜、最笨”的那個(gè),而是最適合你當(dāng)前任務(wù)的那個(gè)。

我們其實(shí)在花很多力氣優(yōu)化 Auto,因?yàn)檫@就是智能體實(shí)驗(yàn)室真正該做的事。某種意義上,Auto 很像智能投顧。我們不是拿它當(dāng)利潤(rùn)工具,而是拿它去減少用戶壓力。

它肯定不會(huì)永遠(yuǎn)是最強(qiáng)的模型,因?yàn)榇蠖鄶?shù)任務(wù)根本不需要 Opus 那種級(jí)別的能力。

Simon Last:而且和很多前沿實(shí)驗(yàn)室不一樣,我們并沒有被激勵(lì)去讓你盡可能多地消耗 Token。我們真正關(guān)心的是,為你找到完成任務(wù)的正確工具。很多時(shí)候,那個(gè)正確工具甚至是直接寫代碼,根本不需要智能體。

如果某個(gè)智能體最終能自動(dòng)化地把自己“炒掉”,我們其實(shí)會(huì)很開心。


Notion 真正想卡位的,是協(xié)作發(fā)生后的全部沉淀

主持人(Swyx):我聽下來,你們?cè)缤頃?huì)去訓(xùn)練自己的模型。畢竟你們有這么多 Token 數(shù)據(jù)。

Sarah Sachs:如果你說的是花自己的錢去訓(xùn)練一個(gè)基礎(chǔ)模型,我并不這么看。

Simon Last:我也不覺得這應(yīng)該成為我們的核心競(jìng)爭(zhēng)力。

如果真要往模型訓(xùn)練走,我更感興趣的不是給全世界做一個(gè)超級(jí)通用模型,而是未來是不是能做那種真正理解某一家企業(yè)上下文的模型。不是所有人共用一個(gè)大腦,而是一個(gè)特別懂你們公司業(yè)務(wù)、員工、流程的模型。那種東西如果有一天足夠可行,我覺得質(zhì)量提升會(huì)非常明顯。

Sarah Sachs:現(xiàn)在確實(shí)已經(jīng)有企業(yè)客戶會(huì)問類似的問題,比如能不能把一個(gè)很懂他們內(nèi)部環(huán)境的模型帶進(jìn)來,或者自己帶密鑰接進(jìn)來。這也正是為什么我們會(huì)更愿意把系統(tǒng)提示詞和工具接口做得開放一點(diǎn)。

當(dāng)然,在 Notion 的某些具體能力上,我們還是會(huì)做微調(diào)和強(qiáng)化學(xué)習(xí)。但那不一定需要直接吃用戶數(shù)據(jù)。只要我們的數(shù)據(jù)科學(xué)家和模型行為工程師足夠清楚地理解差距在哪,我們就會(huì)在那些地方下手。

Simon Last:我自己以前在模型訓(xùn)練上花過非常多時(shí)間。那件事特別容易讓人上癮。你會(huì)一直訓(xùn)練、一直重訓(xùn),睡前都得確保實(shí)驗(yàn)在跑。

Sarah Sachs:然后我這個(gè)管預(yù)算的人就會(huì)出現(xiàn),把你叫停。

Simon Last:是的。但現(xiàn)在很有意思的是,編程智能體又把這種狀態(tài)帶回來了,F(xiàn)在我睡覺前也會(huì)想,我有沒有啟動(dòng)足夠多的智能體,讓它們?cè)谖宜臅r(shí)候繼續(xù)跑。

有一次我甚至讓一個(gè)編程智能體線程連續(xù)跑了十七天。

Sarah Sachs:然后前沿實(shí)驗(yàn)室的人跑來問我,Simon 到底在干嘛,他是不是在證明弦理論。

Sarah Sachs:不過我們現(xiàn)在確實(shí)有一個(gè)領(lǐng)域在明顯加大訓(xùn)練投入,就是檢索。

因?yàn)楝F(xiàn)在我們很多搜索流量,其實(shí)已經(jīng)不是人發(fā)起的,而是智能體發(fā)起的。打到 ElasticSearch 或向量索引上的那些查詢,背后很多根本不是人在搜,而是智能體在搜。

這件事會(huì)改變整個(gè)檢索系統(tǒng)的優(yōu)化目標(biāo)。對(duì)于人類搜索,你可能特別在意第一名和第六名的位置差異、點(diǎn)擊率這些。但對(duì)智能體來說,更重要的是 Top-K 是否夠全、返回結(jié)果能不能覆蓋更多可能答案。

你會(huì)開始思考并行查詢、查詢扇出、查詢多樣性這些問題。甚至很多時(shí)候,向量嵌入本身已經(jīng)不是最重要的優(yōu)化層級(jí)了。更重要的是檢索、排序、查詢生成這整條鏈怎么一起工作。我們內(nèi)部把這個(gè)方向叫“智能體查找”。

所以你會(huì)看到我們開始更認(rèn)真地招排序工程師、模型訓(xùn)練工程師,因?yàn)檫@里確實(shí)已經(jīng)變成一個(gè)新的核心問題。

主持人(Alessio):我們也得聊聊會(huì)議紀(jì)要。這個(gè)功能現(xiàn)在做得很好,背后到底發(fā)生了什么?

Sarah Sachs:會(huì)議紀(jì)要其實(shí)一開始讓我們非常緊張。我們擔(dān)心它會(huì)逼著大家學(xué)習(xí)一套新的工作方式,擔(dān)心用戶摩擦太大。

但現(xiàn)在回頭看,它已經(jīng)成了我們最強(qiáng)的增長(zhǎng)引擎之一,無論是病毒式傳播還是留存都很強(qiáng)。所以隨著它表現(xiàn)越來越好,我們也在不斷往里加資源。

我覺得這個(gè)功能真正強(qiáng)大的地方在于,Notion 本來就是一個(gè)記錄系統(tǒng),而會(huì)議紀(jì)要讓它開始捕獲另一類以前很難系統(tǒng)化保存的數(shù)據(jù)。

比如我自己用它的方法就是,每次和經(jīng)理的一對(duì)一會(huì)議,我都會(huì)留紀(jì)要。等到年終做績(jī)效自評(píng)時(shí),我基本上就是回頭去看這些會(huì)議記錄,然后寫我這一年做了什么。因?yàn)槿绻臣聫膩頉]有進(jìn)入我和經(jīng)理的一對(duì)一討論,那它大概率也不是最重要的優(yōu)先級(jí)。

所以會(huì)議紀(jì)要給我們帶來了大量非常有價(jià)值的信號(hào)。這對(duì)一個(gè)記錄系統(tǒng)當(dāng)然很重要,對(duì)智能體也很重要。因?yàn)橐坏┠汩_始有了大量轉(zhuǎn)錄文本,你的內(nèi)容規(guī)模會(huì)爆炸式增長(zhǎng),你怎么做上下文壓縮、怎么在智能體里利用這些內(nèi)容,都會(huì)被它反過來推動(dòng)。

主持人(Alessio):某種意義上,這是在捕獲一類全新的數(shù)據(jù)。以前 Notion 里已經(jīng)有我很多別的資料,所以我自然也會(huì)把這些新東西繼續(xù)放進(jìn)來。

Sarah Sachs:完全是這樣。我們團(tuán)隊(duì)現(xiàn)在的工作方式基本上已經(jīng)連起來了。每天站會(huì)前,會(huì)有一個(gè)自定義智能體先去讀 Slack 和 GitHub,生成會(huì)前閱讀。然后會(huì)議紀(jì)要記錄會(huì)議過程。開完會(huì)之后,再有一個(gè)和日歷聯(lián)動(dòng)的智能體,根據(jù)討論內(nèi)容往任務(wù)數(shù)據(jù)庫(kù)里生成今天或明天要做的事,同時(shí)自動(dòng)發(fā)出我們?cè)跁?huì)里決定要跟進(jìn)的 Slack 消息。

所以我們?cè)跁?huì)里基本可以雙手離開鍵盤,把注意力放在問題本身,而不是圍繞問題做一堆繁瑣記錄。

Simon Last:會(huì)議紀(jì)要最近還多了一個(gè)我特別喜歡的功能。它在生成總結(jié)時(shí)會(huì)自動(dòng) @ 提及被提到的人。所以現(xiàn)在只要有人在會(huì)里提到我,我就會(huì)收到通知。

主持人(Alessio):這會(huì)讓你立刻知道,哦,他們正在聊我負(fù)責(zé)的東西。

Simon Last:對(duì)。我一看到這種通知,就會(huì)想,太好了,我應(yīng)該馬上去跟他們聊聊。

Sarah Sachs:這背后其實(shí)也有很多小但關(guān)鍵的質(zhì)量工作。比如如果公司里有兩個(gè) Simon,系統(tǒng)怎么知道會(huì)議里提到的是哪一個(gè)?我們會(huì)做參會(huì)者相似度緩存,也會(huì)建立人物畫像去輔助判斷。目標(biāo)當(dāng)然是盡量別搞錯(cuò)。

會(huì)議紀(jì)要本質(zhì)上就是建立在轉(zhuǎn)錄原語上的智能體原語。它一開始可能只是總結(jié),現(xiàn)在已經(jīng)越來越像一個(gè)數(shù)據(jù)捕獲問題。以后我們當(dāng)然希望它更進(jìn)一步,比如它能在會(huì)議進(jìn)行的同時(shí),知道這場(chǎng)會(huì)對(duì)應(yīng)哪個(gè)任務(wù)數(shù)據(jù)庫(kù)、應(yīng)該往哪里更新哪些任務(wù),讓整個(gè)過程更無縫。

主持人(Alessio):那你們會(huì)不會(huì)去做硬件?比如 OpenAI 現(xiàn)在就在做新的硬件形態(tài)。

Sarah Sachs:大概率不會(huì)。

Simon Last:但我對(duì)這個(gè)品類本身是很興奮的。

Sarah Sachs:我會(huì)把它理解成一種機(jī)制,而這種機(jī)制應(yīng)該和 Notion 深度配合。無論最后是誰在做這類硬件,我們都愿意和他們合作。

現(xiàn)在已經(jīng)有很多很有意思的公司在做可穿戴設(shè)備,他們都在和我們的合作團(tuán)隊(duì)交流。我每次都很愛旁聽這些 demo。因?yàn)槟阃耆梢韵胂,這種能一直陪在你身邊的設(shè)備,一旦能搜索上下文、接入 CRM、再連上 Notion 智能體,會(huì)形成很多新的用法。

但這里又和自定義智能體不太一樣。它越簡(jiǎn)單,你反而越難對(duì)它進(jìn)行那種非常高級(jí)的能力控制。所以它更像是一個(gè)很好的數(shù)據(jù)捕獲入口,不一定適合做復(fù)雜工作流本身。

Simon Last:而且這類設(shè)備天然很私人。公司不可能強(qiáng)迫每個(gè)人都戴個(gè)腕帶,對(duì)吧。

我們真正關(guān)心的切面更像是,公司能不能把會(huì)議里所有這些上下文最終變成對(duì)自己有價(jià)值的記錄和能力。

Sarah Sachs:對(duì),這其實(shí)和我前面說的是一回事。我們的工作不是去構(gòu)建最好的智能體運(yùn)行框架,也不是構(gòu)建最好的硬件。我們的工作是成為人們協(xié)作的最佳場(chǎng)所,是這些記錄最終最該落下來的地方。

主持人(Alessio):也就是說,別人把數(shù)據(jù)管道接進(jìn)來,你們把后面的事做好。

Sarah Sachs:對(duì),我覺得這就是最合理的定位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
李亞鵬復(fù)婚登上熱搜,前妻海哈金喜回應(yīng):我們都是夏夏的父母,不會(huì)不聯(lián)系和尷尬,我們都很好,謝謝大家關(guān)心

李亞鵬復(fù)婚登上熱搜,前妻海哈金喜回應(yīng):我們都是夏夏的父母,不會(huì)不聯(lián)系和尷尬,我們都很好,謝謝大家關(guān)心

魯中晨報(bào)
2026-04-24 18:00:07
不裝了?馬斯克罕見承認(rèn):美國(guó)是第一,但第二到第十全都來自中國(guó)

不裝了?馬斯克罕見承認(rèn):美國(guó)是第一,但第二到第十全都來自中國(guó)

大衛(wèi)聊科技
2026-04-23 12:13:36
魏建軍的“五分鐘暴怒”:撕開長(zhǎng)城汽車高端化轉(zhuǎn)型的“皇帝新衣”

魏建軍的“五分鐘暴怒”:撕開長(zhǎng)城汽車高端化轉(zhuǎn)型的“皇帝新衣”

劉曠
2026-04-24 08:54:54
張朝陽(yáng):我一不談戀愛、二不喜歡應(yīng)酬,我有得是錢,沒必要結(jié)婚!

張朝陽(yáng):我一不談戀愛、二不喜歡應(yīng)酬,我有得是錢,沒必要結(jié)婚!

說點(diǎn)事
2026-04-17 16:40:09
哇塞,這大體格太完美了,誰娶了她,定能旺三代微信

哇塞,這大體格太完美了,誰娶了她,定能旺三代微信

西莫的藝術(shù)宮殿
2026-04-17 18:12:11
施大畏文革期間的畫作,他會(huì)后悔嗎?事實(shí)上卻是他最有價(jià)值的作品

施大畏文革期間的畫作,他會(huì)后悔嗎?事實(shí)上卻是他最有價(jià)值的作品

文學(xué)之私秘
2026-04-25 00:14:26
斯諾克世錦賽26日凌晨!世界冠軍被淘汰,3連鞭,趙心童9-7丁俊暉

斯諾克世錦賽26日凌晨!世界冠軍被淘汰,3連鞭,趙心童9-7丁俊暉

帛河體育
2026-04-26 00:44:20
41歲C羅肌肉依舊炸裂!前私廚揭秘飲食紅線:牛奶堅(jiān)決不碰!

41歲C羅肌肉依舊炸裂!前私廚揭秘飲食紅線:牛奶堅(jiān)決不碰!

仰臥撐FTUer
2026-04-24 14:38:03
銷量大跳水!昔日中年男人的夢(mèng)中豪車賣不動(dòng)了?轉(zhuǎn)頭賣起70萬的表

銷量大跳水!昔日中年男人的夢(mèng)中豪車賣不動(dòng)了?轉(zhuǎn)頭賣起70萬的表

財(cái)經(jīng)八卦
2026-04-24 17:06:14
明明只是戲子,卻把自己當(dāng)大腕,論“耍大牌”,這5位明星夠丟人

明明只是戲子,卻把自己當(dāng)大腕,論“耍大牌”,這5位明星夠丟人

青橘罐頭
2026-04-22 09:59:06
毛主席去世前,留下兩大謎團(tuán),一個(gè)至今無人知曉

毛主席去世前,留下兩大謎團(tuán),一個(gè)至今無人知曉

幽州校尉
2026-03-29 08:12:28
一張嘴封神,秦昊給娛樂圈所有假客氣上了慘痛一課

一張嘴封神,秦昊給娛樂圈所有假客氣上了慘痛一課

草莓解說體育
2026-04-25 20:54:33
你威脅開戰(zhàn),我就以戰(zhàn)爭(zhēng)相回應(yīng)!你想毀滅中國(guó),中國(guó)就先毀滅你!

你威脅開戰(zhàn),我就以戰(zhàn)爭(zhēng)相回應(yīng)!你想毀滅中國(guó),中國(guó)就先毀滅你!

安安說
2026-03-20 11:13:04
紅旗HS6 PHEV低調(diào)上市,17.88萬起的中大型插混SUV到底值不值?

紅旗HS6 PHEV低調(diào)上市,17.88萬起的中大型插混SUV到底值不值?

EV世紀(jì)
2025-12-17 13:31:07
董潔回遼寧過年,分享年夜飯拿手好菜,不受年齡限制的美貌太吸睛

董潔回遼寧過年,分享年夜飯拿手好菜,不受年齡限制的美貌太吸睛

柒佰娛
2026-02-16 10:26:22
重磅!漢莎航空將取消約兩萬個(gè)航班

重磅!漢莎航空將取消約兩萬個(gè)航班

開元周游
2026-04-25 18:03:52
第一次對(duì)現(xiàn)金的購(gòu)買力有這么清晰的概念!網(wǎng)友:不要小瞧一萬塊錢

第一次對(duì)現(xiàn)金的購(gòu)買力有這么清晰的概念!網(wǎng)友:不要小瞧一萬塊錢

夜深愛雜談
2026-03-16 21:38:52
二環(huán)路每天堵車,城墻早沒了,可磚頭還在地鐵里

二環(huán)路每天堵車,城墻早沒了,可磚頭還在地鐵里

王二哥老搞笑
2026-04-24 04:33:59
他逃亡16年,靠贓款娶4個(gè)漂亮老婆生12個(gè)娃,被捕時(shí)身家有幾個(gè)億

他逃亡16年,靠贓款娶4個(gè)漂亮老婆生12個(gè)娃,被捕時(shí)身家有幾個(gè)億

小熊侃史
2026-01-12 07:30:14
被倒數(shù)第1打爆 國(guó)安7輪1勝淪為保級(jí)隊(duì)+21年尷尬 44歲少帥:我全責(zé)

被倒數(shù)第1打爆 國(guó)安7輪1勝淪為保級(jí)隊(duì)+21年尷尬 44歲少帥:我全責(zé)

風(fēng)過鄉(xiāng)
2026-04-25 22:59:11
2026-04-26 01:56:52
CSDN incentive-icons
CSDN
成就一億技術(shù)人
26482文章數(shù) 242272關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

頭條要聞

媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

頭條要聞

媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

體育要聞

那一刻開始,兩支球隊(duì)的命運(yùn)悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財(cái)經(jīng)要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

家居
藝術(shù)
旅游
親子
數(shù)碼

家居要聞

自然肌理 溫潤(rùn)美學(xué)

藝術(shù)要聞

最適合作為抖音總部的大樓,它在福建莆田!

旅游要聞

美猴王VS水蜜桃,連云港、無錫文旅“雙向奔赴”

親子要聞

發(fā)生率僅十萬分之一!這種稀有血型跨省緊急調(diào)配,只為守護(hù)母嬰安全

數(shù)碼要聞

聯(lián)發(fā)科亮相2026北京車展:主動(dòng)式智能體座艙解決方案

無障礙瀏覽 進(jìn)入關(guān)懷版