国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic、OpenAI、谷歌和微軟都認為智能代理控制層是產(chǎn)品,但在定價上存在分歧

0
分享至


作者 | Janakiram MSV

譯者 | 平川

策劃 | Tina

本文最初發(fā)布于 TheNewStack 博客。

3 月 30 日,Sycamore宣布 了 6500 萬美元的種子輪融資,用于構(gòu)建其創(chuàng)始人所說的自主企業(yè)級 AI 操作系統(tǒng)。4 月 8 日,Anthropic 在公共測試版中推出了每會話小時八美分的 托管代理。七天后,OpenAI 將自己的模型原生控制層(harness)作為開源 Agents SDK 的更新 發(fā)布,除標準 API 和工具費用外,無需支付額外的第一方運行時費用。

十六天內(nèi)的三個動作,每一個都是基于相同的市場觀察在押注?,F(xiàn)在,控制層是產(chǎn)品。但各實驗室在如何銷售該產(chǎn)品上存在尖銳的公開分歧。

Anthropic 在自己的基礎(chǔ)設(shè)施上增加了單獨計費的運行時。谷歌和微軟將其打包成一個跨會話、內(nèi)存、代碼執(zhí)行和工具的消費層。OpenAI 將運行時開源并免費提供,只對已經(jīng)計費的模型和工具調(diào)用收費。這個領(lǐng)域正在迅速成型,但商業(yè)模式尚未確定。

1 什么是控制層?它為何會成為一個市場?

“控制層”這個詞在二月份廣泛流傳開來,當時 OpenAI 發(fā)表了一篇工程 博文,描述了一個小型團隊如何交付了一個百萬行的生產(chǎn)級系統(tǒng),其中沒有一行代碼是由人手工編寫的。這個術(shù)語之所以流行了起來,是因為它命名了一個團隊一直在實踐但沒有命名的真實學(xué)科。Martin Fowler 在四月初的一篇長文中對其極力推崇,將控制工程(harness engineering)定義成圍繞 AI 模型但不包括模型在內(nèi)的一切。

控制層是圍繞代理的控制層,幫助其在生產(chǎn)環(huán)境中可靠地運行。它通常涵蓋模型調(diào)用和上下文管理、工具編排、沙箱執(zhí)行、持久化會話和執(zhí)行狀態(tài)、范圍權(quán)限、錯誤恢復(fù)、可觀測性和追蹤。從這個意義上說,它類似于容器周圍的生產(chǎn)基礎(chǔ)設(shè)施:不是模型本身,而是使長期運行的代理更安全、更可調(diào)試且更可靠的周邊系統(tǒng)。

在過去的 18 個月里,云和框架供應(yīng)商提供了這一層的部分托管組件,但大多數(shù)交付生產(chǎn)級代理的團隊仍然有太多的東西需要自己組裝。初創(chuàng)公司通過銷售現(xiàn)成的版本來籌集資金。內(nèi)部平臺團隊基于開源組件構(gòu)建自己的平臺。控制層之所以成為一個市場,是因為現(xiàn)有的組件還無法提供一個完整的解決方案。

2 Anthropic 交付了什么?它的使用成本是多少?

對于這一市場空白,Anthropic 給出的答案是 Managed Agents,他們將其打包為 Claude 平臺上的測試版 API。開發(fā)人員定義代理、工具和護欄,而 Anthropic 則負責運行執(zhí)行環(huán)境。該環(huán)境支持持續(xù)數(shù)小時的長期會話、沙箱化代碼執(zhí)行、范圍限定權(quán)限、端到端追蹤,以及基于 MCP 的第三方服務(wù)連接。

首批客戶頗具影響力。Notion 利用 Managed Agents 同時運行數(shù)十個并行委托任務(wù)。Rakuten 在產(chǎn)品、銷售、市場營銷、財務(wù)和人力資源等部門部署了專家代理。Sentry 開發(fā)了一個代理,能夠?qū)擞洺龅?Bug 自動轉(zhuǎn)換為公開的拉取請求,無需任何人工干預(yù)。Asana 將該服務(wù)集成到了其 AI Teammates 功能中,而 Atlassian 也成為首批客戶之一。

其定價相對比較透明。所有模型推理都適用于 Claude 平臺的標準令牌費率,會話運行期間每會話小時八美分的基礎(chǔ)使用費。多代理編排、自我評估結(jié)果和長期記憶需要通過單獨的研究預(yù)覽訪問申請才能獲得,這也就意味著其中三項最引人注目的功能使用受限。

Anthropic 還提供了一個 Claude Agent SDK 用于編程構(gòu)建,因此托管與開源的區(qū)別在于產(chǎn)品而不是公司。但托管代理,4 月 8 日發(fā)布的那一部分,僅托管在 Anthropic 的基礎(chǔ)設(shè)施上。

3 OpenAI 發(fā)布了什么?它的使用成本是多少?

七天后,OpenAI 下了不同的賭注。升級后的開源 Agents SDK 增加了模型原生控制層和本地沙箱執(zhí)行,提供可配置的內(nèi)存、沙箱感知編排、Codex 風(fēng)格的文件系統(tǒng)工具和標準化的 MCP 集成。它針對的是持續(xù)好幾個小時并調(diào)用許多工具的長程代理(long-horizon agents),和托管代理針對的用例一樣。

該交付模式和 Anthropic 截然不同。OpenAI 不負責運行計算任務(wù)。開發(fā)者通過支持七家沙箱提供商(包括 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel)的 Manifest 抽象層自帶計算資源,存儲則分布于 S3、GCS、Azure Blob 和 Cloudflare R2 上。狀態(tài)外部化使運行實例能在沙箱容器丟失后繼續(xù)存活,并通過快照功能在新容器中恢復(fù)運行。雖然控制層負責協(xié)調(diào),但基礎(chǔ)設(shè)施歸開發(fā)者所有。

價格線是對比最明顯的地方。OpenAI 的公告指出,新功能采用基于令牌和工具使用情況的標準 API 定價,不收取單獨的第一方運行時費用,也不按會話小時計費。SDK 本身是免費且開源的。開發(fā)者仍然需要向其選擇的任何服務(wù)提供商支付使用沙箱計算和存儲所產(chǎn)生的實際費用,因此總成本并非為零,但 OpenAI 拒絕設(shè)置單獨的運行時收費項目。根據(jù)工作負載的形態(tài),總成本可能高于或低于 Anthropic 捆綁的模型。

OpenAI 明確說明了原因。他們在公告中指出,雖然托管代理 API 簡化了部署,但代價是限制代理運行的位置以及它們訪問敏感數(shù)據(jù)的方式。這是公開與 Anthropic、谷歌和微軟背道而馳。

4 各實驗室都同意應(yīng)該有這一層,但他們對如何計費持不同的看法。

谷歌將 Vertex AI Agent Engine 列為完全托管的運行時,包括會話、內(nèi)存、代碼執(zhí)行和可觀測性,每一項都作為單獨的消費線計費,而不是單一的每小時費用。微軟提供的 Foundry Agent Service 則基于模型和工具的使用計費,對于 Code Interpreter 等工具有特定的會話計量,而不是整個平臺統(tǒng)一計費。亞馬遜云科技在 2 月份 宣布,將與 OpenAI 共同創(chuàng)建一個有狀態(tài)的運行時環(huán)境,未來幾個月通過 Bedrock 提供,同時 Bedrock AgentCore 將作為運行時原語層。

這些都是不同的定價模式。Anthropic 將計算、狀態(tài)和編排打包在一起,按每小時會話計費。谷歌則單獨計量組件,而微軟按模型和工具計量。亞馬遜云科技將在 OpenAI 運行時發(fā)布后增加另一個托管路徑。OpenAI 的官方答案則完全跳過了運行時計量。

這五家供應(yīng)商一致認為這一層很重要,他們都想擁有它。他們存在分歧的地方是,該產(chǎn)品究竟是具備獨立計費系統(tǒng)的托管服務(wù)、一套收費的原語集合,還是由商業(yè)模式支撐的開源 SDK。這種分歧并非僵局,而是一種有意為之的戰(zhàn)略差異。

5 AI 中間件架構(gòu)路線出現(xiàn)了分裂。

云基礎(chǔ)設(shè)施領(lǐng)域此前曾經(jīng)出現(xiàn)過這種分化,而結(jié)果并非是哪一方被完全取代。Terraform 作為開源項目繼續(xù)存在,與 AWS CloudFormation 的托管服務(wù)并行發(fā)展。Kubernetes 同樣保持開源,并成為了事實上的行業(yè)標準,盡管亞馬遜云科技、谷歌和微軟都推出了托管的容器服務(wù)。在這兩種情況下,開源都沒有取代托管服務(wù),托管服務(wù)也并未淘汰開源。它們之所以能夠共存,是因為它們服務(wù)于截然不同的用戶群體。

我們的經(jīng)驗是,當一個供應(yīng)商提供免費的開源軟件,其他供應(yīng)商提供付費的托管軟件時,市場傾向于根據(jù)基礎(chǔ)設(shè)施偏好分化,而不是崩潰。想要托管便利性的團隊會轉(zhuǎn)向托管服務(wù)。想要控制權(quán)、可移植性或多云靈活性的團隊會轉(zhuǎn)向開源技術(shù)棧。這兩種模式都在云時代支撐著真實的業(yè)務(wù)運營。

獨立開發(fā)者銷售該層橫向版本的經(jīng)濟模式開始發(fā)生變化。OpenAI 提供的免費原生模型框架,會給獨立框架帶來定價壓力,而且遠超任何付費托管服務(wù)。云計算的模式正在顯現(xiàn),但正同時經(jīng)歷著兩重壓縮。

6 這對希望填補空白的初創(chuàng)公司意味著什么?

我認為,初創(chuàng)企業(yè)的風(fēng)險特征變得更加明確了。Sycamore 向 Coatue 和 Lightspeed 的推介重點是企業(yè) AI 中的信任、治理與控制,并內(nèi)置了多模型支持。這一推介方案在面對 Anthropic 主導(dǎo)的路線和 OpenAI 的開源路線時都具有充分的說服力,因為它瞄準的是那些非常希望避免依賴任何單一實驗室的買家。在此背景下,Sycamore 看上去并不像是那種容易受到?jīng)_擊的典型模式。

在我看來,這些發(fā)布所凸顯的典型模式是“橫向編排框架”。如今,LangChain、CrewAI 和 VoltAgent 正在與他們所依賴的實驗室展開更直接的競爭,他們使用這些實驗的模型,但后者推出了免費、模型原生的控制層框架。當相關(guān)供應(yīng)商免費提供一個與其前沿模型高度契合的開源控制層時,那些主張“模型無關(guān)”框架的論點(即靈活性優(yōu)于供應(yīng)商鎖定)就變得更難站住腳了。那些仍在向企業(yè)買家推銷橫向“模型無關(guān)”編排層的廠商,未來恐怕將面臨更艱難的談判。

銷售付費托管平臺的初創(chuàng)公司則面臨來自 Anthropic、谷歌和微軟的壓力。在我看來,從戰(zhàn)略上講,應(yīng)對這兩種壓力的方法似乎是一樣的:在治理、合規(guī)、垂直深度或多模型控制方面實現(xiàn)差異化,或者在價格上與免費服務(wù)和打包服務(wù)展開競爭。

7 這對自建團隊意味著什么?

在“自建與采購”的權(quán)衡中,出現(xiàn)了兩個新的參考點。希望采用捆綁式基礎(chǔ)設(shè)施的團隊,可以將內(nèi)部系統(tǒng)與 Anthropic Managed Agents 進行對比——后者的定價為每會話小時 8 美分外加 Token 費用。而已經(jīng)擁有自有基礎(chǔ)設(shè)施的團隊,則可以將 OpenAI SDK 作為參照,該方案除需支付沙箱和存儲服務(wù)提供商的費用外,不再額外收取第一方運行時費用。至于哪一個更具參考價值因團隊而異。在一個月前,這兩個選項都還不存在。

對于仍處于原型階段的團隊來說,一夜之間,便無法把從頭開始構(gòu)建腳手架難度大當理由了。過去被認為是差異化工程的基礎(chǔ)性工作,現(xiàn)在可以通過 API 或免費的 SDK 獲得。對于已經(jīng)投入生產(chǎn)應(yīng)用的團隊而言,可能內(nèi)部系統(tǒng)仍然更適合當前的工作負載。但現(xiàn)在,其維護團隊正和四個前沿實驗室在他們進行著積極投資的領(lǐng)域里展開競爭,這將使這項工作進展變慢,地位變低,招聘難度變大。

自建仍然是一個有效的選擇,不過需要在工作負載適應(yīng)性和團隊可持續(xù)性兩個基準上都勝出,而不是一項都不行。

8 接下來會發(fā)生什么?

控制層本應(yīng)成為護城河。在十八個月的時間里,大多數(shù)交付生產(chǎn)級代理的團隊都自己構(gòu)建或組裝了自己的控制層,這就是差異化。前沿實驗室集體決定不出售模型訪問權(quán),看著別人捕獲其上的邊際利潤,但他們在如何自己獲取利潤上存在分歧。其中三個實驗室以某種形式對運行時收費。有一個實驗室則免費提供控制層,轉(zhuǎn)而押注于模型忠誠度。

值得關(guān)注的問題是哪個商業(yè)模式會勝出,或者市場是否能夠都支撐。OpenAI 的賭注是,一個免費的、開源的、模型原生的控制層會比付費的托管運行時帶來更多的模型消費,而 Bedrock 合作伙伴關(guān)系則涵蓋了希望采用托管服務(wù)的企業(yè)。Anthropic 則押注于付費的完全托管版本,而谷歌和微軟則押注于將定價明確的組件整合到更廣泛的平臺中。這些可能適用于不同的模式。那些在場外觀望的初創(chuàng)公司需要先弄清楚市場的主流趨勢,再制定差異化戰(zhàn)略。敬請關(guān)注,后續(xù)我將繼續(xù)為你解讀“控制層”和“運行時”這兩個不斷演進的概念。

https://thenewstack.io/ai-agent-harness-pricing-split

聲明:本文為 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

南方都市報
2026-04-26 20:40:18
男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢也怕堵車

男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢也怕堵車

丫頭舫
2026-04-27 17:39:57
38歲王思聰近照認不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

38歲王思聰近照認不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

橙星文娛
2026-04-27 14:17:09
2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補時絕平,曼聯(lián)險勝

2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補時絕平,曼聯(lián)險勝

足球狗說
2026-04-28 05:07:09
“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

未央看點
2026-04-27 22:13:40
從排隊入籍到集體觀望?美國入籍申請驟降,綠卡人群態(tài)度變了?

從排隊入籍到集體觀望?美國入籍申請驟降,綠卡人群態(tài)度變了?

紐約時間
2026-04-28 02:29:16
看完女排最新集訓(xùn),心里五味雜陳!別說里約,連倫敦周期都比不上

看完女排最新集訓(xùn),心里五味雜陳!別說里約,連倫敦周期都比不上

金毛愛女排
2026-04-28 00:00:04
Deepseek,光通信之后的下一個主升浪

Deepseek,光通信之后的下一個主升浪

靜姐的財富第六感
2026-04-26 22:31:06
淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

風(fēng)過鄉(xiāng)
2026-04-27 06:15:09
有的人為了當官,把老婆送給領(lǐng)導(dǎo)睡

有的人為了當官,把老婆送給領(lǐng)導(dǎo)睡

斜杠人生
2026-04-28 00:00:04
金價:大家不用等候了!不出意外,金價可能將歷史重演!

金價:大家不用等候了!不出意外,金價可能將歷史重演!

殘夢重生來
2026-04-28 04:40:09
不到72小時,俞敏洪再迎兩大壞消息,主播集體辭職只是“開胃菜”

不到72小時,俞敏洪再迎兩大壞消息,主播集體辭職只是“開胃菜”

阿廢冷眼觀察所
2026-04-28 00:24:36
皮蛋再次成為關(guān)注對象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

皮蛋再次成為關(guān)注對象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

健康科普365
2026-04-25 09:27:08
七萬匹東洋大馬的覆滅:國民黨三年敗光日本四十五年心血

七萬匹東洋大馬的覆滅:國民黨三年敗光日本四十五年心血

小莜讀史
2026-04-26 22:44:33
特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

線裝史冊
2026-04-28 02:38:29
東南亞隱藏的“電詐大佬”,一個個正在浮出水面

東南亞隱藏的“電詐大佬”,一個個正在浮出水面

現(xiàn)實的聲音
2026-04-27 20:36:14
大姑子一家9口住進來,老公說他5200養(yǎng)活全家足夠,我?guī)夯啬锛?>
    </a>
        <h3>
      <a href=麥子情感故事
2026-04-27 21:34:15
沒人再提激光雷達數(shù)量?直擊北京車展:今年智能駕駛“卷”什么

沒人再提激光雷達數(shù)量?直擊北京車展:今年智能駕駛“卷”什么

時代周報
2026-04-26 18:14:26
涉黃被傳喚,馬斯克出事了

涉黃被傳喚,馬斯克出事了

營銷頭版
2026-04-27 14:42:14
中國排協(xié)官宣!16點30分,女排訓(xùn)練將直播,第二批球員恐揭曉

中國排協(xié)官宣!16點30分,女排訓(xùn)練將直播,第二批球員恐揭曉

跑者排球視角
2026-04-27 23:48:17
2026-04-28 05:28:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
12309文章數(shù) 51863關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

健康
藝術(shù)
時尚
游戲
軍事航空

干細胞如何讓燒燙傷皮膚"再生"?

藝術(shù)要聞

他的油畫筆觸粗獷又細膩,透著一種不可言說的美!

絲巾的10種系法,愛美的女人必看

《AC黑旗》重制版新增專屬劇情!原版編劇親自執(zhí)筆

軍事要聞

伊朗外長折返伊斯蘭堡內(nèi)情披露

無障礙瀏覽 進入關(guān)懷版