国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

多Agent 狂吞token,Claude 頂不住了:一人月燒15萬美元,免費(fèi)AI正在退場

0
分享至


整理 | 褚杏娟

Anthropic 團(tuán)隊(duì)正以極高強(qiáng)度內(nèi)部試用 Claude Code。

在過去 52 天里,Claude 團(tuán)隊(duì)推出了 50 多項(xiàng)重大功能更新。x 上有消息稱,Anthropic 80% 的員工每天都在使用 Claude Code,高頻用戶的賬單更是達(dá)到六位數(shù),僅一名員工單月在 Claude Code 上的使用費(fèi)用就高達(dá) 15 萬美元。

與此同時(shí),Claude 外部使用量也正在迎來一輪明顯加速。

“多個(gè)在大型科技公司和初創(chuàng)企業(yè)工作的朋友告訴我,他們每天在 Claude Code 或 Codex token 上的花費(fèi)超過 1000 美元,折合每年 36.5 萬美元?!?Hyperbolic 聯(lián)創(chuàng) Yuchen Jin 感嘆道,“我們距離企業(yè)在大模型 token 上的支出超過人力員工成本的時(shí)代,已經(jīng)不遠(yuǎn)了?!?/p>

消費(fèi)者交易分析公司 Indagari 分析了約 2800 萬美國消費(fèi)者、數(shù)十億筆匿名信用卡交易數(shù)據(jù)。結(jié)果顯示,Claude 付費(fèi)訂閱用戶正以前所未有的速度增長,今年的付費(fèi)訂閱數(shù)大幅增長,規(guī)模已經(jīng)翻了一倍多,Anthropic 發(fā)言人也證實(shí)了該數(shù)據(jù)。

其中,大多數(shù)新增訂閱用戶選擇的是最低檔的 Pro 套餐,價(jià)格為每月 20 美元;相比之下,更高檔套餐的價(jià)格分別為每月 100 美元 和 200 美元。


無論是 Anthropic 在超級(jí)碗期間推出的幾支公開調(diào)侃 ChatGPT 的廣告,還是其與美國國防部之間的矛盾,亦或是 1 月推出的 Claude Cowork 和新上線的 Computer Use 功能,都為其帶來了明顯增長。

盡管如此,Claude 與 ChatGPT 之間仍然有不小差距。數(shù)據(jù)顯示,OpenAI 仍在快速吸引新的付費(fèi)訂閱用戶,并繼續(xù)穩(wěn)居消費(fèi)者 AI 平臺(tái)中的最大玩家。


一邊瘋狂付費(fèi)被限,一邊承擔(dān)風(fēng)險(xiǎn)

用戶規(guī)模不斷變大的同時(shí),Anthropic 前不久調(diào)整了其一向不透明的 Claude 使用限制:在需求高峰時(shí)段,降低向用戶提供服務(wù)的強(qiáng)度,以平衡不斷增長的需求與自身的服務(wù)承載能力。

Anthropic 技術(shù)團(tuán)隊(duì)成員 Thariq Shihipar 在社交媒體發(fā)文稱:“為了應(yīng)對(duì)不斷增長的 Claude 使用需求,我們正在調(diào)整免費(fèi)版、Pro 和 Max 訂閱用戶在高峰時(shí)段的 5 小時(shí)會(huì)話限制。你們的每周總限額保持不變。”


這意味著,在高峰時(shí)段的太平洋時(shí)間 05:00 至 11:00,Claude 用戶可能會(huì)在不到 5 小時(shí)內(nèi)耗盡原本對(duì)應(yīng) 5 小時(shí)會(huì)話的使用額度。而在一天中的其他時(shí)段,同樣的 5 小時(shí)會(huì)話則允許用戶完成更多工作。之所以會(huì)出現(xiàn)這種彈性定義,是因?yàn)?Anthropic 并未公開其 5 小時(shí)會(huì)話窗口內(nèi)具體允許使用多少 token。

根據(jù) Shihipar 的說法,“大約有 7% 的用戶會(huì)撞上此前不會(huì)遇到的會(huì)話限制,尤其是 Pro 檔用戶。如果你在后臺(tái)運(yùn)行高 token 消耗任務(wù),把它們挪到非高峰時(shí)段會(huì)讓你的會(huì)話額度用得更久?!?/p>

Anthropic 表示,在其他需求較低的時(shí)段,公司已經(jīng)擴(kuò)充了可用容量,因此從整體上看,用戶的總使用額度并沒有凈損失。Shihipar 解釋稱:“總體每周限額保持不變,只是它們?cè)谝恢苤械姆植挤绞桨l(fā)生了變化?!?/p>

目前,Anthropic 以兩種形式銷售其 AI 服務(wù):一種是 API,另一種是訂閱服務(wù)。

  • API 用戶按照公開價(jià)格付費(fèi),計(jì)費(fèi)項(xiàng)目包括多種不同類型的 token 使用:Base Input Tokens、5m Cache Writes、1h Cache Writes、Cache Hits & Refreshes,以及 Output Tokens。

  • 訂閱用戶,包括 Free、Pro(每月 20 美元)、Max 5x(每月 100 美元)和 Max 20x(每月 200 美元),則是在一套未公開的使用上限約束下使用 Claude。Anthropic 并沒有明確說明這些限制到底是如何計(jì)算的,用戶也無法據(jù)此提前規(guī)劃自己的 token 使用量。

Anthropic 在文檔中解釋稱:“你的使用情況會(huì)受到多種因素影響,包括對(duì)話的長度和復(fù)雜度、你使用的功能,以及你聊天時(shí)所選擇的 Claude 模型。不同的訂閱計(jì)劃(Pro、Max、Team 等)對(duì)應(yīng)不同的使用額度,付費(fèi)計(jì)劃通常會(huì)提供更高的上限?!?/p>

Claude 用戶可以在一個(gè)儀表盤查看自己在 5 小時(shí)日常會(huì)話限額和每周使用限額中的消耗進(jìn)度。如果用戶超過了限額,Claude 就會(huì)將其鎖定在外,除非他們?cè)敢忸~外付費(fèi)購買更多使用量。

在這套新的 token 分配機(jī)制下,開發(fā)者可以預(yù)期在非高峰時(shí)段能完成更多工作,而在其他時(shí)段完成的工作會(huì)更少。但有多少加州人會(huì)在早上 5 點(diǎn)醒來狠狠寫代碼呢?這無疑引起了很多開發(fā)者反感。

與此同時(shí),用戶還要承擔(dān) Claude Code 隨時(shí)可能爆發(fā)的工程執(zhí)行風(fēng)險(xiǎn)。

Claude Code 剛被曝出一項(xiàng)高風(fēng)險(xiǎn)缺陷:在特定異常情況下,插件市場的后臺(tái)刷新機(jī)制可能會(huì)誤對(duì)用戶當(dāng)前項(xiàng)目倉庫執(zhí)行 git reset --hard origin/main,并且每 10 分鐘觸發(fā)一次,從而清除未提交的本地改動(dòng)。

正常情況下,程序會(huì)定期更新位于 ~/.claude/plugins/marketplaces/claude-plugins-official/ 的官方插件市場副本;但當(dāng)該目錄損壞、尤其是缺失 .git 目錄時(shí),相關(guān) Git 操作可能不會(huì)在插件市場目錄中執(zhí)行,而是錯(cuò)誤地落到用戶當(dāng)前的項(xiàng)目倉庫上。提交者稱,編譯后二進(jìn)制的行為分析顯示,這一流程會(huì)執(zhí)行 git fetch origin 以及 git reset --hard origin/main。

更危險(xiǎn)的是,這類問題并不容易第一時(shí)間被察覺。當(dāng)用戶所有改動(dòng)都已經(jīng)提交時(shí),reset --hard 看起來不會(huì)造成明顯后果,容易讓問題表現(xiàn)得像“偶發(fā)故障”;但一旦用戶處于正常開發(fā)狀態(tài)、仍有未提交修改,就可能遭遇反復(fù)的數(shù)據(jù)丟失。


這并不是個(gè)別開發(fā)者的偶發(fā)經(jīng)歷?!拔乙呀?jīng)遇到過好幾次了。甚至有一次,它還直接強(qiáng)推到了 GitHub 上;而對(duì)于個(gè)人私有項(xiàng)目,GitHub 并不會(huì)啟用分支保護(hù)?!遍_發(fā)者 jeswin 說道。

事實(shí)上,關(guān)于這款現(xiàn)在由 100% AI 代碼構(gòu)成的產(chǎn)品,Github 上提交的問題一直沒斷過。僅在三月份,Claude 服務(wù)器就至少宕機(jī)了五次。

而 AI 工具的用戶們就是處于這樣的矛盾狀態(tài)下:一邊為 AI 產(chǎn)品瘋狂付費(fèi),一邊自己承擔(dān) AI 產(chǎn)品自身的潛在工程風(fēng)險(xiǎn)。

免費(fèi) AI 正在退場

在前期,不少公司靠“高額補(bǔ)貼”“近乎免費(fèi)”甚至“無限試用”吸引了大量用戶。但如今,這種策略正在收縮,免費(fèi) AI 可能真的要結(jié)束了。

最早釋放出明確信號(hào)的,就是 Google。

過去,在免費(fèi)和補(bǔ)貼這條路上,Google 一度走得極為激進(jìn)。它認(rèn)為只要把產(chǎn)品做得“足夠好、足夠便宜”,就有機(jī)會(huì)讓大量用戶繞開 OpenAI 和 Anthropic,重新把 AI 的流量入口奪回自己手里。

但這套策略的代價(jià)也非常高。大量 GPU 資源被幾乎不付費(fèi)的用戶占用,原本應(yīng)該服務(wù)高價(jià)值客戶的資源被不斷擠壓,最終連付費(fèi)用戶的體驗(yàn)都受到影響。比如,有用戶反映,在 T3 Chat 中按 API 價(jià)格購買算力時(shí),會(huì)遇到 Gemini 3.1 因過載無法響應(yīng)的情況;甚至連每月支付 250 美元的訂閱用戶,在 Gemini 3.1 Pro 剛上線時(shí)都無法正常使用,官方給出的解釋依然是容量不足,根本原因正是免費(fèi)資源送得太多了。

這種緊張狀態(tài)開始體現(xiàn)在產(chǎn)品策略上。Gemini CLI 已經(jīng)啟動(dòng)新一輪調(diào)整:更嚴(yán)格地識(shí)別違規(guī)使用場景、優(yōu)先保障某些類型賬號(hào)的流量,并限制免費(fèi)層用戶訪問 Gemini Pro 模型。與此同時(shí),GitHub Copilot for students 也發(fā)生變化,不再支持自由選擇原本附帶的部分高端模型。

“如今已經(jīng)沒有理由繼續(xù)使用 Antigravity 或 Gemini CLI?!庇杏脩糁毖??!癎oogle 的補(bǔ)貼大幅縮水,甚至將免費(fèi)用戶完全排除在 Gemini Pro 之外。盡管我在一定程度上喜歡 Gemini Flash,但它完全無法勝任日常開發(fā)工作。用免費(fèi)版 Gemini 3 Flash 或 Gemini CLI 做正經(jīng)開發(fā),感覺就像用兒童玩具鍵盤開發(fā)真實(shí)應(yīng)用,用玩具卡拉 OK 機(jī)錄制專輯,完全不在一個(gè)層級(jí),顯得十分荒謬?!?/p>

更離譜的是官方關(guān)于“配額控制權(quán)”的表述:如果想直接掌控配額與計(jì)費(fèi),請(qǐng)使用 AI Studio 或 Vertex.ai 的付費(fèi) API key。換句話說,Gemini CLI 官方在直接告訴用戶,“我們會(huì)縮減你付費(fèi)訂閱內(nèi)的可用額度,想用更多就自己另買 API key?!边@一做法極其強(qiáng)硬,明顯在驅(qū)趕用戶。

Google 收縮免費(fèi)權(quán)益的根本原因就是這套模式本身越來越難以維持。

世界上本就不存在“免費(fèi)算力”。如果一家公司愿意把 AI 推理免費(fèi)送給你,那一定另有所圖:可能靠廣告盈利,可能用試用方式轉(zhuǎn)化潛在客戶,也可能在大規(guī)模收集數(shù)據(jù)。更現(xiàn)實(shí)的情況是多種因素疊加,才能讓免費(fèi)模式在商業(yè)上勉強(qiáng)成立,這筆賬必須能從別的地方補(bǔ)上。

現(xiàn)在繼續(xù)大規(guī)模做免費(fèi)補(bǔ)貼,已經(jīng)沒有意義。雖然前沿大模型的單個(gè) token 成本確實(shí)在持續(xù)下降,像 4o、4o mini 這樣的模型,相比早期 GPT-4 32K 已經(jīng)便宜了十倍以上,但現(xiàn)實(shí)是推理需求的復(fù)雜度和規(guī)模上漲得更快。

和 2023 年相比,現(xiàn)在單個(gè)問題生成的 token 數(shù)量至少增加了十倍。原因很簡單:今天的模型已經(jīng)不再只是回答一個(gè)孤立問題,而是會(huì)把整個(gè)代碼庫納入上下文、調(diào)用工具、執(zhí)行多步操作、采集外部數(shù)據(jù),并在每一步中繼續(xù)生成新的內(nèi)容。token 生成量大幅增加,費(fèi)用自然水漲船高。更重要的是,同一個(gè) prompt 帶來的成本漲幅,已經(jīng)抵消甚至超過了單 token 降價(jià)帶來的收益。

過去一條消息可能只生成 200 個(gè) token,現(xiàn)在卻可能達(dá) 200000 個(gè) token,GPU 占用時(shí)間成倍增加。而只要 GPU 正在服務(wù)一個(gè)用戶,就意味著同一時(shí)間無法服務(wù)別人,這本身就是高昂成本。

更長的生成內(nèi)容、更高的 GPU 占用、更久的耗時(shí),這類負(fù)載需求仍在持續(xù)上升。這也是為什么很多 AI 工具在計(jì)費(fèi)模型上遲遲無法做到真正合理。

最初,大多數(shù)用戶并不理解 token 這種抽象計(jì)費(fèi)單位,所以許多產(chǎn)品都選擇了更直觀的方式:按消息數(shù)收費(fèi),包括不少開發(fā)者工具和聊天產(chǎn)品,都曾采用過這種路徑。

但問題很快暴露出來:每一條消息的成本不都一樣。

比如,同樣是在聊天工具里發(fā)一條消息,“2 加 2 等于幾”這樣的請(qǐng)求,模型可能只花 11 個(gè) token 就能回答;但如果讓模型寫幾首關(guān)于 React 的詩,生成的 token 立刻會(huì)翻幾十倍?,F(xiàn)實(shí)里,一條消息在 token 消耗上的差距,甚至能達(dá)到 400 倍。最低的一批請(qǐng)求可能只值 0.001 美元,最高的一批則可能要燒掉數(shù)美元。

一家公司如果把產(chǎn)品定價(jià)為每月 8 美元,但某些用戶一條 prompt 的 API 成本就可能達(dá)到 1 美元,那相當(dāng)于一條請(qǐng)求就吃掉了整個(gè)訂閱收入的八分之一。這樣的產(chǎn)品,只要用戶活躍度稍微上來一點(diǎn),虧損幾乎是必然的。

也正因此,過去一兩年里,圍繞 AI 工具“按消息數(shù)收費(fèi)還是按實(shí)際用量收費(fèi)”的爭議越來越多。去年 Cursor 從按消息數(shù)切換到按使用量計(jì)費(fèi)時(shí),用戶情緒大爆發(fā),本質(zhì)上就是因?yàn)檫@層矛盾終于被擺上臺(tái)面:一條消息,不再只是“一條消息”,而是背后一整套成本系統(tǒng)。

廣告、數(shù)據(jù),撐不起“免費(fèi)模式”

很多人認(rèn)為,像 Google 這樣靠廣告起家的公司,似乎天然更適合做免費(fèi) AI。反正廣告收入那么高,拿一部分補(bǔ)貼推理不就行了嗎?在播主 Theo-t3?gg 看來,現(xiàn)實(shí)遠(yuǎn)沒有這么簡單。

廣告業(yè)務(wù)之所以看上去“年入數(shù)十億”,是因?yàn)樗⒃诤A科毓獾囊?guī)模上,而單次展示能賺到的錢,其實(shí)少得驚人。即便是在擁有高質(zhì)量開發(fā)者受眾、CPM 相對(duì)較高的頻道上,廣告收入拆到單次觀看,往往也只是極低的零頭。

他以自己的經(jīng)驗(yàn)直接表示,“廣告在個(gè)體層面幾乎不賺錢?!北热?,在 28 天內(nèi),他的視頻累計(jì)被觀看 2 萬天時(shí)長、卻僅獲 9000 美元廣告分成(谷歌預(yù)估分成后大約 1.8 萬美元),單次播放廣告收入僅約 0.28 美分,這遠(yuǎn)不足以覆蓋單次可能超 1 美元的 AI 推理成本,他能做下去完全是因?yàn)橐蕾囐澲獭?/p>

另一個(gè)經(jīng)常被拿出來解釋免費(fèi)策略的理由是數(shù)據(jù)。這不全錯(cuò),行業(yè)已經(jīng)反復(fù)證明,那些擁有高質(zhì)量結(jié)果反饋的真實(shí)聊天歷史,對(duì)于訓(xùn)練新模型有非常高的價(jià)值。

你無法用一個(gè)較弱模型生成的數(shù)據(jù),把新模型做得徹底超過原模型,但你可以逼近,而且成本遠(yuǎn)低于從頭訓(xùn)練。也正因?yàn)槿绱?,很多公司?huì)格外在意 prompt、上下文和使用反饋的流向。外界也一直有各種傳聞,說有人試圖通過中間層服務(wù)截取輸入輸出數(shù)據(jù),再拿去訓(xùn)練自己的模型。哪怕這些事并不能被公開驗(yàn)證,它們背后反映的邏輯卻是一致的:真實(shí)用戶數(shù)據(jù)本身,就是 AI 時(shí)代最重要的資產(chǎn)之一。

Cursor 這類產(chǎn)品也能從用戶數(shù)據(jù)中獲益,但遠(yuǎn)不足以支撐完全免費(fèi)服務(wù)。數(shù)據(jù)雖然貴重,也還沒有貴重到足以讓一家公司完全靠“白送推理換數(shù)據(jù)”活下去。

數(shù)據(jù)的價(jià)值高度分化。如果用戶本身并不處于真實(shí)商業(yè)環(huán)境中、沒有公司級(jí)代碼庫,也沒有持續(xù)高質(zhì)量產(chǎn)出,那這些數(shù)據(jù)的價(jià)值就遠(yuǎn)低于那些真正工作在生產(chǎn)環(huán)境中的開發(fā)者。換句話說,數(shù)據(jù)不是沒有價(jià)值,而是它無法替代真正的付費(fèi)轉(zhuǎn)化,只能在一定程度上幫助公司多吞一點(diǎn)成本。

各大公司推行免費(fèi)與補(bǔ)貼的核心原因,是搶奪用戶。

一家公司讓你從原來的產(chǎn)品切到自己的產(chǎn)品,通常只有兩種方式:要么它明顯更好,要么它“足夠好且更便宜”。在今天這個(gè) AI 工具快速變化的階段,用戶已經(jīng)越來越難判斷“誰明顯更好”,尤其當(dāng)每個(gè)人手里都已經(jīng)有好幾個(gè)每月 20 美元、100 美元甚至 200 美元的訂閱時(shí),獲取一個(gè)新用戶的難度大幅提高。在這種情況下,價(jià)格就成了最容易傳達(dá)的競爭力。

但免費(fèi)模式中有一個(gè)經(jīng)常被忽視的細(xì)節(jié):不是所有免費(fèi)用戶都一樣。

理想中的免費(fèi)用戶,是那種“如果免費(fèi),我愿意試;如果它真的更好,我也愿意付錢”的人。但還有另一類用戶,他們只會(huì)在產(chǎn)品免費(fèi)時(shí)出現(xiàn),一旦收費(fèi)就會(huì)消失。這類用戶對(duì)公司來說就是災(zāi)難。他們會(huì)消耗大量 GPU、客服、時(shí)間和支持成本,卻永遠(yuǎn)不會(huì)成為付費(fèi)客戶。甚至很多時(shí)候,他們?cè)谥С謱用娴南谋雀邇r(jià)值用戶還更高。

免費(fèi)或低價(jià)可以帶來大量潛在用戶,但如果產(chǎn)品本身不夠出色,用戶無法留存,前期補(bǔ)貼投入將全部浪費(fèi)。免費(fèi)策略能吸引大量用戶嘗試,但真正優(yōu)質(zhì)的轉(zhuǎn)化來自“因免費(fèi)體驗(yàn)、因產(chǎn)品優(yōu)秀而付費(fèi)”的用戶群體。GitHub 就是典型案例:用戶因免費(fèi)開始使用,進(jìn)入職場后帶動(dòng)企業(yè)付費(fèi),形成健康商業(yè)閉環(huán)。

但如果產(chǎn)品不夠好,免費(fèi)策略只會(huì)吸引“只在免費(fèi)時(shí)使用”的低價(jià)值用戶,這是一條死亡線。這類用戶只會(huì)消耗 GPU、電力、人力與客服成本,付費(fèi)概率幾乎為零,且服務(wù)成本往往更高。

Google 正是陷入了這一困境。其產(chǎn)品競爭力不足,只能依靠免費(fèi)引流,導(dǎo)致 Antigravity 用戶高度兩極化:一端是缺乏付費(fèi)能力的新手程序員,另一端是不愿付費(fèi)的資深用戶,包括 Linus Torvalds 這類知名開發(fā)者也在薅免費(fèi)額度。吸引了大量只消耗資源不產(chǎn)生收入的用戶后,Google 最終不得不收緊這中就不該長期存在的補(bǔ)貼模式。

為什么 Anthropic 能玩轉(zhuǎn)?

同樣是補(bǔ)貼,OpenAI 和 Anthropic 走出的卻是兩條完全不同的路線。

OpenAI 現(xiàn)在更像是在增長階段“搶地盤”。它還沒有拿到足夠高的市場份額,因此愿意通過更激進(jìn)的補(bǔ)貼、臨時(shí)提升 Codex 速率限制,以及推動(dòng)更多外部工具集成等方式,盡可能讓自己的模型出現(xiàn)在更多開發(fā)者的工作流里。

對(duì) OpenAI 來說,現(xiàn)階段最重要的是先成為“最好的選項(xiàng)”,而不是“唯一的選項(xiàng)”。正因如此,它看起來比 Anthropic 更開放、更愿意和生態(tài)伙伴合作。不過,這種開放更多是增長階段的商業(yè)選擇,而不一定是長期立場。一旦市場格局繼續(xù)變化,也未必不會(huì)轉(zhuǎn)向。

Anthropic 的補(bǔ)貼邏輯則只有在一個(gè)前提下才成立,那就是必須把用戶變成終身客戶。如果開發(fā)者可以在 Cursor、Codex CLI 或其他多模型工具里自由切換,Anthropic 給出的高額補(bǔ)貼就很難形成長期回報(bào)。

一個(gè)付費(fèi)能力很強(qiáng)的開發(fā)者,也許每月會(huì)消耗幾千美元的推理成本,但他往往會(huì)把這套工具帶進(jìn)自己的團(tuán)隊(duì),甚至帶進(jìn)整個(gè)公司。這樣一來,很多人雖然訂閱了服務(wù),卻只用了很小一部分額度,而這些低使用率的付費(fèi)用戶,實(shí)際上就在補(bǔ)貼真正的重度用戶。

以 Theo-t3?gg 為例,他雖然一直保留著每月 200 美元的訂閱,但最近主要在用 Cursor 和 Codex CLI,Cloud Code 的實(shí)際使用量并不高,因此自己的額度沒有用滿,等于間接在補(bǔ)貼其他用戶。

企業(yè)采購會(huì)進(jìn)一步放大這種效應(yīng):一個(gè)工程組織統(tǒng)一訂閱之后,真正高頻使用的人往往只占少數(shù)。假設(shè)整個(gè)團(tuán)隊(duì)都開通了服務(wù),最終可能只有 20% 的人會(huì)正常使用,真正高強(qiáng)度使用的甚至只有 10%。這意味著,絕大多數(shù)訂閱費(fèi)用都來自那些并沒有把額度真正吃滿的人,這種結(jié)構(gòu)是其高價(jià)套餐能夠成立的關(guān)鍵。

Theo-t3?gg 提到,Anthropic 每月 200 美元的訂閱,最高可能對(duì)應(yīng)價(jià)值 5000 美元的算力資源。短期看,平臺(tái)在重度用戶身上確實(shí)在虧錢;但隨著推理成本持續(xù)下降,再疊加大量用戶實(shí)際并沒有用滿額度,平臺(tái)就有機(jī)會(huì)逐步把賬算平,甚至走向盈利。更重要的是,這類高價(jià)值個(gè)人用戶還會(huì)帶來團(tuán)隊(duì)和企業(yè)層面的擴(kuò)散,進(jìn)一步提升終身商業(yè)價(jià)值。

相比之下,免費(fèi)用戶并不具備這種邏輯。如果一群用戶只會(huì)在產(chǎn)品免費(fèi)時(shí)出現(xiàn),一旦收費(fèi)就會(huì)消失,那么他們不僅無法形成長期回報(bào),還會(huì)消耗大量 GPU、支持資源和運(yùn)維成本。Google 恰恰在這一點(diǎn)上犯了錯(cuò)。

另外,Google 的問題并不只是補(bǔ)貼力度太大,而更像是組織本身失控了。它確實(shí)迫切想拿到真正的 AI 客戶,但內(nèi)部卻有太多團(tuán)隊(duì)彼此不溝通、互相爭搶 GPU 和資源,開發(fā)者工具團(tuán)隊(duì)甚至無法說服公司把某些模型開放給自己的產(chǎn)品,因?yàn)橘Y源優(yōu)先級(jí)先被讓給了免費(fèi)用戶。

某種意義上,Google 的補(bǔ)貼不是“想清楚之后主動(dòng)選擇”的結(jié)果,而是“補(bǔ)著補(bǔ)著把自己補(bǔ)進(jìn)坑里”的結(jié)果。

結(jié)束語

對(duì)使用這些 AI 工具的開發(fā)者來說,眼下是一個(gè)矛盾又短暫的窗口期。

一方面,大公司之間的競爭,讓補(bǔ)貼和訂閱服務(wù)依然非??犊?;另一方面,所有人都已經(jīng)開始意識(shí)到,這種狀態(tài)不會(huì)永遠(yuǎn)持續(xù)。免費(fèi)會(huì)越來越少,補(bǔ)貼力度會(huì)越來越精準(zhǔn),模型選擇權(quán)會(huì)越來越受平臺(tái)控制,而那些真正高價(jià)值的套餐,也會(huì)越來越像稀缺資源。

所以,對(duì)于用戶來說,現(xiàn)在可能是使用這些工具的一個(gè)“黃金期”:你依然能在相對(duì)低的價(jià)格下,拿到遠(yuǎn)高于自身支付成本的價(jià)值回報(bào)。無論是每月 20 美元,還是 200 美元,只要你真的能把這些工具用起來,它們帶來的生產(chǎn)力提升仍然極具性價(jià)比。

但對(duì)小公司來說,這也是競爭最艱難的時(shí)候。大公司用補(bǔ)貼搶客戶,用高額算力壓縮后來者空間,小公司不僅要承擔(dān)原價(jià) API 成本,還要面對(duì)用戶被教育成“免費(fèi)就是理所當(dāng)然”的市場心態(tài)。

https://www.youtube.com/watch?v=w62xTVuyu3s&t=1s

https://www.newsbytesapp.com/news/science/anthropic-s-claude-sees-explosive-subscriber-growth-amid-pentagon-clash/story

https://techcrunch.com/2026/03/28/anthropics-claude-popularity-with-paying-consumers-is-skyrocketing/

https://www.theregister.com/2026/03/26/anthropic_tweaks_usage_limits/?td=rt-3a

聲明:本文為 AI 前線整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

會(huì)議推薦

QCon 全球軟件開發(fā)大會(huì)·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會(huì)以“Agentic AI 時(shí)代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節(jié)跳動(dòng)、小米、百度等一線科技企業(yè)與創(chuàng)新團(tuán)隊(duì)的技術(shù)專家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進(jìn)展開深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進(jìn)行咨詢。

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
130萬皇馬球迷請(qǐng)?jiān)鸽x隊(duì)!姆巴佩心碎發(fā)聲:等我走了你們才會(huì)后悔

130萬皇馬球迷請(qǐng)?jiān)鸽x隊(duì)!姆巴佩心碎發(fā)聲:等我走了你們才會(huì)后悔

體育閑話說
2026-05-07 08:05:06
吳宜澤奪冠后首度現(xiàn)身國內(nèi),在西安機(jī)場受球迷接機(jī)送花,之后還將舉行見面會(huì),此前他曾表示想回國吃美食、見朋友

吳宜澤奪冠后首度現(xiàn)身國內(nèi),在西安機(jī)場受球迷接機(jī)送花,之后還將舉行見面會(huì),此前他曾表示想回國吃美食、見朋友

極目新聞
2026-05-07 07:12:51
“我要去中國了” 51歲老馬退出斯諾克元老賽 火箭:為錢我會(huì)參加

“我要去中國了” 51歲老馬退出斯諾克元老賽 火箭:為錢我會(huì)參加

風(fēng)過鄉(xiāng)
2026-05-07 07:56:33
行業(yè)第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

行業(yè)第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

商悟社
2026-05-07 00:07:04
740萬觀眾的選擇:這部英劇為何讓刻薄女人成了主角

740萬觀眾的選擇:這部英劇為何讓刻薄女人成了主角

娛圈觀察員
2026-05-06 15:15:55
同濟(jì)大學(xué)教師王某團(tuán)隊(duì)一年兩登《自然》的論文被指造假,本人曾稱“十年磨一劍” 學(xué)校正調(diào)查

同濟(jì)大學(xué)教師王某團(tuán)隊(duì)一年兩登《自然》的論文被指造假,本人曾稱“十年磨一劍” 學(xué)校正調(diào)查

紅星新聞
2026-04-16 21:08:20
豆包搜索黎元洪跳出演員范偉圖片,官方回應(yīng):系媒體大量報(bào)道

豆包搜索黎元洪跳出演員范偉圖片,官方回應(yīng):系媒體大量報(bào)道

PChome電腦之家
2026-05-06 10:22:59
丟了7年的手機(jī)突然發(fā)回定位 還自動(dòng)拍下了使用者的照片 失主:已經(jīng)成功要回了手機(jī)

丟了7年的手機(jī)突然發(fā)回定位 還自動(dòng)拍下了使用者的照片 失主:已經(jīng)成功要回了手機(jī)

閃電新聞
2026-05-06 12:58:59
GPT-5.5 Instant 突然全員免費(fèi)了!

GPT-5.5 Instant 突然全員免費(fèi)了!

新浪財(cái)經(jīng)
2026-05-07 04:41:37
罪有應(yīng)得!以色列,正被全世界集體孤立!

罪有應(yīng)得!以色列,正被全世界集體孤立!

毛豆論道
2026-05-05 17:35:52
日本部署消耗性超廉價(jià)紙板無人機(jī):售價(jià)2000美元 可在5到10分鐘內(nèi)組裝完成

日本部署消耗性超廉價(jià)紙板無人機(jī):售價(jià)2000美元 可在5到10分鐘內(nèi)組裝完成

快科技
2026-05-05 10:29:05
黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

魔都姐姐雜談
2026-05-07 15:17:15
國乒男團(tuán)VS韓國隊(duì),比賽時(shí)間公布,王皓是否換人,央視解說引爭議

國乒男團(tuán)VS韓國隊(duì),比賽時(shí)間公布,王皓是否換人,央視解說引爭議

體育大學(xué)僧
2026-05-07 10:52:38
高校畢業(yè)生創(chuàng)新高 上海打出組合拳護(hù)航就業(yè)

高校畢業(yè)生創(chuàng)新高 上海打出組合拳護(hù)航就業(yè)

看看新聞Knews
2026-05-06 19:32:02
1958年毛澤東視察濟(jì)南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

1958年毛澤東視察濟(jì)南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

史海孤雁
2026-05-05 17:07:19
問題果然出現(xiàn)了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

問題果然出現(xiàn)了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

混沌錄
2026-05-06 23:01:06
江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對(duì)話語權(quán)?

江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對(duì)話語權(quán)?

觀察眼看世界
2026-05-07 11:02:46
馬刺用104歲三塔慶祝!創(chuàng)9紀(jì)錄晉級(jí)概率升75% 文班:反彈意料之中

馬刺用104歲三塔慶祝!創(chuàng)9紀(jì)錄晉級(jí)概率升75% 文班:反彈意料之中

顏小白的籃球夢(mèng)
2026-05-07 18:13:57
普京不想再打了,俄軍打下來的領(lǐng)土,足夠給1億俄羅斯人一個(gè)交待

普京不想再打了,俄軍打下來的領(lǐng)土,足夠給1億俄羅斯人一個(gè)交待

混沌錄
2026-05-05 13:50:21
1933年希特勒接見中國青年潘德明,說了一句話令在場德國軍官震驚

1933年希特勒接見中國青年潘德明,說了一句話令在場德國軍官震驚

超人強(qiáng)動(dòng)物俱樂部
2026-05-07 15:07:42
2026-05-07 18:48:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1477文章數(shù) 149關(guān)注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

媒體:不是中國離不開世界杯 是世界杯更需要中國

頭條要聞

媒體:不是中國離不開世界杯 是世界杯更需要中國

體育要聞

巴黎再進(jìn)歐冠決賽,最尷尬的情況還是發(fā)生了

娛樂要聞

孫楊強(qiáng)迫拉張豆豆手那一幕,我看笑了,也看怒了

財(cái)經(jīng)要聞

金融“風(fēng)暴”,AI制造

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

態(tài)度原創(chuàng)

房產(chǎn)
親子
健康
藝術(shù)
軍事航空

房產(chǎn)要聞

負(fù)債23億,抵押482畝地!海南這家巨頭,慘遭拍賣!

親子要聞

三歲女兒在高鐵上給媽媽送祝福,溫暖又治愈

干細(xì)胞治燒燙傷面臨這些“瓶頸”

藝術(shù)要聞

這位老教授筆下的青年,活力滿滿

軍事要聞

特朗普:美伊"很可能"達(dá)成協(xié)議

無障礙瀏覽 進(jìn)入關(guān)懷版