国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Token的成本下降10倍,但大模型公司卻離盈利越來越遠(yuǎn)

0
分享至

這篇文章的作者Ethan Ding,系統(tǒng)性地闡明了如今正在AI行業(yè)發(fā)生的一個(gè)“詭異”現(xiàn)象:雖然Token的單位成本下降了,但是由于AI能做的事越來越多,越來越被更多的人自動化地執(zhí)行更大的任務(wù), Token的消耗爆炸了,大模型公司的虧損率都在不斷提高。

不過,這對經(jīng)歷過多次互聯(lián)網(wǎng)補(bǔ)貼大戰(zhàn)的中國用戶來說,卻也遠(yuǎn)不算什么新鮮事了:業(yè)務(wù)發(fā)展越來越紅火,虧損額度越來越大,公司估值節(jié)節(jié)走高,直到......

未來,大語言模型的單位成本,也許還會一次又一次地便宜10倍,但AI付費(fèi)訂閱服務(wù)依然會被榨干。


token可以理解為詞元,在大模型里,token 是分詞器把文本切分后的最小處理/計(jì)費(fèi)單位,它可能是一個(gè)字、一個(gè)詞或一個(gè)標(biāo)點(diǎn)。模型的上下文長度、生成長度、速度與費(fèi)用,都按token計(jì)量。

但是,要注意它不直接等同于“字”或“詞”,拆分規(guī)則要由具體分詞器決定。

如若要了解token和大語言模型的具體工作原理,可參考這篇:

如下為《ai subscriptions get short squeezed》的正文,enjoy,歡迎點(diǎn)贊、轉(zhuǎn)發(fā)和收藏。

想象一下:你創(chuàng)立了一家公司,但你心里清楚,消費(fèi)者每月最多只愿意付20美金(如今大部分AI大模型服務(wù)的月費(fèi)價(jià)格)。

沒關(guān)系,你心想,典型的VC打法——按成本價(jià)收費(fèi),為增長犧牲利潤率,CAC、LTV 之類的賬,你也都算過了。

不過接下來就有意思了,你看過 a16z 的那張圖,顯示 LLM 的成本每年下降 10 倍。


于是你心里盤算,今天每月20美金,可以做到收支平衡,等模型明年成本降低10 倍:砰的一下,利潤率就有 90% 了。

虧損只是暫時(shí)的,利潤終將到來!

這個(gè)策略,簡單到連 VC 公司新人都能懂

  • 第一年:每月20美金 實(shí)現(xiàn)收支平衡

  • 第二年:算力成本降低 10 倍,利潤率達(dá)到 90%

  • 第三年:買個(gè)豪華大游艇!

這個(gè)策略,確實(shí)也說得通,因?yàn)榇蠹叶荚谀钸叮骸按竽P屯评淼某杀荆?6 個(gè)月就降至原來的三分之一,我們會沒事的?!?/p>

但是,18個(gè)月后,你的利潤率依然負(fù)得不能再負(fù)。

Windsurf 公司最終被拆解變賣,Claude Code 本周(25年8月初)也不得不下架了后來推出的每月200 美元但不限量的套餐。

公司們?nèi)栽诔掷m(xù)流血。

模型確實(shí)更便宜了,GPT-3.5 的調(diào)用費(fèi)用,已經(jīng)只有原來的十分之一。但不知為何,利潤率反而更糟了。

這是不是有哪里不對?

一、沒人想要前天的報(bào)紙

GPT-3.5 現(xiàn)在雖然便宜了 10 倍,但它的吸引力也和在 iPhone 發(fā)布會上亮相的翻蓋手機(jī)一樣低。

當(dāng)一款新模型作為 SOTA 問世時(shí),99% 的用戶需求會立刻轉(zhuǎn)向它,消費(fèi)者對所有產(chǎn)品都是這么做的。

現(xiàn)在來看看那些前沿模型的實(shí)際定價(jià)歷史,也就是任何時(shí)候都占據(jù) 99%用戶需求的那些模型:


看看上圖,發(fā)現(xiàn)什么了嗎?

當(dāng) GPT-4 以 $60 的價(jià)格推出時(shí),盡管 GPT-3.5(之前的SOTA)便宜 26 倍,所有人還是一窩蜂地改用 GPT-4。

當(dāng) Claude 3 Opus 以 $60 推出時(shí),哪怕 GPT-4 已經(jīng)降價(jià),人們還是轉(zhuǎn)向了 Claude 3 Opus。

10 倍降成本確實(shí)存在,但體現(xiàn)在上一代的模型上。

所以,這就是“成本會下降”戰(zhàn)略站不住腳的第一個(gè)原因:市場對“最好的語言模型”有需求,就是這么簡單。

然而,最好的模型價(jià)格始終都差不多貴,因?yàn)槟谴砹水?dāng)下推理所需的最大成本。

當(dāng)你和 AI 相處時(shí)——無論是在編程、寫作還是思考——你總是追求最高的質(zhì)量。

沒有人會打開 Claude 想:“嗯,要不我用那個(gè)老版本幫老板省點(diǎn)錢?!?/p>

我們在認(rèn)知上都是貪婪的生物,想要能獲得的最強(qiáng)大腦,特別是當(dāng)我們拿自己的寶貴時(shí)間去換取它的時(shí)候。

二、Tokens的消耗,比我們想象中還要多

“好吧,但這仍然可控,對吧?我們就一直保持收支平衡不就行了?”

哎,天真的孩子

的確,每一代前沿模型的單個(gè)Token 成本,確實(shí)也沒有變貴。

然而,出現(xiàn)更糟糕的情況:模型消耗的 Token 數(shù)量,呈現(xiàn)了爆炸式增長。

以前,ChatGPT 對一句話的問題,只回復(fù)一句話。

現(xiàn)在,Deep Research模式要花 3 分鐘來規(guī)劃,20 分鐘來閱讀,再用 5 分鐘為你重寫一份報(bào)告。

推理階段計(jì)算量的激增,導(dǎo)致了一個(gè)誰也沒預(yù)料到的結(jié)果:AI 能夠完成的單次任務(wù)長度,每六個(gè)月翻一番。

過去返回1000 個(gè) Token 的任務(wù),現(xiàn)在返回10萬個(gè)。

當(dāng)你把趨勢往后推算,數(shù)字瘋狂得離譜。

目前,一次 20分鐘的“深度研究”運(yùn)行成本大約是1美金。

到了 2027 年,我們將有 Agent 可以連續(xù)運(yùn)行 24 小時(shí),而不丟失上下文,再考慮前沿模型的單價(jià)并未下降,那就是一次運(yùn)行要燒掉72美金。

也就是每位用戶每天72美金,而且用戶還可以同時(shí)并行運(yùn)行多個(gè)這樣的任務(wù)。

一旦我們能部署 Agent 異步執(zhí)行連續(xù) 24 小時(shí)的任務(wù),我們就不會再一次只給它一條指令然后等反饋了。

我們會批量調(diào)度它們,整個(gè) AI 艦隊(duì)們并行地攻克問題,燒起Token來就跟不要錢似的。

顯然,這一點(diǎn)怎么強(qiáng)調(diào)都不為過:每月20美金的付費(fèi)訂閱,連支撐一個(gè)用戶每天跑一次成本1美金的深度研究模式都做不到。

但,這恰恰是我們正在面對的局面。

模型能力每提高一次,都意味著它們一次能夠有效利用的算力上限又升高了。

這就像造出了一臺更省油的發(fā)動機(jī),然后用省下的油去造了一輛巨型卡車。

沒錯(cuò),你每加侖油是能跑得更遠(yuǎn)了,但你也會一次燒掉 50 倍的油。

這種局面,逼得Windsurf 不得不賣身,任何采用“固定費(fèi)用套餐 + 高強(qiáng)度 Token 消耗”模式的創(chuàng)業(yè)公司,如今都正處于槍口之下。

三、Anthropic奮力應(yīng)對這場逼空

Claude Code 推出的Max-Unlimited套餐,可以說是我們見過的、為抵御這場風(fēng)暴所做的最精密嘗試。然而,他們用盡了一切招數(shù),但最后仍然被擊潰了。

他們的策略確實(shí)很巧妙:

1、價(jià)格定高 10 倍:當(dāng) Cursor 收 $20/月 時(shí),它定 $200/月。先留出更大的緩沖區(qū),好讓出血開始前能多撐一陣子;

2、按負(fù)載自動切換模型:負(fù)載高時(shí)就從 Opus 模型($75/百萬 Token)切換到 Sonnet 模型($15/百萬),閱讀時(shí)用 Haiku 模型優(yōu)化。

就像 AWS 的彈性擴(kuò)容,只不過更加用在“刀刃”上。

他們肯定把這種行為,直接寫進(jìn)了模型權(quán)重里。這是一種范式轉(zhuǎn)變,后面我們大概率會更常見到。

3、把計(jì)算量轉(zhuǎn)給用戶的機(jī)器:如果用戶的 CPU 都閑著,為什么還要自己開沙箱sandboxes呢?

盡管用了這些高明的工程手段,Token的消耗仍然像超新星一樣爆炸了。


排名第一的用戶,消耗了100億個(gè) Token,相當(dāng)于在一個(gè)月里輸出了1.25萬本《戰(zhàn)爭與和平》的內(nèi)容。

怎么做到的?就算每次連續(xù)運(yùn)行 10 分鐘,一個(gè)用戶又怎么能燒掉 100 億個(gè)Token呢?

結(jié)果發(fā)現(xiàn),連續(xù)運(yùn)行 10~20 分鐘,剛好足夠卡詩“for loop”的妙用。

一旦將 Token 消耗與用戶在應(yīng)用中的時(shí)間解耦decouple,物理規(guī)律就接管了一切:把 Claude 丟去執(zhí)行一個(gè)任務(wù),讓它自己檢查結(jié)果、重構(gòu)、優(yōu)化,如此循環(huán),直到破產(chǎn)為止。

用戶變成了 API 編排者,在 Anthropic 買單的情況下,7×24 小時(shí)地運(yùn)行代碼轉(zhuǎn)換引擎。

從聊天到 Agent 的演化,一夜之間就發(fā)生了,消耗量暴增了 1000 倍。

這是一次相變,而不是漸變。

于是, Anthropic 下架了無限量套餐。

他們本可以嘗試每月2000美金的訂價(jià),但教訓(xùn)不在于價(jià)格夠不夠高,而在于在這個(gè)新世界中,無論哪種訂閱模式,都不可能撐得起無限使用。

換言之,在這個(gè)新環(huán)境下,不存在行得通的固定訂閱價(jià)。

這筆賬已經(jīng)從根本上算不平了。

四、其他人的囚徒困境
這讓其他所有公司都陷入了一個(gè)進(jìn)退兩難的處境。
每家AI公司都知道按用量計(jì)費(fèi)(而不是固定價(jià)格),就能救自己,但他們也知道那么做會要了自己的命。
你在老老實(shí)實(shí)按 $0.01/1000Token收費(fèi),你那靠風(fēng)投資金支持的競爭對手卻提供每月只需$20的無限量套餐。
用戶會選誰,還用猜嗎?

典型的囚徒困境:

  • 大家都按用量收費(fèi) → 行業(yè)可持續(xù)發(fā)展

  • 大家都按包月收費(fèi) → 一起卷到死

  • 你按用量收,別人包月 → 你先死

  • 你包月收,別人按用量 → 你贏了,但遲早也得死

結(jié)果就是,人人都選擇了背叛。

大家都去補(bǔ)貼重度用戶,所有人都在曬高斜率的增長曲線,但最終大家都不得不發(fā)布“重要定價(jià)更新”的公告。

Cursor、Lovable、Replit,他們心里都清楚賬怎么回事。他們選擇了今天先拼增長、明天再談盈利,最終難免破產(chǎn),但那是下任 CEO 才要操心的問題。

老實(shí)說,也許他們最終是對的。

在跑馬圈地階段,市場份額確實(shí)比利潤率更重要。只要 VC 們還在不斷掏錢,填補(bǔ)單位經(jīng)濟(jì)的虧空。

但去問問 Jasper,當(dāng)音樂停止時(shí)會發(fā)生什么吧。

五、避免死局?
難道真的有辦法,避免這場“死局”嗎?
據(jù)傳,Cognition 最近正以150 億美元估值融資,而它對外公布的 ARR ,還不到1 億美元(我猜也就 5000 萬左右)。
對比之下,Cursor 在 ARR5 億美元時(shí),融到了100 億美元的估值,增長曲線要陡峭得多。
前者收入不到后者的八分之一,估值卻達(dá)到了后者的三分之二。
風(fēng)投們知道關(guān)于 Cognition 的什么秘密,是我們所不知道的嗎?兩家公司做的都是寫代碼的 AI Agent。
難道 Cognition 找到了擺脫死亡螺旋的辦法?

從邏輯上看,避開死局有三條出路:

1、從第一天起就按使用量計(jì)費(fèi)

不補(bǔ)貼用戶,不搞「先拉用戶、以后再變現(xiàn)」,而是老老實(shí)實(shí)按經(jīng)濟(jì)賬來,理論上這聽上去很不錯(cuò)。

可是,有按量計(jì)費(fèi)且大獲成功的面向消費(fèi)者的 AI 公司嗎?

消費(fèi)者討厭分段計(jì)費(fèi)!

他們寧愿多花錢買不限量,也不想事后收到賬單時(shí)被嚇一跳。

每一家成功的 to C 訂閱服務(wù)——Netflix、Spotify、ChatGPT——用的都是統(tǒng)一套餐。

你只要一加上計(jì)量表,增長立馬死掉。

2、極高的切換成本 ,然后帶來高利潤率

Devin 正是all in在這條路上。

他們最近宣布了和花旗銀行及高盛的合作:在每家讓 4 萬名軟件工程師上手 Devin。按每人每月20美金算,這是個(gè)年收入近1000萬美金的項(xiàng)目。

但問題來了:你是愿意有來自高盛的1000萬美金的ARR,還是愿意有來自發(fā)燒級開發(fā)者們的5億美金ARR?

答案顯而易見:6 個(gè)月的部署實(shí)施、合規(guī)審核、安全審計(jì)、采購地獄……這意味著拿下高盛的單子非常困難,雖然一旦拿下,就幾乎不可能被撼動。只有當(dāng)銀行里那個(gè)拍板的人,把自己的聲譽(yù)都押在你身上時(shí),你才能簽下這些合同。而簽了約后,每個(gè)人都會想方設(shè)法把項(xiàng)目做成。

這也是為什么在超大規(guī)模云廠商之外,最大的那些軟件公司全都是賣比如 CRM/ERP/EHR等系統(tǒng)的,它們面向的正是這些客戶。這類公司通常能做到 80-90% 的利潤率,因?yàn)榭蛻粼绞遣蝗菀鬃?,你的買家對價(jià)格就越不敏感。

當(dāng)競爭對手趕到時(shí),你已經(jīng)在客戶的體系中扎根很深,想切換得再耗一個(gè) 6 個(gè)月的銷售周期。他們并非走不了,而是你客戶的 CFO寧死也不想再經(jīng)歷一次選擇過程了。

3、垂直整合,靠基礎(chǔ)架構(gòu)賺錢

這是 Replit 的游戲:把編碼 Agent 和應(yīng)用托管、數(shù)據(jù)庫管理、部署監(jiān)控、日志等打包提供。

每個(gè) Token 都在虧錢,但你在這代新開發(fā)者的技術(shù)棧中每一層其他地方都攫取了價(jià)值,以下是 Replit 是如何做到高度垂直整合的。


把 AI 虧本賣,然后引流,來帶動那些與 AWS 競爭的服務(wù)消費(fèi)。你賣的不是推理本身,你賣的是其余的一切,而推理部分只是營銷開支。

絕妙之處在于,代碼生成,自然而然會催生托管的需求。

每個(gè)應(yīng)用都需要運(yùn)行的地方,每個(gè)數(shù)據(jù)庫都需要維護(hù),每次部署都需要監(jiān)控。

就讓 OpenAI 和 Anthropic 去把推理價(jià)格卷到歸零吧,而你擁有其余所有部分。

那些還在玩“固定套餐、不計(jì)成本增長”的公司,都是行尸走肉,它們不過是把昂貴的葬禮安排在了第四季度而已。

六、前路和未來

我總是看到一些創(chuàng)始人,指望著“模型明年會便宜 10 倍”,把它當(dāng)成救命稻草。

沒錯(cuò),模型會更便宜,但你的用戶會期待它們多干出 20 倍的活。

Cursor 對Windsurf 損益的壓力,讓他們找不到脫身之策。

就連擁有地球上最垂直整合應(yīng)用層的 Anthropic ,也無法讓無限量的固定訂閱模式跑通。

雖然我常說,先發(fā)制人勝過策略聰明being early beats being smart,但是,如果只是搶先,卻沒有計(jì)劃,也意味著你只是第一個(gè)進(jìn)墓地的人。

如今,不會有 Google 給負(fù)利潤業(yè)務(wù)開出 24 億美元的支票。

當(dāng)“以后再說”意味著你的AWS 賬單已經(jīng)比營收還高時(shí),也就沒什么“以后再說”的余地了。

完。

歡迎關(guān)注、收藏和分享,點(diǎn)贊代表催稿下一篇,嘻嘻,之后我會發(fā)布黃仁勛出道以來推薦過的書,這位老哥非常神奇,現(xiàn)年62歲、創(chuàng)業(yè)32年的他,似乎一共只推薦過7本書,但是本本經(jīng)典,敬請期待。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
吳樹國不幸去世,年僅55歲,學(xué)校官網(wǎng)已變黑白

吳樹國不幸去世,年僅55歲,學(xué)校官網(wǎng)已變黑白

黃河新聞網(wǎng)呂梁頻道
2026-02-01 09:32:36
唐嫣彭冠英官宣后,惡心的一幕出現(xiàn)了,婚變傳聞終于真相大白

唐嫣彭冠英官宣后,惡心的一幕出現(xiàn)了,婚變傳聞終于真相大白

艷姐的搞笑視頻
2026-01-16 13:24:42
SpaceX申請100萬顆太空算力衛(wèi)星;星艦V3首飛、升級解析……眼花繚亂的消息更新

SpaceX申請100萬顆太空算力衛(wèi)星;星艦V3首飛、升級解析……眼花繚亂的消息更新

問問馬斯克AskMusk
2026-01-31 20:50:22
這種保溫杯早被國家禁了,可能引發(fā)慢性中毒,很多人卻成天不離手

這種保溫杯早被國家禁了,可能引發(fā)慢性中毒,很多人卻成天不離手

DrX說
2025-12-16 14:36:14
兒子丟了、父親走了、妻子跑了,央視主持張澤群如今落到這般田地

兒子丟了、父親走了、妻子跑了,央視主持張澤群如今落到這般田地

蜉蝣說
2026-01-31 15:10:43
歐冠淘汰賽資格入賬4200萬歐元!穆帥一場勝仗刷出14倍年薪回報(bào)

歐冠淘汰賽資格入賬4200萬歐元!穆帥一場勝仗刷出14倍年薪回報(bào)

葉赫那拉菲菲
2026-02-01 07:11:40
只有看過豎版世界地圖,才能明白格陵蘭島的重要性

只有看過豎版世界地圖,才能明白格陵蘭島的重要性

孤云朗境
2026-01-31 23:59:33
大局已定,今年的返鄉(xiāng)潮可能徹底消失了!

大局已定,今年的返鄉(xiāng)潮可能徹底消失了!

達(dá)文西看世界
2026-01-29 19:30:48
保姆想讓雇主嫁給兒子這是啥心理?網(wǎng)友:這算盤打得好 想身份互換

保姆想讓雇主嫁給兒子這是啥心理?網(wǎng)友:這算盤打得好 想身份互換

另子維愛讀史
2026-01-30 18:18:16
人民幣現(xiàn)金收付新規(guī),今起施行

人民幣現(xiàn)金收付新規(guī),今起施行

澎湃新聞
2026-02-01 11:55:04
印度黃金ETF跌幅收窄,HDFC Gold ETF現(xiàn)跌7%

印度黃金ETF跌幅收窄,HDFC Gold ETF現(xiàn)跌7%

每日經(jīng)濟(jì)新聞
2026-02-01 13:29:06
全球只有5位領(lǐng)導(dǎo)人被永久保留遺體,他們都是誰

全球只有5位領(lǐng)導(dǎo)人被永久保留遺體,他們都是誰

扶蘇聊歷史
2026-01-29 16:13:42
特朗普威脅對加采取“重磅措施”

特朗普威脅對加采取“重磅措施”

財(cái)聯(lián)社
2026-02-01 20:27:32
朝鮮1月幾乎沒再給俄羅斯送武器了

朝鮮1月幾乎沒再給俄羅斯送武器了

桂系007
2026-02-01 05:23:02
突發(fā)!銀行利率降至0%?

突發(fā)!銀行利率降至0%?

新浪財(cái)經(jīng)
2026-02-01 19:48:39
京東七鮮新店開業(yè):價(jià)格全面對標(biāo)山姆,茅臺直降近百元

京東七鮮新店開業(yè):價(jià)格全面對標(biāo)山姆,茅臺直降近百元

新浪財(cái)經(jīng)
2026-02-01 10:29:22
伊朗、中國和俄羅斯將舉行聯(lián)合海上演習(xí)

伊朗、中國和俄羅斯將舉行聯(lián)合海上演習(xí)

桂系007
2026-01-30 03:56:40
今年臘月二十九除夕,四類人要穿紅,3種人不要去拜年,有你嗎?

今年臘月二十九除夕,四類人要穿紅,3種人不要去拜年,有你嗎?

阿龍美食記
2026-01-29 11:03:56
大量吸入房子里霉變的粉塵,6歲女孩感染煙曲霉腦子被啃了20多個(gè)洞,醫(yī)生提醒:最好別讓孩子參與大掃除

大量吸入房子里霉變的粉塵,6歲女孩感染煙曲霉腦子被啃了20多個(gè)洞,醫(yī)生提醒:最好別讓孩子參與大掃除

觀威海
2026-01-31 23:14:10
敢不敢打?我軍重大人事變故后菲律賓南海演習(xí),更像是一種試探

敢不敢打?我軍重大人事變故后菲律賓南海演習(xí),更像是一種試探

悅心知足
2026-02-01 00:50:48
2026-02-02 02:28:49
柳胖胖 incentive-icons
柳胖胖
36氪、虎嗅、鈦媒體專欄作者
208文章數(shù) 386關(guān)注度
往期回顧 全部

科技要聞

10億元寶紅包突襲 復(fù)刻微信支付還是微視?

頭條要聞

愛潑斯坦追逐女孩、安德魯跪爬女子身上畫面全公布

頭條要聞

愛潑斯坦追逐女孩、安德魯跪爬女子身上畫面全公布

體育要聞

德約大度祝賀阿卡 幽默互動逗笑納達(dá)爾

娛樂要聞

春晚第三次聯(lián)排陣容曝光:全是實(shí)力派

財(cái)經(jīng)要聞

黃仁勛臺北"夜宴":匯聚近40位臺企高管

汽車要聞

嵐圖汽車1月交付10515輛 同比增長31%

態(tài)度原創(chuàng)

時(shí)尚
本地
房產(chǎn)
游戲
健康

“多巴胺風(fēng)”又又又火了!這樣穿時(shí)髦又減齡

本地新聞

云游中國|撥開云霧,巫山每幀都是航拍大片

房產(chǎn)要聞

藏不住的小城大事,海澄新城執(zhí)掌自貿(mào)港風(fēng)口,進(jìn)階兌現(xiàn)美好生活新篇

末期癌癥玩家圓夢《毀滅戰(zhàn)士》!id公開致敬

耳石癥分類型,癥狀大不同

無障礙瀏覽 進(jìn)入關(guān)懷版