国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型廠商,是時候告別Token狂歡了

0
分享至

文 | 伯虎財經(jīng)(bohuFN),作者 | 楷楷

“低價賣Token并對第三方開放,看起來很友好,但那是一個陷阱。”

近日,小米集團MiMo負(fù)責(zé)人羅福莉在X平臺發(fā)文,將Token價格戰(zhàn)比喻為“陷阱”,提醒大模型公司不應(yīng)該盲目參與價格戰(zhàn)。

幾天之前,Anthropic突然宣布切斷第三方工具對Claude訂閱的訪問權(quán)限,這也是羅福莉發(fā)文討論Token定價邏輯的契機。

在這場全民“養(yǎng)龍蝦”的Token狂歡中,羅福莉的公開信和Anthropic的“封殺令”,成為行業(yè)中罕見的“不同聲音”,給這股熱潮潑下了冷水。

但問題是,大模型廠商當(dāng)真算不清這筆成本賬?還是說,這只是行業(yè)一場心照不宣的博弈,用狂燒的Token換取一張通往未來的入場券,賭的是AGI的未來。

如果是這樣的話,誰還能叫醒一個正在裝睡的人。

01 Anthropic撐不住了

幾天前,Anthropic向所有用戶發(fā)送郵件,宣布自當(dāng)?shù)貢r間4月4日下午3點起,Claude Pro和Max訂閱將不再覆蓋OpenClaw等第三方工具的使用。


事出突然,Anthropic給用戶送了一筆一次性補貼,金額剛好等于一個月訂閱費。但相較于從前花200美元月費就能無限量調(diào)用Claude的好日子,這筆補貼顯然只是杯水車薪。

消息一出,社交媒體瞬間炸鍋,用戶們破口大罵,鋪天蓋地都是“過河拆橋”的論調(diào),因為OpenClaw創(chuàng)始人彼得·斯坦伯格跟Anthropic的恩怨早已有之。

OpenClaw最初上線時命名為Clawdbot,由于名字跟Anthropic旗下的Claude高度相似,被Anthropic一份律師函要求改名,梁子算是結(jié)下了。

更重要的是,在OpenClaw驗證了市場對開源智能體的需求后,Anthropic隨即推出了Claude Cowork,除了安全考量之外,這也被認(rèn)為是想用自家產(chǎn)品取代OpenClaw。

但這些都不足以解釋“封殺令”的全部,真正讓Anthropic下決心動刀的,是成本問題。

Anthropic在用戶信中提到,“第三方工具對系統(tǒng)造成了過大的壓力,我們必須優(yōu)先保障使用我們核心產(chǎn)品的用戶體驗?!?/p>

外媒稱明星獨角獸Cursor曾在去年進(jìn)行估算,發(fā)現(xiàn)每月200美元的Claude Code訂閱可能消耗高達(dá)2000美元的計算資源,說明Anthropic一直在進(jìn)行巨額補貼;也有其他分析師指出,Anthropic訂閱制實際消耗的算力成本或高達(dá)5000美元。

這意味著,大模型曾經(jīng)的訂閱收費模式,在Agent時代恐怕難以跑通。

一方面,在Agent模式下,Token使用量正以幾何級增長速度膨脹。

當(dāng)大模型還停留在對話層面時,單輪對話大約消耗1000-3000個Token,平臺只要統(tǒng)計出一個代表大部分用戶的用量均值,就可以跑通訂閱制。

但在Agent場景中,一個用戶背后可能同時跑著10個甚至100個Agent,每個Agent都在

7×24小時地執(zhí)行任務(wù),每次任務(wù)都會觸發(fā)多次模型推理,隨著交互次數(shù)不斷增多,就形成了“滾雪球式”的Token消耗,靠“少用”補貼“多用”的訂閱制也就失去了平衡。

作為參考,一個普通ChatGPT用戶即使天天聊天,月消耗也不過百萬級;而一個重度“養(yǎng)蝦”用戶,日均消耗Token則在3000萬-1億之間。

但另一方面,大模型企業(yè)的成本并沒有隨著用量暴增而自然下降,反而越走越高。

斯坦福大學(xué)的《2025年人工智能指數(shù)報告》指出,在高效小模型的驅(qū)動下,GPT-3.5 級別的模型推理成本已在過去兩年間下降到了原來的1/280,硬件成本每年下降 30%。

只是,推理成本雖然下降了,但訓(xùn)練成本卻依然驚人。更重要的是,全球算力依然處于緊缺階段,越多用戶扎堆使用Agent,越推高了企業(yè)的運營成本。

以O(shè)penAI為例,其對投資者表示,預(yù)計到2028年算力支出將達(dá)到1210億美元,屆時虧損可能會達(dá)到850億美元,或?qū)⒊揭延猩鲜泄镜奶潛p記錄。

雖然Anthropic的訓(xùn)練成本沒那么高,約為OpenAI的40%左右,但當(dāng)下也依然處于燒錢狀態(tài),其自然不想再被第三方工具白薅羊毛。


(圖:OpenAI與Anthropic訓(xùn)練成本對比)

02 卷Token價格是陷阱

Anthropic撐不住了,國產(chǎn)大模型企業(yè)又如何呢?

羅福莉可能是最能共鳴Anthropic的同行,她在社交平臺發(fā)文,稱 Claude Code大概率不賺錢,甚至可能在虧損,因為Claude Code的定價邏輯要成立,前提是用戶必須用 Anthropic 自己的框架,否則就會出問題。

她以O(shè)penClaw作為案例,指出接入第三方框架可能帶來的問題:

“我觀察過OpenClaw的上下文管理,很糟糕。在單次用戶查詢里,它會觸發(fā)多輪低價值工具調(diào)用,每次都是攜帶長上下文的獨立API請求,往往超過10萬Token。”


簡單來說,同一件事,OpenClaw會比Claude Code原生框架多跑幾遍,實際成本會達(dá)到訂閱價格的數(shù)十倍。在成本結(jié)構(gòu)上,即便是使用OpenClaw的輕度用戶,也等同于重度用戶。

因此,低價售賣Token并對第三方開放看似對用戶友好,實則是陷阱。企業(yè)為了控制成本,只能降低算力或用更便宜的低智模型;用戶在低智模型上反復(fù)碰壁,使用體驗也并不好。

可是,羅福莉這番發(fā)言卻是國內(nèi)大模型行業(yè)中“少數(shù)的聲音”。至少在當(dāng)下,大部分大廠及大模型企業(yè)還是將Token吞吐量視為衡量實力的重要指標(biāo)。

全球大模型聚合路由平臺OpenRouter數(shù)據(jù)顯示,中國大模型的單周調(diào)用量已連續(xù)一個月超過海外模型,調(diào)用量位于前列的都是國產(chǎn)模型,比如小米、階躍星辰、Minimax等。


全球科技大廠也在推波助瀾,比如鼓勵員工多使用AI工具,Meta甚至列出了Token 消耗量排行榜,這已成為科技大廠的隱性KPI。


因此,Token之所以貴,不僅僅在于居高不下的成本,更因為這是一場暫時還看不到盡頭的消耗戰(zhàn),當(dāng)所有人都在拼命消耗更多Token,算力便永遠(yuǎn)追不上被制造出來的需求。

況且,比起Token消耗到底是不是虛假繁榮這個問題,大模型企業(yè),更難抵御的是真金白銀的誘惑——在短短3個月里,Anthropic的年化收入便從90億美元飆升至300 億美元。


卷Token價格或許是“陷阱”,但在全球大模型廠商“你追我趕”之際,誰都不愿意先踩下“剎車”。

對于阿里、字節(jié)、騰訊等一線科技公司而言,大家圍繞AI超級入口爭奪已久,但還是無法擺脫“燒錢換流量”的互聯(lián)網(wǎng)打法,發(fā)紅包、增投流能激活DAU,可一旦沒有了“鈔能力”,用戶也會快速流失。

“龍蝦”則成為了新的契機。用戶完成部署后,就相當(dāng)于將自己的“智能體助手”嵌入了某個云平臺,不僅會產(chǎn)生源源不斷的Token消耗,個人數(shù)據(jù)也會沉淀在生態(tài)體系內(nèi),遷移成本將變得越來越高,大廠自然不會放過這個新的“生態(tài)入口”。

對于Kimi、智譜等二線廠商而言,“龍蝦”的出現(xiàn)帶動了算力需求,讓它們的模型能夠被調(diào)用起來,API增長也有故事可講,這足以驅(qū)動它們更賣力地銷售API。

從邏輯上來講,羅福莉?qū)τ赥oken的評價是對的,“價格內(nèi)卷”不可能一直持續(xù)。但對于因為“龍蝦”而跑通增長敘事的大模型廠商而言,大家或許還想再“裝睡”一會兒。

03 效率比價格更重要

誰也無法叫醒一個裝睡的人,但現(xiàn)實或許可以——越來越高的Token消耗量并沒有帶來相應(yīng)的利潤增長,這也是大模型企業(yè)無法回避的問題。

以全面對標(biāo)Anthropic的智譜為例,其在2025年交出了一份“高增長、高虧損”的成績單:全年總收入7.24億元,同比大增131.9%;全年虧損47.18億元,同比擴大59.5%。

智譜創(chuàng)始人張鵬曾表示,智譜要成為Anthropic的平替,甚至開玩笑稱Anthropic賣200美元,我們就賣200元人民幣。今年3月,智譜發(fā)布了一鍵安裝的AutoClaw,個人版39元/月/3500萬Tokens,99元/月/1億Tokens,門檻確實不高。


但背后的賬單也非常沉重。2025年,智譜的研發(fā)開支為31.8億元,同比增長44.9%;沒有基礎(chǔ)設(shè)施的智譜,還需要給第三方算力供應(yīng)商支付高額的采購費,從2022 年的1463萬元飆升至2025 年上半年的 11.45億元。

面對無法繞開兩大剛性支出——研發(fā)投入與算力成本,進(jìn)入2026年以來,國內(nèi)外云廠商陸續(xù)對AI算力、存儲等相關(guān)產(chǎn)品進(jìn)行調(diào)價,但國內(nèi)模型相較于海外模型而言,依然便宜。

根據(jù)民銀證券2025年12月發(fā)布的研報,國內(nèi)大模型API平均價格約為 3.88 元/百萬 Tokens,而海外模型約為20.46 元/百萬 Tokens,是國內(nèi)模型 API 價格的5倍以上。

價格優(yōu)勢帶來了規(guī)模需求,在這一背景下,國內(nèi)大模型廠商恐怕暫時還不會擺脫價格戰(zhàn)。但在Token消耗大于供給的當(dāng)下,逐漸收緊免費額度和補貼也是大勢所趨。

羅福莉提到,大模型行業(yè)的出路不是更便宜的Token,而是“更高token效率的Agent框架”疊加“更強大高效的模型”,Agent時代不屬于燒算力最多的人,而是用算力最聰明的人。

這將推動大模型廠商往兩個方向發(fā)展:

一方面,從“算力規(guī)模”轉(zhuǎn)向“工程效率”的競爭,單純賣API的企業(yè)將面臨越來越近的天花板,要將模型層跟智能硬件、應(yīng)用產(chǎn)品等深度結(jié)合起來,才能為商業(yè)模式注入更多可能性。

另一方面,推動Token收費的分層定價。當(dāng)下,主流大模型的計費方式基本上涵蓋了訂閱制、按量計費以及Token Plan套餐,即超額后再按量付費。

長遠(yuǎn)來看,Token定價除了簡單地“按量分層”,還可以按推理能力、任務(wù)數(shù)量等維度推出更精細(xì)化的付費體系,既能讓平臺緩解算力峰值的壓力,也能進(jìn)一步增加收入。

比如DeepSeek悄悄上線了“快速模式”和“專家模式”兩個入口,被認(rèn)為是分成模式的一種全新探索;火山引擎譚待表示,未來可能會孵化出垂直領(lǐng)域的智能體,按回答問題的數(shù)量收費。


當(dāng)下,Token狂歡或許還會持續(xù)一段時間,但對整個大模型來說,Token成本已經(jīng)成為每一個企業(yè)和用戶都無法忽視的成本因素。

說到底,大模型從來不是一門純粹的技術(shù)生意,而是一場關(guān)于效率與價值的博弈。大模型企業(yè)想做長久的生意,自然也要學(xué)會算賬,只有腳踏實地,才能更好仰望星空。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
新加坡已經(jīng)成功預(yù)測中美沖突,一旦爆發(fā),美稱中國不能攻打美本土

新加坡已經(jīng)成功預(yù)測中美沖突,一旦爆發(fā),美稱中國不能攻打美本土

起喜電影
2026-04-16 01:05:59
恒星“自投羅網(wǎng)”成黑洞“面條”

恒星“自投羅網(wǎng)”成黑洞“面條”

小眼睛小世界
2026-04-16 06:15:54
阿德巴約現(xiàn)在恐怕腸子都要悔青了!

阿德巴約現(xiàn)在恐怕腸子都要悔青了!

君子一劍似水流年
2026-04-16 07:13:03
皇馬歐冠出局:一場被放大的技術(shù)失誤

皇馬歐冠出局:一場被放大的技術(shù)失誤

競技風(fēng)云錄
2026-04-16 09:05:52
臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個香港!

臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個香港!

阿腩講娛樂
2026-04-13 04:13:20
退休后才發(fā)現(xiàn),一個人有錢沒錢,一眼就能看出:沒錢的人,大多有這3個“窮習(xí)慣”

退休后才發(fā)現(xiàn),一個人有錢沒錢,一眼就能看出:沒錢的人,大多有這3個“窮習(xí)慣”

風(fēng)起見你
2026-04-11 15:31:29
深圳灣這一幕太燃了!路人:這是我最近看到最有力的城市宣傳

深圳灣這一幕太燃了!路人:這是我最近看到最有力的城市宣傳

深圳晚報
2026-04-15 20:37:15
一條垃圾私信背后的平臺戰(zhàn)爭

一條垃圾私信背后的平臺戰(zhàn)爭

娛圈觀察員
2026-04-16 08:05:43
中資油船無視禁令出港,伊軍百萬到位,特朗普緊急踩下剎車

中資油船無視禁令出港,伊軍百萬到位,特朗普緊急踩下剎車

一葉禪林
2026-04-16 07:25:36
恭喜!她將于6月結(jié)婚!

恭喜!她將于6月結(jié)婚!

奮斗在韓國
2026-04-15 19:21:41
腿比腰粗的女生長啥樣?看完真人照片后具象化了哈哈

腿比腰粗的女生長啥樣?看完真人照片后具象化了哈哈

經(jīng)典段子
2026-04-13 22:33:26
伊朗要求五個中東國家賠償戰(zhàn)爭損失

伊朗要求五個中東國家賠償戰(zhàn)爭損失

財聯(lián)社
2026-04-14 06:55:04
金星大氣層薄霧:難解的“霧中謎團”

金星大氣層薄霧:難解的“霧中謎團”

小眼睛小世界
2026-04-16 06:19:03
原來溫瑞博的爸爸是他!曾是乒乓球隊頂梁柱,難怪19歲兒子這么牛

原來溫瑞博的爸爸是他!曾是乒乓球隊頂梁柱,難怪19歲兒子這么牛

林子說事
2026-04-15 11:34:09
特朗普家族婚禮經(jīng)濟學(xué):一場派對背后的流量密碼

特朗普家族婚禮經(jīng)濟學(xué):一場派對背后的流量密碼

娛圈觀察員
2026-04-16 08:51:26
這是李鴻章妻妾的真實樣貌,個個美艷身材修長,顏值不輸當(dāng)代女星

這是李鴻章妻妾的真實樣貌,個個美艷身材修長,顏值不輸當(dāng)代女星

阿廢冷眼觀察所
2026-04-11 18:41:14
“暗物質(zhì)是黑洞”論調(diào)荒謬至極

“暗物質(zhì)是黑洞”論調(diào)荒謬至極

小眼睛小世界
2026-04-16 06:17:23
張倫碩節(jié)目直言要親生孩子,無視鐘麗緹高齡,張泉靈當(dāng)場翻白眼

張倫碩節(jié)目直言要親生孩子,無視鐘麗緹高齡,張泉靈當(dāng)場翻白眼

明星爆料客
2026-04-14 20:55:07
“46歲羅志祥在家中猝死”登上熱搜!經(jīng)紀(jì)人回應(yīng)

“46歲羅志祥在家中猝死”登上熱搜!經(jīng)紀(jì)人回應(yīng)

洪觀新聞
2026-04-14 14:37:35
上海男子在順德吃席,隨禮200元,看到桌上的菜后尷尬道:隨少了

上海男子在順德吃席,隨禮200元,看到桌上的菜后尷尬道:隨少了

阿天愛旅行
2026-04-15 19:35:29
2026-04-16 11:07:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
132288文章數(shù) 862097關(guān)注度
往期回顧 全部

科技要聞

39.98萬!小鵬GX預(yù)售“純電增程同價”

頭條要聞

24歲抗癌博主去世媽媽和姐姐也病世 一家五口只剩兩人

頭條要聞

24歲抗癌博主去世媽媽和姐姐也病世 一家五口只剩兩人

體育要聞

WNBA史上最大合同!阿賈3年500萬超級頂薪留隊

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

一季度GDP增5%!國新辦介紹國民經(jīng)濟情況

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

時尚
本地
房產(chǎn)
健康
公開課

赫本愛穿的傘裙,好優(yōu)雅!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學(xué)用地!寶龍城這把穩(wěn)了?

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版