国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

火山引擎有了它自己的Token經(jīng)濟(jì)學(xué)

0
分享至


作者 | 王兆洋
郵箱 | wangzhaoyang@pingwest.com

Token,Token,還是Token。

在12月18日的FORCE原動力大會上,火山引擎總裁譚待半小時的開場演講里提了18次“Token”,而“云”則只出現(xiàn)了7次。

火山也再次更新了備受矚目的豆包大模型最新日均Token調(diào)用量:

50萬億。


這一指標(biāo)從發(fā)布至今實現(xiàn)了417 倍增長,相比去年 12 月則是超 10 倍增長。作為對比,Google10月最新公布的月均Token直接換算為日均量的數(shù)據(jù)是43萬億。豆包大模型的調(diào)用量已經(jīng)是中國第一、全球第三。

而根據(jù)IDC的報告,火山引擎在中國的公有云大模型的服務(wù)調(diào)用量上也是穩(wěn)居第一,MaaS市場份額從2024年的46.4%進(jìn)一步提升到了今年的49.2%。

“也就是說,在中國公有云上每產(chǎn)生的兩個Tokens就有一個是火山引擎生產(chǎn)的?!弊T待在當(dāng)天面對臺下5000名觀眾說道。

在當(dāng)天的發(fā)布中,一如既往由火山來更新了字節(jié)最新模型的進(jìn)展。

豆包大模型1.8正式亮相,它在多項指標(biāo)上顯著提升,繼續(xù)走All-in-One的技術(shù)路線,文字、代碼、Agent、音頻,圖視頻等能力,全部在同一個基礎(chǔ)模型里演進(jìn);而專門為視頻生成服務(wù)的Seedance 1.5 pro也同步推出,在音畫同步、中文及方言處理上做到了“世界領(lǐng)先水平”。

字節(jié)要傳達(dá)的信息明顯:豆包大模型創(chuàng)造著Token,且它的進(jìn)化方向也正對應(yīng)著今天Token消耗的結(jié)構(gòu)性變化——從“推理取代訓(xùn)練”推動Token消耗,到今天多模態(tài)+Agent成為Token的絕對大頭,這些需求都可以被火山提供的服務(wù)滿足。

這一切迅猛增長的背后,火山引擎正在建立起一套它自己的Token經(jīng)濟(jì)學(xué)。

1

更多的Token就是代表更多智能

Token,是大模型處理信息的基本單位。無論是文字、圖像還是視頻,在模型中都在被轉(zhuǎn)換為Token序列進(jìn)行計算。本質(zhì)上,Token就是人們對AI的調(diào)用量。

但這背后存在一個問題:由于Token的計算方式基于長度,所以一篇文章和一段關(guān)鍵的代碼可能消耗相似的Token數(shù)量。那么,純粹的以Token數(shù)量來衡量,能否真實反映AI創(chuàng)造的價值?

火山引擎的算法人員在和我們的交流中回憶,其實曾經(jīng)火山內(nèi)部也有過類似爭論,但最終的結(jié)論是:Token量一定是對的指標(biāo)。


“AI要在實際場景產(chǎn)生價值,大家肯定要把它用起來,不管單位價值有大有小,但實際上一定是跟Token用量正相關(guān)的??赡苣阕罱K的那個關(guān)鍵決策對應(yīng)的只是‘是’或者‘否’,一個Token,但得出這個結(jié)論必然已經(jīng)用掉了大量Token?!?/p>

所以火山內(nèi)部最終明確,更多的Token就是代表更多智能。

而今天Token的增長,其內(nèi)在結(jié)構(gòu)也在悄然變化。火山引擎智能算法負(fù)責(zé)人吳迪提供了一個演化路徑:

“可能到了2027,2028年,一個普通的C端用戶從AI助手得到的很多的信號就是視覺的,你不會看到大段大段的文字了。那么,到時候LLM會以coding和agent的形式下沉到整個數(shù)字世界的底層運行邏輯里。”

換言之,Token會分層,LLM會向下成為底座,多模態(tài)的視覺、交互Token將在上層涌現(xiàn)。

這就會讓Token成為一個持續(xù)增長的指標(biāo),也是一個有效指標(biāo)。吳迪預(yù)測,到2030年,國內(nèi)市場的Token消耗量將是現(xiàn)在的百倍以上。屆時,衡量企業(yè)智能化程度的核心指標(biāo),將從其擁有的GPU數(shù)量轉(zhuǎn)變?yōu)橄牡腡oken總量,因為它是唯一能同時穿透“模型能力、使用頻率和真實需求”的統(tǒng)一指標(biāo)。

1

云設(shè)施必須以模型為中心重構(gòu)

更多Token意味更多智能,那么如何讓企業(yè)客戶更好生成它們需要的Token,就是火山作為從字節(jié)內(nèi)部走出的“AI云原生”基礎(chǔ)設(shè)施的任務(wù)。

過往云計算所習(xí)慣的一整套體系也因此出現(xiàn)“不適”,它更多是一個圍繞算力設(shè)計的體系,而火山認(rèn)為新的需求注定是圍繞模型的。

“傳統(tǒng) IaaS、PaaS、SaaS分層規(guī)劃的IT架構(gòu)不再有效,以模型為中心的AI云原生架構(gòu)正在形成?!弊T待說。


此次的一整套體系也由此誕生。

火山推出了“推理代工”,企業(yè)可將訓(xùn)練好的模型托管至火山,按實際Token消耗付費,無需自建推理集群;

Agent開發(fā)套件(ADK) 全面升級,支持動態(tài)運行時、多會話共享、強(qiáng)身份傳遞與內(nèi)置工具鏈;

智能端點(Endpoint) 支持模型路由,可根據(jù)效果、成本等策略自動分流至豆包、DeepSeek、Kimi等多模型后端;

方舟平臺進(jìn)一步升級,支持客戶在自有場景中做RL 強(qiáng)化學(xué)習(xí)等的微調(diào)。

而且這一系列產(chǎn)品里的很多細(xì)節(jié),都體現(xiàn)出很多根本性差異。

例如,Agent開發(fā)套件(ADK) 的動態(tài)運行時設(shè)計,直接挑戰(zhàn)了行業(yè)慣例。AWS AgentCore為每個會話啟動一個獨立運行時,而火山采用多會話共享模式。

火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人田濤濤直言,這是一個行業(yè)慣性的問題,AgentCore為每個session起一個Runtime,過去可以,但進(jìn)入模型時代就太奢侈了,而火山對成本敏感,字節(jié)自己內(nèi)部就一直有不同的更AI原生的需求,因此本就有不同的設(shè)計,現(xiàn)在可以推廣給更多模型用戶。

在火山看來,人們最終會“躍過”對算力的關(guān)注,最終直接沖著模型而來。

“你很難想象五年后新的創(chuàng)業(yè)者還會去云上租GPU、開數(shù)據(jù)庫。到時候在他們創(chuàng)業(yè)的第一天,他們會直接向云服務(wù)商‘要Token’,直接要的就是調(diào)用模型和配套工具?!?/b>吳迪說。

“我們已經(jīng)把像Response API、分布式的KV Cache、良好的P/D分離、一大堆高品質(zhì)的內(nèi)置Tools組裝好了,等著你把你的一個齒輪裝上來,這輛車就能跑?!?/p>

火山還配套改進(jìn)了模型服務(wù)的定價模式,推出了一個“AI節(jié)省計劃”,讓企業(yè)達(dá)到模型使用成本的全局最優(yōu)解。

“客戶只需要為用了的Token付錢?!?/p>

1

模型訓(xùn)練和市場需求一桿子打通

現(xiàn)在我們可以來看看字節(jié)和火山今天已經(jīng)有了什么:

  • 最大規(guī)模的云計算需求:內(nèi)部支撐抖音等國民級產(chǎn)品帶來的規(guī)模效應(yīng)和成本優(yōu)勢。

  • 最多用戶的大模型產(chǎn)品:豆包。而且在火山的視角,它也是一個最大的Agent產(chǎn)品。

  • 第一的Token調(diào)用量:50萬億/天,且還在猛漲。

  • 以及支持著豆包app和抖音這種巨量真實需求的多模態(tài)和推理大一統(tǒng)的豆包大模型。

這種全棧系統(tǒng)能力是今天最重要AI玩家必備的能力,橫向?qū)Ρ?,可以把目前的玩家分為三種路線:

  1. OpenAI + 微軟路線:模型自己的,云設(shè)施是戰(zhàn)略伙伴的。

  2. 阿里云路線:開源模型長在自己云上,然后近期在強(qiáng)推產(chǎn)品。

  3. Google路線:全部自研,模型閉源,產(chǎn)品到研發(fā)直接全面打通。

這里面,字節(jié)的路線很像Google。

豆包就對應(yīng)著Gemini,一個大一統(tǒng)的多模態(tài)agent模型。Seedance 1.5緊跟Veo3,甚至超過了對方。這一切的技術(shù)基礎(chǔ)也和Google類似,都長在自己的以AI為核心的機(jī)器學(xué)習(xí)平臺和云服務(wù)上,然后這些“Gemini同款”和“豆包同款”細(xì)化成產(chǎn)品再提供給外界。

而尚未被太多關(guān)注到的另一個“相似”,則是對待模型技術(shù)的方式上。

Google在Gemini 3的“翻身仗”后分享了很多內(nèi)部復(fù)盤,其中最重要一個因素就是模型、研發(fā)、產(chǎn)品和需求的統(tǒng)一打通。而字節(jié)如何訓(xùn)練模型此前并未被外界了解,它與大多模型公司一個非常大的不同是,它把真實市場需求直接一桿子打通到了模型訓(xùn)練層面。

火山引擎作為模型對外統(tǒng)一的出口,也有自己的算法人員,他們和字節(jié)的模型部門Seed緊密合作,甚至是“混合辦公”和各種靈活的配合方式,而火山引擎團(tuán)隊所獲取到的市場需求情況,可以直接影響模型研發(fā)方向和決策。

火山的模型策略團(tuán)隊會把市場上的需求反饋收集和抽象出來,直接影響到模型的重要功能和研發(fā)方向。

這都直接體現(xiàn)在豆包大模型的身上:

豆包之所以是一個大一統(tǒng)的模型,除了技術(shù)路線的選擇,也是從客戶體驗出發(fā):火山的客戶們認(rèn)為模型版本太多了,甚至字節(jié)內(nèi)部的“用戶”都搞不清楚各方面的區(qū)別,所以這個模型必須all in one來降低選擇成本。

字節(jié)認(rèn)為,今天訓(xùn)練模型最重要的是評估體系,而它絕對不應(yīng)該只是公開的benchmark,必須用真實業(yè)務(wù)價值來衡量模型能力。字節(jié)內(nèi)部已經(jīng)為B端建設(shè)了大量benchmark,模型開發(fā)成果必須真正符合實際的經(jīng)濟(jì)價值要求。

于是Seedance會在模型層面增加一個Draft樣片的能力,讓用戶不是抽卡,而是提前做預(yù)覽判斷;豆包模型在建設(shè)工具調(diào)用能力之外,直接在配套API中就配套做了許多built in的工具。128k上下文這種看起來能用來炫技但事實上實際需求并不高的能力,就會被去掉。

“在25年,有超過100萬家企業(yè)和個人使用了火山引擎的大模型服務(wù),覆蓋了100多個行業(yè),我們也對他們在火山方舟上的用量進(jìn)行了匿名統(tǒng)計,我們發(fā)現(xiàn),有超過100家企業(yè)在火山引擎累計Tokens使用量超過了1萬億?!弊T待在發(fā)布會上說。

這可能是比市場份額增長更值得玩味的一組數(shù)據(jù)。 它最能體現(xiàn)字節(jié)這種用需求指引模型發(fā)展的方式所帶來的收益。


所以,如果我們來拆解一下,字節(jié)的Token經(jīng)濟(jì)學(xué)就是:

1. 越多的Token意味越高智能

Token是智能的度量衡,其增長與結(jié)構(gòu)變化指引技術(shù)演進(jìn)。

2. 服務(wù)AI的云必須以模型為中心重構(gòu)

傳統(tǒng)云廠商的慣性已經(jīng)太大,而火山服務(wù)的最大客戶就是字節(jié)自己,字節(jié)就是一個長在AI和模型上的公司,火山解決的一直是AI的需求,現(xiàn)在這些需求變成外界的廣泛需求,它的技術(shù)思路就可以用來重構(gòu)整個云行業(yè)的方案。

3. Agent的普及會讓Token從原材料變?yōu)楦呒壍闹悄軉卧M(jìn)而帶來更大價值

譚待曾經(jīng)形容,目前基于Token的商業(yè)模式還很原始,而今天他認(rèn)為,隨著Agent的進(jìn)步和在企業(yè)里的普及,Token最終會走出今天“原材料”的定位。

Agent 可將模型串聯(lián),云平臺和中間件進(jìn)一步把Tokens組裝成Agents,并實現(xiàn)Agent和現(xiàn)有工作流、Agent和Agent之間的智能互通,以 API 或完整 Agent 的方式提供服務(wù),從更高抽象層次創(chuàng)造價值。

“今天討論Token,是從底層操作系統(tǒng)角度看,是在 IT 預(yù)算環(huán)節(jié)考慮;而抽象成 Agent 后,可從 BPO (業(yè)務(wù)流程外包)角度看待,那么它就是在擴(kuò)大整個市場的規(guī)模了?!弊T待說。

“人們常說的10萬億Agent市場,核心就是這個邏輯?!?/p>


點個愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
黃宗澤26年終奪雙料視帝,淚灑頒獎臺憶往昔

黃宗澤26年終奪雙料視帝,淚灑頒獎臺憶往昔

小兔子的快樂
2026-01-05 09:16:17
最新通報:河北省20人死亡重大事故···

最新通報:河北省20人死亡重大事故···

新牛城
2026-01-05 09:58:17
委內(nèi)瑞拉官員:美對委軍事行動已致80人死亡

委內(nèi)瑞拉官員:美對委軍事行動已致80人死亡

財聯(lián)社
2026-01-05 03:02:31
廣東一男子的自建房,占地約一畝,極簡外觀加大花園,堪比別墅!

廣東一男子的自建房,占地約一畝,極簡外觀加大花園,堪比別墅!

手工制作阿愛
2026-01-05 14:57:14
街道辦回應(yīng)“揚塵逼遷”:是忘加水導(dǎo)致的誤操作

街道辦回應(yīng)“揚塵逼遷”:是忘加水導(dǎo)致的誤操作

映射生活的身影
2026-01-04 18:09:17
36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

釋凡電影
2025-08-14 09:33:19
7萬人鼓掌!皇馬21歲小將封神戰(zhàn):完美戴帽 佛爺親自祝賀

7萬人鼓掌!皇馬21歲小將封神戰(zhàn):完美戴帽 佛爺親自祝賀

葉青足球世界
2026-01-05 08:42:50
20歲中國籍女網(wǎng)紅在柬埔寨街頭流浪,面容憔悴,腿疑似受傷,母親最新發(fā)聲:一個柬埔寨的電話打來叫我們?nèi)ソ尤?>
    </a>
        <h3>
      <a href=揚子晚報
2026-01-04 18:37:09
笑不活!司曉迪“可汗大點兵”炸翻頂流圈,我卻笑死在成毅評論區(qū)

笑不活!司曉迪“可汗大點兵”炸翻頂流圈,我卻笑死在成毅評論區(qū)

八卦南風(fēng)
2026-01-03 17:33:45
復(fù)盤!東契奇交易大贏家!22歲曼巴門徒質(zhì)變了?

復(fù)盤!東契奇交易大贏家!22歲曼巴門徒質(zhì)變了?

籃球盛世
2026-01-05 19:43:58
中國乘客被趕下飛機(jī)!委內(nèi)瑞拉機(jī)組回應(yīng)拒載操作:去看新聞吧!

中國乘客被趕下飛機(jī)!委內(nèi)瑞拉機(jī)組回應(yīng)拒載操作:去看新聞吧!

聽風(fēng)喃
2026-01-05 04:39:07
給2025年最好的10部動作片排個名:《匿殺》第7,《捕風(fēng)追影》第2

給2025年最好的10部動作片排個名:《匿殺》第7,《捕風(fēng)追影》第2

皮皮電影
2026-01-04 09:50:59
田樸珺刪光王石合影,王石:每晚最難熬是等她回家,不知道回不回

田樸珺刪光王石合影,王石:每晚最難熬是等她回家,不知道回不回

眉眼動人
2026-01-04 11:41:23
田樸珺坐不住了,被傳離婚不過24小時,親自辟謠:否認(rèn)離婚傳言!

田樸珺坐不住了,被傳離婚不過24小時,親自辟謠:否認(rèn)離婚傳言!

好賢觀史記
2026-01-05 13:40:16
主持馬杜羅庭審的法官是誰?今年92歲,美國現(xiàn)役最年長聯(lián)邦法官之一,曾禁止特朗普驅(qū)逐委內(nèi)瑞拉移民,裁定美國軍方公布“虐囚照”

主持馬杜羅庭審的法官是誰?今年92歲,美國現(xiàn)役最年長聯(lián)邦法官之一,曾禁止特朗普驅(qū)逐委內(nèi)瑞拉移民,裁定美國軍方公布“虐囚照”

極目新聞
2026-01-05 14:55:18
唐嫣在國外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時髦?

唐嫣在國外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時髦?

章眽八卦
2026-01-05 12:27:07
曝山東泰山敲定教練組!韓鵬組長+宿茂臻主帥,或簽邊路多面手

曝山東泰山敲定教練組!韓鵬組長+宿茂臻主帥,或簽邊路多面手

奧拜爾
2026-01-05 14:53:51
英媒:李在明訪華向日本發(fā)出明確信號

英媒:李在明訪華向日本發(fā)出明確信號

參考消息
2026-01-05 13:14:06
李在明:周五下班去上海是韓國年輕人的新潮流

李在明:周五下班去上海是韓國年輕人的新潮流

看看新聞Knews
2026-01-05 18:21:02
理想汽車產(chǎn)品線大調(diào)整,從華為向豐田的轉(zhuǎn)向

理想汽車產(chǎn)品線大調(diào)整,從華為向豐田的轉(zhuǎn)向

晚點LatePost
2026-01-05 12:59:22
2026-01-05 20:03:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
2767文章數(shù) 10425關(guān)注度
往期回顧 全部

科技要聞

4100家科技企業(yè)集結(jié)賭城,CES揭開AI新戰(zhàn)場

頭條要聞

美對委動手致歐盟立場分裂 兩元首先后發(fā)文內(nèi)容南轅北轍

頭條要聞

美對委動手致歐盟立場分裂 兩元首先后發(fā)文內(nèi)容南轅北轍

體育要聞

41歲詹皇26+10+6又迎里程碑 湖媒贊GOAT

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎臺憶往昔

財經(jīng)要聞

丁一凡:中美進(jìn)入相對穩(wěn)定的競爭共存期

汽車要聞

海獅06EV冬季續(xù)航挑戰(zhàn) "電"這事比亞迪絕對玩明白了

態(tài)度原創(chuàng)

游戲
時尚
房產(chǎn)
親子
公開課

大話手游交易服能不能搬磚?寶兒姐回歸二〇二六,神豪老板集結(jié)

這些才是真正接地氣的穿搭!褲子基礎(chǔ)、外套保暖,簡單又自然

房產(chǎn)要聞

再次登頂海南樓市!超越阿那亞的,只有阿那亞!

親子要聞

試管嬰兒的授精過程

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版