国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從Token到詞元,中國重塑全球AI產(chǎn)業(yè)生態(tài)

0
分享至

日前,在國務(wù)院新聞辦公室的新聞發(fā)布會上,國家數(shù)據(jù)局局長劉烈宏正式宣布,AI領(lǐng)域核心術(shù)語“Token”的官方中文定名為“詞元”,并公布我國日均詞元調(diào)用量已突破140萬億,較2024年初增長超1400倍,較2025年底增長40%以上。這一里程碑式的定名與數(shù)據(jù)發(fā)布,標(biāo)志著我國人工智能產(chǎn)業(yè)正從技術(shù)探索邁入規(guī)模化商業(yè)落地的新紀(jì)元,詞元作為智能時代的“價值錨點(diǎn)”與“結(jié)算單位”,正重塑著全球AI產(chǎn)業(yè)生態(tài)。

01

從千億到百萬億:

中國AI駛?cè)胍?guī)?;鲩L快車道

如今,中國AI發(fā)展的“數(shù)字脈搏”正以詞元調(diào)用量的形式清晰跳動。今年3月以來,我國日均詞元(Token)調(diào)用量已超過140萬億,相比2024年初的1000億增長了1000多倍,相比2025年底的100萬億,3個月時間又增長了40%多?!叭站~元調(diào)用量的大量增加,充分表明中國的人工智能發(fā)展進(jìn)入了快速增長階段。”劉烈宏表示,人工智能應(yīng)用場景在不斷深化,從能對話到能決策執(zhí)行的智能體,中國人工智能產(chǎn)業(yè)的競爭力顯著增強(qiáng),現(xiàn)在備受關(guān)注的Token出海,就是產(chǎn)業(yè)競爭力增強(qiáng)的一個標(biāo)志。

據(jù)劉烈宏介紹,在各方共同努力下,我國高質(zhì)量數(shù)據(jù)集的建設(shè)工作取得了階段性成效。截至2025年底,全國已建成的高質(zhì)量數(shù)據(jù)集超過10萬個,總體量相當(dāng)于中國國家圖書館數(shù)字資源總量的310倍。國家數(shù)據(jù)局將持續(xù)推進(jìn)數(shù)據(jù)賦能人工智能創(chuàng)新發(fā)展,協(xié)同各方深入實施新一輪的高質(zhì)量數(shù)據(jù)集建設(shè)行動計劃,以場景需求為牽引,加快推進(jìn)先行先試的工作,打造技術(shù)可行、實用便捷、質(zhì)量保障的AI-Ready(AI就緒度)高質(zhì)量數(shù)據(jù)集,實現(xiàn)高質(zhì)量數(shù)據(jù)集供給的量質(zhì)提升。

02

解碼詞元:

AI大模型的“基本運(yùn)算單元”與價值計量核心

究竟何為詞元?作為AI大模型處理信息的基本單位,我們以字為單位來讀書寫字,對于大模型,這個輸入輸出的單位就是Token。在AI的眼里,一個Token可能對應(yīng)幾個漢字、單詞,也可能是一個標(biāo)點(diǎn)、數(shù)字或者符號。它就像AI時代手機(jī)的流量一樣,每一個AI模型廠商都會提供自己的Token,并且以它的消耗量為單位向用戶收費(fèi)。

無論是用戶的提問,還是AI生成的一段代碼,最終都要被拆解成Token來完成運(yùn)算。例如火爆的“養(yǎng)龍蝦”(部署和使用本地AI智能體OpenClaw),想讓它變得更聰明,就得為大模型的服務(wù)付費(fèi),本質(zhì)上就是在購買Token的使用量。

從技術(shù)本質(zhì)來看,詞元是自然語言的數(shù)學(xué)化表達(dá)。一段文字、一個問題進(jìn)入AI模型前,會先被“分詞器”拆解為若干詞元,拆分規(guī)則因模型分詞器設(shè)計而異:“朋友買了西瓜手機(jī)!”可能被拆分為“朋友”“買”“了”“西瓜”“手機(jī)”,而“Transformer”這類英文詞匯,可能被拆成“Trans”“former”。

這些拆分后的詞元,對人類而言是有意義的文字,對AI卻缺乏直觀認(rèn)知。為了讓AI“理解”,大模型會先給每個Token分配一個數(shù)字編號,然后將這個編號轉(zhuǎn)化為一組數(shù)字坐標(biāo)(向量)。這個坐標(biāo)決定了AI如何“理解”這個詞。

更關(guān)鍵的是,AI對詞匯的理解并非固定不變,而是通過計算詞元坐標(biāo)間的復(fù)雜關(guān)系實現(xiàn)動態(tài)解讀——比如“西瓜”,AI會根據(jù)上下文,將其坐標(biāo)向“品牌”或“食物”相關(guān)方向調(diào)整,從而精準(zhǔn)理解“西瓜手機(jī)”這類組合的含義。

總而言之,Token計量的,并不只是你看到的AI模型給出的答案,而是生成這個答案所需的全部計算資源。而進(jìn)入以O(shè)penclaw(龍蝦)為代表的agent場景,這種Token的消耗會被指數(shù)級擴(kuò)大。比如讓Openclaw替你干活,把“幫我整理一下文件夾”這句話甩給它之后,它可能需要先讀懂這個要求,然后拆解成十幾個子任務(wù),每個子任務(wù)分別調(diào)用一次AI,每次調(diào)用都帶著完整的系統(tǒng)指令和上下文,必要的時候還要反復(fù)檢查有沒有做對、是否需要修正。這背后可能是幾十輪對話、幾萬個Token的連鎖消耗,這也是它看起來只干了點(diǎn)普通的活,但格外消耗Token的原因。

03

中國領(lǐng)跑全球:

詞元競爭背后的算力與產(chǎn)業(yè)優(yōu)勢

全球AI產(chǎn)業(yè)的競爭,正以詞元調(diào)用量為標(biāo)尺展開。全球最大AI模型API聚合平臺OpenRouter最新數(shù)據(jù)顯示,截至3月15日,中國AI大模型的周調(diào)用量達(dá)到4.69萬億個Token,連續(xù)第二周超越美國。全球詞元調(diào)用量排名前三的位置,更是被中國模型占據(jù)。國產(chǎn)大模型MiniMax M2.5連續(xù)五周位居全球大模型調(diào)用量榜首,在公司總部的辦公區(qū),產(chǎn)品研發(fā)人員展示了直觀的價格差距圖。“達(dá)到同樣能力水平的海外模型跟我們的相比,價格可能有十幾倍的差距?!?/p>

我們要知道,Token并不是憑空產(chǎn)生的,它是由高性能的GPU在消耗大量的電能,完成數(shù)千億次的推理運(yùn)算后產(chǎn)生的數(shù)字資產(chǎn)。每生成一個Token都對應(yīng)著真實的推理過程,也對應(yīng)著真實的電力消耗和算力消耗。

而中國大模型公司之所以能夠把Token價格做得更低,主要原因有:第一是我們的電力優(yōu)勢。中國擁有更完善的電力基礎(chǔ)設(shè)施和技術(shù)體系,尤其是西部地區(qū)豐富的新能源綠電,正在與數(shù)據(jù)中心算力、樞紐加快耦合,把電直接轉(zhuǎn)化成AI時代的新型服務(wù)能力。第二是技術(shù)能力。近年來中國科技企業(yè)在推理芯片、模型架構(gòu)和系統(tǒng)優(yōu)化上持續(xù)突破,這意味著面對同樣一個問題,中國的大模型往往可以用更少的算力、更短的時延、更高的能效,就把答案給算出來。有人說Token將是AI時代新的能源單位,中國電力、中國算力正在以一種全新的方式參與著全球的競爭。

04

詞元成產(chǎn)業(yè)“晴雨表”:

重構(gòu)AI商業(yè)邏輯與產(chǎn)業(yè)生態(tài)

在人工智能時代,用戶輸入的每一個字,大模型生成的每一段話、識別的每一幅圖像,都在消耗詞元。國家數(shù)據(jù)局專家咨詢委員會委員張向宏介紹,日均超140萬億的詞元調(diào)用量,相當(dāng)于1000萬億個中文詞匯,也相當(dāng)于250個中國國家圖書館的資源量。

國家發(fā)展改革委國家信息中心人工智能處工程師蔡馳宇介紹,詞元日均調(diào)用量大幅增長,充分表明人工智能正加速從實驗室走向千行百業(yè)和千家萬戶,變成了實實在在的生產(chǎn)力工具,像水、電、網(wǎng)絡(luò)一樣,成為智能社會運(yùn)轉(zhuǎn)的基礎(chǔ)資源。詞元的消耗量是人工智能產(chǎn)業(yè)發(fā)展的重要指標(biāo)和“晴雨表”。

詞元的普及,更在重構(gòu)人工智能產(chǎn)業(yè)的商業(yè)邏輯。圍繞詞元的調(diào)用、分發(fā)與結(jié)算,一套新的價值體系正在加速演進(jìn)形成,并成為人工智能產(chǎn)業(yè)可能變現(xiàn)的重要路徑。蔡馳宇介紹,過去一家企業(yè)使用信息服務(wù),需要購買信息軟件;現(xiàn)在一家企業(yè)使用信息服務(wù),可直接調(diào)用大模型接口,用多少詞元,就付多少費(fèi)用,以詞元消耗量的多少作為計費(fèi)依據(jù)。這種按需付費(fèi)的模式,大幅降低了企業(yè)的AI應(yīng)用門檻,也讓AI產(chǎn)業(yè)的商業(yè)變現(xiàn)更具靈活性。

與此同時,專家表示,詞元消耗量增長也對電力資源提出了更高要求。今年的政府工作報告提出,實施算電協(xié)同等新基建工程。專家表示,算電協(xié)同的本質(zhì)含義,就是要依托我國具有超前優(yōu)勢的綠電來發(fā)展算力產(chǎn)業(yè)和人工智能產(chǎn)業(yè)。

素材來源:央視新聞、央視財經(jīng)、科普中國

編輯:董敏煒

審核:馮海波 劉肖勇


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

廣東科技報 incentive-icons
廣東科技報
傳播科技資訊,普及科學(xué)知識。
3346文章數(shù) 1261關(guān)注度
往期回顧 全部

專題推薦

洞天福地 花海畢節(jié) 山水饋贈里的“詩與遠(yuǎn)方

無障礙瀏覽 進(jìn)入關(guān)懷版