国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話戴國浩:用Token重新理解AI的成本與價值

0
分享至



近期,DeepTech 密集報道了一系列 AI 在具體場景中落地的新突破。在曼哈頓,一位耶魯畢業(yè)的律師借助 Claude,僅用兩小時便完成了傳統(tǒng)中型律所團(tuán)隊通宵才能交付的并購提案;一位從未寫過代碼的管道工程師利用 AI 工具分析診斷數(shù)據(jù),在幾分鐘內(nèi)鎖定了復(fù)雜管道網(wǎng)絡(luò)的故障源,而過去這通常需要高級工程師上門勘測數(shù)日;與此同時,開源 AI 智能體項目 OpenClaw 繼續(xù)以“人類歷史上增長最快的開源項目”之勢席卷全球,幫助不同行業(yè)的從業(yè)者實現(xiàn)了更復(fù)雜的 Agent 功能。

這些故事的共同點顯而易見:AI 正在抹平團(tuán)隊與個體之間的產(chǎn)能鴻溝,“一人公司”(One Person Company)不再是愿景,而是觸手可及的現(xiàn)實。

然而,幾乎每一條案例的評論區(qū),都出現(xiàn)了同一種聲音:“他們做到這些究竟燒掉了多少 token?”

是的,效率的躍升并非毫無代價。作為大語言模型處理信息的最小單位,AI 在具體場景中施展拳腳,離不開海量 token 的消耗。陶哲軒在用 AI 輔助破解數(shù)學(xué)難題時,首次嘗試便因消耗過量 Token 導(dǎo)致本地算力崩潰;據(jù)報道,OpenAI 工程師團(tuán)隊一周處理的 token 量高達(dá) 2,100 億,相當(dāng)于復(fù)寫 33 遍維基百科;而一些 OpenClaw 的重度用戶曬出的算力賬單更是驚人,月支出從數(shù)千美元到數(shù)萬美元不等。

與此同時,企業(yè)界也開始重新審視 token 的稀缺性與戰(zhàn)略價值。黃仁勛在近期 GTC 大會上提出了“token 經(jīng)濟(jì)學(xué)”的概念,他認(rèn)為數(shù)據(jù)中心正在演變?yōu)樯a(chǎn) token 的“AI 工廠”,token 需要根據(jù)相應(yīng)的標(biāo)準(zhǔn)進(jìn)行分層定價供給。同時,token 將成為繼工資、獎金、期權(quán)之后的“第四種薪酬”。在硅谷,工程師的身價評估體系也正在被呼吁重構(gòu),其中一項重要標(biāo)準(zhǔn)就是看他能高效調(diào)用多少 token。

token,這個曾經(jīng)位于技術(shù)文檔底部的計量單位,正在躍升為 AI 時代的新貨幣。它既是生產(chǎn)力的燃料,也是稀缺資源的象征;它既是個體實現(xiàn)能力躍遷的杠桿,也可能成為新的數(shù)字鴻溝。

為了更深入地解讀 token 在 AI 時代的全新意義,我們邀請了上海交通大學(xué)副教授、無問芯穹聯(lián)合創(chuàng)始人戴國浩進(jìn)行了一次深度對話。他長期致力于稀疏計算與軟硬件協(xié)同設(shè)計方向,研究內(nèi)容包括結(jié)構(gòu)化稀疏方法、動態(tài)編譯策略與細(xì)粒度并行架構(gòu),從而在有限硬件條件下提升算力表現(xiàn)。戴國浩也是 2024 年《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人”中國入選者。

我們圍繞 token 從技術(shù)參數(shù)向經(jīng)濟(jì)變量轉(zhuǎn)化的內(nèi)在邏輯、底層算力效率的優(yōu)化路徑,也對在個人層面如何更高效地使用 token 展開了討論。

以下是對話內(nèi)容:

DeepTech:token 作為一個概念,過去幾年主要出現(xiàn)在技術(shù)討論中,例如推理成本、模型定價。但最近它開始出現(xiàn)在薪酬談判和企業(yè)預(yù)算里。在你看來,token 從一個技術(shù)參數(shù)變成一個經(jīng)濟(jì)變量,這個轉(zhuǎn)變的背后發(fā)生了什么?

戴國浩:我認(rèn)為最根本的原因在于模型的智能化水平已經(jīng)達(dá)到了“可用”的階段。

如果以 2022 年底 ChatGPT 的發(fā)布為起點,到現(xiàn)在大約三年多時間。當(dāng)時的模型更多還是一個對話系統(tǒng),雖然具備一定的智能,可以進(jìn)行自然語言交互,但很難真正嵌入到生產(chǎn)流程中,也無法直接轉(zhuǎn)化為生產(chǎn)力。

而現(xiàn)在,一個關(guān)鍵變化在于模型已經(jīng)具備完成實際任務(wù)的能力。也就是說,當(dāng)用戶獲得一定的 token 配額后,不再只是與模型進(jìn)行對話,而是可以通過模型完成具體工作。這種能力的轉(zhuǎn)變,使得 token 不再只是一個技術(shù)層面的計量單位,而是成為可以直接對應(yīng)生產(chǎn)結(jié)果的資源。

因此,token 從技術(shù)參數(shù)演變?yōu)榻?jīng)濟(jì)變量,本質(zhì)上是由模型能力和整體智能水平的提升所驅(qū)動的。

DeepTech:從理論上看,模型能力的提升通常會帶來單位 token 成本的下降。但在現(xiàn)實中,我們看到不少云廠商選擇上調(diào)價格。同時,隨著像 OpenClaw 這類智能體應(yīng)用的興起,越來越多用戶開始感受到高額 token 消耗所帶來的成本壓力。

你如何看待這種看似矛盾的現(xiàn)象?其背后是供需關(guān)系的變化,還是推理成本結(jié)構(gòu)發(fā)生了改變,或是其他因素在起作用?

戴國浩:我剛才提到模型能力的提升,這實際上意味著“單個 token 的能力”在增強(qiáng)。

如果從經(jīng)濟(jì)角度來理解,可以將其放入一個更完整的價值轉(zhuǎn)化鏈條中來看。之所以很多人將 AI 視為“第四次工業(yè)革命”,本質(zhì)上是因為每一次工業(yè)革命,都是通過某種關(guān)鍵技術(shù),創(chuàng)造出新的生產(chǎn)力形式。而所有生產(chǎn)力的核心,都是將輸入價值轉(zhuǎn)化為輸出價值。

在傳統(tǒng)工業(yè)體系中,例如蒸汽機(jī)或發(fā)電機(jī),提供的是動力或電力,用于將原始物料加工為具有經(jīng)濟(jì)價值的產(chǎn)品。而在這一輪 AI 變革中,模型能力的提升,使其本身也成為一種新的價值轉(zhuǎn)換機(jī)制。

如果將這一過程拆解,可以得到一個相對清晰的鏈條:

輸入價值→①→電能→②→token→③→生產(chǎn)力→④→輸出價值

其中①是供電體系,②是芯片和系統(tǒng),③是模型和算法,④是社會評價體系

輸入價值首先是轉(zhuǎn)化為電能,然后電能通過芯片與計算系統(tǒng)轉(zhuǎn)化為算力,算力進(jìn)一步轉(zhuǎn)化為 token,最后 token 再通過模型轉(zhuǎn)化為生產(chǎn)力;最終,這些生產(chǎn)力通過社會評價體系(例如代碼、文本內(nèi)容等)被賦予具體的經(jīng)濟(jì)價值。

在這個鏈條中,token 是一個關(guān)鍵中間環(huán)節(jié)。隨著模型能力的提升,“token 到生產(chǎn)力”的轉(zhuǎn)化效率顯著提高。換句話說,每一個 token 所能承載和釋放的價值變得更高。

這也解釋了為什么 token 會具備經(jīng)濟(jì)屬性?梢灶惐葹槠髽I(yè)為員工配備工具:之所以配備計算機(jī),是因為它能夠提升生產(chǎn)力,而不是提供一個沒有實際用途的工具。同理,當(dāng) token 能夠直接驅(qū)動生產(chǎn)時,它自然會被納入經(jīng)濟(jì)體系。

另一方面,“成本下降”更多發(fā)生在“電能到 token”的階段,也就是算力效率的提升,例如硬件優(yōu)化或系統(tǒng)效率提升。而“token 到生產(chǎn)力”的價值轉(zhuǎn)化,則屬于鏈條中的另一環(huán)節(jié)。

在模型尚不可用的階段,由于后端價值有限,企業(yè)往往需要通過低價甚至補(bǔ)貼來推動使用,包括大規(guī)模鋪量或持續(xù)優(yōu)化成本結(jié)構(gòu)。但當(dāng)模型能力提升、后端價值顯著提高后,整個邏輯會從“推廣驅(qū)動”轉(zhuǎn)向“市場化驅(qū)動”。

在這種情況下,企業(yè)需要重新平衡成本與收益,即使技術(shù)仍在持續(xù)優(yōu)化、推理效率不斷提升,價格上調(diào)也是市場化過程中的自然結(jié)果。因此,這種“成本下降但價格上升”的現(xiàn)象并不矛盾。本質(zhì)上,一方面是底層技術(shù)效率在提升,另一方面是過去推廣階段所存在的成本缺口逐步被填補(bǔ),最終形成一個可持續(xù)的商業(yè)閉環(huán)。

DeepTech:你的研究方向之一是稀疏注意力(sparse attention)等機(jī)制,這類方法會直接影響 token 的計算成本。如果沿著這一思路繼續(xù)推演,未來模型是否有可能具備“自適應(yīng)計算能力”,即自動判斷哪些 token 需要精細(xì)計算,哪些可以簡化甚至跳過?這種機(jī)制在多大程度上會影響推理成本?

戴國浩:從具體技術(shù)來看,這種趨勢已經(jīng)在發(fā)生,而且不僅限于稀疏注意力。

例如,稀疏專家(Mixture-of-Experts)、層級稀疏(layer skipping)、以及模型結(jié)構(gòu)層面的多級配置(如投機(jī)解碼、大小模型協(xié)同),本質(zhì)上都可以歸為“稀疏化”或“結(jié)構(gòu)化”的探索。像 DeepSeek 等團(tuán)隊,已經(jīng)在稀疏注意力等方向上進(jìn)行了實踐;同時,大規(guī)模模型(百億甚至千億參數(shù)級別)中,稀疏專家結(jié)構(gòu)也已較為常見。此外,一些系統(tǒng)開始引入小模型與大模型協(xié)同,通過推測解碼(speculative decoding)提升整體吞吐效率。

這些方法的共同點在于:通過結(jié)構(gòu)設(shè)計,而非單純增加參數(shù)規(guī)模,來提升計算效率與性能表現(xiàn)。

從更宏觀的角度看,智能系統(tǒng)的發(fā)展,本質(zhì)上是在不斷逼近“最優(yōu)結(jié)構(gòu)”。在早期,由于對模型結(jié)構(gòu)理解有限,采用稠密矩陣(dense architecture)是一種更直接、通用的表達(dá)方式,通過擴(kuò)大數(shù)據(jù)和參數(shù)規(guī)模來獲得性能提升。但隨著理解的加深,結(jié)構(gòu)性特征會逐漸顯現(xiàn)。例如殘差連接(residual connection)、卷積結(jié)構(gòu)(convolution)等,都是在這一過程中被發(fā)現(xiàn)并固化下來的有效結(jié)構(gòu)。

理論上,任何結(jié)構(gòu)都可以用更大的稠密矩陣來近似表達(dá),但在實際中,這樣的模型往往難以收斂,同時計算效率極低,因此并不可行。

回到 token 這一中間環(huán)節(jié),未來一個重要方向是對 token 進(jìn)行更細(xì)粒度的計算分配。例如,在推理過程中,不同 token 的復(fù)雜度是不同的:一些 token 可能只需要較淺層的計算即可得到結(jié)果,但另一些則需要更深層、更復(fù)雜的計算路徑。

因此,可以針對每個 token 動態(tài)分配計算資源,對其計算深度和計算量進(jìn)行定制化設(shè)計。相比于“所有 token 都經(jīng)過同樣深度模型”的方式,這種方法能夠在保證效果的同時顯著降低整體計算開銷。這也是為什么 token 在當(dāng)前階段不僅是計量單位,更是計算調(diào)度與資源分配的核心對象,它也將逐漸成為一種關(guān)鍵的生產(chǎn)要素。

DeepTech:如果進(jìn)一步拆解 token 的成本結(jié)構(gòu),除了模型本身,還包括 KV Cache 的顯存占用、帶寬,以及芯片架構(gòu)等因素。在這些層面中,你認(rèn)為當(dāng)前優(yōu)化空間最大的是哪一部分?

戴國浩:可以用一個相對簡化的模型來描述推理開銷:

那就是時間 ≈ 計算量 ÷(算力 × 利用率)

或者從存儲角度來看:

時間 ≈ 數(shù)據(jù)量 ÷(帶寬 × 利用率)

在這個框架下,不同變量對應(yīng)不同層面的參與者:

首先,計算量主要由模型設(shè)計決定,例如參數(shù)規(guī)模(3B、30B、300B 等);其次,算力取決于芯片能力,例如算力規(guī)模(TFLOPS 級別差異);最后,利用率則與軟硬件協(xié)同優(yōu)化密切相關(guān)。

此外,像 KV Cache 的顯存占用、注意力計算開銷等問題,本質(zhì)上更多影響的是系統(tǒng)的帶寬利用率與整體資源利用效率。芯片本身的能力則與其架構(gòu)設(shè)計和制造工藝有關(guān)。

在這一建?蚣芟拢梢钥吹讲煌瑑(yōu)化方向的邊界:

首先,單純降低模型計算量的空間其實有限,因為模型發(fā)展的首要目標(biāo)仍然是提升智能水平,這是一個基本前提。因此,在模型設(shè)計層面,壓縮計算量并不是主要矛盾。相比之下,利用率的優(yōu)化空間非常大。無論是算力利用率、帶寬利用率,還是緩存命中率,都存在顯著提升空間。

其次,芯片架構(gòu)本身的設(shè)計也是一個重要方向。例如 英偉達(dá)黃仁勛 所提出的“AI Factory”理念,本質(zhì)上是將芯片、系統(tǒng)軟件以及電力供給等多個層面打通,進(jìn)行整體協(xié)同優(yōu)化?傮w來看,未來推理成本下降,更依賴于:一個是各層級資源利用率的提升,另一個是芯片架構(gòu)與系統(tǒng)設(shè)計的持續(xù)演進(jìn)。

而這些優(yōu)化的最終目標(biāo),都是為了支撐更大規(guī)模、更高智能水平的模型發(fā)展。

DeepTech:那么從當(dāng)前階段來看,性能優(yōu)化的主要瓶頸更偏向算法側(cè),還是硬件側(cè)?

戴國浩:我認(rèn)為主要瓶頸仍然在硬件,以及硬件與算法的協(xié)同設(shè)計(co-design)。

算法的發(fā)展方向始終是探索更高水平的智能,這是不會改變的。但算法的迭代效率,很大程度上受限于硬件條件。例如,一個模型版本的迭代周期是一個月還是三個月,本質(zhì)上取決于算力資源與系統(tǒng)效率。

因此,問題不僅在于是否存在更優(yōu)的算法,還在于這些算法能否在現(xiàn)有硬件體系下高效實現(xiàn)。目前也有越來越多的團(tuán)隊在嘗試算法與硬件的協(xié)同優(yōu)化,但這一過程的效率,仍然受到硬件設(shè)計能力以及對硬件理解深度的制約。從這個角度來看,未來的關(guān)鍵競爭點,將越來越集中在軟硬件一體化的協(xié)同設(shè)計能力上。

DeepTech:前段時間,黃仁勛在 GTC 大會上提出了一個頗具沖擊力的觀點:未來員工的 token 消耗量應(yīng)當(dāng)與薪酬成正比,可以將 token 使用量視為生產(chǎn)效率的一種指標(biāo)。與此同時,硅谷也出現(xiàn)了一種被稱為“tokenmaxxing”的現(xiàn)象:一些從業(yè)者會刻意提高 token 使用量,用不完甚至?xí)a(chǎn)生焦慮。你如何看待這一觀點?無論是企業(yè)還是個人,應(yīng)該建立怎樣的“token 觀”?

戴國浩:我傾向于從辯證的角度來看。

首先,我可以理解他為什么會提出這樣的觀點。結(jié)合他所強(qiáng)調(diào)的 AI Factory,本質(zhì)上是在將算力體系轉(zhuǎn)化為“token 的生產(chǎn)系統(tǒng)”。在早期,當(dāng) AI 尚未形成完整的正向經(jīng)濟(jì)循環(huán)時,GPU 只是數(shù)據(jù)中心或算力基礎(chǔ)設(shè)施中的一個組件,是供應(yīng)鏈的一環(huán)。

但當(dāng) AI Factory 的概念成立之后,這套系統(tǒng)更像是一個“token 生產(chǎn)工廠”。如果進(jìn)一步類比,可以將其視為一種“價值生成裝置”。在一種極端設(shè)想下,如果 token 的消耗可以直接映射為經(jīng)濟(jì)回報,那么這套系統(tǒng)就具備類似“價值生成器”的屬性。

另一方面,我認(rèn)為這一觀點也具備一定合理性。因為從工具屬性來看,可以類比為早期的軟件工程實踐。例如在十年前,程序員的產(chǎn)出有時會通過代碼量進(jìn)行粗略衡量。代碼量在某種程度上反映了工具使用的強(qiáng)度和產(chǎn)出規(guī)模。

在今天,token 消耗可以被理解為一種新的“工作投入度量”。你使用了多少 token,某種程度上意味著你調(diào)用了多少模型能力,完成了多少任務(wù)。因此,它與產(chǎn)出之間確實存在一定相關(guān)性。

但問題在于,這種關(guān)系并不是線性的,也不是穩(wěn)定的。如果回到我們前面討論的價值轉(zhuǎn)化鏈條,token 只是其中的一個中間環(huán)節(jié)!皌oken 到生產(chǎn)力”的轉(zhuǎn)化效率,取決于多個因素:例如使用的模型能力,模型之間的協(xié)同方式,token 的質(zhì)量(例如 prompt 質(zhì)量),或者是具體任務(wù)類型。

因此,我認(rèn)同 token 消耗量與價值之間“存在相關(guān)性”,但更關(guān)鍵的是:如何使用 token。換句話說,高質(zhì)量地使用 token(例如選擇合適模型、設(shè)計有效結(jié)構(gòu)),比單純增加 token 消耗更重要。這可能才是未來個體需要重點關(guān)注的能力。

DeepTech:那是否有可能存在一個更合理的指標(biāo),而不是簡單用 token 消耗量來衡量生產(chǎn)效率?

戴國浩:如果在理想情況下,“token 到生產(chǎn)力”的轉(zhuǎn)化關(guān)系是標(biāo)準(zhǔn)化的,例如一個 token 可以穩(wěn)定對應(yīng)某種經(jīng)濟(jì)價值,那么確實可以直接用 token 消耗來衡量產(chǎn)出。

但現(xiàn)實中,這一環(huán)節(jié)并不穩(wěn)定,尤其是在當(dāng)前階段。

對于一些高度標(biāo)準(zhǔn)化、確定性較強(qiáng)的行業(yè)(例如部分法律、會計等場景),隨著工具成熟,未來可能逐步接近這種“線性映射”。在這種情況下,將 token 使用量與產(chǎn)出掛鉤,是可以成立的。但對于更具創(chuàng)造性的工作,這種關(guān)系往往是非線性的。例如,有的人可能只使用較少的 token,就能產(chǎn)生更高價值的結(jié)果;而另一些人即使消耗更多 token,產(chǎn)出價值卻未必更高。

在這種情況下,更合理的評價方式,應(yīng)該是將token 使用量”與“最終產(chǎn)出價值”進(jìn)行聯(lián)合評估。從資源配置角度看,我們更應(yīng)該鼓勵的是:用更少的 token 產(chǎn)生更高的價值。這也可以理解為一種更正確的 token 觀。

DeepTech:在最近的趨勢中,我們發(fā)現(xiàn)了許多使用者尤其關(guān)注一個問題:在實際使用大模型時,如何更高效、更具性價比地使用 token?你作為專業(yè)的從業(yè)人員,在日常使用中,有沒有一些經(jīng)過驗證的方法或經(jīng)驗,比如在 prompt 設(shè)計、任務(wù)拆解、模型選擇等方面?

戴國浩:這三個方面,其實都非常關(guān)鍵。

可以用一個類比來理解:在傳統(tǒng)的軟件團(tuán)隊中,通常會有架構(gòu)師和程序員的分工。程序員負(fù)責(zé)具體實現(xiàn),而架構(gòu)師負(fù)責(zé)整體設(shè)計,包括任務(wù)拆解、模塊劃分以及協(xié)作方式。

從當(dāng)前大模型的能力來看,它已經(jīng)可以高效完成很多“程序員層面”的執(zhí)行工作,這一點并不困難。真正的挑戰(zhàn)在于更上層的結(jié)構(gòu)設(shè)計。具體來說,可以對應(yīng)三個關(guān)鍵環(huán)節(jié):

第一是任務(wù)拆解。需要將一個復(fù)雜問題分解為多個子任務(wù),并明確各自的邊界與目標(biāo)。第二是 prompt 設(shè)計。本質(zhì)上是對任務(wù)目標(biāo)的精確表達(dá),相當(dāng)于對執(zhí)行單元的“指令定義”。第三是模型選擇與調(diào)度。即讓“合適的模型做合適的事情”,例如簡單任務(wù)可以交給輕量模型處理,復(fù)雜任務(wù)再調(diào)用更強(qiáng)的模型。這三個環(huán)節(jié),實際上構(gòu)成了一個完整的“結(jié)構(gòu)設(shè)計過程”。

此外,還有一個容易被忽視的點:人類輸入的 token 往往更高效。在一些推理型模型中(例如帶有長鏈路思考過程的模型),模型在內(nèi)部會生成大量中間推理步驟,這些過程本身會消耗大量 token。而人類可以在前置階段,通過更清晰的任務(wù)定義,減少模型不必要的探索路徑,從而降低整體開銷。

結(jié)合這些經(jīng)驗,我個人的使用方式是:先盡可能在前期將 prompt 定義得清晰、具體;然后,對任務(wù)進(jìn)行結(jié)構(gòu)化拆解;最后,在不同復(fù)雜度任務(wù)之間,靈活選擇模型(包括開源模型與高性能閉源模型的組合使用)。

從長期來看,這也意味著一個能力轉(zhuǎn)變。以程序員為例,需要逐漸從單純的“編碼者(coder)”,轉(zhuǎn)向“系統(tǒng)架構(gòu)設(shè)計者(architect)”。只有在更高層面進(jìn)行結(jié)構(gòu)設(shè)計,才能真正提升整體效率。

DeepTech:黃仁勛在會上還提出了 token 的分層定價策略,沿著"模型智能程度 × 生成速度 × 上下文長度"三個維度來定價,形成從免費層到高速層 $150/百萬 token 的供給體系。在這方面,一些國內(nèi)公司已經(jīng)相繼響應(yīng)。你認(rèn)為這一框架對產(chǎn)業(yè)格局會產(chǎn)生怎樣的深層影響?它是否會加速大模型市場的兩極分化?

戴國浩:剛才你提到的幾個關(guān)鍵變量,包括模型智能水平、生成速度和上下文長度,其實可以歸為兩類,并分別對應(yīng)我們之前討論的價值轉(zhuǎn)化鏈條中的不同環(huán)節(jié)。

其中,生成速度和上下文長度,主要影響“算力到 token”的轉(zhuǎn)化效率。這一部分與計算能力和存儲能力密切相關(guān):上下文長度更多涉及存儲與帶寬,生成速度主要與計算能力相關(guān),同時也受到訪存效率的影響。

模型的智能水平,則對應(yīng)“token 到生產(chǎn)力”的轉(zhuǎn)化效率。

從這個角度看,這三個變量實際上構(gòu)成了整個價值鏈條中的關(guān)鍵維度。因此,將 token 按不同能力層級進(jìn)行劃分,本身是有內(nèi)在合理性的。

進(jìn)一步來說,不同行業(yè)、不同任務(wù),對 token 的“價值密度”要求是不同的。高質(zhì)量 token(例如由更強(qiáng)模型生成)在某些場景中能夠產(chǎn)生更高價值,因此在定價上進(jìn)行分層,是符合基本經(jīng)濟(jì)邏輯的。

至于具體的定價策略,我并不是這方面的專家,但從一般規(guī)律來看,一個比較普遍的現(xiàn)象是:價值越高的產(chǎn)品,其“性價比”往往反而越低。

這一點在很多行業(yè)中都存在。例如汽車、手機(jī)等領(lǐng)域,高端產(chǎn)品通常在絕對性能上更強(qiáng),但單位性能的價格也更高。這樣的結(jié)構(gòu)并不會導(dǎo)致行業(yè)失衡,反而使不同需求的用戶,都可以在同一價值鏈中找到適合自己的選擇。

如果將 AI 視為一種逐漸成熟的“商品”,那么類似的分層定價體系,大概率也會自然出現(xiàn)。

DeepTech:但 token 作為一種相對新的“商品”,用戶在理解和接受它的過程中,可能還需要時間。它不像傳統(tǒng)行業(yè)那樣已經(jīng)形成穩(wěn)定認(rèn)知。

戴國浩:是的,一方面是認(rèn)知上的適應(yīng)過程,另一方面,技術(shù)本身仍處在快速發(fā)展階段。

AI 在未來會在更多行業(yè)中釋放價值,但目前仍處于一個早期拐點階段。已經(jīng)開始在部分場景中形成明確價值,但整體滲透率還不高。如果回看三年前,以對話系統(tǒng)為主的模型確實很難直接產(chǎn)生經(jīng)濟(jì)價值,而現(xiàn)在情況已經(jīng)發(fā)生了明顯變化。

DeepTech:當(dāng)前的云計算基礎(chǔ)設(shè)施,本質(zhì)上是為人類工程師設(shè)計的,而不是為 agent(智能體)設(shè)計的。在這種情況下,這套架構(gòu)是否在一定程度上限制了 token 效率的進(jìn)一步釋放?如果以“token factory”為目標(biāo)推進(jìn),你認(rèn)為從硬件、軟件到調(diào)度和服務(wù),各個層面需要進(jìn)行怎樣的重構(gòu)?這種變化會有多激進(jìn)?

戴國浩:這個問題也可以從生產(chǎn)體系演進(jìn)的角度來理解。

如果把 token factory 類比為一種新的“工廠”,那么它和傳統(tǒng)的電廠或水廠類似,本質(zhì)上是在生產(chǎn)基礎(chǔ)資源;乜垂I(yè)發(fā)展歷程,每一次工業(yè)革命都會引入新的基礎(chǔ)生產(chǎn)要素,從蒸汽到電力,再到信息計算能力,而每一次這種變化,都會帶來整個系統(tǒng)結(jié)構(gòu)的重構(gòu)。

從這個意義上看,以 token 為代表的大模型體系,正在成為一種新的基礎(chǔ)生產(chǎn)要素。雖然它目前仍建立在既有的電力和信息系統(tǒng)之上,但隨著其重要性不斷提升,底層架構(gòu)發(fā)生系統(tǒng)性變化是一個必然趨勢。

外界對 token 有不同的類比,比如把它看作比特,或者類比為電力,這些說法各有其合理性。但更關(guān)鍵的一點在于,當(dāng) token 成為核心生產(chǎn)單元之后,整個系統(tǒng)的各個層級都會圍繞它進(jìn)行重新組織。最先發(fā)生變化的,往往是接口層——如果 token 成為統(tǒng)一的計量單位,那么系統(tǒng)之間的交互、任務(wù)的度量、甚至算力與電力的轉(zhuǎn)換關(guān)系,都可能逐漸以 token 為核心來表達(dá)。

當(dāng)然,這一判斷隱含了一個前提,即當(dāng)前以 Transformer 為基礎(chǔ)、以 token 為核心處理單元的范式在一段時間內(nèi)是穩(wěn)定的。從目前來看,這一方向具有較高確定性,但仍然存在技術(shù)演進(jìn)的不確定性。

在這個前提下,各個層面的變化其實已經(jīng)在發(fā)生。以芯片為例,像 NVIDIA 的 GPU 架構(gòu),雖然仍然是通用計算架構(gòu),但在數(shù)據(jù)中心場景中,已經(jīng)引入了大量針對 Transformer 的專用計算單元。本質(zhì)上,這些優(yōu)化都是在圍繞 token 的處理效率展開。整個過程是漸進(jìn)式的:從最早的通用計算,到針對矩陣運算的加速,再到專門為 Transformer 結(jié)構(gòu)優(yōu)化,逐步向 token 對齊。類似的趨勢,也會在軟件、調(diào)度乃至服務(wù)層逐步體現(xiàn)出來。

DeepTech:如果整個體系都逐步對齊到 token,本質(zhì)上意味著默認(rèn)的計算范式仍然是以 Transformer 為基礎(chǔ)。但我們也看到一些新的架構(gòu)在出現(xiàn),比如 Mamba,或者擴(kuò)散模型在語言建模中的嘗試。你覺得如果這些技術(shù)發(fā)展到某個階段,token 是否可能被替代,或者演化成新的計算單元?

戴國浩:這個問題可以分兩個層面來看。

在中短期內(nèi),一種范式是否會被替代,關(guān)鍵不在于它“是否更好”,而在于它是否能在整體效率上實現(xiàn)數(shù)量級的提升。因為現(xiàn)有體系不僅僅是技術(shù)本身,還包括完整的工業(yè)基礎(chǔ)、軟件生態(tài)以及價值評估體系,這些都是高度固化的,切換成本非常高。往往需要展現(xiàn)出一個數(shù)量級的提升的潛力,才有可能推動技術(shù)的汰換迭代。

目前確實出現(xiàn)了一些新的架構(gòu),比如 Mamba,以及基于擴(kuò)散過程的語言模型。這些方法在某些特定任務(wù)上可能表現(xiàn)更優(yōu),但從整體來看,一方面還缺乏大規(guī)模工程驗證,另一方面也很難在短時間內(nèi)嵌入現(xiàn)有體系。更重要的是,它們在實際落地時,仍然需要與現(xiàn)有接口對齊,最終輸出依然是 token 序列。因此,從現(xiàn)實路徑來看,這些技術(shù)更像是在現(xiàn)有范式內(nèi)部進(jìn)行優(yōu)化,而不是直接替代。

如果把視角拉得更長遠(yuǎn),確實存在一種可能性,即未來出現(xiàn)完全不同的計算范式,例如連續(xù)計算甚至量子計算。這類體系一旦成立,可能會從根本上改變當(dāng)前以離散 token 為基礎(chǔ)的計算方式。但同樣,它必須在關(guān)鍵效率指標(biāo)上顯著優(yōu)于現(xiàn)有體系,才有可能推動整個產(chǎn)業(yè)遷移。

在當(dāng)前階段,我更傾向于認(rèn)為,這樣的范式轉(zhuǎn)變還需要較長時間。更現(xiàn)實的問題仍然是,在以 token 為核心的既有體系中,如何持續(xù)提升轉(zhuǎn)化效率,以及如何完善整個基礎(chǔ)設(shè)施和應(yīng)用生態(tài)。這可能才是當(dāng)下更關(guān)鍵的方向。

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為何投資開拓者?華裔老板程正昌:我很看好我們的潛力新人楊瀚森

為何投資開拓者?華裔老板程正昌:我很看好我們的潛力新人楊瀚森

羅說NBA
2026-04-03 06:49:49
退休人員也要繳費了!4月起執(zhí)行,每月扣多少、誰能免,一次說清

退休人員也要繳費了!4月起執(zhí)行,每月扣多少、誰能免,一次說清

閱微札記
2026-04-02 22:22:41
“項王故里”景區(qū)招募項羽扮演者 要求身高185cm以上 日薪按身高10倍計算

“項王故里”景區(qū)招募項羽扮演者 要求身高185cm以上 日薪按身高10倍計算

閃電新聞
2026-04-02 11:12:54
勃列日涅夫之死內(nèi)幕曝光:唯一知情人貼身護(hù)衛(wèi)梅德韋杰夫揭開謎團(tuán)

勃列日涅夫之死內(nèi)幕曝光:唯一知情人貼身護(hù)衛(wèi)梅德韋杰夫揭開謎團(tuán)

談史論天地
2026-04-02 18:34:04
道指深夜重挫近500點,芯片股集體下跌,美光科技跌超6%,黃金急跌3%,原油飆漲13%

道指深夜重挫近500點,芯片股集體下跌,美光科技跌超6%,黃金急跌3%,原油飆漲13%

21世紀(jì)經(jīng)濟(jì)報道
2026-04-02 22:39:05
張雪峰反復(fù)提的這7所大學(xué),畢業(yè)就是鐵飯碗,關(guān)鍵分?jǐn)?shù)還不高!

張雪峰反復(fù)提的這7所大學(xué),畢業(yè)就是鐵飯碗,關(guān)鍵分?jǐn)?shù)還不高!

優(yōu)墨出品
2026-03-30 19:24:31
誰“毀”了單依純?是常石磊的再造,還是被過早采摘的宿命?

誰“毀”了單依純?是常石磊的再造,還是被過早采摘的宿命?

非常先生看娛樂
2026-03-31 16:20:58
文班亞馬:我非常在意MVP,偉大的球員生涯早期就會抓住一切榮譽(yù)

文班亞馬:我非常在意MVP,偉大的球員生涯早期就會抓住一切榮譽(yù)

懂球帝
2026-04-02 15:33:43
十年效忠,半夜卷鋪蓋:司法部長帕姆·邦迪的“頭號忠臣”幻滅記

十年效忠,半夜卷鋪蓋:司法部長帕姆·邦迪的“頭號忠臣”幻滅記

冰汝看美國
2026-04-03 05:02:08
《戰(zhàn)旗如畫》被觀眾要求下架!理由:劇情離譜、主演降智

《戰(zhàn)旗如畫》被觀眾要求下架!理由:劇情離譜、主演降智

不似少年游
2026-04-02 19:48:54
癱瘓19年湯淼現(xiàn)狀:母親妻子早已改嫁,女兒已9歲,郎平多次探望

癱瘓19年湯淼現(xiàn)狀:母親妻子早已改嫁,女兒已9歲,郎平多次探望

拳擊時空
2026-04-03 05:47:35
喪心病狂!邯鄲中學(xué)校長性侵15歲女生,拿20萬封口,勢力大也沒用

喪心病狂!邯鄲中學(xué)校長性侵15歲女生,拿20萬封口,勢力大也沒用

觀察鑒娛
2026-04-02 10:26:05
國足兩戰(zhàn)穩(wěn)中求變,邵佳一的改革從讓每個人踢舒服開始

國足兩戰(zhàn)穩(wěn)中求變,邵佳一的改革從讓每個人踢舒服開始

懂球帝
2026-04-02 15:02:14
國務(wù)院食安辦、市場監(jiān)管總局、海關(guān)總署約談3家平臺企業(yè)

國務(wù)院食安辦、市場監(jiān)管總局、海關(guān)總署約談3家平臺企業(yè)

界面新聞
2026-04-02 19:02:33
德國工程師:中國人難道不知南水北調(diào)的弊端,環(huán)保大國稱號何來?

德國工程師:中國人難道不知南水北調(diào)的弊端,環(huán)保大國稱號何來?

心靈得以滋養(yǎng)
2026-03-13 22:44:44
問都不問直接下單!張雪機(jī)車奪冠后,武漢東西湖張雪機(jī)車門店十來天激增140臺,820rr訂單排至7

問都不問直接下單!張雪機(jī)車奪冠后,武漢東西湖張雪機(jī)車門店十來天激增140臺,820rr訂單排至7

極目新聞
2026-04-02 14:29:35
粉底液將軍事件再升級!網(wǎng)友懷疑反華勢力入侵,張凌赫恐被當(dāng)炮灰

粉底液將軍事件再升級!網(wǎng)友懷疑反華勢力入侵,張凌赫恐被當(dāng)炮灰

暗香暗香
2026-04-03 00:19:04
國民黨今在臺中舉行誓師大會,盧秀燕鄭麗文合體挺江啟臣

國民黨今在臺中舉行誓師大會,盧秀燕鄭麗文合體挺江啟臣

海峽導(dǎo)報社
2026-04-03 07:29:02
2010年文強(qiáng)被執(zhí)行死刑前照片!?生命最后四小時公開

2010年文強(qiáng)被執(zhí)行死刑前照片!?生命最后四小時公開

深度報
2026-04-01 21:52:05
2年和領(lǐng)導(dǎo)開房410次!從臨時工“睡”成處長,南航女經(jīng)理升遷之路

2年和領(lǐng)導(dǎo)開房410次!從臨時工“睡”成處長,南航女經(jīng)理升遷之路

就一點
2026-03-28 17:42:50
2026-04-03 08:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16526文章數(shù) 514831關(guān)注度
往期回顧 全部

科技要聞

三年虧20億,最新估值58億,Xreal沖刺港股

頭條要聞

特朗普剛說"要打擊一些橋梁" 伊朗標(biāo)志性大橋就被炸

頭條要聞

特朗普剛說"要打擊一些橋梁" 伊朗標(biāo)志性大橋就被炸

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

《浪姐》人氣榜出爐!曾沛慈斷層第一

財經(jīng)要聞

市場被特朗普一句話打醒 滯脹交易回歸

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅(qū)小車QQ3 EV

態(tài)度原創(chuàng)

房產(chǎn)
藝術(shù)
教育
時尚
軍事航空

房產(chǎn)要聞

巨無霸來了!?诔歉,突然又爆大動作!

藝術(shù)要聞

吳昌碩『扇畫』老辣古拙

教育要聞

國際奧林匹克競賽題,求n,太難了

成熟女性衣服別越買越多,準(zhǔn)備好襯衫和西裝,得體大方又高級

軍事要聞

伊朗自殺無人機(jī)突進(jìn) 逼退林肯號航母

無障礙瀏覽 進(jìn)入關(guān)懷版