国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek等開源模型,更“浪費(fèi)”token嗎

0
分享至

很多業(yè)內(nèi)人士已經(jīng)注意到,似乎DeepSeek-R1等開源模型,在回答問題時(shí)往往缺乏“節(jié)制”。尤其是簡(jiǎn)單問題,它想得過于復(fù)雜了。它的單位token成本的API價(jià)格優(yōu)勢(shì),最終將可能被不受制約的“冗長(zhǎng)思考”所侵蝕。

NousResearch團(tuán)隊(duì)一項(xiàng)研究,就是想搞清楚,開源權(quán)重模型在完成相同任務(wù)時(shí),是否系統(tǒng)性地需要比閉源模型更多的token?當(dāng)將token消耗數(shù)量納入考量后,這種差異如何影響總體推理成本?這種效率差異在不同的任務(wù)類型中是否更加顯著?

該研究發(fā)現(xiàn),對(duì)于不需要復(fù)雜推理就可直答的知識(shí)題(Knowledge questions),開源模型的“浪費(fèi)”最為明顯,DeepSeek-R1-0528完成任務(wù)消耗的token數(shù)量(completion tokens)——它既包括向用戶呈現(xiàn)的輸出結(jié)果,也包括思維鏈(CoT),并與實(shí)際計(jì)費(fèi)的token數(shù)量相匹配——要比基準(zhǔn)水平高出4倍。不過,到了需要推理數(shù)學(xué)題(Math problems)以及更復(fù)雜的邏輯謎題(Logic puzzles),DeepSeek-R1-0528消耗的token數(shù)量,高出基準(zhǔn)水平縮小至2倍左右??磥韺?shí)際工作中,向合適的模型詢問合適的問題是一大學(xué)問。


事實(shí)上,AI招聘獨(dú)角獸公司Mercor的也注意到了這一現(xiàn)象。在它提出的衡量大模型的AI生產(chǎn)力指數(shù)的APEX-v1.0基準(zhǔn)上,Qwen-3-235B和DeepSeek-R1的輸出長(zhǎng)度都超過了其他前沿模型。它們思考得更久,可以彌補(bǔ)一些不足,提升了平均成績(jī),代價(jià)就是更多的token消耗。

但這也是“慢思考”剛推出時(shí)的魅力,不是嗎?在預(yù)訓(xùn)練擴(kuò)展邊際放緩后,測(cè)試時(shí)擴(kuò)展越來越重要,是提升解題能力的關(guān)鍵?;氐絅ousResearch團(tuán)隊(duì)的研究上,DeepSeek-R1在各類邏輯謎題的準(zhǔn)確率,也明顯勝出一籌。也許它慢了一些,用的token也多了一些,但答對(duì)了題!


所以,開源模型相比前沿閉源模型,究竟經(jīng)濟(jì)不經(jīng)濟(jì)?

如果有一個(gè)最簡(jiǎn)易的統(tǒng)計(jì)公式,那么token經(jīng)濟(jì)可以歸納為:AI完成一項(xiàng)任務(wù)的收益=token兌現(xiàn)的價(jià)值-單位token成本×消耗token數(shù)量。

Token兌現(xiàn)的價(jià)值,一方面取決于模型能不能最終解決現(xiàn)實(shí)問題,另一方面則取決于它所解決的問題有多值錢。它下圍棋戰(zhàn)勝世界冠軍,值多少錢?獲得奧數(shù)金牌,又值多少錢?但更重要的是,在實(shí)際工作場(chǎng)景中創(chuàng)造出經(jīng)濟(jì)價(jià)值,而這些價(jià)值由市場(chǎng)來決定。

單位token成本也決定著模型的經(jīng)濟(jì)性。黃仁勛一直鼓吹“買得越多,省得越多”,就是從硬件與基礎(chǔ)設(shè)施層面優(yōu)化能效,降低運(yùn)營(yíng)成本的邏輯。這是美國(guó)的強(qiáng)項(xiàng)。目前,美國(guó)幾乎所有AI云巨頭與前沿大模型廠商,都在探索與部署AI定制芯片以降低推理成本。英偉達(dá)計(jì)劃自研HBM基礎(chǔ)裸片(Base Die),OpenAI則找上了SK海力士與三星合作;閃迪甚至預(yù)見了數(shù)年后HBF的顛覆性。

中國(guó)開源社區(qū)的貢獻(xiàn),主要在于算法和架構(gòu)的改進(jìn),對(duì)MOE推理與注意力機(jī)制的探索層出不窮。阿里巴巴的架構(gòu),總參數(shù)80B,卻只需激活3B,即可媲美旗艦版Qwen3-235B性能,效率大幅提升。DeepSeek最新發(fā)布的引入了DSA機(jī)制,能在成本更低的同時(shí)幾乎不影響模型的輸出效果。這些都體現(xiàn)為每百萬token的輸入和輸出成本在持續(xù)下降。

微軟近期一篇為自己的碳足跡“洗白”的論文中,駁斥過往的紙面研究,往往忽略了實(shí)際部署環(huán)境中的規(guī)模效應(yīng)與軟硬件優(yōu)化措施。論文提到,就每次AI查詢而言,實(shí)際能耗要比預(yù)估低8-20倍。其中,硬件改進(jìn)帶來1.5至2倍降幅,模型改進(jìn)帶來3至4倍降幅,工作負(fù)載優(yōu)化帶來2至3倍降幅。

這里的工作負(fù)載優(yōu)化,既包括KV緩存管理與批大小管理等提升單位token生成效率的手段,也包括用戶手動(dòng)設(shè)置token預(yù)算上限,或自動(dòng)觸發(fā)智能路由調(diào)用合適模型等降低token消耗數(shù)量的技術(shù)。OpenAI堅(jiān)持讓實(shí)時(shí)路由系統(tǒng),根據(jù)對(duì)話類型、復(fù)雜度、所需工具和明確意圖快速?zèng)Q定調(diào)用哪個(gè)模型。字節(jié)跳動(dòng)的Knapsack RL也是類似的預(yù)算分配策略探索。這些都是出于性價(jià)比的考慮。

很長(zhǎng)一段時(shí)間以來,在討論token經(jīng)濟(jì)學(xué)時(shí),完成任務(wù)的token消耗數(shù)量,往往被人們所忽視。這一指標(biāo)缺乏前述各類測(cè)評(píng)token價(jià)值的基準(zhǔn),也不在大模型API定價(jià)中直接標(biāo)識(shí)出來。

但它無疑越來越重要,它決定著AI的經(jīng)濟(jì)性。實(shí)際工作不同于刷榜(有的刷榜也有算力成本上限),往往存在明顯的成本約束。前述微軟論文也擔(dān)心,隨著多模型與智能體的廣泛落地,更多的推理次數(shù)和更長(zhǎng)的推理時(shí)間將帶來更高的能耗。不僅如此,要輸出更多token,通常也意味著更長(zhǎng)的響應(yīng)時(shí)間,用戶體驗(yàn)下降;對(duì)于部分必須高速精準(zhǔn)響應(yīng)的場(chǎng)景,這甚至是生死問題;單次任務(wù)越來越多的token消耗,也可能耗盡模型的上下文窗口,限制它處理復(fù)雜長(zhǎng)任務(wù)的能力。

受限于各自的技術(shù)儲(chǔ)備、供應(yīng)鏈體系與電力供給條件,中國(guó)與美國(guó)在token經(jīng)濟(jì)學(xué)上已經(jīng)各自分岔。中國(guó)開源模型的首要目標(biāo)是在國(guó)產(chǎn)替代的現(xiàn)實(shí)中逼近前沿水平,用較多的token換取較高的價(jià)值;美國(guó)閉源模型則要開始想法設(shè)法去降低token的消耗,并提升token的價(jià)值。

從DeepSeek的R1到R1-0528,或者,從Qwen3-235B-A22B-thinking到Qwen-235B-A22B-thinking-2507,中國(guó)領(lǐng)先的開源模型的迭代,往往伴隨著總token消耗的上升。而Anthropic、OpenAI與xAI的模型迭代,則伴隨著總token消耗的降低。


到目前為止,NousResearch團(tuán)隊(duì)的研究認(rèn)為,綜合token消耗數(shù)量與單位token成本(基于海外第三方的API價(jià)格,因工作負(fù)載不同,定價(jià)區(qū)間差別較大),DeepSeek等開源模型仍具備整體成本優(yōu)勢(shì),但在最高API定價(jià)時(shí)(即以更大的上下文或更高的吞吐速度交付結(jié)果等),它的整體成本優(yōu)勢(shì)已經(jīng)不再顯著,尤其是在回答簡(jiǎn)單問題時(shí)。


結(jié)合中國(guó)的AI算力生態(tài),token消耗過多的短板會(huì)進(jìn)一步放大。有一項(xiàng)研究,專門就基礎(chǔ)設(shè)施的框架,量化了前沿模型的硬件配置與環(huán)境乘數(shù),對(duì)能耗、水與碳足跡的影響。在其設(shè)定場(chǎng)景下,DeepSeek-R1成為了碳排放量最高的前沿模型,且遠(yuǎn)高于其他模型。除了與o3類似,它大量依賴CoT深度思考,還因?yàn)樵撗芯繛樗胺峙洹绷薍800等更低能效的芯片,以及更高PUE的數(shù)據(jù)中心。

當(dāng)下對(duì)性能的追求壓倒了一切。最終,起作用的將是AI的經(jīng)濟(jì)性,用盡可能少的token解決盡可能有價(jià)值的問題。

參考:

https://doi.org/10.48550/arXiv.2505.09598

https://doi.org/10.48550/arXiv.2509.20241

https://arxiv.org/html/2509.25721v2

https://github.com/cpldcpu/LRMTokenEconomy/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
U23國(guó)足20分鐘丟2球!小倉(cāng)幸成遠(yuǎn)射世界波,王鈺棟低級(jí)失誤

U23國(guó)足20分鐘丟2球!小倉(cāng)幸成遠(yuǎn)射世界波,王鈺棟低級(jí)失誤

奧拜爾
2026-01-24 23:27:54
民進(jìn)黨準(zhǔn)備下死手,黃國(guó)昌攜美密令向大陸遞投名狀,統(tǒng)一已成定局

民進(jìn)黨準(zhǔn)備下死手,黃國(guó)昌攜美密令向大陸遞投名狀,統(tǒng)一已成定局

小俎娛樂
2026-01-25 14:34:15
布呂尼:從妻子變兒媳,同時(shí)和父子談戀愛,最終成為法國(guó)第一夫人

布呂尼:從妻子變兒媳,同時(shí)和父子談戀愛,最終成為法國(guó)第一夫人

青途歷史
2026-01-23 20:12:55
明確規(guī)定來了!機(jī)關(guān)事業(yè)單位職工下班后打牌打麻將,算違紀(jì)嗎?

明確規(guī)定來了!機(jī)關(guān)事業(yè)單位職工下班后打牌打麻將,算違紀(jì)嗎?

阿纂看事
2026-01-24 09:56:48
78年王近山病逝,鄧小平看過訃告上的軍級(jí)之后,坦言:確實(shí)不合適

78年王近山病逝,鄧小平看過訃告上的軍級(jí)之后,坦言:確實(shí)不合適

元哥說歷史
2026-01-25 14:45:03
打臉黑子,湖人逆轉(zhuǎn)獨(dú)行俠,賽后還有5個(gè)好消息,東契奇喜笑顏開

打臉黑子,湖人逆轉(zhuǎn)獨(dú)行俠,賽后還有5個(gè)好消息,東契奇喜笑顏開

鄒維體育
2026-01-25 12:17:55
此人叛變新四軍,1949年李先念主動(dòng)宴請(qǐng)他,他舉報(bào):有人要叛變

此人叛變新四軍,1949年李先念主動(dòng)宴請(qǐng)他,他舉報(bào):有人要叛變

大運(yùn)河時(shí)空
2026-01-25 17:05:03
越共中央政治局,“新面孔”接近一半

越共中央政治局,“新面孔”接近一半

中國(guó)新聞周刊
2026-01-24 19:46:04
2026年養(yǎng)老金繼續(xù)漲?人社部部長(zhǎng)表態(tài)了!取消掛鉤調(diào)整可行嗎?

2026年養(yǎng)老金繼續(xù)漲?人社部部長(zhǎng)表態(tài)了!取消掛鉤調(diào)整可行嗎?

李健政觀察
2026-01-25 13:08:19
49年,裝滿50箱大洋的飛機(jī)墜毀,當(dāng)?shù)厝四寐榇鼡?,卻付出慘痛代價(jià)

49年,裝滿50箱大洋的飛機(jī)墜毀,當(dāng)?shù)厝四寐榇鼡專瑓s付出慘痛代價(jià)

雍親王府
2026-01-25 08:20:03
白宮發(fā)布“特朗普和企鵝漫步格陵蘭島”圖,遭群嘲

白宮發(fā)布“特朗普和企鵝漫步格陵蘭島”圖,遭群嘲

新華社
2026-01-25 16:55:04
井柏然曬北京千萬豪宅!水泥地?fù)Q成木板土氣,陽臺(tái)和劉雯合照搶鏡

井柏然曬北京千萬豪宅!水泥地?fù)Q成木板土氣,陽臺(tái)和劉雯合照搶鏡

曉徙娛樂
2026-01-25 04:21:24
肯德基,被迫改名PFK

肯德基,被迫改名PFK

設(shè)計(jì)癖
2026-01-24 12:13:41
丈夫項(xiàng)英犧牲后,李又蘭改嫁張愛萍,生下三個(gè)兒子都是牛人

丈夫項(xiàng)英犧牲后,李又蘭改嫁張愛萍,生下三個(gè)兒子都是牛人

史韻流轉(zhuǎn)
2026-01-25 06:25:03
“臘八3不吃,福氣進(jìn)家門”,指哪3不吃?臘八節(jié)來臨,莫忘老傳統(tǒng)

“臘八3不吃,福氣進(jìn)家門”,指哪3不吃?臘八節(jié)來臨,莫忘老傳統(tǒng)

神牛
2026-01-24 15:00:25
陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

阿器談史
2025-12-26 15:26:05
快報(bào)調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

快報(bào)調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

現(xiàn)代快報(bào)
2026-01-24 18:53:06
14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個(gè)好老婆有多重要

14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個(gè)好老婆有多重要

豐譚筆錄
2026-01-13 07:20:11
“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

巧手曉廚娘
2025-12-30 18:59:18
從草根到頂流,趙麗穎能“輸?shù)闷稹钡牡着疲旱艿懿攀钦嬲氖刈o(hù)者

從草根到頂流,趙麗穎能“輸?shù)闷稹钡牡着疲旱艿懿攀钦嬲氖刈o(hù)者

夢(mèng)在深巷qw
2026-01-25 10:22:47
2026-01-25 17:27:00
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
292文章數(shù) 61關(guān)注度
往期回顧 全部

科技要聞

黃仁勛在上海逛菜市場(chǎng),可能惦記著三件事

頭條要聞

獲黃仁勛簽名紅包商戶:我開始不認(rèn)識(shí)他 紅包里有600元

頭條要聞

獲黃仁勛簽名紅包商戶:我開始不認(rèn)識(shí)他 紅包里有600元

體育要聞

中國(guó)足球不會(huì)一夜變強(qiáng),但他們已經(jīng)創(chuàng)造歷史

娛樂要聞

王玉雯方嚴(yán)正聲明 劇方回應(yīng):涉事人員已被開除

財(cái)經(jīng)要聞

隋廣義等80人被公訴 千億騙局進(jìn)入末路

汽車要聞

別克至境E7內(nèi)飾圖曝光 新車將于一季度正式發(fā)布

態(tài)度原創(chuàng)

房產(chǎn)
教育
家居
時(shí)尚
手機(jī)

房產(chǎn)要聞

正式官宣!三亞又一所名校要來了!

教育要聞

北京中考數(shù)學(xué),0的倒數(shù)是多少?

家居要聞

在家度假 160平南洋混搭宅

2025年度榜單|| 真金白銀票選出來的“真愛”,今天破價(jià)1.6折!

手機(jī)要聞

榮耀泡泡瑪特聯(lián)名手機(jī)今日開售:首銷即引爆,線下再現(xiàn)排隊(duì)熱潮

無障礙瀏覽 進(jìn)入關(guān)懷版