国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

人民想念DeepSeek

0
分享至

Token正在重塑AI時代的價值坐標(biāo),它是效率革命的引擎,還是成本失控的暗礁?本期將從Token降本的視角,透視AI時代"新石油"的經(jīng)濟邏輯。

———— / BEGIN / ————

最近關(guān)于Token的討論挺魔幻的。

朋友圈隨處能看到Token中文翻譯的討論——有"詞元"、"智元"等等,甚至有"慧根"之類的搞笑版本。

Token不是一個新概念,大模型落地第一天起,它便與神經(jīng)網(wǎng)絡(luò)共生,但直到OpenClaw(俗稱"龍蝦")在用戶群大規(guī)模擴散,各類Agent應(yīng)用開始把Token帶入了公眾視野。

我認(rèn)為其中有兩個關(guān)鍵問題:它的消耗量太大了,價格也太貴了。

記得OpenAI發(fā)布GPT-5.4的時候,有用戶反饋測試一句"你好"就消耗掉了80美元的Token,當(dāng)時不少人都說這個使用量太夸張,但隨著小龍蝦大規(guī)模在用戶群擴散,一個任務(wù)燒完千萬級Token成為常態(tài)。

與之相對的是,英偉達(dá)CEO黃仁勛在GTC2026大會上以及之后的很多場合,都在強調(diào)工程師要大量的使用Token,甚至將Token納入到薪酬激勵機制。

一次對話環(huán)節(jié),黃仁勛說:"如果年薪50萬美元的工程師,連25萬美元的Token都沒用掉,我會極度恐慌。"

問題是,瘋狂的燒Token一定能解決問題嗎,有多少Token是有效的,什么樣的投入產(chǎn)出比是合理的?

結(jié)合剛剛外媒的消息,有OpenAI程序員一周燒掉了2100億Token,相當(dāng)于33個維基百科,但這樣的消耗量最終帶來了什么?我發(fā)了一個朋友圈,說這樣重度使用能升P10嗎,有好友隨即評論,"能幫賣Token的升P10。"

很顯然,這場瘋狂燒Token的運動,能帶來多少效果是存疑的,誰是獲利者則是確定的。

黃仁勛將英偉達(dá)描述為"Token之王",擁有世界最先進(jìn)的"Token制造機",但如果拼命鼓吹這件事,甚至暗示不用Token就會落后,那么可以說:一方面,黃仁勛想徹底改變AI時代企業(yè)"效率考核"的邏輯,另一方面,他也間接制造出了Token焦慮。

Token太貴了

不久前,我請教了周鴻祎"Token太貴"這個問題,他說:"大家覺得Token貴可能存在些誤解,因為大模型后端是可以靈活配置的。"

在他的理解中,用戶可以自主選擇模型控制成本。"日常聊天對話的成本其實很低。真正消耗Token的是復(fù)雜任務(wù),比如幫你生成視頻、創(chuàng)作短劇或?qū)懶≌f這類調(diào)用場景。"

我記得獵豹移動CEO傅盛在一條視頻中說,自己通過一些使用技巧把最初日均幾百美元的Token費用,優(yōu)化到目前日均10多美元,30天就是2100元,年費是25200元。

問題來了:有多少用戶承擔(dān)得起日均10美元的成本?

對比目前中國互聯(lián)網(wǎng)上的商用to C類軟件,比如剪映,高端會員年費也只有600元左右,娛樂相關(guān)的會員費用大致在300元左右,根本找不到一款年費超過25000元的消費級軟件。

"絕大部分人一天10美金,仍然不會接受,這里會過濾掉大片的非付費用戶。"我對傅盛說,他沒有否認(rèn)我的判斷。

這些天,我也在嘗試各種類型的小龍蝦產(chǎn)品,要接觸到的費用遠(yuǎn)不止Token。

舉個例子,如果用戶對生圖有需求,就需要專門的生圖模型API;如果要監(jiān)控動態(tài),也需要接入付費的搜索API,這些潛在的費用會逐步的勸退絕大多數(shù)用戶。雖然可能有一些開源變通的方式降本,但開源項目就間接隱藏著安全風(fēng)險。

3月13日,當(dāng)時騰訊科技"蝦聊"系列直播的第一期(鵝廠工程師講透“龍蝦”真相:“笨”不是“蝦”的錯),玄武實驗室的嘉賓Lambda分享過一個數(shù)據(jù)——他自己平均每個月"養(yǎng)蝦"的費用在千元以上。

不管是參照消費級工具年費,還是行業(yè)"養(yǎng)蝦戶"的反饋,基于Agent的Token消耗說一句"Token太貴了",是站得住腳的。

存儲瓶頸與效率黑洞

Token簡單理解就是大語言模型處理信息的基本單位——用戶輸入提示詞,模型輸出答案,每一個字、每一個標(biāo)點,都會計入Token的消耗量,本質(zhì)上還是算力成本。

過去大家計算算力總擁有成本,指標(biāo)有很多,包括衡量能效的Flops/W,核算均值的成本/Flops等等,今年的"Token經(jīng)濟學(xué)"中,Token/W逐步成為共識。

"我們的每一個Token成本都是世界最低的。"黃仁勛在GTC上說。

但不管有多便宜,不管是哪一種計算單位,它都是投入成本量化,涉及到研發(fā)成本、硬件成本,部署成本,能耗成本,運營成本等。換句話說,降本也都是圍繞上述環(huán)節(jié)展開。

對于Token降本來說,一個不好的消息是內(nèi)存價格在瘋漲。

以HBM內(nèi)存為例,它是支撐大模型訓(xùn)練和推理的關(guān)鍵器件,同時,推理數(shù)據(jù)量的暴漲也引發(fā)出了存儲需求的同步上漲。2026年第一季度,DRAM的價格環(huán)比上漲超過50%,NAND價格環(huán)比最高漲幅達(dá)到150%。

黃仁勛、蘇姿豐都已經(jīng)喊出了"HBM有多少要多少",三星、美光這些存儲原廠,已經(jīng)對外披露頭部客戶的戰(zhàn)略長約已經(jīng)簽到了5年。

《內(nèi)存暴漲100天,千元機被迫死亡》一文提到過,消費級市場,千元機庫存可能都要停產(chǎn)了,但實際上受這個問題的影響,云廠商目前也處于漲價的煎熬之中。目前行業(yè)最樂觀的預(yù)計是2028年存儲價格回落,悲觀一點要到2030年。

存儲價格一天不回落,Token降價就缺少一個關(guān)鍵的外部杠桿。

模型能力的提升也可以視為降價的另一個杠桿。"現(xiàn)在一些8B的小模型,能力越來越逼近全量大模型。"一位學(xué)術(shù)界研究員說。

在這方面,面壁智能聯(lián)合清華團(tuán)隊在《Nature》子刊上提出了Densing Law的概念,強調(diào)大模型的能力密度隨時間指數(shù)增長,約每3.5個月翻一倍,同等性能所需參數(shù)量每3.5個月減半。

一位國產(chǎn)AI芯片從業(yè)者也強調(diào)模型能力好、規(guī)模小,進(jìn)而能推動成本降低。"你看國內(nèi)開源大模型token價格,基本都跟模型規(guī)模正相關(guān)。"

多位國產(chǎn)算力從業(yè)者表示,提升MFU也會帶來成本壓縮的空間,此外也還包括架構(gòu)、顯存等多方面的推理優(yōu)化。

"MFU跟模型本身關(guān)系不太大,主要是算子和調(diào)度策略有關(guān)。"另一位國產(chǎn)存算一體芯片從業(yè)者說,"目前主流大模型的推理MFU均值在30%左右,優(yōu)化后可超過50%,估計能省出50%的成本。"

也就是說,行業(yè)并沒有榨干GPU的性能——花了100%的GPU錢,現(xiàn)在只用了不到三分之一的算力。

不過,MFU提升雖然可以帶來單Token成本下降,但會不會傳導(dǎo)到C端,取決于大模型提供方的商業(yè)考量,如果用來打價格戰(zhàn),這毫無疑問是一個有效的杠桿。

再來一次價格戰(zhàn)

中國大模型的價格戰(zhàn),不是沒有先例。

2024年,國內(nèi)廠商就曾經(jīng)爆發(fā)過一輪激烈的價格戰(zhàn)。當(dāng)時恰逢DeepSeek-V2上線,每百萬Token輸入1元、輸出2元,彼時價格相當(dāng)于GPT-4-Turbo的百分之一。

DeepSeek當(dāng)時的降價關(guān)鍵就在于推理優(yōu)化——MoE稀疏架構(gòu)大幅降低了計算量,MLA多頭潛在注意力把KV緩存壓縮90%以上。

DeepSeek開啟這輪降價之后,隨即阿里、字節(jié)、等等先后下場展開價格戰(zhàn)博弈,一度出現(xiàn)了"Token免費"的現(xiàn)象。

王小川當(dāng)年在一次交流會上談價格戰(zhàn),他認(rèn)為與此前團(tuán)購、網(wǎng)約車大戰(zhàn)有本質(zhì)不同,"這次價格戰(zhàn)是直接生產(chǎn)力的供給,是B端市場的價格戰(zhàn)。"

在當(dāng)時,王小川也強調(diào)即使短期內(nèi)虧損,(大廠)也可能在一年后實現(xiàn)盈利。

"在推理效率提升的情況下,通過補貼,用戶有了非常明顯的增長,"一位參與過上一輪價格戰(zhàn)的大模型公司內(nèi)部人士說,"大概花了幾個億吧。"

不過,這一輪Token的消耗,B端和C端需求同時爆發(fā),反而和團(tuán)購、網(wǎng)約車大戰(zhàn)一樣,具備改變生產(chǎn)關(guān)系的條件,但市場卻表現(xiàn)出了出奇的沉默。

前述參與價格戰(zhàn)的大模型內(nèi)部人士認(rèn)為,在模型的特定能力成熟,有了穩(wěn)定用戶來源的情況下,大家未必有動力再下場去打價格戰(zhàn)。

"Token消耗不像2024年那種規(guī)模了,這個情況下,為了蝦打價格戰(zhàn),存量用戶的ARR收入也會被迫失血,"前述國產(chǎn)AI芯片從業(yè)者說,"沒必要,價格戰(zhàn)帶來的增量還不確定,先把存量自砍了,這賬不好算。"


Artificial Analysis跟蹤的大模型API價格

根據(jù)Artificial Analysis的跟蹤數(shù)據(jù),國產(chǎn)模型的API單價已經(jīng)足夠便宜了,只是這個便宜程度對于Agent的巨量消耗來說,還遠(yuǎn)遠(yuǎn)不夠。

如前面所說,受內(nèi)存和存儲的硬件成本沖擊,國內(nèi)云廠商現(xiàn)在面對的是漲價的難題,短期不太有降價的可能性。

"現(xiàn)在是前兩年價格戰(zhàn)的持續(xù),國內(nèi)廠商的價格比北美有明顯的優(yōu)勢。只是大家清楚搶用戶是個持久戰(zhàn),不是一兩次價格戰(zhàn)能搞定的。"前述國產(chǎn)存算一體芯片從業(yè)者補充道。

把模型"焊"在芯片上

為了解決Token瘋狂消耗帶來的成本問題,一部分用戶開始嘗試?yán)帽镜夭渴鹉P汀?/p>

到目前為止,已經(jīng)有不少用戶基于Mac Mini為"小龍蝦"配置本地模型,只不過這種解決方案,在短時間內(nèi)會不斷地推高Token使用成本,同時本地部署本身就存在門檻,且開源模型的能力未必能夠符合用戶的需求。

針對那些入門級用戶,也有廠商嘗試推出EdgeClaw硬件,并且在硬件生意之上,套上一層安全的故事,這其實是一個值得嘗試的方向,只是在內(nèi)存漲價大環(huán)境下,顯得有些生不逢時。

此前,一位Mini主機創(chuàng)業(yè)者說,漲價對行業(yè)都有沖擊。

"以前用戶是覺得'好貴',現(xiàn)在直接根本不看了,他們并不在乎你的內(nèi)存和硬盤有多大。"該創(chuàng)業(yè)者說。

與此同時,一些品牌也在電商平臺推出準(zhǔn)系統(tǒng)產(chǎn)品(無內(nèi)存、存儲),最低價格在2000元以內(nèi),它們雖然沒有"安全故事",卻是Edgeclaw這種創(chuàng)業(yè)型項目第一個要逾越的難關(guān)。

對"小龍蝦"端側(cè)AI硬件來說,最大的挑戰(zhàn)還是Mac Mini,蘋果的供應(yīng)鏈話語權(quán)和毛利率可以支撐Mac Mini超高性價比的定價,創(chuàng)業(yè)團(tuán)隊在這里很難講故事。

還記得2025年初期,DeepSeek爆火時的"一體機"嗎,你看今天行業(yè)里面還有它們的故事嗎?

除了一體機這種集成硬件方案,也有創(chuàng)業(yè)項目嘗試從更底層的芯片上去做創(chuàng)新。

2月份,Taalas團(tuán)隊推出了一款全新的芯片HC1,該芯片基于TSMC N6制程,die size 815mm2,晶體管密度僅53B,單芯片可運行Llama 3.1 8B模型,最核心的是單用戶TPS(Token/s)輸出16960/s,數(shù)據(jù)堪稱爆表,關(guān)鍵就在于HC1的設(shè)計。

Taalas團(tuán)隊在這款芯片上,用Mask ROM將Llama 3.1 8B模型權(quán)重硬編碼固化在硅片上,芯片金屬層連線相當(dāng)于神經(jīng)元連接,相當(dāng)于把模型"焊在"芯片上,同時實現(xiàn)計算與存儲物理融合,徹底消除HBM/DRAM數(shù)據(jù)搬運,打破了內(nèi)存墻限制。

雖然TPS性能突出,它的短板也同樣來自于模型"焊在"芯片上這個特點,這意味著只能跑固定版本的固定模型,權(quán)重不能改、結(jié)構(gòu)不能動,想換模型就要重新流片,你也可以理解為專芯專用。

一切的討論都基于Token使用成本——貴的不是單價,而是重度任務(wù)對Token使用量的倍數(shù)放大。


我曾經(jīng)嘗試過用小龍蝦來生成指定時間戳的gif,在和一位同行交流的過程中,他說:"你這里面的gif圖,我們同事做,半分鐘做一張,手工。"

盡管這個案例不是很典型,但如果做幾張gif就要花掉幾元錢,顯然不具備經(jīng)濟性。


接入DeepSeek API制作gif的消耗情況

要改變這一點,要么擁有更便宜的Token定價,要么Token消耗最小化,這依賴模型層面的優(yōu)化,也取決于推理硬件層面的創(chuàng)新。

但無論如何,在Token使用的總費用打不下來,且投入的有效產(chǎn)出不明確的情況下,瘋狂安利Token消耗,甚至強調(diào)與績效掛鉤,說是制造Token焦慮,制造AI焦慮也不為過。

再往前看,老黃還呼吁科技行業(yè)領(lǐng)袖審慎發(fā)聲,避免引發(fā)公眾對人工智能技術(shù)的非理性恐慌。這就好比跟全行業(yè)說:別打壓人工智能制造恐慌了,你們都要把Token燒起來。

可問題是,誰來解決價格問題呢,會是遲遲沒有到來的DeepSeek V4嗎?

我記得2017年的時候,有一篇刷屏文章叫《人民想念周鴻祎》,現(xiàn)在人民應(yīng)該很想念Token價格戰(zhàn),想念DeepSeek。

至少對于"蝦民"來說,大概率如此。

本文來自公眾號:騰訊科技 作者:蘇揚 編輯:徐青陽

想要第一時間了解行業(yè)動態(tài)、面試技巧、商業(yè)知識等等等?加入產(chǎn)品經(jīng)理進(jìn)化營,跟優(yōu)秀的產(chǎn)品人一起交流成長!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上海老板夫妻命喪自家店鋪,一張帶血手印的《每周廣播電視報》,讓警方破獲30年前命案

上海老板夫妻命喪自家店鋪,一張帶血手印的《每周廣播電視報》,讓警方破獲30年前命案

極目新聞
2026-04-15 17:45:11
從緬甸被救1年后,王星不再隱瞞,當(dāng)眾吐露心聲,2大困境太難解

從緬甸被救1年后,王星不再隱瞞,當(dāng)眾吐露心聲,2大困境太難解

小椰的奶奶
2026-04-15 14:09:10
我剛從臺灣回來:說實話很難聽,但這就是真實的臺灣省現(xiàn)狀了

我剛從臺灣回來:說實話很難聽,但這就是真實的臺灣省現(xiàn)狀了

番外行
2026-02-24 19:45:01
詹姆斯:終于不用打該死的附加賽了,我可以喝喝小酒坐那看比賽

詹姆斯:終于不用打該死的附加賽了,我可以喝喝小酒坐那看比賽

懂球帝
2026-04-15 04:47:12
李小璐母親:我這輩子最后悔的決定,就是心軟讓女兒嫁給了賈乃亮

李小璐母親:我這輩子最后悔的決定,就是心軟讓女兒嫁給了賈乃亮

她時尚丫
2026-03-22 21:32:14
不尋常!男子一連9次乘坐同一郵輪,一天逛十幾次免稅店,上海民警一查,果然不簡單

不尋常!男子一連9次乘坐同一郵輪,一天逛十幾次免稅店,上海民警一查,果然不簡單

新民晚報
2026-04-10 13:56:07
A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

夜深愛雜談
2026-04-15 22:11:41
“胖改”急需現(xiàn)金回血,永輝超市成功“追債”38億元,王健林等承擔(dān)連帶保證責(zé)任

“胖改”急需現(xiàn)金回血,永輝超市成功“追債”38億元,王健林等承擔(dān)連帶保證責(zé)任

藍(lán)鯨新聞
2026-04-15 17:43:16
演員文章開面館引關(guān)注,代排隊價格被炒到500元

演員文章開面館引關(guān)注,代排隊價格被炒到500元

界面新聞
2026-04-14 10:04:47
收手吧鐘漢良,假發(fā)邊明顯、疲態(tài)盡顯,誰要看50歲裝嫩談戀愛?

收手吧鐘漢良,假發(fā)邊明顯、疲態(tài)盡顯,誰要看50歲裝嫩談戀愛?

一娛三分地
2026-04-14 13:56:40
40歲以上中年人失業(yè)都干嘛去了?網(wǎng)友:跑順風(fēng)車,送外賣,當(dāng)保安

40歲以上中年人失業(yè)都干嘛去了?網(wǎng)友:跑順風(fēng)車,送外賣,當(dāng)保安

律法刑道
2026-04-12 09:35:52
廣東91歲老人讓兒子保管900多萬養(yǎng)老錢,兒媳去世前卻將300多萬分給自己姐姐,老人瞬間傻眼,法院:錢是保管不是贈與,全額返還

廣東91歲老人讓兒子保管900多萬養(yǎng)老錢,兒媳去世前卻將300多萬分給自己姐姐,老人瞬間傻眼,法院:錢是保管不是贈與,全額返還

觀威海
2026-03-18 22:11:07
陪玩陪睡還不夠?繼注射不明物體后,再傳"噩耗",多位明星被牽連

陪玩陪睡還不夠?繼注射不明物體后,再傳"噩耗",多位明星被牽連

八斗小先生
2026-04-13 17:43:37
細(xì)思極恐!人類連太陽系都飛不出去,憑什么畫出銀河系的形狀?

細(xì)思極恐!人類連太陽系都飛不出去,憑什么畫出銀河系的形狀?

觀察宇宙
2026-04-15 22:13:42
52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

流云隨風(fēng)去遠(yuǎn)方
2026-04-14 12:22:59
憤怒的李想和遭到圍攻的理想汽車

憤怒的李想和遭到圍攻的理想汽車

界面新聞
2026-04-13 10:01:09
接下來的廣州,地鐵、燃?xì)?、水費都要漲價?

接下來的廣州,地鐵、燃?xì)?、水費都要漲價?

南沙部落
2026-04-15 09:53:21
50歲女星千萬洋房曝光!嫁高管丁克12年活成贏家,打臉9年情前任

50歲女星千萬洋房曝光!嫁高管丁克12年活成贏家,打臉9年情前任

藝能八卦局
2026-04-09 23:18:38
全球最長直飛航線要來!空客首架A350-1000ULR飛機下線:可從悉尼直飛至倫敦

全球最長直飛航線要來!空客首架A350-1000ULR飛機下線:可從悉尼直飛至倫敦

快科技
2026-04-14 08:08:10
2年和領(lǐng)導(dǎo)開房410次!從臨時工“睡”成處長,南航女經(jīng)理升遷之路

2年和領(lǐng)導(dǎo)開房410次!從臨時工“睡”成處長,南航女經(jīng)理升遷之路

就一點
2026-03-28 17:42:50
2026-04-16 02:23:00
人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
人人都是產(chǎn)品經(jīng)理社區(qū)
想要成為大牛先從學(xué)做產(chǎn)品開始
64631文章數(shù) 311586關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

法國全票通過 “將不義之財歸還中國”

頭條要聞

法國全票通過 “將不義之財歸還中國”

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

數(shù)碼
旅游
家居
房產(chǎn)
公開課

數(shù)碼要聞

明基新款顯示器首發(fā)12499元:4K專業(yè)級色彩校準(zhǔn) 根據(jù)環(huán)境光自動調(diào)整

旅游要聞

拉豬車?yán)@關(guān)闖禁區(qū):隱秘危險游該踩剎車了

家居要聞

簡而不減 暖居之道

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學(xué)用地!寶龍城這把穩(wěn)了?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版