国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

定價(jià)權(quán)VS消耗戰(zhàn):大模型下半場(chǎng)的續(xù)命法則

0
分享至



作者丨鳳梨編輯丨九黎

當(dāng)下的AI圈,正陷入一場(chǎng)深刻的算力焦慮。

面對(duì)中美AI競(jìng)賽和龍蝦帶來(lái)的指數(shù)級(jí)膨脹大模型推理需求,算力荒成了懸在所有玩家頭頂?shù)倪_(dá)摩克利斯之劍。然而,面對(duì)同一道難題,行業(yè)卻在走向兩個(gè)截然不同的解題方向。

一邊是以智譜、Kimi以及海外芯片新貴Taalas為首的“降價(jià)派”,他們揮舞著資本與硬件創(chuàng)新的大旗,試圖將Token的價(jià)格徹底擊穿,用極致的廉價(jià)換取生態(tài)規(guī)模;另一邊,則是以小米等端側(cè)巨頭為代表的“降耗派”,他們拋出反共識(shí)的論調(diào):出路不是更便宜的Token,而是更省Token的底層框架。

這不僅僅是技術(shù)路徑的切磋,更是一場(chǎng)關(guān)乎AI時(shí)代話語(yǔ)權(quán)、商業(yè)模式乃至算力流向的路線之爭(zhēng)。

01

降價(jià)派的暴力美學(xué)

在大模型的牌桌上,降價(jià)派無(wú)疑是目前聲量最大、動(dòng)作最猛的陣營(yíng),他們的核心訴求非常純粹:既然算力昂貴阻礙了AI的普及,那就通過(guò)商業(yè)補(bǔ)貼或底層硬件的顛覆式重構(gòu),強(qiáng)行把Token的價(jià)格打下來(lái),讓AI像自來(lái)水一樣廉價(jià)且隨處可得。這一陣營(yíng)中,既有試圖用互聯(lián)網(wǎng)經(jīng)典打法做大蛋糕的AI新貴,也有從芯片物理層發(fā)起革命的硬核極客。

首先是軟件與API層的商業(yè)降維打擊。以智譜、Kimi、MiniMax等為代表的AI六小龍,在過(guò)去幾個(gè)月內(nèi)掀起了一場(chǎng)慘烈的價(jià)格戰(zhàn),部分基礎(chǔ)模型的API調(diào)用價(jià)格甚至無(wú)限趨近于免費(fèi)。

這種打法,互聯(lián)網(wǎng)人再熟悉不過(guò),典型的以虧損換規(guī)模。他們深知,大模型時(shí)代的護(hù)城河在于應(yīng)用生態(tài)與數(shù)據(jù)飛輪。只有前端的Token足夠便宜,B端開(kāi)發(fā)者才敢放手去構(gòu)建原生應(yīng)用,C端用戶才愿意毫無(wú)心理負(fù)擔(dān)地將其作為高頻工具。

這群AI新貴們正在用未來(lái)的預(yù)期市場(chǎng)份額,來(lái)攤薄眼下的算力成本。他們賭的是規(guī)模效應(yīng):當(dāng)調(diào)用量呈幾何級(jí)數(shù)爆炸時(shí),數(shù)據(jù)中心的邊際成本會(huì)隨之驟降;同時(shí),海量的高質(zhì)量交互數(shù)據(jù)反哺模型,形成贏家通吃的壟斷壁壘。在這個(gè)邏輯下,降價(jià)不是無(wú)奈之舉,而是搶占AI時(shí)代操作系統(tǒng)入口的核武器。

其次是硅片層的物理級(jí)降價(jià)革命。降價(jià)派不僅有軟件層面的商業(yè)補(bǔ)貼,更涌現(xiàn)出了如Taalas這樣的硬件破局者。這家由Tenstorrent前CEO LjubisaBajic創(chuàng)立的AI芯片新星,其野心比單純的API降價(jià)狂妄得多。Taalas的路線是:既然通用GPU運(yùn)行大模型存在極大的資源冗余和能耗浪費(fèi),那不如直接將特定的大模型,比如千億參數(shù)模型直接硬編碼進(jìn)硅片中,打造專用AI芯片(ASIC)。

Taalas試圖通過(guò)直接在芯片上實(shí)現(xiàn)模型的計(jì)算邏輯,從而繞過(guò)傳統(tǒng)的內(nèi)存讀取瓶頸,實(shí)現(xiàn)相比傳統(tǒng)GPU成百上千倍的效率提升和成本下降。如果說(shuō)國(guó)內(nèi)的AI六小龍是通過(guò)商業(yè)模式在前端把Token價(jià)格打下來(lái),那么Taalas就是試圖通過(guò)硬件重構(gòu)在后端把Token的生產(chǎn)成本徹底打穿。

無(wú)論是補(bǔ)貼戰(zhàn)還是造芯戰(zhàn),降價(jià)派的終極信仰都是摩爾定律的延續(xù),他們堅(jiān)信算力的絕對(duì)價(jià)格終將不可逆轉(zhuǎn)地走向低廉,而誰(shuí)能在這個(gè)過(guò)程中率先提供最便宜的算力,誰(shuí)就能成為AI時(shí)代的AWS或基礎(chǔ)設(shè)施霸主。

02

降耗派的效率革命

就在降價(jià)派在云端算力場(chǎng)廝殺得難解難分之時(shí),以小米為代表的降耗派卻在另一條路上逆向而行。小米MiMo團(tuán)隊(duì)負(fù)責(zé)人羅福莉的一番話,精準(zhǔn)概括了這一陣營(yíng)的技術(shù)哲學(xué):當(dāng)下AI的算力荒,出路不是更便宜的Token,而是更省Token的框架和更高效的模型共同進(jìn)化。

如果說(shuō)降價(jià)派是在尋找更便宜的水源,那么降耗派則是在研發(fā)更抗旱的作物。

這一路線的崛起,本質(zhì)上是由硬件廠商的基因和端側(cè)落地的剛需所決定的,對(duì)于小米這樣的科技制造巨頭而言,未來(lái)的主戰(zhàn)場(chǎng)不在遠(yuǎn)在天邊的數(shù)據(jù)中心,而在于手機(jī)、汽車、AIoT等數(shù)以億計(jì)的端側(cè)設(shè)備。在云端,你可以通過(guò)無(wú)限堆疊GPU來(lái)大力出奇跡;但在端側(cè),手機(jī)的電池容量是有物理極限的,內(nèi)存帶寬是極其金貴的,芯片的散熱空間是寸土寸金的。

在這些苛刻的物理約束下,端側(cè)設(shè)備根本無(wú)法承受海量無(wú)節(jié)制的Token消耗,即便云端的Token降到零元,只要依然依賴云端運(yùn)算,就會(huì)面臨網(wǎng)絡(luò)延遲、隱私泄露以及設(shè)備本身聯(lián)網(wǎng)功耗的問(wèn)題。因此,降耗派必須從根源上解決問(wèn)題:讓模型在產(chǎn)生同等甚至更高質(zhì)量回答的同時(shí),極大減少對(duì)計(jì)算資源的消耗。

具體到技術(shù)落地,這是一場(chǎng)極其硬核的架構(gòu)瘦身戰(zhàn)。降耗派的做法不是簡(jiǎn)單的模型壓縮或蒸餾,而是對(duì)AI運(yùn)轉(zhuǎn)框架的底層重構(gòu)。例如,通過(guò)改進(jìn)注意力機(jī)制,引入如Mamba等線性復(fù)雜度的狀態(tài)空間模型,或者優(yōu)化鍵值緩存的管理策略,使得模型在處理長(zhǎng)文本時(shí)不再呈指數(shù)級(jí)消耗內(nèi)存。更高效的Tokenizer設(shè)計(jì),也能讓模型用更少的Token表達(dá)更多的信息密度。

對(duì)于小米等硬件大廠而言,把Token的消耗打下來(lái),直接關(guān)系到其核心商業(yè)模式的成敗。一部搭載端側(cè)大模型的AI手機(jī),如果模型運(yùn)行極其耗電,或者占用過(guò)多運(yùn)存導(dǎo)致系統(tǒng)卡頓,那將是災(zāi)難性的用戶體驗(yàn)。因此,降耗派的終極目標(biāo),是將大模型變成一種低功耗、高效率的基礎(chǔ)組件,無(wú)縫熔鑄進(jìn)操作系統(tǒng)的底層。他們不在乎云端調(diào)用一次收多少錢,他們?cè)诤醯氖?,如何讓每一次AI推理的電量消耗降到最低,讓哪怕是中低端硬件也能流暢運(yùn)行強(qiáng)大的智能。這是一種典型的產(chǎn)品經(jīng)理嫁接硬件工程師思維,用極致的工程優(yōu)化去對(duì)抗算力黑洞。

03

殊途同歸的商業(yè)局

當(dāng)降價(jià)派和降耗派在各自的賽道上狂奔時(shí),我們必須看清:這并不是一場(chǎng)非此即彼的零和博弈,而是AI產(chǎn)業(yè)鏈走向成熟過(guò)程中的必然分工與商業(yè)錯(cuò)位。這兩條路線的交鋒,本質(zhì)上是兩種截然不同的商業(yè)模式在AI時(shí)代的碰撞。

降價(jià)派代表的是水電煤邏輯,無(wú)論是不斷探底API價(jià)格的AI六小龍,還是試圖通過(guò)顛覆性芯片重塑算力成本的Taalas,他們都在致力于將AI算力變成社會(huì)的基礎(chǔ)設(shè)施。在他們的藍(lán)圖中,算力應(yīng)該像電力一樣,用戶無(wú)需關(guān)心發(fā)電機(jī)是如何工作的,只需要插上插座、按需付費(fèi)。這種邏輯的護(hù)城河在于網(wǎng)絡(luò)效應(yīng)和極高轉(zhuǎn)換成本。一旦海量的企業(yè)級(jí)應(yīng)用和消費(fèi)級(jí)App建立在他們廉價(jià)且高效的API之上,龐大的生態(tài)慣性將使得后來(lái)者極難顛覆。但其面臨的風(fēng)險(xiǎn)也同樣巨大:在真正形成寡頭壟斷之前,長(zhǎng)期的失血和價(jià)格戰(zhàn)可能拖垮任何一家資金鏈稍顯脆弱的明星公司。

降耗派代表的則是消費(fèi)電子與體驗(yàn)邏輯,以小米為首的端側(cè)巨頭,他們不需要通過(guò)賣API來(lái)賺錢。他們賺錢的方式,是賣出更多搭載了極佳AI體驗(yàn)的手機(jī)、汽車和智能家居。在他們的商業(yè)閉環(huán)里,優(yōu)秀的、低消耗的AI模型,是硬件產(chǎn)品的高級(jí)附屬價(jià)值。降耗派的護(hù)城河在于軟硬一體的閉環(huán)體驗(yàn)和離用戶更近的場(chǎng)景占有。當(dāng)算力被高效壓縮在設(shè)備本地時(shí),他們掌握了用戶最隱私的數(shù)據(jù)、最直接的交互入口,這種壁壘是云端大模型無(wú)法輕易穿透的。

推演終局,這兩條路線大概率將走向云端協(xié)同的融合,未來(lái)的AI應(yīng)用場(chǎng)景中,需要重度計(jì)算、海量知識(shí)檢索的通用復(fù)雜任務(wù),將交由降價(jià)派構(gòu)建的廉價(jià)云端超算中心來(lái)完成,大吃大嚼著廉價(jià)的Token;而涉及個(gè)人隱私、需要極低延遲響應(yīng)、結(jié)合環(huán)境感知的個(gè)性化任務(wù),則將由降耗派優(yōu)化到極致的端側(cè)低功耗模型來(lái)處理。

然而,在融合到來(lái)之前的這段窗口期,路線之爭(zhēng)依然會(huì)非常激烈,因?yàn)橘Y源的分配是有限的,資本的目光是挑剔的。是押注那些能夠通過(guò)瘋狂降價(jià)燒出個(gè)未來(lái)的超級(jí)平臺(tái),還是看好那些穩(wěn)扎穩(wěn)打、通過(guò)技術(shù)降耗提升硬件毛利的生態(tài)巨頭?這不僅是投資人的考題,更是所有AI從業(yè)者必須面對(duì)的戰(zhàn)略抉擇。

歷史總是驚人地相似。如今大模型領(lǐng)域的這條分水嶺,像極了當(dāng)年P(guān)C時(shí)代的云端服務(wù)器與本地芯片效率之戰(zhàn),又仿佛智能手機(jī)初期的流量補(bǔ)貼與硬件體驗(yàn)之爭(zhēng)。

有人以虧損換取明天,用降價(jià)的利刃劈開(kāi)市場(chǎng);有人以技術(shù)打磨基石,用降耗的內(nèi)功構(gòu)筑壁壘。“把Token價(jià)格打下來(lái)”和“把Token消耗打下來(lái)”,終極目標(biāo)都是為了讓AI真正走向普羅大眾。

但商業(yè)世界是殘酷的。當(dāng)資本退潮,當(dāng)大模型的算力紅利被吃透,你認(rèn)為誰(shuí)的路線能構(gòu)筑起更深、更堅(jiān)固的護(hù)城河?是做大蛋糕的降價(jià)派,還是做精架構(gòu)的降耗派?

參考資料:

羅福莉X,11:13 Apr5 2026

鈦媒體APP,《“邪修”AI芯片的Taalas,成色如何?》

21世紀(jì)經(jīng)濟(jì)報(bào)道,《2025年,“大模型價(jià)格戰(zhàn)”不怕虧錢了?》

每日經(jīng)濟(jì)新聞,《豆包引流抖音,Kimi連通京淘:大模型“帶貨”烽煙起引爆智能入口爭(zhēng)奪戰(zhàn)》

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
港媒:中國(guó)正從伊朗的廢墟中汲取關(guān)于“持久戰(zhàn)”的冷酷經(jīng)驗(yàn)

港媒:中國(guó)正從伊朗的廢墟中汲取關(guān)于“持久戰(zhàn)”的冷酷經(jīng)驗(yàn)

矚望云霄
2026-04-24 23:33:38
中國(guó)大學(xué)生需回爐重新學(xué)習(xí),人社部財(cái)政部已發(fā)通知,是不是學(xué)歷倒退或降級(jí)?

中國(guó)大學(xué)生需回爐重新學(xué)習(xí),人社部財(cái)政部已發(fā)通知,是不是學(xué)歷倒退或降級(jí)?

深度報(bào)
2026-04-23 22:43:47
北京車展名場(chǎng)面:雷軍打卡蔚來(lái)展臺(tái) 李斌聞?dòng)嵰宦沸∨苴s來(lái)

北京車展名場(chǎng)面:雷軍打卡蔚來(lái)展臺(tái) 李斌聞?dòng)嵰宦沸∨苴s來(lái)

快科技
2026-04-24 20:54:03
臺(tái)球皇帝亨得利:丁俊暉碰上趙心童就打雞血,但他防守壓力太大了

臺(tái)球皇帝亨得利:丁俊暉碰上趙心童就打雞血,但他防守壓力太大了

楊華評(píng)論
2026-04-25 01:56:27
如果馬寅初沒(méi)提出人口論,也沒(méi)有計(jì)劃生育,如今我國(guó)會(huì)怎么樣?

如果馬寅初沒(méi)提出人口論,也沒(méi)有計(jì)劃生育,如今我國(guó)會(huì)怎么樣?

舊史新譚
2026-04-24 15:49:04
四個(gè)“西字輩”省份排名大洗牌

四個(gè)“西字輩”省份排名大洗牌

城市財(cái)經(jīng)
2026-04-25 11:35:03
19歲女孩失控的人生:14個(gè)月在直播間豪擲1700萬(wàn)公款

19歲女孩失控的人生:14個(gè)月在直播間豪擲1700萬(wàn)公款

瀟湘晨報(bào)
2026-04-24 22:36:30
楊鈺瑩首談毛寧:當(dāng)年被賴文峰6輛奔馳追走,錯(cuò)過(guò)他后悔了28年

楊鈺瑩首談毛寧:當(dāng)年被賴文峰6輛奔馳追走,錯(cuò)過(guò)他后悔了28年

子芫伴你成長(zhǎng)
2026-04-24 22:49:47
黃一鳴回應(yīng):沒(méi)結(jié)婚一天找8個(gè)男的也沒(méi)關(guān)系 承認(rèn)跟40歲大叔交往過(guò)

黃一鳴回應(yīng):沒(méi)結(jié)婚一天找8個(gè)男的也沒(méi)關(guān)系 承認(rèn)跟40歲大叔交往過(guò)

奇思妙想草葉君
2026-04-24 22:03:45
年度9系旗艦,就該是這個(gè)樣

年度9系旗艦,就該是這個(gè)樣

汽車公社
2026-04-25 08:35:54
華晨宇撫仙湖項(xiàng)目叫停!中國(guó)頂級(jí)淡水命脈,絕不給流量資本讓路

華晨宇撫仙湖項(xiàng)目叫停!中國(guó)頂級(jí)淡水命脈,絕不給流量資本讓路

離離言幾許
2026-04-24 07:25:41
兩屆奧運(yùn)冠軍、中國(guó)羽毛球協(xié)會(huì)主席張軍“失聯(lián)”,知情人士:被紀(jì)監(jiān)部門調(diào)查,與外界失去聯(lián)系已有十余日

兩屆奧運(yùn)冠軍、中國(guó)羽毛球協(xié)會(huì)主席張軍“失聯(lián)”,知情人士:被紀(jì)監(jiān)部門調(diào)查,與外界失去聯(lián)系已有十余日

臺(tái)州交通廣播
2026-04-24 23:52:42
中央紀(jì)委國(guó)家監(jiān)委公開(kāi)通報(bào)八起違反中央八項(xiàng)規(guī)定精神典型問(wèn)題

中央紀(jì)委國(guó)家監(jiān)委公開(kāi)通報(bào)八起違反中央八項(xiàng)規(guī)定精神典型問(wèn)題

新華社
2026-04-24 17:05:33
507萬(wàn)人民幣梭哈英特爾!曾被全網(wǎng)群嘲敗家子 如今身家暴漲至1370萬(wàn)元

507萬(wàn)人民幣梭哈英特爾!曾被全網(wǎng)群嘲敗家子 如今身家暴漲至1370萬(wàn)元

快科技
2026-04-25 11:56:06
女性動(dòng)情(性興奮狀態(tài))全身及私密部位和下體會(huì)有什么表現(xiàn)?

女性動(dòng)情(性興奮狀態(tài))全身及私密部位和下體會(huì)有什么表現(xiàn)?

荷蘭豆愛(ài)健康
2026-04-25 12:20:41
丁俊暉:趙心童打球太像奧沙利文了,他未來(lái)將接管斯諾克這項(xiàng)運(yùn)動(dòng)

丁俊暉:趙心童打球太像奧沙利文了,他未來(lái)將接管斯諾克這項(xiàng)運(yùn)動(dòng)

楊華評(píng)論
2026-04-25 07:03:01
100個(gè)能救命的冷知識(shí)!關(guān)鍵時(shí)刻能保命,建議收藏

100個(gè)能救命的冷知識(shí)!關(guān)鍵時(shí)刻能保命,建議收藏

詩(shī)詞天地
2026-04-22 14:06:22
湖人3比0火箭:父子籃球玩耍烏度卡?

湖人3比0火箭:父子籃球玩耍烏度卡?

張佳瑋寫(xiě)字的地方
2026-04-25 11:56:09
鹽城城投 “超級(jí)內(nèi)循環(huán)”:肥水不流外人田,民企還能分幾杯羹?

鹽城城投 “超級(jí)內(nèi)循環(huán)”:肥水不流外人田,民企還能分幾杯羹?

MC洋洋拍客
2026-04-24 16:52:05
5.8億!上海最大爛尾商場(chǎng)賣了!要變亞洲最大奧萊?

5.8億!上海最大爛尾商場(chǎng)賣了!要變亞洲最大奧萊?

阿離家居
2026-04-25 10:55:38
2026-04-25 14:43:00
科技新知 incentive-icons
科技新知
洞察技術(shù)變化背后的產(chǎn)業(yè)變遷。
2729文章數(shù) 13123關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

頭條要聞

"蚊子大軍"來(lái)襲北極圈也被攻破 各地疾控發(fā)出重要預(yù)警

頭條要聞

"蚊子大軍"來(lái)襲北極圈也被攻破 各地疾控發(fā)出重要預(yù)警

體育要聞

火箭0-3觸發(fā)百分百出局定律:本季加時(shí)賽9戰(zhàn)8敗

娛樂(lè)要聞

鄧超最大的幸運(yùn),就是遇見(jiàn)孫儷

財(cái)經(jīng)要聞

90%訂單消失,中東旺季沒(méi)了

汽車要聞

2026款樂(lè)道L90亮相北京車展 樂(lè)道L80正式官宣

態(tài)度原創(chuàng)

游戲
時(shí)尚
藝術(shù)
教育
本地

PS5實(shí)體版僅需180元!這款索尼3A級(jí)大作真心不能錯(cuò)過(guò)

火了30年的off-duty,不費(fèi)力,才是真本事

藝術(shù)要聞

荒廢十多年!福建石獅“最美爛尾樓”,德國(guó)品牌接盤了

教育要聞

第11課-Discomfort and difficulties 海外遇到困難怎么辦?

本地新聞

云游中國(guó)|逛世界風(fēng)箏都 留學(xué)生探秘中國(guó)傳統(tǒng)文化

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版