国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型價(jià)格戰(zhàn),還能再狠一點(diǎn)

0
分享至

誰也不曾想到,大模型產(chǎn)業(yè)的首次“集體會(huì)戰(zhàn)”,居然圍繞價(jià)格展開。

5月6日,私募巨頭幻方旗下的深度求索,打響了降價(jià)第一槍。深度求索發(fā)布的模型DeepSeek-V2(32k),在數(shù)學(xué)、編程、中英文等能力上已逼近GPT-4;然而,DeepSeek-V2的使用價(jià)格僅約為GPT-4o的1/35。

DeepSeek-V2的輸入與輸出價(jià)格分別為1元/百萬tokens和2元/百萬tokens,遠(yuǎn)低于市場(chǎng)價(jià)。

比拼多多砍一刀還便宜的價(jià)格,驚動(dòng)了不少美國專家。知名分析師Dylan Patel讀完DeepSeek-V2的論文后,激動(dòng)地表示,“這可能是今年最好的一篇。[1]”

DeepSeek-V2的論文

一周后,“卷王”字節(jié)跳動(dòng)又添一把火。

豆包通用模型Pro-32k的輸入價(jià)格,被一刀砍到了更低的0.8元/百萬tokens?;鹕揭婵偛米T待表示,“豆包比行業(yè)價(jià)格低了99.3%,大模型從此以厘計(jì)價(jià)?!?/p>

眼看友商如此不講武德,其他科技公司再也坐不住了。

阿里率先回?fù)?,一狠心,大舉下調(diào)了所有模型的價(jià)格。

幾個(gè)小時(shí)后,百度干脆沖向競(jìng)價(jià)終點(diǎn):宣布兩款輕量級(jí)模型全面免費(fèi)。緊接著,科大訊飛星火Lite API、騰訊混元大模型lite 256k也相繼宣布免費(fèi)。

如此盛況,很難不讓人夢(mèng)回那段滴滴大戰(zhàn)快的、ofo摩拜互扯頭發(fā)的激情歲月。

然而,圍繞大模型的價(jià)格戰(zhàn),遠(yuǎn)不如網(wǎng)約車、共享單車那般直觀,各種專業(yè)名詞讓人摸不著頭腦。所以,這些大模型公司,到底在熱鬧些什么?


價(jià)格戰(zhàn)的B面

想要理解這點(diǎn),首先得知曉大模型的商業(yè)模式。以阿里云為例,它所提供的大模型服務(wù),共有3種[2]:

(1)基礎(chǔ)服務(wù):模型推理。

模型推理,指的是根據(jù)輸入的信息內(nèi)容,給出回答的過程。換句話說,推理就是“實(shí)際使用”模型的過程。

阿里云預(yù)置了多個(gè)性能不同的“標(biāo)準(zhǔn)版模型”,供用戶推理。該服務(wù)的計(jì)費(fèi)方式很簡(jiǎn)單,即“以量計(jì)價(jià)”:以消耗的token數(shù)量為單位,用得越多,費(fèi)用越高。并且性能越好的模型,收費(fèi)越貴。

token是大模型用來衡量文本長(zhǎng)度的一種計(jì)數(shù)單位,可以簡(jiǎn)單理解為“字?jǐn)?shù)”。3本篇幅為75萬字的《三國演義》,大約需要125萬個(gè)token。

(2)進(jìn)階服務(wù):模型微調(diào)。

如果覺得“標(biāo)準(zhǔn)版模型”不好用,阿里云還提供了“定制研發(fā)”服務(wù),即模型微調(diào)。具體收費(fèi),則取決于“定制研發(fā)”消耗的計(jì)算資源與開發(fā)周期。

(3)超進(jìn)階服務(wù):模型部署。

當(dāng)用戶需要長(zhǎng)期使用大模型時(shí),最好的方式是將它部署到獨(dú)占實(shí)例中。

獨(dú)占實(shí)例,指的是直接承包一個(gè)或多個(gè)物理服務(wù)器的全部資源。翻譯成人話就是,不再只是租一個(gè)商鋪,而是將整個(gè)商業(yè)廣場(chǎng)都租下來。

這么做的好處在于,沒有別的商戶和你搶計(jì)算資源,響應(yīng)速度更快。

其收費(fèi)模式,也是以量計(jì)價(jià),但有兩種形式:阿里是直接按照“商業(yè)廣場(chǎng)”消耗的計(jì)算資源計(jì)費(fèi);除此之外,百度還支持按照模型推理的token數(shù)量計(jì)費(fèi)。

這3種收費(fèi)模式,面向的是企業(yè)與個(gè)人開發(fā)者,代表了大模型開發(fā)由淺入深的過程。而各大科技公司瘋狂砍價(jià)的,其實(shí)是上文提到的“基礎(chǔ)服務(wù)”,即“標(biāo)準(zhǔn)版模型”的推理費(fèi)用。

推理費(fèi)用的具體定價(jià),又分成了“輸入”和“輸出”兩部分。

簡(jiǎn)單來說,輸入就是用戶提問的內(nèi)容,而輸出則是大模型的回答。科技公司往往會(huì)根據(jù)輸入和輸出的token數(shù)量(字?jǐn)?shù)),進(jìn)行兩次計(jì)費(fèi)。

這種復(fù)雜又細(xì)微的差異,很容易成為科技公司的套路。

例如字節(jié)跳動(dòng)的“0.8元/百萬tokens”“比行業(yè)價(jià)格低99.3%”,其實(shí)只是輸入價(jià)格。豆包通用模型Pro-32k的輸出價(jià)格仍是2元/百萬tokens,與DeepSeek-V2等同行持平。

由此可見,別看大模型價(jià)格戰(zhàn)打得火熱,背后實(shí)則另有洞天。


降價(jià)的千層套路

可以發(fā)現(xiàn),本輪價(jià)格戰(zhàn)最為活躍的,基本上都是云計(jì)算公司,代表廠商是BAT和字節(jié)跳動(dòng)。

它們之所以敢如此降價(jià),還是因?yàn)槟軓膭e的地方彌補(bǔ)損失,羊毛出在羊身上。

正如前文提到,降價(jià)乃至免費(fèi)的,其實(shí)只是基礎(chǔ)服務(wù)。

毫無疑問,這可以幫助中小開發(fā)者以更低的成本構(gòu)建應(yīng)用。然而,當(dāng)開發(fā)者或者企業(yè),需要更貼合自身業(yè)務(wù),深入使用大模型時(shí),往往繞不開進(jìn)階的模型微調(diào)和模型部署——這兩項(xiàng)服務(wù),可不是本次價(jià)格戰(zhàn)的主角。

例如百度宣布免費(fèi)的ERNIE-Speed-8K,如果實(shí)際部署,收費(fèi)就變成了5元/百萬tokens[3]。

與此同時(shí),各家降價(jià)最狠的,其實(shí)都是輕量級(jí)的預(yù)置模型;相比之下,性能更強(qiáng)悍的“超大杯”模型,實(shí)際降價(jià)幅度沒有那么夸張。

例如阿里的Qwen-Max,實(shí)際與字節(jié)跳動(dòng)的豆包通用模型Pro-32k一樣,只是降低了輸入的價(jià)格;而隔壁的百度,壓根沒提超大杯模型。

云計(jì)算廠商的價(jià)格戰(zhàn),更像是用“免費(fèi)游戲”的形式吸引更多玩家加入;但若想繼續(xù)“升級(jí)變強(qiáng)”,該氪金還得氪金。

當(dāng)然,云計(jì)算廠商并非唯一的參與者。

以深度求索與智譜AI為代表的明星初創(chuàng)公司,之所以也敢跟進(jìn)內(nèi)卷,很大程度上是因?yàn)橛谐渥愕膹椝?,尤其是算力資源。

早在大模型尚未爆發(fā)的2020年,背靠私募巨頭幻方的深度求索,就投資了上億元籌建AI超級(jí)計(jì)算機(jī)。

目前,幻方是除BAT、商湯、字節(jié)跳動(dòng)外,第六家擁有1萬張以上英偉達(dá)A100 GPU儲(chǔ)備的中國公司[4]。

而智譜AI則背靠阿里和騰訊,是估值過百億的AI獨(dú)角獸公司。

2020年時(shí),智譜AI也碰巧囤積了不少GPU資源。 其CEO張鵬曾在接受《中國企業(yè)家》采訪時(shí)提到:

當(dāng)時(shí),他認(rèn)識(shí)的一家云計(jì)算廠商,有一批GPU積灰了。 這批GPU原本是供應(yīng)給游戲公司的,但陰差陽錯(cuò)之下,對(duì)方又不買了。 張鵬知道這個(gè)消息后,順勢(shì)接盤了這批計(jì)算資源[5]。

現(xiàn)金流、算力資源都充足的情況下,即便燒錢換市場(chǎng),這些初創(chuàng)公司也能扛得住。

那么問題來了:當(dāng)年移動(dòng)互聯(lián)網(wǎng)補(bǔ)貼換市場(chǎng),尚可以簡(jiǎn)單粗暴地歸因?yàn)椤凹夹g(shù)門檻低”;主打一手高科技的大模型,怎么也沒走出價(jià)格戰(zhàn)的怪圈?


必經(jīng)之路

大模型智能化帶給世人的震撼,往往讓人忽視它的本質(zhì),其實(shí)是一種基礎(chǔ)設(shè)施。

去年,知名計(jì)算機(jī)科學(xué)家吳恩達(dá)曾在公開演講中提到:

AI其實(shí)是一系列工具的集合。這些工具包括了監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),以及現(xiàn)在的生成式人工智能。 所有這些都是通用技術(shù),意味著它與電力和互聯(lián)網(wǎng)等其他通用技術(shù),并沒有什么區(qū)別[6]。

電力與互聯(lián)網(wǎng),并沒法直接創(chuàng)造價(jià)值;真正改變世界的,其實(shí)電燈、電腦、電商、電子游戲。

然而,應(yīng)用的爆發(fā)其實(shí)有一個(gè)前提:即基礎(chǔ)設(shè)施足夠便宜。此前,大模型應(yīng)用沒能快速鋪開的一個(gè)主要困境,正是使用成本過高。

哄哄模擬器就是一個(gè)典型的案例。

今年年初,一位名叫王登科的獨(dú)立開發(fā)者,開發(fā)了一款模擬“生氣女朋友”形象的AI應(yīng)用。該應(yīng)用的玩法很簡(jiǎn)單,用戶必須斗智斗勇哄好對(duì)話窗口里的AI女友。

因?yàn)榻换ズ?jiǎn)單和立意頗有情趣,哄哄模擬器上線第一天就吸引了60多萬用戶。

突然的爆紅,卻讓王登科哭笑不得。哄哄模擬器使用了預(yù)置的GPT-3.5模型,運(yùn)營一早上就花了他2000多美金的推理費(fèi)用。

這就相當(dāng)于,開發(fā)了個(gè)App,還沒想到咋賺錢,先交了1萬塊錢電費(fèi)。

縱觀歷史可以發(fā)現(xiàn),當(dāng)年移動(dòng)互聯(lián)網(wǎng)的大規(guī)模普及,也是建立在基礎(chǔ)設(shè)施降本之上的。

2014年的一份調(diào)查報(bào)告顯示,當(dāng)時(shí)由于流量費(fèi)用高昂,手機(jī)用戶每天使用流量不會(huì)超過3小時(shí)。且不使用移動(dòng)網(wǎng)絡(luò)時(shí),很多用戶會(huì)選擇將其關(guān)閉,以防止手機(jī)應(yīng)用在后臺(tái)消耗流量[7]。

彼時(shí),大多數(shù)用戶,都曾做過“一覺醒來房子歸中國移動(dòng)”的噩夢(mèng)。

2013年的時(shí)候,快手就明確了“短視頻社區(qū)”的定位,但增長(zhǎng)相對(duì)緩慢。這背后,很難說沒有大環(huán)境的原因。

事實(shí)上,直到電信運(yùn)營商開始大搞“降費(fèi)提速”,短視頻行業(yè)才真正開始爆發(fā)。

2019年,手機(jī)上網(wǎng)流量資費(fèi)較2014年時(shí)已下降了超90%[8]。至此,手機(jī)淘寶、微信、抖音等才逐漸成為字面意義上的“國民應(yīng)用”。

由此可見,降價(jià)其實(shí)是大模型產(chǎn)業(yè)發(fā)展的必經(jīng)之路。

也許在這輪價(jià)格戰(zhàn)中,云計(jì)算廠商與初創(chuàng)公司,各有各的小九九;但對(duì)開發(fā)者和普通用戶來說,建議可以打得再狠一點(diǎn)。


參考資料

[1] OpenAI Is Doomed,SemiAnalysis

[2] 阿里云大模型服務(wù)平臺(tái)百煉

[3] 千帆大模型平臺(tái)

[4] 量化巨頭發(fā)布第一代大模型:免費(fèi)商用,完全開源,澎湃新聞

[5] 智譜AI CEO張鵬:中國大模型創(chuàng)業(yè)者,不再追隨OpenAI,中國企業(yè)家

[6] Andrew Ng: Opportunities in AI - 2023,Stanford Online

[7] 2014年中國手機(jī)流量使用報(bào)告:近四成用戶流量不夠用,中國新聞網(wǎng)

[8] 工業(yè)和信息化部組織召開“提速降費(fèi)”用戶面對(duì)面座談會(huì)

編輯:陳彬

視覺設(shè)計(jì):疏睿

責(zé)任編輯:陳彬

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大風(fēng)!降雨!大降溫!冷空氣已抵福建

大風(fēng)!降雨!大降溫!冷空氣已抵福建

環(huán)球網(wǎng)資訊
2025-12-24 16:14:02
爸把18套房全給私生子,宣讀遺囑時(shí)媽竟在笑,半年后我才知真相

爸把18套房全給私生子,宣讀遺囑時(shí)媽竟在笑,半年后我才知真相

溫情郵局
2025-12-08 11:29:02
龐家后人對(duì)《新華社》報(bào)道的聲明:不公正、不理解、不接受

龐家后人對(duì)《新華社》報(bào)道的聲明:不公正、不理解、不接受

每日一見
2025-12-21 14:31:46
 《阿凡達(dá)3》在德國殺瘋了!

《阿凡達(dá)3》在德國殺瘋了!

仙味少女心
2025-12-23 17:50:24
簽了簽了!貝弗利重磅加盟!來自NBA的防守大閘

簽了簽了!貝弗利重磅加盟!來自NBA的防守大閘

籃球?qū)崙?zhàn)寶典
2025-12-23 22:15:51
胰腺癌去世的人越來越多!專家:牢記飯后4不做,飯前3不吃

胰腺癌去世的人越來越多!專家:牢記飯后4不做,飯前3不吃

岐黃傳人孫大夫
2025-12-20 11:45:03
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
日本女神顏值大比拼,巔峰前十

日本女神顏值大比拼,巔峰前十

吃瓜黨二號(hào)頭目
2025-12-24 08:37:22
蔣萬安反對(duì)兩岸統(tǒng)一,已獲民進(jìn)黨批準(zhǔn)將再訪大陸,大陸用10字回應(yīng)

蔣萬安反對(duì)兩岸統(tǒng)一,已獲民進(jìn)黨批準(zhǔn)將再訪大陸,大陸用10字回應(yīng)

老范談史
2025-12-24 11:40:26
粵A車主笑開花!廣州交通大變化,粵A車主不限行,外地車12次夠嗎

粵A車主笑開花!廣州交通大變化,粵A車主不限行,外地車12次夠嗎

三農(nóng)老歷
2025-12-24 12:52:26
泰軍端掉電詐呼叫中心,繳獲千萬現(xiàn)金黃金,網(wǎng)友沸騰

泰軍端掉電詐呼叫中心,繳獲千萬現(xiàn)金黃金,網(wǎng)友沸騰

胡嚴(yán)亂語
2025-12-23 15:47:01
10人U22國足1-0中亞黑馬!西亞拉練迎開門紅 王鈺棟制勝+彭嘯復(fù)出

10人U22國足1-0中亞黑馬!西亞拉練迎開門紅 王鈺棟制勝+彭嘯復(fù)出

我愛英超
2025-12-24 12:24:07
順德魚生是淡水生魚片,不擔(dān)心寄生蟲嗎?網(wǎng)友:大數(shù)據(jù)不會(huì)騙人!

順德魚生是淡水生魚片,不擔(dān)心寄生蟲嗎?網(wǎng)友:大數(shù)據(jù)不會(huì)騙人!

夜深愛雜談
2025-12-23 17:35:17
最新 | 天津市委、市政府決定!名單發(fā)布!

最新 | 天津市委、市政府決定!名單發(fā)布!

天津廣播
2025-12-24 09:54:15
防守崩盤!湖人108-132太陽,本場(chǎng)誰是罪魁禍?zhǔn)?,?shù)據(jù)不會(huì)說謊

防守崩盤!湖人108-132太陽,本場(chǎng)誰是罪魁禍?zhǔn)?,?shù)據(jù)不會(huì)說謊

籃球看比賽
2025-12-24 12:55:18
韓媒:日本強(qiáng)征韓籍軍人遺屬首次在韓起訴靖國神社要求取消合祀

韓媒:日本強(qiáng)征韓籍軍人遺屬首次在韓起訴靖國神社要求取消合祀

參考消息
2025-12-24 10:19:06
49年毛主席關(guān)鍵抉擇:為漢字文脈按下“暫停鍵”避免一場(chǎng)文字浩劫

49年毛主席關(guān)鍵抉擇:為漢字文脈按下“暫停鍵”避免一場(chǎng)文字浩劫

顧史
2025-12-19 19:30:46
江蘇一市明年起征收生活垃圾處理費(fèi),每戶每月4元

江蘇一市明年起征收生活垃圾處理費(fèi),每戶每月4元

環(huán)球網(wǎng)資訊
2025-12-24 10:42:44
13年前,被父親逼迫零下13度裸跑的4歲小男孩,如今過得怎么樣?

13年前,被父親逼迫零下13度裸跑的4歲小男孩,如今過得怎么樣?

趣文說娛
2025-11-21 16:06:59
官媒對(duì)成龍的稱呼變了,三字之差釋放強(qiáng)烈信號(hào),王晶的話有人信了

官媒對(duì)成龍的稱呼變了,三字之差釋放強(qiáng)烈信號(hào),王晶的話有人信了

振華觀史
2025-12-23 20:24:20
2025-12-24 16:39:00
遠(yuǎn)川科技評(píng)論 incentive-icons
遠(yuǎn)川科技評(píng)論
用投資視角,扒巨頭秘史
371文章數(shù) 2279關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

假冒的“晴王”葡萄,還在賣

頭條要聞

遼寧省三名廳官被開除黨籍 一人被指未經(jīng)批準(zhǔn)出入國境

頭條要聞

遼寧省三名廳官被開除黨籍 一人被指未經(jīng)批準(zhǔn)出入國境

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

科技要聞

馬斯克沒想到的"中國速度"!2026值得期待

汽車要聞

“運(yùn)動(dòng)版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

教育
時(shí)尚
本地
親子
旅游

教育要聞

成都鹽外芙蓉學(xué)校第六屆教育教學(xué)研討會(huì):探索素養(yǎng)導(dǎo)向育人新路徑

介紹一個(gè)如果你用了,你就看不到這篇文章的產(chǎn)品

本地新聞

云游安徽|一川江水潤(rùn)安慶,一塔一戲一城史

親子要聞

媽媽對(duì)你的愛,永遠(yuǎn)拿得出手

旅游要聞

瞰中國·冰雪冬韻|內(nèi)蒙古:雪落南山 天地皚皚

無障礙瀏覽 進(jìn)入關(guān)懷版