国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

性價(jià)比搏擊:Grok 4 Fast 推理成本直降 98%

0
分享至



打響低成本推理之爭。

作者丨梁丙鑒

編輯丨馬曉寧

幾乎沒有預(yù)熱,馬斯克不聲不響把模型調(diào)用成本砍掉 98%。

作為低成本推理模型的最新進(jìn)展,xAI 于上周五發(fā)布了其旗艦?zāi)P偷妮p量化版本 Grok 4 Fast。

通過大規(guī)模強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)智能密度最大化,Grok 4 Fast 在基準(zhǔn)測試上實(shí)現(xiàn)了與 Grok 4 相當(dāng)?shù)谋憩F(xiàn)。同時(shí)由于推理任務(wù)的平均 token 消耗減少了 40 %,xAI 此次更新將前沿模型的調(diào)用成本大幅降低。

據(jù)官方測算,Grok 4 Fast 單個(gè)推理任務(wù)的成本最低可降至原來的 2%。

這已經(jīng)是一個(gè)可以改寫大模型競爭規(guī)則的數(shù)字。

01

端到端強(qiáng)化學(xué)習(xí)

如果要給 Grok 4 Fast 三個(gè)關(guān)鍵詞,那應(yīng)該是 AI 搜索、上下文窗口和統(tǒng)一模型架構(gòu)。

xAI 在一篇博客中介紹,Grok 4 Fast 擁有原生的工具調(diào)用能力,這是指 Grok 4 Fast 通過端到端工具使用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,在決定何時(shí)調(diào)用代碼或網(wǎng)頁等工具方面表現(xiàn)出色。

由于背靠 X 平臺(tái)的豐富數(shù)據(jù),此舉為 Grok 4 Fast 在自主探索能力方面帶來的優(yōu)勢更為突出。該模型能夠無縫瀏覽網(wǎng)頁和 X 平臺(tái),利用實(shí)時(shí)數(shù)據(jù)增強(qiáng)查詢,同時(shí)支持跳轉(zhuǎn)鏈接獲取媒體內(nèi)容,并以極快速度綜合生成結(jié)果。

對于外部工具的自主使用能力,Grok 4 Fast 在 BrowseComp(44.9%)和 X Bench Deepsearch(74%)等基準(zhǔn)測試中,表現(xiàn)優(yōu)均于 Grok 4。

在 LMArena 的搜索競技場中,Grok 4 Fast 以 1163 分位列第一,力壓此前 OpenAI 領(lǐng)先的 o3-websearch,更是優(yōu)于 gpt-5-search 和 grok-4-search。在文本競技場中,Grok 4 Fast 則排名第八,以一分之差險(xiǎn)勝 grok-4-0709版本。

可以看到,Grok 4 Fast 已經(jīng)顯著優(yōu)于同等量級(jí)的模型,而在搜索相關(guān)任務(wù)中,模型參數(shù)造成的差距則可以被強(qiáng)化學(xué)習(xí)帶來的推理效率和智能密度所追平甚至跨越。


即將和 Grok 4 Fast 同期推出的是其兩個(gè)版本,grok-4-fast-reasoning 和 grok-4-fast-non-reasoning,即長鏈?zhǔn)剿季S和快速響應(yīng)兩種推理模式,均具備 200 萬 token 的上下文窗口。

值得一提的是,Grok 4 Fast 采用了統(tǒng)一模型架構(gòu)。

此前,在不同推理模式下應(yīng)用不同的獨(dú)立模型已經(jīng)成為業(yè)界通行的選擇。對于僅需要簡單回答和大量推理的任務(wù),手動(dòng)切換模型的開關(guān)對于各個(gè)模型廠商來說幾乎已是標(biāo)配。

而 Grok 4 Fast 此次更新引入了統(tǒng)一架構(gòu),其中 reasoning(長鏈?zhǔn)剿季S)和 non-reasoning(快速響應(yīng))兩種模式由同一模型權(quán)重處理,推理過程中通過系統(tǒng)提示進(jìn)行引導(dǎo)。

這種設(shè)計(jì)進(jìn)一步降低了端到端延遲和 token 成本。可以預(yù)見的結(jié)果是,在壓縮調(diào)用成本之外,Grok 4 Fast 距離那些對即時(shí)響應(yīng)存在高需求的場景也更近了一步。

02

SOTA 性價(jià)比

SOTA一日三變,市場對模型性能擠牙膏的戲碼早就沒有了耐心。

xAI 也深知這一點(diǎn),所以比起循例公布的基準(zhǔn)測試結(jié)果,此次更新真正的“軍火展示”其實(shí)是下面這兩張圖。



Grok 4 Fast 的 token 效率提升了 40%,加之每個(gè) token 的大幅降價(jià),最終結(jié)果是開發(fā)者的模型調(diào)用成本顯著降低。而此時(shí)的模型性能,仍可以基本保持在 Grok 4 的水平。

根據(jù) Artificial Analysis 的獨(dú)立評測,Grok 4 Fast 相較于其它公開可用的模型,展現(xiàn)出了 SOTA 級(jí)別的性價(jià)比。

在官方博客中,xAI 將 Grok 4 Fast 稱為“低成本推理的最近進(jìn)展”。98% 的成本壓縮一出,馬斯克就差把“我們最便宜大碗”寫在臉上。雖然沒能在追求智能上限的路上甩開友商,但“誰都能用”是在“比誰都強(qiáng)”之外,另一種打遍天下的可行方案。

在此前的很長一段時(shí)間里,大模型都是一場暴力美學(xué)的軍備競賽,更大的參數(shù)規(guī)模、算力消耗和更強(qiáng)的推理能力成為了模型廠商競爭的硬指標(biāo)。GPT-4、Gemini、Llama系列,乃至 xAI 自家的 Grok 4 Heavy,都是這種極致性能追求下的產(chǎn)物。

然而實(shí)驗(yàn)室之外的世界沒有那么關(guān)注技術(shù)邊界,當(dāng)大模型以一款產(chǎn)品的角色面向市場,過去的技術(shù)路線也在應(yīng)用場景之前留下了一道道坎,其中最為明顯的就是昂貴的推理成本和漫長的響應(yīng)時(shí)間。

相比之下,曾經(jīng)被視為閹割性能的小模型,如今卻正在成為應(yīng)用普及的關(guān)鍵角色。

xAI 雖未公布 Grok 4 Fast 的具體參數(shù),但根據(jù)命名邏輯的行業(yè)慣例,其大概率是在 Grok 4 的基礎(chǔ)上通過蒸餾、架構(gòu)優(yōu)化等技術(shù)降低了計(jì)算負(fù)載與延遲。這意味著它能在更低配置的服務(wù)器甚至邊緣設(shè)備上高效運(yùn)行,并實(shí)現(xiàn)遠(yuǎn)低于 Grok 4 Heavy 每百萬 tokens 輸入 3 美元、輸出 15 美元的“奢侈品”定價(jià)。

“低成本推理”主打的不是推理,而是低成本。在智能上限短期內(nèi)突破無望的背景下,每省下一個(gè) token,每個(gè) token 多便宜一點(diǎn),都是向落地多邁出了一步。而在這場性價(jià)比搏擊中,馬斯克先揮出了一記重拳。

參考資料:


https://x.ai/news/grok-4-fast
-tool-use-with-sota-search

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請先在「AI科技評論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
33+9+9!弗拉格正式進(jìn)化!三狀元合體倒計(jì)時(shí)

33+9+9!弗拉格正式進(jìn)化!三狀元合體倒計(jì)時(shí)

籃球教學(xué)論壇
2025-12-24 18:37:41
陜西黑老大鄭衛(wèi)國去酒店吃飯,不料踢到鐵板,死前連中9槍寧死不跪

陜西黑老大鄭衛(wèi)國去酒店吃飯,不料踢到鐵板,死前連中9槍寧死不跪

青青會(huì)講故事
2024-11-01 16:45:36
老字號(hào)餐館店員用84消毒液泡水壺,顧客喝后食道被腐蝕,一個(gè)多月暴瘦近20斤未出院,多部門介入

老字號(hào)餐館店員用84消毒液泡水壺,顧客喝后食道被腐蝕,一個(gè)多月暴瘦近20斤未出院,多部門介入

極目新聞
2025-12-24 13:21:57
南博事件再升級(jí)!1997年藏品調(diào)撥單申請人凌波,2008年已身居要職

南博事件再升級(jí)!1997年藏品調(diào)撥單申請人凌波,2008年已身居要職

鶴羽說個(gè)事
2025-12-22 14:11:12
龐萊臣曾孫女龐叔令的聲明:新華社未采訪本人,質(zhì)疑南博鑒定材料公開不公

龐萊臣曾孫女龐叔令的聲明:新華社未采訪本人,質(zhì)疑南博鑒定材料公開不公

新浪財(cái)經(jīng)
2025-12-24 13:24:56
哪一刻意識(shí)到自己沒見過世面?網(wǎng)友:從此再?zèng)]喝過茶

哪一刻意識(shí)到自己沒見過世面?網(wǎng)友:從此再?zèng)]喝過茶

另子維愛讀史
2025-12-13 21:53:50
陳芋汐回應(yīng)“有后臺(tái)”:不能用謠言去詆毀運(yùn)動(dòng)員所有的付出,稱與全紅嬋友情不會(huì)被輿論左右;曾在決賽前收到“威脅短信”

陳芋汐回應(yīng)“有后臺(tái)”:不能用謠言去詆毀運(yùn)動(dòng)員所有的付出,稱與全紅嬋友情不會(huì)被輿論左右;曾在決賽前收到“威脅短信”

極目新聞
2025-12-24 21:31:45
死刑!就是給這種人準(zhǔn)備的!

死刑!就是給這種人準(zhǔn)備的!

鈞言堂
2025-12-23 14:38:14
南博《江南春》暗箱操作丑聞的五個(gè)關(guān)鍵要害,被一個(gè)女人無意泄密

南博《江南春》暗箱操作丑聞的五個(gè)關(guān)鍵要害,被一個(gè)女人無意泄密

雪中風(fēng)車
2025-12-22 19:12:14
懵了!羅永浩還沒公布錄音,華與華要把公司賣了

懵了!羅永浩還沒公布錄音,華與華要把公司賣了

說財(cái)貓
2025-12-24 21:07:22
俄中將遇襲地附近發(fā)生爆炸 兩警察身亡

俄中將遇襲地附近發(fā)生爆炸 兩警察身亡

新華社
2025-12-24 18:08:02
越南少將阮德輝吐實(shí)情:中國軍隊(duì)回撤途中黎筍下了道死命令

越南少將阮德輝吐實(shí)情:中國軍隊(duì)回撤途中黎筍下了道死命令

磊子講史
2025-12-23 20:13:04
向太太敢說了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

向太太敢說了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

心靜物娛
2025-12-24 11:02:28
一夜爆兩冷門!冠軍隊(duì)狂輸18分,魚腩大勝豪強(qiáng),2主帥遭下課壓力

一夜爆兩冷門!冠軍隊(duì)狂輸18分,魚腩大勝豪強(qiáng),2主帥遭下課壓力

老吳說體育
2025-12-24 23:28:12
簽了簽了!貝弗利重磅加盟!來自NBA的防守大閘

簽了簽了!貝弗利重磅加盟!來自NBA的防守大閘

籃球?qū)崙?zhàn)寶典
2025-12-23 22:15:51
難以想象!上?!案欢?年花光1300萬,“每頓飯一萬多,出去一次一百多萬……”

難以想象!上海“富二代”1年花光1300萬,“每頓飯一萬多,出去一次一百多萬……”

環(huán)球網(wǎng)資訊
2025-12-23 19:51:46
13年前,被父親逼迫零下13度裸跑的4歲小男孩,如今過得怎么樣?

13年前,被父親逼迫零下13度裸跑的4歲小男孩,如今過得怎么樣?

趣文說娛
2025-11-21 16:06:59
美日對中國最恐懼的是海南封關(guān),如果成功,推廣全國就天下無敵了

美日對中國最恐懼的是海南封關(guān),如果成功,推廣全國就天下無敵了

我心縱橫天地間
2025-12-24 16:47:33
1月2次慘敗,長征十二號(hào)甲回收失利,火箭發(fā)動(dòng)機(jī)故障高空失控燃燒

1月2次慘敗,長征十二號(hào)甲回收失利,火箭發(fā)動(dòng)機(jī)故障高空失控燃燒

胖福的小木屋
2025-12-23 23:05:32
被逼到墻角的克林頓宣戰(zhàn)了,哪怕身敗名裂,也要讓特朗普“陪葬”

被逼到墻角的克林頓宣戰(zhàn)了,哪怕身敗名裂,也要讓特朗普“陪葬”

墨蘭史書
2025-12-24 20:30:03
2025-12-25 00:39:00
AI科技評論 incentive-icons
AI科技評論
點(diǎn)評學(xué)術(shù),服務(wù)AI
7022文章數(shù) 20717關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

頭條要聞

15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財(cái)經(jīng)要聞

北京進(jìn)一步放松限購 滬深是否會(huì)跟進(jìn)?

汽車要聞

“運(yùn)動(dòng)版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

本地
健康
房產(chǎn)
旅游
軍事航空

本地新聞

云游安徽|一川江水潤安慶,一塔一戲一城史

這些新療法,讓化療不再那么痛苦

房產(chǎn)要聞

硬核!央企??谝痪€江景頂流紅盤,上演超預(yù)期交付!

旅游要聞

寶山文旅精彩亮相2025中國旅交會(huì)!

軍事要聞

軍事專家:"特朗普級(jí)"戰(zhàn)艦設(shè)計(jì)疑大量借鑒中國055大驅(qū)

無障礙瀏覽 進(jìn)入關(guān)懷版