国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

熱度第一、Tokens周調(diào)用破3T,MiniMax這個春節(jié)殺瘋了

0
分享至



編輯|楊文

這個春節(jié),MiniMax 殺瘋了。

2 月 20 日,港股馬年首個交易日,MiniMax 收盤股價報漲 14.52%,市值一度沖破 3042 億港元。



這輪上漲并非只是資本市場的情緒宣泄。

過去兩年,AI 行業(yè)的敘事幾乎集中在供給側(cè),比如更強的模型、更快的芯片、更大的數(shù)據(jù)中心。然而,制約 AI 產(chǎn)業(yè)規(guī)?;涞氐?,除了供給側(cè)的能力上限外,還有大量長期憋著、始終未能真正釋放的需求。

春節(jié)假期前后,MiniMax 發(fā)布新一代模型 M2.5,這些被壓制的需求終于找到了一個出口。

M2.5 發(fā)布后 12 小時內(nèi)登頂 OpenRouter 熱度榜,一周內(nèi)登頂調(diào)用量榜首,周調(diào)用量暴漲至 3.07T tokens,超過 Kimi K2.5、GLM-5 與 DeepSeek V3.2 三家的總和。



這還不是故事的全部。OpenRouter 整體調(diào)用量也在同步攀升。官方隨后確認(rèn),M2.5 帶動了 100K 至 1M 長文本區(qū)間的增量調(diào)用需求,而這個區(qū)間正是 Agent 工作流的典型消耗場景。

此前因為找不到能力和成本同時過關(guān)的模型,大量開發(fā)者手里攥著現(xiàn)成的工作流卻遲遲無法啟動。Agent 任務(wù)的 token 消耗遠(yuǎn)比普通對話密集,需求一旦被激活,帶動的調(diào)用增量自然相當(dāng)可觀。



硅谷在用什么,已經(jīng)悄悄變了

早在 MiniMax 推出 M2.1 模型時,被公認(rèn)為 Cursor 最強挑戰(zhàn)者的硅谷新貴 Kilo Code 就已表態(tài)。這家可調(diào)用全球超過 500 種模型的 AI 編程工具,在核心產(chǎn)品的默認(rèn)模型位置上,曾高調(diào)宣布首選 MiniMax M2.1。

Kilo 聯(lián)合創(chuàng)始人兼 CEO Breitenother 給出的理由簡單粗暴:在開發(fā)者直接評判的真實編碼工作流程中,M2.1 能夠與前沿模型相媲美。

此次 M2.5 發(fā)布后隨即全面開源,模型權(quán)重在 HuggingFace 上發(fā)布,支持本地部署,Kilo 再次宣布接入。與此同時,OpenCode、OpenClaw、Fireworks、Factory、TRAE、Cline、OpenHands、Roo Code,以及 Ollama、vLLM、SGLang、Dify、魔搭社區(qū)等國內(nèi)外知名開源 Agent 應(yīng)用、開源工具平臺,也在第一時間接入



Kilo 代表新一代 AI 編程工具的方向,OpenClaw 代表最新的 AgentOS,它們在底層模型的選擇上極為挑剔,M2.5 能夠成為這類產(chǎn)品的優(yōu)先推薦,意味著在真實生產(chǎn)環(huán)境中對于模型的認(rèn)可。

在編程領(lǐng)域最具代表性的 SWE-Bench Verified 評測中,M2.5 以 80.2% 的通過率達(dá)到了與 Claude Opus 系列相當(dāng)?shù)乃?,在多語言任務(wù) Multi-SWE-Bench 上排名第一。

知名技術(shù)博主 Simon Willison 使用 mini-swe-agent 對當(dāng)前主流模型進(jìn)行了獨立測評,結(jié)果顯示 M2.5 排名第三,僅次于 Claude Opus 4.5 和 Gemini 3 Flash,且是開源模型中的第一名





執(zhí)行效率也有實質(zhì)性提升。研究機(jī)構(gòu) SemiAnalysis 實測顯示,在 8 張 H200 顯卡上,M2.5 在合理首 token 延遲范圍內(nèi)能夠持續(xù)達(dá)到每 GPU 每秒約 2500 個 token 的吞吐量,即便在嚴(yán)格要求每用戶每秒 20 個 token 交互性的條件下,處理超過 1 萬個 token 的上下文時仍能維持穩(wěn)定的解碼速度。



開源 Agent 社區(qū)的密集接入同樣說明問題。對于需要長時間運行、高頻調(diào)用工具的 Agent 框架來說,模型的定價直接決定了產(chǎn)品能否跑通商業(yè)邏輯。

M2.5 的價格區(qū)間恰好落在這批產(chǎn)品真正能接受的范圍里。它提供兩個版本:100 TPS 快速版,輸入每百萬 tokens 僅需 0.3 美元,輸出每百萬 tokens 僅需 2.4 美元;50 TPS 版本輸出價格還要再降一半。

能力、速度、成本,這三個維度在 M2.5 上同時達(dá)標(biāo),帶來的結(jié)果在 OpenRouter 上看得尤為清楚,M2.5 第一次走出了一條接近指數(shù)型的曲線。

滿足真實需求,從底層重新設(shè)計

這些提升的背后,得益于 MiniMax 從工程底層重新設(shè)計的一套原生 Agent 強化學(xué)習(xí)系統(tǒng),代號 Forge。

Forge 將 Agent 的執(zhí)行邏輯與底層訓(xùn)練推理引擎徹底解耦。在此之前,大多數(shù) RL 框架要求把 Agent 當(dāng)作白盒來處理,Agent 與框架之間需要深度共享內(nèi)部狀態(tài),一旦涉及動態(tài)上下文管理或多 Agent 協(xié)作,工程復(fù)雜度就會急劇膨脹;傳統(tǒng)的 Token-In-Token-Out 模式還迫使 Agent 與底層 Tokenizer 深度綁定,維護(hù)訓(xùn)練和推理之間的一致性成本極高。

Forge 通過引入中間件抽象層繞開了這兩個問題。Gateway Server 作為標(biāo)準(zhǔn)化通信網(wǎng)關(guān),將 Agent 的高層行為與底層模型復(fù)雜性隔離;Data Pool 異步收集訓(xùn)練軌跡,使生成與訓(xùn)練徹底解耦。這套架構(gòu)讓 MiniMax 可以在不修改任何 Agent 內(nèi)部代碼的前提下,接入數(shù)百種框架和數(shù)千種工具調(diào)用格式進(jìn)行訓(xùn)練。



訓(xùn)練效率上,F(xiàn)orge 引入了 Prefix Tree Merging 方案,將訓(xùn)練樣本從線性序列重構(gòu)為樹形結(jié)構(gòu),消除了多輪 Agent 請求之間大量重復(fù)的上下文前綴,實現(xiàn)了約 40 倍的訓(xùn)練加速,同時顯著降低了顯存開銷。



異步調(diào)度上,F(xiàn)orge 提出 Windowed FIFO 策略,在最大化系統(tǒng)吞吐量的同時,通過滑動窗口約束控制樣本的離策略程度,避免訓(xùn)練分布向「快而簡單」的樣本嚴(yán)重偏移,兼顧了效率與穩(wěn)定性。



算法層面,MiniMax 沿用自研的 CISPO 算法保障 MoE 模型在大規(guī)模訓(xùn)練中的穩(wěn)定性,并針對 Agent 場景的長軌跡信用分配難題,設(shè)計了由過程獎勵、任務(wù)完成時間獎勵與 Reward-to-Go 三部分組成的復(fù)合獎勵:過程獎勵對 Agent 中間行為進(jìn)行密集監(jiān)督,不只依賴最終結(jié)果;任務(wù)完成時間獎勵將相對完成時間作為獎勵信號,激勵模型主動利用并行策略選擇最短執(zhí)行路徑;Reward-to-Go 則通過標(biāo)準(zhǔn)化回報大幅降低梯度方差,穩(wěn)定優(yōu)化過程。

此外,MiniMax 還將上下文管理機(jī)制直接整合進(jìn)了 RL 交互循環(huán),將其視為驅(qū)動狀態(tài)轉(zhuǎn)換的功能性動作,讓模型在訓(xùn)練階段就學(xué)會預(yù)見并適應(yīng)上下文變遷,這從根本上解決了長程任務(wù)中隨交互輪次增加而出現(xiàn)的注意力稀釋問題。

正是這套系統(tǒng),讓 M2.5 在 Kilo、OpenClaw 這類對模型要求頗為苛刻的 Agent 框架上跑出了穩(wěn)定的表現(xiàn)。

超越 Agentic Engineering,面向下一代應(yīng)用生態(tài)

在過去 108 天里,MiniMax 陸續(xù)推出了 M2、M2.1 和 M2.5,在 SWE-Bench Verified 榜單上,M2 系列的進(jìn)步速度超過了 Claude、GPT 和 Gemini 系列,是行業(yè)迭代最快的



這個節(jié)奏,恰好踩在一個需求爆發(fā)的窗口上。OpenClaw 從籍籍無名到席卷全球,前后不過一兩個月時間。如今 OpenRouter 上已有上千種類似工具和應(yīng)用在此生長,這片 ChatGPT、Claude、Gemini「御三家」之外的生態(tài)里,開發(fā)者只認(rèn)一個標(biāo)準(zhǔn):模型跑不跑得通、用不用得起。

能力達(dá)到第一梯隊、價格只有主流旗艦?zāi)P褪种?、還支持本地部署,MiniMax M2.5 和一系列國產(chǎn)模型的出現(xiàn),恰好在性能與成本之間擊穿了那個臨界點,讓開源社區(qū)里那些原本只存在于 Demo 中的復(fù)雜多 Agent 系統(tǒng),第一次具備了大規(guī)模商業(yè)落地的經(jīng)濟(jì)可行性。

3T tokens 的周調(diào)用量背后,是開發(fā)者們用腳投出的票。這個數(shù)字不只是 M2.5 模型的增量,更是硅谷下一代的開源生態(tài)應(yīng)用的增量

那些被壓制了許久的 Agent 需求,真的要開始跑起來了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“山姆女王”為何密集拜訪江蘇三個最強地級市委書記?

“山姆女王”為何密集拜訪江蘇三個最強地級市委書記?

財經(jīng)無忌
2026-02-25 21:55:36
50家房企超140個樓盤齊發(fā)力,廣州春節(jié)樓市火熱

50家房企超140個樓盤齊發(fā)力,廣州春節(jié)樓市火熱

中國房地產(chǎn)報官方號
2026-02-26 09:26:02
央媒親自下場!打人夫妻被正式批捕,真實身份曝光,勢力大也沒用

央媒親自下場!打人夫妻被正式批捕,真實身份曝光,勢力大也沒用

呂甒極限手工
2026-02-26 02:22:31
天價拖車費后續(xù),交警介入,拖車公司求刪視頻退錢,當(dāng)事人拒和解

天價拖車費后續(xù),交警介入,拖車公司求刪視頻退錢,當(dāng)事人拒和解

社會日日鮮
2026-02-25 12:17:53
哈登加盟首場傷停騎士惜敗雄鹿 波特準(zhǔn)絕殺阿倫27+11扳平球無效

哈登加盟首場傷停騎士惜敗雄鹿 波特準(zhǔn)絕殺阿倫27+11扳平球無效

醉臥浮生
2026-02-26 11:27:00
第三鄰國作廢?蒙古與俄會談結(jié)束不到24小時,官宣對華成首要方針

第三鄰國作廢?蒙古與俄會談結(jié)束不到24小時,官宣對華成首要方針

嫹筆牂牂
2026-02-26 09:55:54
當(dāng)AI吞下春晚

當(dāng)AI吞下春晚

藍(lán)鯨新聞
2026-02-25 14:25:42
金正恩:韓國是“徹底的敵國、永遠(yuǎn)的敵人”

金正恩:韓國是“徹底的敵國、永遠(yuǎn)的敵人”

澎湃新聞
2026-02-26 12:30:08
歐冠16強出爐,阿森納喜提大禮包!巴黎下下簽,頭號奪冠熱門誕生

歐冠16強出爐,阿森納喜提大禮包!巴黎下下簽,頭號奪冠熱門誕生

球場沒跑道
2026-02-26 12:07:39
不打了!哈登突發(fā)拇指骨折!NBA最佳交易誕生

不打了!哈登突發(fā)拇指骨折!NBA最佳交易誕生

籃球?qū)崙?zhàn)寶典
2026-02-26 15:19:31
掘金103-84凱爾特人,約基奇30+12,布朗23+11,穆雷病退

掘金103-84凱爾特人,約基奇30+12,布朗23+11,穆雷病退

懂球帝
2026-02-26 13:49:51
真正的“逆齡運動”,堅持一年大腦年輕2.3歲!不是跑步、走路……

真正的“逆齡運動”,堅持一年大腦年輕2.3歲!不是跑步、走路……

人民日報健康客戶端
2026-02-25 07:34:27
湖南一縣委書記抖音賬號成民情留言板,當(dāng)?shù)兀簳涀约菏褂迷撡~號,是她本人回復(fù)網(wǎng)友

湖南一縣委書記抖音賬號成民情留言板,當(dāng)?shù)兀簳涀约菏褂迷撡~號,是她本人回復(fù)網(wǎng)友

極目新聞
2026-02-26 12:03:32
上海一女子懷疑丈夫出軌閨蜜,花9000元雇人追蹤被抓包!法院:“私家偵探”判刑4個月罰款3000元

上海一女子懷疑丈夫出軌閨蜜,花9000元雇人追蹤被抓包!法院:“私家偵探”判刑4個月罰款3000元

大象新聞
2026-02-26 09:45:07
特朗普顧問出“劇本”:希望以色列先動手誘發(fā)伊朗報復(fù),塑造美“被迫自衛(wèi)”讓公眾接受

特朗普顧問出“劇本”:希望以色列先動手誘發(fā)伊朗報復(fù),塑造美“被迫自衛(wèi)”讓公眾接受

紅星新聞
2026-02-26 13:38:37
天生一張娃娃臉都已經(jīng)46了,你敢想?

天生一張娃娃臉都已經(jīng)46了,你敢想?

小椰的奶奶
2026-02-26 02:19:53
日經(jīng)225指數(shù)漲幅擴(kuò)大至超1%,首次站上59000點

日經(jīng)225指數(shù)漲幅擴(kuò)大至超1%,首次站上59000點

每日經(jīng)濟(jì)新聞
2026-02-26 08:17:04
收評:科創(chuàng)50指數(shù)探底回升漲0.85% CPO、PCB等算力硬件股集體爆發(fā)

收評:科創(chuàng)50指數(shù)探底回升漲0.85% CPO、PCB等算力硬件股集體爆發(fā)

財聯(lián)社
2026-02-26 15:03:12
平頂山“夫妻打人事件”,最狠毒者是老太

平頂山“夫妻打人事件”,最狠毒者是老太

方清云
2026-02-25 17:44:53
春節(jié)在農(nóng)村老家七天,才發(fā)現(xiàn)農(nóng)村人比城里更現(xiàn)實!

春節(jié)在農(nóng)村老家七天,才發(fā)現(xiàn)農(nóng)村人比城里更現(xiàn)實!

老特有話說
2026-02-25 23:02:42
2026-02-26 15:59:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12368文章數(shù) 142569關(guān)注度
往期回顧 全部

數(shù)碼要聞

三星Galaxy S26系列正式發(fā)布:影像全面升級,搭載防窺屏幕

頭條要聞

德國總理參觀宇樹科技 王興興回應(yīng)

頭條要聞

德國總理參觀宇樹科技 王興興回應(yīng)

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

人民幣升破6.85,創(chuàng)3年新高

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

汽車要聞

第五代宏光MINIEV煥新 四門玩趣代步車來襲

態(tài)度原創(chuàng)

家居
親子
藝術(shù)
房產(chǎn)
健康

家居要聞

歸隱于都市 慢享自由

親子要聞

3歲女兒真能臭美,自己在家化妝臭美,老公氣得直埋怨媳婦

藝術(shù)要聞

2025年百家金陵畫展 | 油畫作品選刊

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標(biāo)桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

無障礙瀏覽 進(jìn)入關(guān)懷版