国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

熱度第一、Tokens周調(diào)用破3T,MiniMax這個(gè)春節(jié)殺瘋了

0
分享至



編輯|楊文

這個(gè)春節(jié),MiniMax 殺瘋了。

2 月 20 日,港股馬年首個(gè)交易日,MiniMax 收盤股價(jià)報(bào)漲 14.52%,市值一度沖破 3042 億港元。



這輪上漲并非只是資本市場(chǎng)的情緒宣泄。

過(guò)去兩年,AI 行業(yè)的敘事幾乎集中在供給側(cè),比如更強(qiáng)的模型、更快的芯片、更大的數(shù)據(jù)中心。然而,制約 AI 產(chǎn)業(yè)規(guī)?;涞氐模斯┙o側(cè)的能力上限外,還有大量長(zhǎng)期憋著、始終未能真正釋放的需求。

春節(jié)假期前后,MiniMax 發(fā)布新一代模型 M2.5,這些被壓制的需求終于找到了一個(gè)出口。

M2.5 發(fā)布后 12 小時(shí)內(nèi)登頂 OpenRouter 熱度榜,一周內(nèi)登頂調(diào)用量榜首,周調(diào)用量暴漲至 3.07T tokens,超過(guò) Kimi K2.5、GLM-5 與 DeepSeek V3.2 三家的總和。



這還不是故事的全部。OpenRouter 整體調(diào)用量也在同步攀升。官方隨后確認(rèn),M2.5 帶動(dòng)了 100K 至 1M 長(zhǎng)文本區(qū)間的增量調(diào)用需求,而這個(gè)區(qū)間正是 Agent 工作流的典型消耗場(chǎng)景。

此前因?yàn)檎也坏侥芰统杀就瑫r(shí)過(guò)關(guān)的模型,大量開(kāi)發(fā)者手里攥著現(xiàn)成的工作流卻遲遲無(wú)法啟動(dòng)。Agent 任務(wù)的 token 消耗遠(yuǎn)比普通對(duì)話密集,需求一旦被激活,帶動(dòng)的調(diào)用增量自然相當(dāng)可觀。



硅谷在用什么,已經(jīng)悄悄變了

早在 MiniMax 推出 M2.1 模型時(shí),被公認(rèn)為 Cursor 最強(qiáng)挑戰(zhàn)者的硅谷新貴 Kilo Code 就已表態(tài)。這家可調(diào)用全球超過(guò) 500 種模型的 AI 編程工具,在核心產(chǎn)品的默認(rèn)模型位置上,曾高調(diào)宣布首選 MiniMax M2.1。

Kilo 聯(lián)合創(chuàng)始人兼 CEO Breitenother 給出的理由簡(jiǎn)單粗暴:在開(kāi)發(fā)者直接評(píng)判的真實(shí)編碼工作流程中,M2.1 能夠與前沿模型相媲美。

此次 M2.5 發(fā)布后隨即全面開(kāi)源,模型權(quán)重在 HuggingFace 上發(fā)布,支持本地部署,Kilo 再次宣布接入。與此同時(shí),OpenCode、OpenClaw、Fireworks、Factory、TRAE、Cline、OpenHands、Roo Code,以及 Ollama、vLLM、SGLang、Dify、魔搭社區(qū)等國(guó)內(nèi)外知名開(kāi)源 Agent 應(yīng)用、開(kāi)源工具平臺(tái),也在第一時(shí)間接入



Kilo 代表新一代 AI 編程工具的方向,OpenClaw 代表最新的 AgentOS,它們?cè)诘讓幽P偷倪x擇上極為挑剔,M2.5 能夠成為這類產(chǎn)品的優(yōu)先推薦,意味著在真實(shí)生產(chǎn)環(huán)境中對(duì)于模型的認(rèn)可。

在編程領(lǐng)域最具代表性的 SWE-Bench Verified 評(píng)測(cè)中,M2.5 以 80.2% 的通過(guò)率達(dá)到了與 Claude Opus 系列相當(dāng)?shù)乃剑诙嗾Z(yǔ)言任務(wù) Multi-SWE-Bench 上排名第一。

知名技術(shù)博主 Simon Willison 使用 mini-swe-agent 對(duì)當(dāng)前主流模型進(jìn)行了獨(dú)立測(cè)評(píng),結(jié)果顯示 M2.5 排名第三,僅次于 Claude Opus 4.5 和 Gemini 3 Flash,且是開(kāi)源模型中的第一名





執(zhí)行效率也有實(shí)質(zhì)性提升。研究機(jī)構(gòu) SemiAnalysis 實(shí)測(cè)顯示,在 8 張 H200 顯卡上,M2.5 在合理首 token 延遲范圍內(nèi)能夠持續(xù)達(dá)到每 GPU 每秒約 2500 個(gè) token 的吞吐量,即便在嚴(yán)格要求每用戶每秒 20 個(gè) token 交互性的條件下,處理超過(guò) 1 萬(wàn)個(gè) token 的上下文時(shí)仍能維持穩(wěn)定的解碼速度。



開(kāi)源 Agent 社區(qū)的密集接入同樣說(shuō)明問(wèn)題。對(duì)于需要長(zhǎng)時(shí)間運(yùn)行、高頻調(diào)用工具的 Agent 框架來(lái)說(shuō),模型的定價(jià)直接決定了產(chǎn)品能否跑通商業(yè)邏輯。

M2.5 的價(jià)格區(qū)間恰好落在這批產(chǎn)品真正能接受的范圍里。它提供兩個(gè)版本:100 TPS 快速版,輸入每百萬(wàn) tokens 僅需 0.3 美元,輸出每百萬(wàn) tokens 僅需 2.4 美元;50 TPS 版本輸出價(jià)格還要再降一半。

能力、速度、成本,這三個(gè)維度在 M2.5 上同時(shí)達(dá)標(biāo),帶來(lái)的結(jié)果在 OpenRouter 上看得尤為清楚,M2.5 第一次走出了一條接近指數(shù)型的曲線。

滿足真實(shí)需求,從底層重新設(shè)計(jì)

這些提升的背后,得益于 MiniMax 從工程底層重新設(shè)計(jì)的一套原生 Agent 強(qiáng)化學(xué)習(xí)系統(tǒng),代號(hào) Forge。

Forge 將 Agent 的執(zhí)行邏輯與底層訓(xùn)練推理引擎徹底解耦。在此之前,大多數(shù) RL 框架要求把 Agent 當(dāng)作白盒來(lái)處理,Agent 與框架之間需要深度共享內(nèi)部狀態(tài),一旦涉及動(dòng)態(tài)上下文管理或多 Agent 協(xié)作,工程復(fù)雜度就會(huì)急劇膨脹;傳統(tǒng)的 Token-In-Token-Out 模式還迫使 Agent 與底層 Tokenizer 深度綁定,維護(hù)訓(xùn)練和推理之間的一致性成本極高。

Forge 通過(guò)引入中間件抽象層繞開(kāi)了這兩個(gè)問(wèn)題。Gateway Server 作為標(biāo)準(zhǔn)化通信網(wǎng)關(guān),將 Agent 的高層行為與底層模型復(fù)雜性隔離;Data Pool 異步收集訓(xùn)練軌跡,使生成與訓(xùn)練徹底解耦。這套架構(gòu)讓 MiniMax 可以在不修改任何 Agent 內(nèi)部代碼的前提下,接入數(shù)百種框架和數(shù)千種工具調(diào)用格式進(jìn)行訓(xùn)練。



訓(xùn)練效率上,F(xiàn)orge 引入了 Prefix Tree Merging 方案,將訓(xùn)練樣本從線性序列重構(gòu)為樹(shù)形結(jié)構(gòu),消除了多輪 Agent 請(qǐng)求之間大量重復(fù)的上下文前綴,實(shí)現(xiàn)了約 40 倍的訓(xùn)練加速,同時(shí)顯著降低了顯存開(kāi)銷。



異步調(diào)度上,F(xiàn)orge 提出 Windowed FIFO 策略,在最大化系統(tǒng)吞吐量的同時(shí),通過(guò)滑動(dòng)窗口約束控制樣本的離策略程度,避免訓(xùn)練分布向「快而簡(jiǎn)單」的樣本嚴(yán)重偏移,兼顧了效率與穩(wěn)定性。



算法層面,MiniMax 沿用自研的 CISPO 算法保障 MoE 模型在大規(guī)模訓(xùn)練中的穩(wěn)定性,并針對(duì) Agent 場(chǎng)景的長(zhǎng)軌跡信用分配難題,設(shè)計(jì)了由過(guò)程獎(jiǎng)勵(lì)、任務(wù)完成時(shí)間獎(jiǎng)勵(lì)與 Reward-to-Go 三部分組成的復(fù)合獎(jiǎng)勵(lì):過(guò)程獎(jiǎng)勵(lì)對(duì) Agent 中間行為進(jìn)行密集監(jiān)督,不只依賴最終結(jié)果;任務(wù)完成時(shí)間獎(jiǎng)勵(lì)將相對(duì)完成時(shí)間作為獎(jiǎng)勵(lì)信號(hào),激勵(lì)模型主動(dòng)利用并行策略選擇最短執(zhí)行路徑;Reward-to-Go 則通過(guò)標(biāo)準(zhǔn)化回報(bào)大幅降低梯度方差,穩(wěn)定優(yōu)化過(guò)程。

此外,MiniMax 還將上下文管理機(jī)制直接整合進(jìn)了 RL 交互循環(huán),將其視為驅(qū)動(dòng)狀態(tài)轉(zhuǎn)換的功能性動(dòng)作,讓模型在訓(xùn)練階段就學(xué)會(huì)預(yù)見(jiàn)并適應(yīng)上下文變遷,這從根本上解決了長(zhǎng)程任務(wù)中隨交互輪次增加而出現(xiàn)的注意力稀釋問(wèn)題。

正是這套系統(tǒng),讓 M2.5 在 Kilo、OpenClaw 這類對(duì)模型要求頗為苛刻的 Agent 框架上跑出了穩(wěn)定的表現(xiàn)。

超越 Agentic Engineering,面向下一代應(yīng)用生態(tài)

在過(guò)去 108 天里,MiniMax 陸續(xù)推出了 M2、M2.1 和 M2.5,在 SWE-Bench Verified 榜單上,M2 系列的進(jìn)步速度超過(guò)了 Claude、GPT 和 Gemini 系列,是行業(yè)迭代最快的



這個(gè)節(jié)奏,恰好踩在一個(gè)需求爆發(fā)的窗口上。OpenClaw 從籍籍無(wú)名到席卷全球,前后不過(guò)一兩個(gè)月時(shí)間。如今 OpenRouter 上已有上千種類似工具和應(yīng)用在此生長(zhǎng),這片 ChatGPT、Claude、Gemini「御三家」之外的生態(tài)里,開(kāi)發(fā)者只認(rèn)一個(gè)標(biāo)準(zhǔn):模型跑不跑得通、用不用得起。

能力達(dá)到第一梯隊(duì)、價(jià)格只有主流旗艦?zāi)P褪种弧⑦€支持本地部署,MiniMax M2.5 和一系列國(guó)產(chǎn)模型的出現(xiàn),恰好在性能與成本之間擊穿了那個(gè)臨界點(diǎn),讓開(kāi)源社區(qū)里那些原本只存在于 Demo 中的復(fù)雜多 Agent 系統(tǒng),第一次具備了大規(guī)模商業(yè)落地的經(jīng)濟(jì)可行性。

3T tokens 的周調(diào)用量背后,是開(kāi)發(fā)者們用腳投出的票。這個(gè)數(shù)字不只是 M2.5 模型的增量,更是硅谷下一代的開(kāi)源生態(tài)應(yīng)用的增量

那些被壓制了許久的 Agent 需求,真的要開(kāi)始跑起來(lái)了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《鏢人》破10億只是開(kāi)始,吳京、沈騰、周星馳要掀起一波新高潮了

《鏢人》破10億只是開(kāi)始,吳京、沈騰、周星馳要掀起一波新高潮了

小丸子的娛樂(lè)圈
2026-02-27 17:57:58
劉詩(shī)詩(shī)吳奇隆突然官宣!女方罕見(jiàn)發(fā)聲:一切早已注定...

劉詩(shī)詩(shī)吳奇隆突然官宣!女方罕見(jiàn)發(fā)聲:一切早已注定...

草莓解說(shuō)體育
2026-03-01 15:10:45
NBA戰(zhàn)報(bào):騎士106-102籃網(wǎng),小波特26分

NBA戰(zhàn)報(bào):騎士106-102籃網(wǎng),小波特26分

懂球帝
2026-03-02 07:49:12
中東多地遭伊朗報(bào)復(fù)性打擊,迪拜帆船酒店遭襲起火

中東多地遭伊朗報(bào)復(fù)性打擊,迪拜帆船酒店遭襲起火

觀察者網(wǎng)
2026-03-01 12:13:04
成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒(méi)給他留一絲體面

成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒(méi)給他留一絲體面

星星沒(méi)有你亮
2026-02-28 20:40:21
炸了!沙特正式參戰(zhàn),伊朗一夜逼反所有鄰國(guó),中東戰(zhàn)局徹底失控

炸了!沙特正式參戰(zhàn),伊朗一夜逼反所有鄰國(guó),中東戰(zhàn)局徹底失控

戧詞奪理
2026-03-01 09:21:40
為全球股市打樣,沙特埃及股市開(kāi)盤大跌5%,但很快反彈

為全球股市打樣,沙特埃及股市開(kāi)盤大跌5%,但很快反彈

上觀新聞
2026-03-01 20:07:17
被曝將撤出中國(guó)市場(chǎng)?知名超市緊急回應(yīng)!深圳僅剩3家

被曝將撤出中國(guó)市場(chǎng)?知名超市緊急回應(yīng)!深圳僅剩3家

深圳晚報(bào)
2026-03-01 23:13:03
扎心了!反詐老陳抖音被封后又被中國(guó)警察網(wǎng)點(diǎn)名批評(píng)

扎心了!反詐老陳抖音被封后又被中國(guó)警察網(wǎng)點(diǎn)名批評(píng)

映射生活的身影
2026-03-02 01:59:29
世紀(jì)斬首:哈梅內(nèi)伊之死,如何徹底改寫(xiě)中東與全球安全未來(lái)?

世紀(jì)斬首:哈梅內(nèi)伊之死,如何徹底改寫(xiě)中東與全球安全未來(lái)?

國(guó)是直通車
2026-03-01 13:18:09
哈梅內(nèi)衣同志犧牲細(xì)節(jié)曝光,40骨干一起帶走

哈梅內(nèi)衣同志犧牲細(xì)節(jié)曝光,40骨干一起帶走

難得君
2026-03-01 21:11:01
51死60傷!美以為何空襲伊朗小學(xué)?專家:或?yàn)槿嫱匾晾剩驅(qū)佟罢`傷”,未來(lái)幾天三方行動(dòng)是關(guān)鍵

51死60傷!美以為何空襲伊朗小學(xué)?專家:或?yàn)槿嫱匾晾剩驅(qū)佟罢`傷”,未來(lái)幾天三方行動(dòng)是關(guān)鍵

極目新聞
2026-02-28 22:09:29
當(dāng)“世界樞紐”按下暫停鍵,迪拜爆炸前后的24小時(shí)

當(dāng)“世界樞紐”按下暫停鍵,迪拜爆炸前后的24小時(shí)

城市進(jìn)化論
2026-03-01 23:51:12
突發(fā)!挪威聯(lián)合救援協(xié)調(diào)中心:一艘油輪在霍爾木茲海峽附近發(fā)求救信號(hào)!“原油大動(dòng)脈”被掐斷,分析師:油價(jià)可能上沖80美元

突發(fā)!挪威聯(lián)合救援協(xié)調(diào)中心:一艘油輪在霍爾木茲海峽附近發(fā)求救信號(hào)!“原油大動(dòng)脈”被掐斷,分析師:油價(jià)可能上沖80美元

每日經(jīng)濟(jì)新聞
2026-03-01 22:41:14
張豐毅70歲昆明打網(wǎng)球,胸肌飽滿男人味爆棚

張豐毅70歲昆明打網(wǎng)球,胸肌飽滿男人味爆棚

春若秋水
2026-03-02 00:25:17
女子回湖北婆家過(guò)年,車被妯娌砸稀爛,報(bào)警后絕不和解,結(jié)局爽了

女子回湖北婆家過(guò)年,車被妯娌砸稀爛,報(bào)警后絕不和解,結(jié)局爽了

離離言幾許
2026-02-27 21:13:58
拒賠中國(guó)361億違約金,轉(zhuǎn)頭抱日本大腿,這個(gè)國(guó)家最終下場(chǎng)如何?

拒賠中國(guó)361億違約金,轉(zhuǎn)頭抱日本大腿,這個(gè)國(guó)家最終下場(chǎng)如何?

來(lái)科點(diǎn)譜
2026-02-17 11:00:15
河南洛陽(yáng)一女子過(guò)年離家,智能馬桶17天耗水超200噸,當(dāng)事人:馬桶晝夜不停自動(dòng)工作

河南洛陽(yáng)一女子過(guò)年離家,智能馬桶17天耗水超200噸,當(dāng)事人:馬桶晝夜不停自動(dòng)工作

黃河新聞網(wǎng)呂梁
2026-02-28 14:27:42
全軍啟用預(yù)備役人員證

全軍啟用預(yù)備役人員證

界面新聞
2026-03-01 10:34:50
為什么科學(xué)家說(shuō):如果宇宙中只有人類,比找到外星人更可怕?

為什么科學(xué)家說(shuō):如果宇宙中只有人類,比找到外星人更可怕?

觀察宇宙
2026-03-01 20:46:19
2026-03-02 08:11:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12382文章數(shù) 142573關(guān)注度
往期回顧 全部

數(shù)碼要聞

時(shí)隔四年!蘋果兩款新Studio Display或于2026上半年發(fā)

頭條要聞

美軍動(dòng)用新型武器:山寨伊朗的

頭條要聞

美軍動(dòng)用新型武器:山寨伊朗的

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂(lè)要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來(lái)襲

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬(wàn)輛

態(tài)度原創(chuàng)

家居
時(shí)尚
親子
游戲
房產(chǎn)

家居要聞

素色肌理 品意式格調(diào)

今年春天最流行的4件衛(wèi)衣,照著穿就很好看

親子要聞

社會(huì)需要為兒童養(yǎng)育提供公共空間

《1348圣誓》被狂噴 官方回嗆:誰(shuí)說(shuō)女性必須漂亮?

房產(chǎn)要聞

濱江九小也來(lái)了!集齊海僑北+哈羅、寰島...江東教育要炸了!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版