国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實測MiniMax M2.1之后,我們終于看懂了其招股書里的技術(shù)底氣

0
分享至




編輯|Panda

這兩天,中國 AI 行業(yè)關(guān)注的核心無疑是 MiniMax。

12 月 21 日,MiniMax(稀宇科技)正式向港交所遞交招股書,披露的一連串數(shù)字瞬間引爆了輿論場:賬上坐擁超10 億美元的現(xiàn)金儲備,2025 年前九個月營收同比激增174.7%,而在保持高強度研發(fā)的同時,經(jīng)調(diào)整凈虧損控制在1.86 億美元。

資本市場的喧囂還沒結(jié)束,23 日,MiniMax 又反手甩出了一張技術(shù)牌:正式上線MiniMax M2.1模型。



這并非一次常規(guī)的版本迭代。根據(jù)官方披露的信息,M2.1 在 SWE-bench Multilingual 多語言評測中以 72.5% 的成績拿下了 SOTA,超越了 Gemini 3 Pro 和 Claude Sonnet 4.5。



更重要的是,它不再局限于 Python 或前端代碼的生成,而是向Rust、Java、C++ 等更廣泛的后端語言發(fā)起了進攻,試圖解決過往模型「寫得像但跑不通」、「缺乏工程感」的痛點。

同時,M2.1 大幅強化了原生 Android 和 iOS 的開發(fā)能力,打出了「Not only vibe WebDev, but also vibe AppDev」的口號。

不僅如此,為了給這種「從零到一」的全棧能力提供硬核支撐,MiniMax 還構(gòu)建并開源了全新基準VIBE(Visual & Interactive Benchmark for Execution in Application Development)。不同于傳統(tǒng)基準,VIBE 涵蓋了 Web、仿真、Android、iOS 及后端五大核心子集,并引入創(chuàng)新的Agent-as-a-Verifier (AaaV)范式,能夠自動評估生成的 Application 在真實運行環(huán)境中的交互邏輯與視覺美感。在這場「全棧構(gòu)建」的終極測試中,M2.1 以平均 88.6 分的成績展現(xiàn)了卓越實力,不僅在幾乎所有子集上顯著優(yōu)于 Claude Sonnet 4.5,更逼近了 Claude Opus 4.5 的水準。



同時,憑借強大的交錯思維與指令跟隨能力,MiniMax M2.1 還能集成「復合指令約束」,從而可以更輕松地完成辦公自動化任務。

更令開發(fā)者驚喜的是其落地的速度與廣度:M2.1 第一時間就可無縫集成至 Claude Code、Cursor 等主流 AI 編程工具中。

配合更快的響應速度、更簡潔的思維鏈以及大幅降低的 token 消耗,它顯然是有備而來,意在直接切入開發(fā)者的核心工作流。

這種「今天秀肌肉,明天亮技術(shù)」的節(jié)奏顯然不是巧合。在外界還在爭論一家成立剛四年的公司為何能跑出如此驚人的 IPO 速度時,MiniMax M2.1 的發(fā)布則是一種有力的回應:它試圖用模型的迭代速度,來詮釋招股書里高效研發(fā)的數(shù)字指標,以及為何這家公司值得眾多明星投資人的信任與多輪投資。



作為一家長期關(guān)注 AI 技術(shù)的媒體,在這一波喧囂過后的 48 小時里,我們拿到 M2.1 的接口,把它扔進了開發(fā)環(huán)境中,用真實的任務對其進行了考驗。

畢竟,招股書是給投資人看的面子,而模型能力才是開發(fā)者真金白銀投票的里子。這份體驗報告或可成為洞見這家公司真實技術(shù)底蘊的切口。

實測:從偏科到全能

在過去很長一段時間里,MiniMax 給開發(fā)者的印象往往帶著鮮明的標簽:它的語音合成極其逼真,視頻生成的表現(xiàn)力備受贊譽(海螺),角色扮演能力也在 C 端應用(如星野)中大放異彩。如果說大模型班級里有特長生,那么 MiniMax 以前更像是一個極具天賦的文科生或藝術(shù)生。

然而,要支撐起招股書中描繪的 AGI 藍圖,光有情商可不夠。在企業(yè)級應用和復雜的生產(chǎn)力場景中,推理能力和模型使用工具的能力才是檢驗模型智商的硬通貨。此前,必須承認的是,作為開源模型,M2 與 Claude Sonnet 4.5 或 GPT-5 (thinking) 等國際頂尖模型相比,在部分任務上確實還差點意思。

這也正是 M2.1 發(fā)布的戰(zhàn)略意義所在:一次針對性的進化。

為了驗證 M2.1 是否真的補齊了編程這塊短板,我們決定跳過那些基礎(chǔ)的「寫首藏頭詩」或「畫個貪吃蛇」,直接將它置于真實的開發(fā)者視角下,以了解其在代碼重構(gòu)、復雜邏輯規(guī)劃等方面的真實表現(xiàn)。

首先來一個相對簡單的任務:蝦仁模擬器,看看我們能否在自己的電腦上扮演這位歷經(jīng)無數(shù)世界的穿越者。首先,構(gòu)建一個簡單的提示詞:

我想構(gòu)建一個蝦仁模擬器小游戲,核心主題是:你是蝦仁,你又穿越了。游戲內(nèi)容是主角蝦仁穿越到不同的朝代或者世界(比如喪尸世界、修仙世界、賽博世界),游戲后臺使用 AI: MiniMax-M2.1。請先規(guī)劃這個項目,讓我選擇游戲方式和技術(shù)棧等,并將任務規(guī)劃放入 task.md 文件。

在 Claude Code 配置好 MiniMax M2.1 之后,直接輸入提示詞開始構(gòu)建!

4 倍速視頻(以下視頻都是 4 倍速)

整個過程耗時不到 6 分鐘。給這個小游戲配置好 API,來初步試試效果:

命令行的界面玩起來總歸是不方便,也不美麗,接下來我們繼續(xù)推進,讓 MiniMax M2.1 開發(fā)一個直觀好看的 UI。

給這個游戲開發(fā)一個漂亮的網(wǎng)頁 UI,整體使用像素風格,使用莫蘭迪色系配色。使用 JavaScript。支持深色和淺色模式切換。界面上加一個隨機穿越的按鈕。

這下,效果好多了。MiniMax M2.1 的審美著實在線!

你甚至能一句話就創(chuàng)建出一個炫酷的個人主頁:

MiniMax M2.1 為漫威超級英雄黑寡婦創(chuàng)建的個人主頁

接下來,我們大幅提升任務難題,來考驗一下 MiniMax M2.1 的多語言編程能力。我們構(gòu)想一個較為復雜的任務,并在 AI 的輔助下撰寫了一個提示詞:



然后我們將其放入任務文件夾的「任務.md」文件中,直接給出執(zhí)行指令:

讀取文件夾中的任務.md 文件并實現(xiàn)這個項目。

這個任務的難度較大,MiniMax M2.1 并沒有一蹴而就,但整個過程非常接近真實的開發(fā)體驗。在與其進行多輪互動后,它最終交出了一份令人滿意的答卷。

值得一提的是,在這個過程中我們遇到了多次報錯,例如 crates.io 鏡像源問題導致無法下載組件、Go 語言中 % 運算符不能用于 float64 而需改用 math.Mod () 函數(shù)等。

令人驚喜的是,這些問題并沒有成為阻礙。我們只需將報錯信息直接反饋給 MiniMax M2.1,它就能迅速理解上下文,自動完成修復工作,并編寫了各個模塊的單元測試。

最后,我們繼續(xù)讓 MiniMax M2.1 將這三個使用不同語言編寫的模塊連接了起來。



最終,我們得到了這樣一個系統(tǒng):



左側(cè)為 React 前端,右上為 Go 語言寫的網(wǎng)關(guān),右下為 Rust 寫的核心程序

我們還進行了其它一些實測,包括將多年前的 C++ 游戲庫重構(gòu)為 Python 版本、修改了一個 Obsidian 插件、一個輔助發(fā)推文的小工具以及一個「技能吃豆人」小游戲。



技能吃豆人增加了技能豆,吃下后可以獲得技能,比如這里的穿墻能力

這些實測證明,MiniMax M2.1 不僅能寫代碼,更能像一個成熟的工程師一樣解決問題。

技術(shù)與商業(yè)的互文

當我們把視線從 IDE 編輯器的代碼窗口移開,重新審視那份數(shù)百頁的招股書時,會發(fā)現(xiàn) M2.1 的發(fā)布其實是解讀 MiniMax 商業(yè)邏輯的一把關(guān)鍵鑰匙。

在外界看來,或許招股書是財務數(shù)字的游戲,而模型發(fā)布是技術(shù)圈的狂歡。但在 MiniMax 這里,兩者構(gòu)成了緊密的互文關(guān)系。

研發(fā)杠桿率:打破「燒錢換增長」的魔咒

招股書中有一個容易被忽視但極具含金量的數(shù)據(jù)對比:2025 年前九個月,MiniMax 的營收同比增長了 174.7%,但同期研發(fā)費用僅增長了約 30%。



這個顯著的「剪刀差」修正了外界對于大模型公司「研發(fā)無底洞」的刻板印象。它揭示了一個關(guān)鍵事實:MiniMax 已經(jīng)跑通了高效的研發(fā)模式。

這意味著,公司不再需要線性地堆砌人力和算力資源來換取模型能力的提升。M2.1 的誕生就是最好的佐證:在研發(fā)投入增速遠低于營收增速的前提下,MiniMax 依然保持了極高的迭代頻率,在短時間內(nèi)填補了代碼和邏輯推理的短板。對于二級市場投資者而言,這種不隨營收規(guī)模同比例膨脹的研發(fā)成本結(jié)構(gòu),是驗證其商業(yè)模式可擴展性(Scalability)的最強證據(jù)。

從聊天機器人到智能體:MiniMax 的生產(chǎn)力雄心

MiniMax 在招股書中強調(diào)了其在 C 端應用(如星野、海螺 AI)上的統(tǒng)治力。然而,要撐起千億級的市場想象空間,僅靠聊天是不夠的。M2.1 補齊邏輯和代碼短板,真正的雄心在于對 B 端生產(chǎn)力場景的滲透。

行業(yè)內(nèi)對于 Agent 能力的評估標準,正在從簡單的對話測試轉(zhuǎn)向更為嚴苛的基準,例如 Toolathon。這是一個包含 32 個專業(yè)軟件(如 Kubernetes、BigQuery)、600 多個工具的第三方高難度評測,要求模型在平均 20 輪的交互中完成復雜的長程任務。

M2.1 對代碼解釋器和工具調(diào)用能力的強化,正是為了應對這種真實世界復雜度。當一個模型能夠熟練操作 Docker 容器、管理日歷并自動處理電商訂單時,它就從一個 C 端的玩具進化成了 B 端的員工。這種能力的躍升,將直接拓寬 MiniMax 開放平臺的客戶半徑,使其能夠承接企業(yè)級工作流的自動化需求。

商業(yè)閉環(huán)的最后一公里

至此,MiniMax 的商業(yè)邏輯形成了閉環(huán):

  • C 端產(chǎn)品(星野、海螺)作為數(shù)據(jù)飛輪和現(xiàn)金牛,提供高用戶粘性和直接收入;
  • 底層模型(M2.1)通過 MoE 架構(gòu)控制推理成本,通過技術(shù)補全提升智商上限;
  • 開放平臺基于 M2.1 的 Agent 和多模態(tài)能力,切入高價值的企業(yè)級市場。

現(xiàn)在的 MiniMax 已左手是資本市場的入場券(招股書),右手是技術(shù)戰(zhàn)場的沖鋒號(M2.1)。

對該公司而言,IPO 是通過技術(shù)轉(zhuǎn)化為生產(chǎn)力的新起點。M2.1 的發(fā)布證明了,這家公司在叩響港交所大門的同時,依然保持著對技術(shù)邊界的極致探索。這種「左手賬本,右手模型」的雙輪驅(qū)動,或許正是它能在短短四年內(nèi)跑通商業(yè)閉環(huán)的秘密所在。

文中視頻鏈接:
https://mp.weixin.qq.com/s/0FUw5WYa-pffvWdM6vrafA

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
36歲銀行女經(jīng)理和丈夫先后自殺:生前花180萬元預訂豪車,身后留下兩個幼女丨紅星調(diào)查

36歲銀行女經(jīng)理和丈夫先后自殺:生前花180萬元預訂豪車,身后留下兩個幼女丨紅星調(diào)查

紅星新聞
2025-12-27 10:37:08
床在晃、樓在搖!杭州網(wǎng)友:震感明顯,有人穿睡衣跑下樓!臺灣突發(fā)6.6級地震

床在晃、樓在搖!杭州網(wǎng)友:震感明顯,有人穿睡衣跑下樓!臺灣突發(fā)6.6級地震

爆笑大聰明阿衿
2025-12-27 23:50:20
美國頁巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災難

美國頁巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災難

新浪財經(jīng)
2025-10-07 21:58:33
"驅(qū)逐"中國外交官,準備與中國戰(zhàn)斗!叫囂:中國必須收下貨品

"驅(qū)逐"中國外交官,準備與中國戰(zhàn)斗!叫囂:中國必須收下貨品

花花娛界
2025-12-27 16:10:16
姜昆“美國唱紅歌”事件再度升級,郭德綱和寧靜的話,一針見血

姜昆“美國唱紅歌”事件再度升級,郭德綱和寧靜的話,一針見血

得得電影
2025-12-26 13:58:03
不被允許的欲望:老年人性需求正在演變?yōu)橹卮蠊残l(wèi)生風險

不被允許的欲望:老年人性需求正在演變?yōu)橹卮蠊残l(wèi)生風險

黑噪音
2025-12-27 20:51:40
越扒越有!不止徐鶯,徐湖平被曝大小情人無數(shù),日本翻譯都不放過

越扒越有!不止徐鶯,徐湖平被曝大小情人無數(shù),日本翻譯都不放過

丁丁鯉史紀
2025-12-27 09:36:59
中方布局奏效,防的就是特朗普,美出爾反爾,醞釀對華加征新關(guān)稅

中方布局奏效,防的就是特朗普,美出爾反爾,醞釀對華加征新關(guān)稅

興史興談
2025-12-27 03:10:25
蘭德公司最新推演泄露,26年將出現(xiàn)窗口期,屆時某大國會采取行動

蘭德公司最新推演泄露,26年將出現(xiàn)窗口期,屆時某大國會采取行動

小哥很OK
2025-12-27 15:40:34
比韓建林還硬!徐湖平大靠山,竟是江蘇“一把手”,父親的老戰(zhàn)友

比韓建林還硬!徐湖平大靠山,竟是江蘇“一把手”,父親的老戰(zhàn)友

阿天愛旅行
2025-12-28 00:49:02
服務超千家金融機構(gòu)!宇信科技啟動“A+H”上市進程,銀行IT解決方案三連冠|港E聲

服務超千家金融機構(gòu)!宇信科技啟動“A+H”上市進程,銀行IT解決方案三連冠|港E聲

時代投研
2025-12-26 18:37:58
律師全部失業(yè)!佛山一律所被吊銷執(zhí)照,起因是非法“購買案源”…

律師全部失業(yè)!佛山一律所被吊銷執(zhí)照,起因是非法“購買案源”…

火山詩話
2025-12-27 14:50:55
我發(fā)現(xiàn),80%的中產(chǎn)還沒意識到降息的嚴重性。

我發(fā)現(xiàn),80%的中產(chǎn)還沒意識到降息的嚴重性。

流蘇晚晴
2025-12-27 17:34:29
這次,姜昆的"澄清"徹底淪為笑話,一份天氣預報,把他們?nèi)鲑u了

這次,姜昆的"澄清"徹底淪為笑話,一份天氣預報,把他們?nèi)鲑u了

千言娛樂記
2025-12-27 19:56:34
“漲到可怕了!”有人一覺醒來賺了18萬

“漲到可怕了!”有人一覺醒來賺了18萬

都市快報橙柿互動
2025-12-27 13:41:17
有一說一,楊瀚森在開拓者是沒有前途的,因為克林根太優(yōu)秀……!

有一說一,楊瀚森在開拓者是沒有前途的,因為克林根太優(yōu)秀……!

田先生籃球
2025-12-27 17:02:53
孟村殺妻案結(jié)果公布,判決前金昊母子照片曝光,兩人狀態(tài)截然不同

孟村殺妻案結(jié)果公布,判決前金昊母子照片曝光,兩人狀態(tài)截然不同

歷史偉人錄
2025-12-27 21:34:16
中山大學教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學術(shù)造假

中山大學教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學術(shù)造假

回旋鏢
2025-12-27 19:14:15
新進展!龐叔令被調(diào)查組問詢5小時,亞洲周刊遭水軍圍攻!

新進展!龐叔令被調(diào)查組問詢5小時,亞洲周刊遭水軍圍攻!

知法而形
2025-12-26 23:21:46
痛心!安徽“半掛西施”王迪去世,有三臺X6000,出事前剛換輪胎

痛心!安徽“半掛西施”王迪去世,有三臺X6000,出事前剛換輪胎

洲洲影視娛評
2025-12-27 23:22:14
2025-12-28 05:55:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12000文章數(shù) 142522關(guān)注度
往期回顧 全部

財經(jīng)要聞

注意,開始拉物價了!

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

藝術(shù)
家居
親子
健康
數(shù)碼

藝術(shù)要聞

手串種類大盤點,全見過的算得上是文玩老手了!

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

親子要聞

親密障礙改善的不僅是能力,更是溝通模式!

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

美國法官裁定蘋果公司智能手表可繼續(xù)在美銷售

無障礙瀏覽 進入關(guān)懷版