国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

AI Coding新王登場!MiniMax M2.1拿下多語言編程SOTA

0
分享至

  • 克雷西 發(fā)自 凹非寺
    量子位 | 公眾號 QbitAI

MiniMax最新旗艦級Coding & Agent模型M2.1,剛剛對外發(fā)布了。

一邊是港交所聆訊通過新進展,另一邊新模型還在嗖嗖嗖上新——而且還SOTA了。

這一次,它直接甩出了一份硬核成績單,在衡量多語言軟件工程能力的Multi-SWE-bench榜單中,以僅10B的激活參數(shù)拿下了49.4%的成績,超越了Claude Sonnet 4.5等國際頂尖競品,拿下全球SOTA。



它試圖解決的,就是此前模型身上嚴重的“學科偏科”問題。

所謂偏科,指的是過去的模型,寫寫Python腳本或Web前端頁面表現(xiàn)還可以,可一旦涉及到后端架構,亦或底層邏輯,表現(xiàn)往往會出現(xiàn)斷崖式下跌。

M2.1的核心進化,就在于它終于突破了這個難題,掌握了后端的開發(fā)規(guī)范。

M2.1的發(fā)布,也證明了MiniMax在推進上市流程的同時,仍保持著高頻的研發(fā)節(jié)奏。

更懂底層,10B激活參數(shù)拿下SOTA

M2.1將對工程上下文的理解,轉化為了對開發(fā)工具鏈的深度適配。它不僅能生成代碼,更能熟練配合Cursor、Claude Code等主流編程工具,在存量代碼庫中執(zhí)行精準的修復(Fix)或重構(Refactor)。

這意味著它不再是一個只會寫新功能的菜鳥,而是一個能遵循既有架構規(guī)范、進行工程級操作的熟手。

具體來說,M2.1系統(tǒng)性提升了Rust / Java / Golang / C++ / Kotlin / Objective-C / TypeScript / JavaScript等語言的能力。

在WebDev與AppDev上,M2.1針對業(yè)界普遍存在的移動端開發(fā)短板,顯著加強了原生Android / iOS開發(fā)能力。

另外,M2.1作為率先引入Interleaved Thinking的模型系列,不僅能關注代碼執(zhí)行是否正確,還能同時關注模型對“復合指令約束”的整合執(zhí)行能力。

使用過程中,M2.1表現(xiàn)出了出色的泛化性,在Claude Code、Droid(Factory AI)、Cline等各類編程工具與Agent框架中均有出色表現(xiàn)。

為了驗證上述能力在真實環(huán)境中的表現(xiàn),MiniMax還構建并開源了全新的測試基準VIBE(Visual & Interactive Benchmark for Execution in Application Development),將考核維度從純文本擴展到了Web、仿真、Android、iOS及后端五個領域。

M2.1最終取得了88.6的平均分,綜合水準逼近Claude Opus 4.5。特別是在開發(fā)環(huán)境最為復雜的Android子項上,它跑出了89.7分,這為那些試圖用AI解決原生客戶端難題的開發(fā)者提供了一個具備說服力的數(shù)據(jù)參考。



特點說了這么多,MiniMax M2.1面對真實的編程任務表現(xiàn)究竟如何,接下來就真刀真槍地試上一試。

實測MiniMax M2.1

先看第一個案例——H5小游戲開發(fā)。

為了更真實地模擬實際開發(fā)過程中的場景,我們沒有一次性提完所有需求,而是將開發(fā)過程分成了三個階段逐步進行。

我們要寫的是一個“星際彈弓”游戲,第一輪的目標是搭建出最基本的游戲界面和功能。



只用不到一分鐘,MiniMax M2.1就完成了HTML架構、CSS屬性和JS腳本的搭建。



實際運行結果也證明,M2.1設計的代碼滿足了prompt當中的所有要求。



當然,這樣設計出來的游戲沒什么難度,我們需要在這個基礎之上增加一些額外設定,這便是第二輪的任務。



M2.1會讀取已有代碼和新的指令,在原有基礎之上進行多輪次的修改。



結果頁面當中也如期出現(xiàn)了“黑洞”,并且通過不斷刷新可以發(fā)現(xiàn),黑洞的大小和位置的確都是隨機產生的。



接著進行試玩檢驗,球的確會受到黑洞的引力吸引,并且被吸入之后游戲自動結束。



這下難度確實上來了,但是好像又太難了,這種水多加面、面多加水的需求,也是實際開發(fā)當中經常遇到的情況,所以第三個階段就是再引入一些新機制,降低一下難度,順便再加一下視覺特效。



對照運行結果,逐一核對提示中的三點需求,確實都滿足了。



這樣這個“星際彈弓”游戲的開發(fā)過程就基本完成了,不過接下來還有一道加試題,用Python把這個程序重寫一遍。

M2.1理解了網頁版的程序邏輯之后,抓住了所要表達的內容,并最終成功實現(xiàn)了從前端到Python的代碼遷移。



接下來我們換一種語言,測試一下最新模型的后端開發(fā)能力。

過去的模型一直按照前端思路在寫后端代碼,造成的結果就是實際跑不通或者并不實用,但實測M2.1之后,感覺后端這塊硬骨頭確確實實被啃下來了。

正好最近量子位官網后臺需要更新升級,我們就選擇了主流開發(fā)語言Java,實現(xiàn)的功能是權限設計體系。這是每個系統(tǒng)必不可少的體系,也是面向Agent大規(guī)模落地,從業(yè)者認為需要重新設計的關鍵部件。

因為這是一項系統(tǒng)任務,而非小修小補,所以我們沒有選擇直接用提示詞去生成代碼,而是先讓模型根據(jù)需求輸出了一份設計文檔,接著再根據(jù)設計文檔去實現(xiàn)代碼。



模型很快就輸出了一份Markdown文檔,內容非常詳細,包括了權限設計需要實現(xiàn)哪些類。



類都包含什么方法和屬性,屬性的類型、方法的參數(shù)、返回值和注釋……都寫得很清晰。



同時還根據(jù)我的需求,把類之間的關系也寫清楚了,在設計之初很好地利用了Java語言的繼承特性。



最后也給出了幾個數(shù)據(jù)庫表設計的建議,定義好了需要哪些字段和對應屬性,看下來有沒有感覺比你那個不寫文檔的同事還好用(Doge)?



接下來我們回到和模型的對話,讓它根據(jù)它自己寫的設計文檔,生成代碼(doge)。

模型生成的速度依然很快,輸出的項目包結構很清晰,分好了實體類、枚舉和實現(xiàn)邏輯等,代碼中也寫清楚了注釋。IDE的代碼行數(shù)統(tǒng)計插件顯示,這個小項目一共有1700多行代碼,而我只花了不到一分鐘時間,輸入了兩句話



接下來,我們又讓M2.1給它配上一套UI界面。

結果非常驚喜,前面階段所需的全部功能全都實現(xiàn)了。



再切換到低權限賬號,能夠進行的操作也匹配了一開始的設定。



總結下來呢,M2.1確實是在后端邏輯的設計上有兩把刷子,能夠完成一個項目從后端到前臺的完整交付。

當然它在多語言支持上修煉的本領還不止如此,像Rust這樣的小眾語言,M2.1也進行了專門學習。

比如官方展示的案例當中,M2.1用Rust打造了CLI + TUI雙模式的Linux安全審計利器,支持一鍵對進程、網絡和SSH等關鍵項的底層掃描與智能風險評級。



而且針對業(yè)界普遍存在的移動端開發(fā)短板,M2.1顯著加強了原生Android / iOS開發(fā)能力。

比如這個iOS桌面交互小組件,設計了“沉睡圣誕老人”點擊喚醒機制,邏輯完整且具備原生級的交互動畫效果。



MiniMax選擇在此時發(fā)新模型,背后又有怎樣的目的呢?

IPO前夕的硬核自證

在剛剛通過港交所聆訊這一微妙的時間節(jié)點,MiniMax選擇發(fā)布M2.1,是一種無聲的戰(zhàn)略宣言。

外界往往因Talkie、海螺等爆款產品給這家公司貼上感性的標簽,認為其長板在于語音和視頻等多模態(tài)交互。

但MiniMax今年在M2、M2.1上接連發(fā)力,證明了文本模型的coding、Agent實力。

長期以來,行業(yè)內默認AI僅擅長Web前端或Python腳本等容錯率高的任務,而M2.1通過對齊崗位上下文——比如真正理解Go語言的并發(fā)模型或C++的內存管理機制——打破了這一天花板。

M2.1同時也是MiniMax研發(fā)效率的一種具象化解釋。招股書披露,公司成立至今僅消耗約5億美元,便構建了全模態(tài)能力。

支撐這一效能的關鍵,在于其內部極高的“含AI量”——超過80%的代碼已由AI完成。M2.1本質上就是這位在內部長期服役的“AI實習生”的能力外溢。

這種“內用轉外售”的路徑,意味著該模型在推向市場前,已經作為生產力工具支撐了385人團隊的高強度迭代。

在流程高度AI化的背景下,MiniMax對AI原生組織產生了獨特的理解——AI需要在更多崗位工種、更真實的生產場景中創(chuàng)造價值。

正是基于這種理解,才有了這個模型的誕生。

對于開發(fā)者而言,這或許比單純的參數(shù)指標更具參考價值。

新模型展現(xiàn)的能力和價值,就是MiniMax最好的路演。

Talk is cheap,Show you Model~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
丹麥態(tài)度突變內幕:忌憚的不是美國施壓,而是格陵蘭執(zhí)意“出走”

丹麥態(tài)度突變內幕:忌憚的不是美國施壓,而是格陵蘭執(zhí)意“出走”

顧史
2026-01-07 19:32:10
147:5,中俄反對無效,聯(lián)大通過決議,日本要求中國“自廢武功”

147:5,中俄反對無效,聯(lián)大通過決議,日本要求中國“自廢武功”

小小科普員
2025-12-04 20:14:22
錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個醒

錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個醒

阿笎評論哥
2026-01-08 06:40:37
千萬不要去破壞自己身上的上等風水

千萬不要去破壞自己身上的上等風水

洞讀君
2025-12-10 16:02:41
辭職24小時內火速簽約!張水華的“現(xiàn)實第一步”炸翻全網

辭職24小時內火速簽約!張水華的“現(xiàn)實第一步”炸翻全網

天天熱點見聞
2026-01-06 08:05:47
我53歲才醒悟:微信上基本不發(fā)朋友圈的人,十有八九是這3種人

我53歲才醒悟:微信上基本不發(fā)朋友圈的人,十有八九是這3種人

千秋文化
2025-12-03 09:44:05
42歲曲婉婷現(xiàn)狀曝光!從豪宅搬到普通平房,男友卷走共同賬戶資金

42歲曲婉婷現(xiàn)狀曝光!從豪宅搬到普通平房,男友卷走共同賬戶資金

小徐講八卦
2026-01-08 09:56:21
海底撈“小便門”當事人登報道歉!其父母回應:深表歉意;被判賠償220萬元

海底撈“小便門”當事人登報道歉!其父母回應:深表歉意;被判賠償220萬元

上觀新聞
2026-01-08 11:03:04
央視主持人崗位完成調整,朱迅被下放,龍洋占據(jù)門面位置

央視主持人崗位完成調整,朱迅被下放,龍洋占據(jù)門面位置

豐譚筆錄
2026-01-05 10:59:09
中國駐日大使罕見缺席日方新年問候交流會!日本政壇大佬施壓高市

中國駐日大使罕見缺席日方新年問候交流會!日本政壇大佬施壓高市

時時有聊
2026-01-08 07:45:16
深度揭秘?|?搞迷信活動,非法收受巨額財物……貴州省委原常委吳勝華的墮落軌跡

深度揭秘?|?搞迷信活動,非法收受巨額財物……貴州省委原常委吳勝華的墮落軌跡

一分為三看人生
2026-01-09 00:11:08
長城汽車正式取消“大小周”,全面落實雙休制度,員工:剛開始聽到消息,以為是謠言不敢信

長城汽車正式取消“大小周”,全面落實雙休制度,員工:剛開始聽到消息,以為是謠言不敢信

大風新聞
2026-01-06 16:58:03
WTT多哈站:一場3-0!王曼昱打敗日本大藤沙月,馬琳擔任場外指導

WTT多哈站:一場3-0!王曼昱打敗日本大藤沙月,馬琳擔任場外指導

齊帥
2026-01-08 20:08:13
明著吃軟飯?多次上春晚竟然全是老婆的功勞,結婚多年被拿捏死

明著吃軟飯?多次上春晚竟然全是老婆的功勞,結婚多年被拿捏死

小熊侃史
2025-12-13 10:14:47
西方媒體炸鍋!中國世界最強神機“壓縮時空”成真?

西方媒體炸鍋!中國世界最強神機“壓縮時空”成真?

徐德文科學頻道
2026-01-07 20:57:39
川普贏了兩次

川普贏了兩次

西樓飲月
2026-01-08 23:20:34
楊蘭蘭最新:不上課、不社交、英語差,喜歡買買買,香奈兒VVIP

楊蘭蘭最新:不上課、不社交、英語差,喜歡買買買,香奈兒VVIP

麥大人
2025-10-09 16:23:06
涉嫌嚴重違紀違法,東莞一學校黨總支原書記被查

涉嫌嚴重違紀違法,東莞一學校黨總支原書記被查

南方都市報
2026-01-08 16:42:19
2026年第一個驚喜?印媒:中國第三架殲-36出現(xiàn)后,轟-20即將首飛

2026年第一個驚喜?印媒:中國第三架殲-36出現(xiàn)后,轟-20即將首飛

軍機Talk
2026-01-08 10:24:15
18家大國企全軍覆沒!昔日世界第一的中國機床,現(xiàn)還有翻身機會嗎

18家大國企全軍覆沒!昔日世界第一的中國機床,現(xiàn)還有翻身機會嗎

牛牛叨史
2025-12-20 21:06:35
2026-01-09 04:39:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11988文章數(shù) 176356關注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內瑞拉防空體系因何失效

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內瑞拉防空體系因何失效

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評

財經要聞

微軟CTO韋青:未來人類會花錢"戒手機"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

游戲
本地
旅游
手機
公開課

山寨《黑神話》續(xù)作上架 PS 商店 / 《GTA 6》或第三次跳票

本地新聞

1986-2026,一通電話的時空旅程

旅游要聞

告別 “門票依賴”!石林的轉型之路,給全國老牌景區(qū)上了一課

手機要聞

1699一加Turbo6首發(fā)測評丨 9000mAh 大電池165超高幀

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版