国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

開源模型榜首MiniMax-M2,新的「AI工程師」紅利要來了

0
分享至

「AI工程師」正在重新定義生產(chǎn)關(guān)系。

最近有個(gè)感受:無論是寫代碼、調(diào)試Agent,還是部署一個(gè)內(nèi)部智能系統(tǒng),模型的“理解力”和“執(zhí)行力”,比任何花拳繡腿的小功能都更重要。

而這一波紅利,正在從懂得調(diào)用模型的“提示詞工程師”,轉(zhuǎn)向能夠整合模型、讓其自動(dòng)行動(dòng)的“AI工程師”手中。

每一個(gè)普通人,都能借助更好的一站式AI模型,實(shí)現(xiàn)頭號(hào)玩家一般的生產(chǎn)力!

海外有Claude 4.5、GPT-5,那么誰是國(guó)內(nèi)大模型的「頭號(hào)AI工程師呢」?

10月27日,MiniMax發(fā)布了全新的M2模型,“專為 Agent 和代碼而生”。


刷到海外博主,標(biāo)題就特別直接:比GLM 4.6還強(qiáng),跟Claude 4.5/GPT-5一樣的能力,但是,免費(fèi)!

Claude、GPT效果好雖好,價(jià)格也確實(shí)不低;現(xiàn)在,就輪到MiniMax M2來掀桌子了……

01. 多模態(tài)強(qiáng)者,文本也強(qiáng)

印象里,MiniMax是多模態(tài)能力很強(qiáng)的,各類全球榜單時(shí)常登頂。


多模態(tài)的優(yōu)勢(shì),對(duì)于MiniMax來說不算新聞,畢竟早已經(jīng)把音頻/視頻/文本模型,分別做到了全球第一/第二/第五。

但這次,殺回編程和文本領(lǐng)域,直接正面迎上Claude、ChatGPT最強(qiáng)勢(shì)的核心腹地,沒點(diǎn)能耐,還真不敢這么對(duì)標(biāo)。

在全球權(quán)威測(cè)評(píng)榜單Artificial Analysis (AA)中,MiniMax-M2(紅色)表現(xiàn)卓越,總分位列全球前五,在開源模型中排第一。

這個(gè)評(píng)測(cè)體系,覆蓋了模型在數(shù)學(xué)、科學(xué)與編碼等多個(gè)核心領(lǐng)域的能力。


尤其在數(shù)學(xué)、科學(xué)與編碼領(lǐng)域,M2的得分非常接近Claude 4.5與Gemini 2.5 Pro,在國(guó)產(chǎn)模型中顯著第一。


而且,在GPQA-Diamond、HLE、LiveCodeBench等關(guān)鍵指標(biāo)上,M2表現(xiàn)極為穩(wěn)健。

但價(jià)格卻僅為Claude的8%,堪稱性價(jià)比之王。

簡(jiǎn)單來說,就是 Claude的性能,ChatGPT的速度,國(guó)產(chǎn)模型的價(jià)格。

02. 效果案例測(cè)評(píng),從Coding、Deep Search到Agent

用M2,第一印象是“干凈”。

界面延續(xù)了MiniMax一貫的極簡(jiǎn)設(shè)計(jì),模型響應(yīng)速度明顯快于上一代M1,生成流暢,沒有Claude那種稍顯“沉穩(wěn)”的延遲感。


MiniMax在M2中強(qiáng)調(diào)了兩個(gè)關(guān)鍵詞——Code Native和Agent Native。

這就是說,它不是我一開始想象的,簡(jiǎn)單在語言模型上疊加編程能力,是從底層架構(gòu)上針對(duì)工程師使用場(chǎng)景進(jìn)行了優(yōu)化。

模型在執(zhí)行多輪任務(wù)、代碼修正和工具調(diào)用上的能力被顯著提升。

用更直白的話說,M2在生成解釋性代碼的同時(shí),也能推理出任務(wù)目標(biāo)的意圖層,具備初步的“執(zhí)行理解”。


MiniMax M2還不單單是榜單上牛,開發(fā)者真實(shí)場(chǎng)景下的體驗(yàn)也確實(shí)不錯(cuò)。

傳統(tǒng)LLM寫代碼,邏輯通常停留在“輸出片段”層面,而M2的最大優(yōu)勢(shì)在于完整的端到端循環(huán)能力。它可以:

  • 同時(shí)處理多個(gè)代碼文件;

  • 自動(dòng)執(zhí)行“編寫 → 運(yùn)行 → 調(diào)試 → 修復(fù)”全過程;

  • 通過單元測(cè)試驗(yàn)證代碼正確性;

  • 甚至能主動(dòng)修改依賴和邏輯結(jié)構(gòu)。


https://0vw4prtvqi3d.space.minimax.io/

嘗試做了一個(gè)能跟隨鼠標(biāo)變化的表情包小游戲,效果很絲滑。


MiniMax M2做的AI會(huì)議紀(jì)要產(chǎn)品的動(dòng)態(tài)官網(wǎng),審美不錯(cuò),小細(xì)節(jié)也很到位,功能交互上完成度比較好。


生成的AI中國(guó)象棋對(duì)戰(zhàn)游戲,我真的能和AI玩上一整天。

Deep Search和Agentic能力也是MiniMax的傳統(tǒng)技能,在M2上有了更極致的發(fā)揮。


用Deep Search提了一個(gè)很具象的要求:選取近90天微博/小紅書/抖音/B站關(guān)于Sora的爆款帖(互動(dòng)量前20),去重后統(tǒng)計(jì)主題分布。

結(jié)果就是數(shù)據(jù)準(zhǔn)確度和全面性都很高。


測(cè)評(píng)統(tǒng)計(jì)來看,MiniMax M2接近GPT-5的能力,優(yōu)于Claude-4.5、DeepSeek V3.2等。

Agentic能力上,MiniMax-M2能夠出色地規(guī)劃并執(zhí)行復(fù)雜的工具鏈,協(xié)同調(diào)用 Shell、瀏覽器、Python代碼執(zhí)行器和各種MCP工具。

在 BrowseComp 評(píng)測(cè)中,它不僅可以挖掘到難以查找的信息源,還能保持信息來源的可追溯性,并具備自我糾錯(cuò)與恢復(fù)的能力。


調(diào)用MCP,執(zhí)行復(fù)雜Pipeline,很多后段的任務(wù)也能真正落地了。

就像視頻里演示的,開發(fā)一個(gè)基于 Markdown 的blog網(wǎng)站,同樣的指令下,反而是Claude出現(xiàn)的負(fù)向反饋更多。

03. 性價(jià)比王者:又好又快還便宜

說回來模型本身,端到端的代碼能力,已經(jīng)很顯著了。

而一個(gè)能做到Claude 4.5相當(dāng)水準(zhǔn)、但只需8%價(jià)格的模型,本身就改變了工程師生態(tài)的底層成本。


以智能能力和價(jià)格作為象限的兩個(gè)坐標(biāo)軸,右上角是兩者兼?zhèn)涞膮^(qū)間,MiniMax M2處在優(yōu)勢(shì)位置。

之前,像我們團(tuán)隊(duì)在內(nèi)部做Agent實(shí)驗(yàn)時(shí),最擔(dān)心的是模型調(diào)用費(fèi)用高昂,尤其是涉及多輪邏輯任務(wù)時(shí),Claude或GPT成本確實(shí)不低。

而M2的開放策略,幾乎讓這種顧慮消失了。甚至近期還能免費(fèi)!!

如果一個(gè)模型既能編程、又能推理、擅長(zhǎng)多模態(tài),還能在團(tuán)隊(duì)部署中以更低價(jià)格持續(xù)運(yùn)行,那么創(chuàng)業(yè)團(tuán)隊(duì)也就能負(fù)擔(dān)得起AI研發(fā),一個(gè)模型就能全棧全鏈路解決問題了。

速度的提升也值得單獨(dú)提一下。

M2在響應(yīng)復(fù)雜任務(wù)時(shí)的延遲比上一代明顯縮短,特別是在代碼生成場(chǎng)景中,它幾乎可以與Claude并行對(duì)話。

眼下100 TPS的速度已經(jīng)很流暢了,而且還在持續(xù)提速。

更有意思的是,它沒有為了追求速度犧牲穩(wěn)定性。在長(zhǎng)輸入、復(fù)雜語義和多任務(wù)調(diào)用下,它依然保持一致的上下文連貫性。

對(duì)工程師而言,這種“穩(wěn)定快”意味著工作節(jié)奏可以更自然地與模型融合,而不是等待一個(gè)遲鈍的響應(yīng)。


04. M2的開源,新的無限可能性

國(guó)內(nèi)大模型生態(tài)過去常被詬病“封閉”,而MiniMax這次的開放態(tài)度,為工程師社區(qū)提供了一個(gè)可以真正動(dòng)手改造和測(cè)試的基礎(chǔ)。

過去,很多國(guó)產(chǎn)模型選擇以「服務(wù)閉源 + API 調(diào)用」的方式提供訪問權(quán)限,而 MiniMax 這次直接開放了模型權(quán)重、部署文檔和二次開發(fā)接口,讓工程師第一次能以更低成本、更自由的方式觸及核心智能。


目前,MiniMax已在 GitHub 與 Hugging Face 上同步開放模型權(quán)重與本地部署指南。

開源協(xié)議采用寬松的 Apache 2.0 許可,這意味著開發(fā)者可以自由下載、修改、集成,甚至用于商業(yè)用途,也讓 M2 成為了少數(shù)真正能“落地”的國(guó)產(chǎn)通用模型之一。

更關(guān)鍵的是,MiniMax 并沒有只開放一個(gè)基礎(chǔ)模型,而是連同面向 Coding 與 Agent 場(chǎng)景優(yōu)化的版本一并開放。


據(jù)官方技術(shù)說明,M2 采用約 10B 激活參數(shù)、230B 總參數(shù)的架構(gòu),特別強(qiáng)化了工具調(diào)用、長(zhǎng)任務(wù)規(guī)劃與程序生成能力。

對(duì)很多想要構(gòu)建自主智能體或在內(nèi)部搭建私有大模型系統(tǒng)的開發(fā)團(tuán)隊(duì)來說,這幾乎相當(dāng)于拿到了一把能直接上手的鑰匙。

無論是二次開發(fā)、模型微調(diào),還是在企業(yè)內(nèi)部部署自定義Agent,可玩性都太高了!

04. 從Agent產(chǎn)品化,到全棧新生態(tài)

打造一個(gè)AI基礎(chǔ)設(shè)施生態(tài),正在成為國(guó)內(nèi)AI應(yīng)用頭號(hào)玩家們的共識(shí)。

回看整個(gè)行業(yè),中國(guó)的AI模型們正經(jīng)歷從“追趕”到“分化”的階段。

過去的模型更像是在語言能力上對(duì)標(biāo)國(guó)外,而現(xiàn)在的競(jìng)爭(zhēng)焦點(diǎn)正在轉(zhuǎn)向“能不能在工程體系中落地”。

M2顯然抓住了這一點(diǎn)——它不追求花哨、娛樂化的對(duì)話表現(xiàn),而是直指工程師的真實(shí)需求。


這種“為使用者設(shè)計(jì)”的方向感,恰恰是國(guó)產(chǎn)模型真正需要的突破口。

更大的背景是,AI工程師紅利正在顯現(xiàn)。

過去依賴提示詞的門檻已經(jīng)越來越低,未來的競(jìng)爭(zhēng)關(guān)鍵將是如何將模型嵌入產(chǎn)品,讓它真正參與執(zhí)行。

M2這樣的模型,正好處在這個(gè)時(shí)代拐點(diǎn):既能編程、又能協(xié)作,既具工程思維、又可本地部署。

開發(fā)者、創(chuàng)意者們,終于有了一個(gè)“聰明的助手”,也擁有了一種新的工作模式——工程師與模型的協(xié)同開發(fā)。

而且這次發(fā)布,不搞套路,手機(jī)電腦上直接都能免費(fèi)用~


兩類模式,一鍵切換:pro專業(yè)模式下有專業(yè)的agent能力,還有一種是lightning高效模式:高效極速版的agent。


在效果上,能以強(qiáng)大agentic能力,降維打擊普通chat模型。

如果說Claude象征著一種理性優(yōu)雅的推理范式,那么M2代表的是工程實(shí)用主義的崛起。

它讓智能不再是昂貴的研究資源,而成為每個(gè)團(tuán)隊(duì)都能使用的工具。這種“智能平權(quán)”,是AI紅利真正落地的標(biāo)志。

如今,越來越多的國(guó)產(chǎn)模型正在向這一方向靠攏,但MiniMax M2的出現(xiàn),無疑讓這個(gè)競(jìng)爭(zhēng)格局更具現(xiàn)實(shí)意義。

它證明,國(guó)產(chǎn)模型不僅能做對(duì)話,更能做事;不僅能輸出答案,更能生成系統(tǒng)。對(duì)于AI工程師而言,這意味著一個(gè)新的時(shí)代正在到來——

一個(gè)模型不只是被問問題,而是能和你一起完成工作的時(shí)代。

最值得一提的是,目前MiniMax M2對(duì)外仍然免費(fèi)開放


這一下,很多海外科技大V也坐不住了。

不管APP安卓還是IOS版本,接入了最新M2的Agent和模型,全球限時(shí)免費(fèi)14天,現(xiàn)在就可以用起來!

在一個(gè)模型調(diào)用還被視為成本負(fù)擔(dān)的行業(yè),M2的免費(fèi)策略讓更多開發(fā)者有機(jī)會(huì)真正體驗(yàn)、實(shí)驗(yàn)和構(gòu)建。

或許這正是國(guó)產(chǎn)模型真正能超越的路徑:不以炫技為目的,而以可用性和開放性贏得未來。

MiniMax創(chuàng)始人閆俊杰,之前在2025世界人工智能大會(huì)演講中就提到:“我們希望AI不再只是大公司的特權(quán),而是每個(gè)開發(fā)者、每家中小企業(yè)都能觸及的智能基礎(chǔ)設(shè)施!


憑借模型技術(shù)優(yōu)勢(shì)、生態(tài)整合能力、前沿的判斷和探索,MiniMax已經(jīng)不止擁有一流的AI模型和產(chǎn)品,更是擁有了“AI+千行百業(yè)“的核心新引擎。

從產(chǎn)品到產(chǎn)業(yè),從成為獨(dú)角獸,到賦能更多獨(dú)角獸,MiniMax的每一步,都踩在人工智能發(fā)展的關(guān)鍵脈絡(luò)上,并正在引領(lǐng)新的可能。

MiniMax-M2開源這一天,也許會(huì)被記作國(guó)產(chǎn)模型生態(tài)的一個(gè)轉(zhuǎn)折點(diǎn)——

從語言到行動(dòng),從對(duì)話到執(zhí)行,從封閉到開放。

MiniMax-M2的出現(xiàn),像是一次宣言:屬于AI工程和系統(tǒng)的紅利,正在中國(guó)被重新定義……


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
戲劇性轉(zhuǎn)變:通牒到期,美伊停火

戲劇性轉(zhuǎn)變:通牒到期,美伊;

南風(fēng)窗
2026-04-08 14:07:48
國(guó)務(wù)院國(guó)資委設(shè)立新機(jī)構(gòu)!

國(guó)務(wù)院國(guó)資委設(shè)立新機(jī)構(gòu)!

新浪財(cái)經(jīng)
2026-04-09 03:07:03
賣掉深圳唯一住房,全部身家押注“冷門”賽道,如今他成全國(guó)第一

賣掉深圳唯一住房,全部身家押注“冷門”賽道,如今他成全國(guó)第一

電商在線
2026-03-03 15:19:04
伊朗壓箱底大殺器洗地,以色列一發(fā)不敢攔,美軍來了也只能干瞪眼

伊朗壓箱底大殺器洗地,以色列一發(fā)不敢攔,美軍來了也只能干瞪眼

健身狂人
2026-04-09 18:02:11
管理過的身材,勝過一切的“奢侈品” ???

管理過的身材,勝過一切的“奢侈品” ???

飛娛日記
2026-03-09 09:16:39
薛之謙漂金發(fā)慘變鬼剃頭! 頭皮冒水泡「全是斷發(fā)」:撐1周沒洗頭

薛之謙漂金發(fā)慘變鬼剃頭! 頭皮冒水泡「全是斷發(fā)」:撐1周沒洗頭

ETtoday星光云
2026-04-09 18:22:04
A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

另子維愛讀史
2026-04-09 19:26:01
長(zhǎng)安逸動(dòng)藍(lán)鯨超擎官圖發(fā)布 百公里城區(qū)油耗2.98L/第200萬輛下線

長(zhǎng)安逸動(dòng)藍(lán)鯨超擎官圖發(fā)布 百公里城區(qū)油耗2.98L/第200萬輛下線

音樂時(shí)光的娛樂
2026-04-09 15:32:07
吳克群在《人民日?qǐng)?bào)》撰文:我雖曾獲得世俗意義上的成功,生活卻越來越單薄……

吳克群在《人民日?qǐng)?bào)》撰文:我雖曾獲得世俗意義上的成功,生活卻越來越單薄……

都市快報(bào)橙柿互動(dòng)
2026-04-09 13:02:09
夫妻過了六十歲。盡量要同居!不是情,是命!別不聽

夫妻過了六十歲。盡量要同居!不是情,是命!別不聽

阿凱銷售場(chǎng)
2026-04-10 01:56:29
消失30天,伊朗新領(lǐng)袖穆杰塔巴持續(xù)隱身,美以鉆地彈威脅曝光!

消失30天,伊朗新領(lǐng)袖穆杰塔巴持續(xù)隱身,美以鉆地彈威脅曝光!

米師傅安裝
2026-04-10 01:05:32
被魯蜜罵怕了!邱彪凌晨回應(yīng)被喊“下課”:心涼了,自身水平有限

被魯蜜罵怕了!邱彪凌晨回應(yīng)被喊“下課”:心涼了,自身水平有限

大嘴爵爺侃球
2026-04-09 19:32:59
伊能靜公開與秦昊結(jié)婚真相,證實(shí)庾澄慶當(dāng)年未說謊

伊能靜公開與秦昊結(jié)婚真相,證實(shí)庾澄慶當(dāng)年未說謊

蕭鑟科普解說
2026-04-08 23:31:02
美國(guó)AI三巨頭聯(lián)手限制蒸餾:最便宜的那條路,被掐斷了

美國(guó)AI三巨頭聯(lián)手限制蒸餾:最便宜的那條路,被掐斷了

盧松松
2026-04-08 14:07:41
伊朗最高領(lǐng)袖:將繼續(xù)利用封鎖霍爾木茲海峽這一戰(zhàn)略杠桿

伊朗最高領(lǐng)袖:將繼續(xù)利用封鎖霍爾木茲海峽這一戰(zhàn)略杠桿

國(guó)際在線
2026-04-06 06:53:08
力挺幕僚參選臺(tái)北市議員,韓國(guó)瑜陪同車掃催票:大家多幫忙

力挺幕僚參選臺(tái)北市議員,韓國(guó)瑜陪同車掃催票:大家多幫忙

海峽導(dǎo)報(bào)社
2026-04-09 17:33:02
中國(guó)人口破億的省只有2個(gè),人口不足5000萬的有16個(gè)省

中國(guó)人口破億的省只有2個(gè),人口不足5000萬的有16個(gè)省

孤云朗境
2026-03-23 20:16:07
一則“墳前告示”網(wǎng)絡(luò)走紅!網(wǎng)友:祖宗因巨額財(cái)產(chǎn)來源不明罪被抓

一則“墳前告示”網(wǎng)絡(luò)走紅!網(wǎng)友:祖宗因巨額財(cái)產(chǎn)來源不明罪被抓

火山詩(shī)話
2026-04-09 09:37:41
55年授銜,當(dāng)主席看到名單中有個(gè)熟悉的名字,大筆一揮:他不是少將

55年授銜,當(dāng)主席看到名單中有個(gè)熟悉的名字,大筆一揮:他不是少將

睡前講故事
2025-12-12 13:58:11
47歲女人吃嫩草后坦言:和年輕小伙子在一起半年,真的是太可怕了

47歲女人吃嫩草后坦言:和年輕小伙子在一起半年,真的是太可怕了

游戲收藏指南
2026-03-15 23:54:36
2026-04-10 03:35:00
AI異類 incentive-icons
AI異類
從硅谷到中關(guān)村,AI信息與測(cè)評(píng)
148文章數(shù) 6關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

以色列總理:同意與黎巴嫩直接談判

頭條要聞

以色列總理:同意與黎巴嫩直接談判

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場(chǎng)上

娛樂要聞

金莎官宣結(jié)婚 與老公孫丞瀟相差18歲

財(cái)經(jīng)要聞

;鹩謶伊,最糟糕的情況要來了?

汽車要聞

文飛掌舵,給神行者帶來了什么?

態(tài)度原創(chuàng)

親子
藝術(shù)
數(shù)碼
本地
公開課

親子要聞

五個(gè)月的寶寶必須學(xué)溫伯格的宇宙學(xué)才不哭

藝術(shù)要聞

戰(zhàn)亂中趕工?阿聯(lián)酋首個(gè)賭場(chǎng)度假村?,明年建成!

數(shù)碼要聞

華為多款新品在路上:Pura 90、闊折疊、AI眼鏡、平板耳機(jī)全都有

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版