国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

MiniMax發(fā)布M2.1大語言模型,大幅提升多語言編程能力

0
分享至


中國(guó)人工智能初創(chuàng)公司MiniMax今日宣布發(fā)布M2.1模型,在現(xiàn)實(shí)世界復(fù)雜任務(wù)和智能體能力方面實(shí)現(xiàn)顯著性能提升,支持更多編程語言和辦公場(chǎng)景。

M2.1的核心亮點(diǎn)

M2.1的關(guān)鍵亮點(diǎn)包括在多種編程語言方面的編程技能大幅增強(qiáng),涵蓋Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript和JavaScript等。在美學(xué)設(shè)計(jì)能力以及Web、Android和iOS用戶界面開發(fā)理解能力方面實(shí)現(xiàn)跳躍式提升。

M2.1相較于M2升級(jí)了系統(tǒng)性問題解決能力,不僅關(guān)注代碼執(zhí)行正確性,還注重遵循包含附加或復(fù)雜指導(dǎo)的指令。公司表示,這在真實(shí)辦公環(huán)境中提供了更高的可用性,即使是簡(jiǎn)單的規(guī)則也可能包含復(fù)雜的細(xì)微差別。

為實(shí)現(xiàn)這一目標(biāo),公司不僅強(qiáng)調(diào)出色的編程能力,還增強(qiáng)了對(duì)話和寫作技能。該模型在日常對(duì)話、技術(shù)文檔編寫以及提供結(jié)構(gòu)化響應(yīng)方面表現(xiàn)出色。

開源智能體AI編碼代理公司Kilo Code Inc.的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Scott Breitenother表示:"我們的用戶已經(jīng)開始依賴MiniMax提供前沿級(jí)編程輔助,成本僅為同類產(chǎn)品的一小部分。早期測(cè)試顯示,M2.1在從架構(gòu)編排到代碼審查和部署的各個(gè)方面都表現(xiàn)出色。"

性能評(píng)估與基準(zhǔn)測(cè)試

MiniMax M2于今年10月底發(fā)布。公司表示,M2.1相比其前身在能力方面表現(xiàn)出顯著改進(jìn),特別是在多語言場(chǎng)景中。在這方面,它的表現(xiàn)超越了Anthropic公司的Claude Sonnet 4.5,接近Claude Opus 4.5(更大、更復(fù)雜的模型)。

作為評(píng)估的一部分,MiniMax建立了一個(gè)新的基準(zhǔn):VIBE(視覺交互執(zhí)行基準(zhǔn))。該測(cè)試套件涵蓋五個(gè)核心能力:Web、仿真、Android、iOS和后端開發(fā)。與其他基準(zhǔn)不同,VIBE采用智能體驗(yàn)證者語言配置。這使其能夠評(píng)估生成應(yīng)用程序的交互邏輯和視覺美學(xué)。

M2.1在VIBE基準(zhǔn)測(cè)試中表現(xiàn)出公司所稱的"杰出性能",平均得分達(dá)到88.6分。它在VIBE-Web和VIBE-Android子集中表現(xiàn)特別出色,分別獲得91.5分和89.7分。

公司還針對(duì)Anthropic、谷歌、OpenAI和DeepSeek等大廠商,在編程和知識(shí)的綜合行業(yè)基準(zhǔn)測(cè)試中對(duì)新模型進(jìn)行了測(cè)試,包括MMLU-Pro、人類最后考試和Toolathon(針對(duì)AI智能體)等。

該模型在智能體工具使用、現(xiàn)實(shí)世界知識(shí)和復(fù)雜問題解決能力方面表現(xiàn)出一致的高性能。在HLE無工具測(cè)試中獲得22.0分,這是一個(gè)具有挑戰(zhàn)性的學(xué)術(shù)基準(zhǔn),包含數(shù)千個(gè)涵蓋不同學(xué)科的研究生級(jí)別多模態(tài)問題。在同樣綜合的學(xué)科知識(shí)基準(zhǔn)MMLU上,該模型得分88分,與前沿模型相當(dāng)或緊隨其后。

該模型可通過MiniMax的應(yīng)用程序接口獲得,或從HuggingFace下載開放權(quán)重版本。目前頁(yè)面尚未開放。公司的旗艦服務(wù)MiniMax Agent基于新的MiniMax-2.1構(gòu)建。

Q&A

Q1:MiniMax M2.1模型支持哪些編程語言?

A:MiniMax M2.1支持多種主流編程語言,包括Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript和JavaScript等,在這些語言的編程技能方面實(shí)現(xiàn)了大幅增強(qiáng)。

Q2:VIBE基準(zhǔn)測(cè)試是什么?它如何評(píng)估模型性能?

A:VIBE是MiniMax建立的視覺交互執(zhí)行基準(zhǔn),涵蓋Web、仿真、Android、iOS和后端開發(fā)五個(gè)核心能力。它采用智能體驗(yàn)證者語言配置,能夠評(píng)估生成應(yīng)用程序的交互邏輯和視覺美學(xué),M2.1在此基準(zhǔn)上獲得88.6分的平均成績(jī)。

Q3:MiniMax M2.1與其他主流AI模型相比表現(xiàn)如何?

A:在多語言場(chǎng)景中,M2.1超越了Claude Sonnet 4.5,接近Claude Opus 4.5的性能。在MMLU基準(zhǔn)測(cè)試中獲得88分,與Anthropic、谷歌、OpenAI等公司的前沿模型相當(dāng)或緊隨其后。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
許光達(dá)愧受大將軍銜,他對(duì)賀老總說:段師長(zhǎng)才是實(shí)至名歸的大將

許光達(dá)愧受大將軍銜,他對(duì)賀老總說:段師長(zhǎng)才是實(shí)至名歸的大將

健康快樂丁
2026-01-01 19:11:26
我是河南人,從臺(tái)灣回來,實(shí)在忍不住想說:臺(tái)灣給我的5點(diǎn)印象

我是河南人,從臺(tái)灣回來,實(shí)在忍不住想說:臺(tái)灣給我的5點(diǎn)印象

i書與房
2026-01-01 16:58:55
僅12天丟掉冠軍,《阿凡達(dá)3》被黃曉明打敗,210億票房夢(mèng)徹底碎了

僅12天丟掉冠軍,《阿凡達(dá)3》被黃曉明打敗,210億票房夢(mèng)徹底碎了

影視高原說
2026-01-01 09:21:50
2026年開始,為什么建議大家盡量使用現(xiàn)金支付,原因很現(xiàn)實(shí)

2026年開始,為什么建議大家盡量使用現(xiàn)金支付,原因很現(xiàn)實(shí)

李博世財(cái)經(jīng)
2026-01-01 17:03:43
美國(guó)提醒日本,小心被中國(guó)揍!日本天皇急召高市早苗:有要事交代

美國(guó)提醒日本,小心被中國(guó)揍!日本天皇急召高市早苗:有要事交代

興史興談
2025-12-31 18:51:20
房貸利率1月1日起下調(diào)

房貸利率1月1日起下調(diào)

財(cái)聞
2026-01-01 15:17:51
停工450天,訂單銳減40%!外資集體“大撤離”,世界工廠時(shí)代結(jié)束了?

停工450天,訂單銳減40%!外資集體“大撤離”,世界工廠時(shí)代結(jié)束了?

劉曠
2026-01-01 20:01:47
小米 17 Ultra的最強(qiáng)賣點(diǎn),卻成了用戶退貨的理由

小米 17 Ultra的最強(qiáng)賣點(diǎn),卻成了用戶退貨的理由

藍(lán)字計(jì)劃
2025-12-31 16:28:39
最低溫-11℃!小雪局部中雪、小雨或雨夾雪,陣風(fēng)7~8級(jí),山東最新元旦假期天氣→

最低溫-11℃!小雪局部中雪、小雨或雨夾雪,陣風(fēng)7~8級(jí),山東最新元旦假期天氣→

魯中晨報(bào)
2026-01-01 16:25:12
摔毛巾+提前離場(chǎng)!名嘴炮轟華子無領(lǐng)袖擔(dān)當(dāng) 狼媒卻直指管理層摳門

摔毛巾+提前離場(chǎng)!名嘴炮轟華子無領(lǐng)袖擔(dān)當(dāng) 狼媒卻直指管理層摳門

顏小白的籃球夢(mèng)
2026-01-01 19:04:23
CBA最新消息!廣東男籃又傷主力,遼寧無換外援計(jì)劃 新疆官宣裁員

CBA最新消息!廣東男籃又傷主力,遼寧無換外援計(jì)劃 新疆官宣裁員

中國(guó)籃壇快訊
2026-01-01 15:51:34
喜訊!國(guó)足最強(qiáng)歸化來了?當(dāng)事人親承確有其事,單賽季21球7助攻

喜訊!國(guó)足最強(qiáng)歸化來了?當(dāng)事人親承確有其事,單賽季21球7助攻

羅掌柜體育
2026-01-01 10:38:06
馬克龍:將確保法國(guó)總統(tǒng) 選舉不受外國(guó)干預(yù)

馬克龍:將確保法國(guó)總統(tǒng) 選舉不受外國(guó)干預(yù)

每日經(jīng)濟(jì)新聞
2026-01-01 09:47:14
一九七六年元旦社論 1976年1月1日《人民日?qǐng)?bào)》

一九七六年元旦社論 1976年1月1日《人民日?qǐng)?bào)》

那些看得見的老照片
2026-01-01 16:37:37
深夜!茅臺(tái)放大招:1499買飛天,每人每日限購(gòu)12瓶!

深夜!茅臺(tái)放大招:1499買飛天,每人每日限購(gòu)12瓶!

中國(guó)基金報(bào)
2026-01-01 00:13:38
劉伯承逝世后,有人建議照顧其后人,鄧小平當(dāng)即拒絕:我們不能幫

劉伯承逝世后,有人建議照顧其后人,鄧小平當(dāng)即拒絕:我們不能幫

歷史龍?jiān)w
2025-12-30 13:35:08
國(guó)乒傳喜訊!24歲主力戀情曝光,女友是日本主力,跨國(guó)戀情引熱議

國(guó)乒傳喜訊!24歲主力戀情曝光,女友是日本主力,跨國(guó)戀情引熱議

體育就你秀
2026-01-01 09:17:30
給2025最好的10部國(guó)產(chǎn)劇排名:《生萬物》僅排第2,第1名沒有爭(zhēng)議

給2025最好的10部國(guó)產(chǎn)劇排名:《生萬物》僅排第2,第1名沒有爭(zhēng)議

小老頭奇聞
2026-01-01 19:28:01
朱元璋逃難到寡婦家,臨走前寡婦害怕懷孕,朱元璋的做法令人敬佩

朱元璋逃難到寡婦家,臨走前寡婦害怕懷孕,朱元璋的做法令人敬佩

銘記歷史呀
2025-12-29 02:30:03
2025年有一種痛苦叫搬進(jìn)了“大平層”,不好住不好賣,已淪不動(dòng)產(chǎn)

2025年有一種痛苦叫搬進(jìn)了“大平層”,不好住不好賣,已淪不動(dòng)產(chǎn)

巢客HOME
2025-12-25 07:25:03
2026-01-01 20:48:49
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
896文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

特斯拉Model 3車主首度全程自駕橫穿美國(guó)

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

體育要聞

2026,這些英超紀(jì)錄可能會(huì)被打破

娛樂要聞

跨年零點(diǎn)時(shí)刻好精彩!何炅飛奔擁抱

財(cái)經(jīng)要聞

巴菲特「身退,權(quán)還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

家居
旅游
藝術(shù)
房產(chǎn)
健康

家居要聞

無形有行 自然與靈感詩(shī)意

旅游要聞

黑龍江方正:360°玩轉(zhuǎn)冰雪

藝術(shù)要聞

投資40億!湖南郴州最大的爛尾商場(chǎng),誰在買單?

房產(chǎn)要聞

實(shí)景暴擊!??谶@個(gè)頂流紅盤,拋出準(zhǔn)現(xiàn)房+頂級(jí)書包雙王炸!

元旦舉家出行,注意防流感

無障礙瀏覽 進(jìn)入關(guān)懷版