国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小米突然發(fā)布新模型:媲美 DeepSeek-V3.2,把手機(jī)的性價比卷到 AI

0
分享至

開源模型再次迎來一位重磅選手,就在剛剛,小米正式發(fā)布并開源新模型 MiMo-V2-Flash。

MiMo-V2-Flash 總參數(shù)3090億,活躍參數(shù)150億,采用專家混合架構(gòu) (MoE),性能還能和 DeepSeek-V3.2、Kimi-K2這些頭部開源模型掰 掰 手腕。


此外,MiMo-V2-Flash 采用 MIT 開源協(xié)議,基礎(chǔ)版權(quán)重也已經(jīng)在 Hugging Face 上發(fā)布。


當(dāng)然,除去「開源」這一標(biāo)簽,新模型真正的殺手锏在于架構(gòu)設(shè)計(jì)上的激進(jìn)創(chuàng)新,把推理速度拉到了150 tokens/秒,成本壓到了每百萬 token 輸入0.1美元、輸出0.3美元,主打一個超絕性價比。


此外 ,根據(jù)官方體驗(yàn)頁面信息,MiMo-V2-Flash 還支持深度思考和聯(lián)網(wǎng)搜索功能, 既能對話聊天,也能在需要實(shí)時數(shù)據(jù)、最新動態(tài)或資料核對的場景里派上用場。


附上 AI Studio 體驗(yàn)地址:

http://aistudio.xiaomimimo.com

開源模型新標(biāo)桿, MiMo-V2-Flash 跑分全線開花

先來看看 MiMo-V2-Flash 的跑分。

基準(zhǔn)測試成績顯示,AIME 2025數(shù)學(xué)競賽和 GPQA-Diamond 科學(xué)知識測試中,MiMo-V2-Flash 都排在開源模型前兩名。

編程能力更是亮眼,SWE-bench Verified 得分73.4%,超越所有開源模型,直逼 GPT-5-High。而這個測試是讓 AI 去修真實(shí)世界的軟件 bug,73.4% 的成功率也意味著它能搞定大部分實(shí)際編程問題。


在多語言編程基準(zhǔn)測試 SWE-Bench Multilingual 里,MiMo-V2-Flash 的解決率為71.7%。

轉(zhuǎn)看智能體任務(wù),MiMo-V2-Flash 在τ2-Bench 分類得分中,通信類95.3分,零售類79.5分,航空類66.0分,BrowseComp 搜索代理得分45.4,啟用上下文管理后直接飆到58.3。


這些數(shù)據(jù)說明,MiMo-V2-Flash 不僅會寫代碼,還能真正理解復(fù)雜任務(wù)邏輯,執(zhí)行多輪智能體交互。

更重要的是,寫作質(zhì)量也接近頂級閉源模型,這意味著 MiMo-V2-Flash 不只是個工具,還能當(dāng)個靠譜的日常助手。

MiMo-V2-Flash 在保持長文本性能的同時,還降低了成本,究其原因,離不開兩項(xiàng)核心技術(shù)創(chuàng)新。

混合滑動窗口注意力機(jī)制:傳統(tǒng)大模型處理長文本時,全局注意力機(jī)制會導(dǎo)致計(jì)算量二次爆炸,存儲中間結(jié)果的 KV 緩存也跟著飆升。

小米這次采用了5比1的激進(jìn)比例,5層滑動窗口注意力搭配1層全局注意力交替使用,滑動窗口只看128個 token。

這種設(shè)計(jì)讓 KV 緩存存儲量直接減少了近6倍,但長文本能力卻沒打折扣,最長支持256k 上下文窗口。


且模型即使在這么激進(jìn)的窗口設(shè)置下,照樣能穩(wěn)住長文本性能。

對此, 羅福莉在社交平臺上特別指出一個反直覺的發(fā)現(xiàn):窗口大小128是「最佳甜點(diǎn)值」。實(shí)驗(yàn)證明,盲目擴(kuò)大窗口(如增至512)反而會導(dǎo)致性能下降。同時她強(qiáng)調(diào),在實(shí)施該機(jī)制時,sink values 是維持性能的關(guān)鍵,絕不可省略。


另一個黑科技是輕量級多 Token 預(yù)測 (MTP)。

傳統(tǒng)模型生成文本時一次只能吐一個 token,就像打字員一個字一個字敲。MiMo-V2-Flash 通過原生集成的 MTP 模塊,能并行預(yù)測多個 token,一次性猜出接下來好幾個 token。

實(shí)測平均能接受2.8到3.6個 token,推理速度直接提升2到2.6倍,不僅在推理時管用,訓(xùn)練階段也能加速采樣,減少 GPU 空轉(zhuǎn),屬于一箭雙雕。


羅福莉提到,在三層 MTP 設(shè)置下,他們觀察到平均接受長度超過3,編碼任務(wù)速度提升約2.5倍。它有效解決了小批量 On-Policy 強(qiáng)化學(xué)習(xí)中「長尾樣本」帶來的 GPU 空閑時間浪費(fèi)問題。

啥叫長尾樣本?就是那些特別難、特別慢的任務(wù),拖著其他任務(wù)一起等,GPU 就在那干瞪眼。MTP 把這個問題給解了,極大提高了效率。

不過羅福莉也坦誠,這次因?yàn)闀r間緊迫沒能把 MTP 完整集成進(jìn) RL 訓(xùn)練循環(huán),但它與該流程高度契合。小米已經(jīng)把三層 MTP 開源了,方便大家在自己的項(xiàng)目中使用與開發(fā)。

算力只用1/50,性能如何不打折?

預(yù)訓(xùn)練階段,新模型使用 FP8混合精度,在27萬億 token 數(shù)據(jù)上完成訓(xùn)練,原生支持32k 序列長度。

FP8混合精度是一種壓縮數(shù)值表示的技術(shù),能在保持精度的同時減少顯存占用和加速訓(xùn)練。這種訓(xùn)練方式在業(yè)界并不常見,需要對底層框架進(jìn)行深度優(yōu)化。

而在后訓(xùn)練階段,小米整了個大活,提出了多教師在線策略蒸餾 (MOPD)。

傳統(tǒng)的監(jiān)督微調(diào)加強(qiáng)化學(xué)習(xí)管線,不僅訓(xùn)練不穩(wěn)定,算力消耗還賊高。MOPD 的思路是讓學(xué)生模型在自己的策略分布上采樣,然后由多個專家教師在每個 token 位置提供密集的獎勵信號。

通俗點(diǎn)說就是,學(xué)生模型自己寫作業(yè),老師在每個字上都給評分,不用等寫完整篇才打分。這樣一來,學(xué)生模型能快速從教師那里學(xué)到精髓,而且訓(xùn)練過程穩(wěn)定得多。

最夸張的是效率提升,MOPD 只需要傳統(tǒng)方法1/50的算力,就能讓學(xué)生模型達(dá)到教師性能峰值。這意味著小米能用更少的資源,更快地迭代模型。

而且 MOPD 支持靈活接入新教師,學(xué)生模型成長后還能反過來當(dāng)教師,形成「教與學(xué)」的閉環(huán)自我進(jìn)化。今天的學(xué)生,明天的老師,后天又能教出更強(qiáng)的學(xué)生,套娃玩法屬實(shí)有點(diǎn)東西。

用羅福莉的話來說,他們借鑒 Thinking Machine 的 On-Policy Distillation 方法,將多個強(qiáng)化學(xué)習(xí)模型進(jìn)行融合,結(jié)果帶來了驚人的效率提升。這為構(gòu)建一個自我強(qiáng)化循環(huán)系統(tǒng)奠定了基礎(chǔ),學(xué)生模型可以逐步進(jìn)化,最終成為更強(qiáng)的教師模型。


在智能體強(qiáng)化學(xué)習(xí)擴(kuò)展上,小米 MiMo-V2-Flash 研究團(tuán)隊(duì)基于真實(shí) GitHub issue 構(gòu)建了超過10萬個可驗(yàn)證任務(wù),自動化流水線跑在 Kubernetes 集群上,并發(fā)能開10000多個 Pod,環(huán)境部署成功率70%。

針對網(wǎng)頁開發(fā)任務(wù),還專門搞了個多模態(tài)驗(yàn)證器,通過錄制視頻而非靜態(tài)截圖來驗(yàn)證代碼執(zhí)行結(jié)果,直接減少視覺幻覺,確保功能正確。

對于開發(fā)者而言,MiMo-V2-Flash 能與 Claude Code、Cursor、Cline 等主流開發(fā)環(huán)境無縫配合,256k 的超長上下文窗口支持?jǐn)?shù)百輪智能體交互與工具調(diào)用。

256k 是什么概念? 大概相當(dāng)于一本中等篇幅的小說,或者幾十頁技術(shù)文檔。這意味著開發(fā)者可以把 MiMo-V2-Flash 直接融入現(xiàn)有工作流,不需要額外適配,拿來就用。

小米還把所有推理代碼貢獻(xiàn)給了 SGLang,并在 LMSYS 博客分享了推理優(yōu)化經(jīng)驗(yàn)。

技術(shù)報(bào)告公開了完整模型細(xì)節(jié),模型權(quán)重 (包括 MiMo-V2-Flash-Base) 在 Hugging Face 上以 MIT 許可協(xié)議發(fā)布。這種全面開源的態(tài)度,在國內(nèi)大廠里屬實(shí)少見。

目前 MiMo-V2-Flash 已經(jīng)在 API Platform 限時免費(fèi)開放,開發(fā)者可以直接上手體驗(yàn)。


小米的 AI 野心,不止于手機(jī)助手

MiMo-V2-Flash 的發(fā)布,標(biāo)志著小米在 AI 賽道上的全面發(fā)力。

羅福莉在社交平臺上透露了更多信息,「MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖上的第二步?!沟诙骄鸵呀?jīng)這么猛了,那后面還有啥大招?想想就有點(diǎn)期待。

當(dāng)然,小米在技術(shù)報(bào)告中也坦誠,MiMo-V2-Flash 與最強(qiáng)的閉源模型相比仍有差距。但他們的計(jì)劃很明確,通過擴(kuò)大模型規(guī)模與訓(xùn)練算力來縮小差距,同時繼續(xù)探索更穩(wěn)健、更高效的智能體架構(gòu)。


MOPD 框架下教師模型與學(xué)生模型的迭代共進(jìn)化,也為未來的能力提升留足了空間。

把視角拉高來看,背后是小米對整個 AI 生態(tài)的一次戰(zhàn)略押注。手機(jī)、IoT、汽車,小米的硬件生態(tài)需要一個強(qiáng)大的 AI 底座,MiMo-V2-Flash 顯然就是小米為全硬件生態(tài)準(zhǔn)備的那塊基石。

就像十四年前小米手機(jī)用1999元重新定義了旗艦機(jī)的價格標(biāo)準(zhǔn),如今 MiMo-V2-Flash 正在用白菜價的成本、73.4% 的 SWE-Bench 得分,重新定義開源大模型的性能標(biāo)準(zhǔn)。

這一次,屬于開源模型的「小米時刻」真的來了。

HuggingFace 模型地址:
http://hf.co/XiaomiMiMo/MiMo-V2-Flash
技術(shù)報(bào)道地址:
http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
41歲朱杰參加聚會,回應(yīng)多年沒拍戲,官宣生下雙胞胎,孩子都6歲

41歲朱杰參加聚會,回應(yīng)多年沒拍戲,官宣生下雙胞胎,孩子都6歲

柒佰娛
2026-01-04 20:13:51
果然不出所料,委代總統(tǒng)通告全球,邀美國共治,我們都被“?!绷?>
    </a>
        <h3>
      <a href=果然不出所料,委代總統(tǒng)通告全球,邀美國共治,我們都被“耍”了 知法而形
2026-01-05 11:59:29
紀(jì)實(shí):浙江女教師突然失蹤6年,13歲兒子憑借一個夢找到母親

紀(jì)實(shí):浙江女教師突然失蹤6年,13歲兒子憑借一個夢找到母親

紅豆講堂
2024-10-25 09:45:59
印度邀請中國參會,AI峰會背后的政治博弈

印度邀請中國參會,AI峰會背后的政治博弈

陸棄
2026-01-04 10:45:00
建議中國普通家庭“全面壓縮教育成本”:不要焦慮,不要逼孩子

建議中國普通家庭“全面壓縮教育成本”:不要焦慮,不要逼孩子

六子吃涼粉
2026-01-05 09:51:11
教育部下了硬指令,私立幼兒園老板們慌了,估計(jì)吃安眠藥都睡不著

教育部下了硬指令,私立幼兒園老板們慌了,估計(jì)吃安眠藥都睡不著

今朝牛馬
2026-01-02 21:04:49
這應(yīng)該是目前世界上最美的女總統(tǒng)了。

這應(yīng)該是目前世界上最美的女總統(tǒng)了。

南權(quán)先生
2026-01-03 17:05:59
奧運(yùn)冠軍管晨辰出演短劇,本人發(fā)文:能夠拿捏

奧運(yùn)冠軍管晨辰出演短劇,本人發(fā)文:能夠拿捏

紅星新聞
2026-01-04 19:22:21
16GB+1TB!新機(jī)曝光:搭載天璣9500++7000mAh!

16GB+1TB!新機(jī)曝光:搭載天璣9500++7000mAh!

科技堡壘
2026-01-05 11:53:48
特朗普政府施壓石油巨頭:若想追回欠款,必須大舉投資委內(nèi)瑞拉!

特朗普政府施壓石油巨頭:若想追回欠款,必須大舉投資委內(nèi)瑞拉!

財(cái)聯(lián)社
2026-01-05 08:44:04
240萬合同!爭議言論,成都簽約張本兄妹,如今該如何收場?

240萬合同!爭議言論,成都簽約張本兄妹,如今該如何收場?

卿子書
2026-01-05 08:46:57
留給大清的時間,真的不多了

留給大清的時間,真的不多了

我是歷史其實(shí)挺有趣
2026-01-03 08:50:37
趙本山承諾將房子過戶,何樹成開直播慶祝:就讓你以后更膈應(yīng)我

趙本山承諾將房子過戶,何樹成開直播慶祝:就讓你以后更膈應(yīng)我

娛說瑜悅
2026-01-04 13:26:48
員工節(jié)假日嫖娼遭行政拘留,隱瞞7年后被銀行發(fā)現(xiàn)并辭退!男子不服官司一路打到高院,法院:辭退決定合法有效

員工節(jié)假日嫖娼遭行政拘留,隱瞞7年后被銀行發(fā)現(xiàn)并辭退!男子不服官司一路打到高院,法院:辭退決定合法有效

揚(yáng)子晚報(bào)
2026-01-04 17:30:03
蘋果20款新品提前曝光,把網(wǎng)友都看呆了!

蘋果20款新品提前曝光,把網(wǎng)友都看呆了!

科技堡壘
2026-01-04 11:42:42
世體:瓦倫西亞女足B隊(duì)主帥馬丁的遺體已找到,其孩子仍失蹤

世體:瓦倫西亞女足B隊(duì)主帥馬丁的遺體已找到,其孩子仍失蹤

懂球帝
2026-01-04 18:06:12
馬杜羅被抓真相

馬杜羅被抓真相

藍(lán)鉆故事
2026-01-04 04:34:25
維爾茨:我以為自己越位了,所以我進(jìn)球后都沒慶祝

維爾茨:我以為自己越位了,所以我進(jìn)球后都沒慶祝

體壇周報(bào)
2026-01-05 11:38:15
抓獲馬杜羅的美軍三角洲部隊(duì)什么來頭?主要執(zhí)行突襲、抓捕、營救人質(zhì)等短期、小規(guī)模高強(qiáng)度作戰(zhàn)任務(wù),組織架構(gòu)、人員等信息屬絕密

抓獲馬杜羅的美軍三角洲部隊(duì)什么來頭?主要執(zhí)行突襲、抓捕、營救人質(zhì)等短期、小規(guī)模高強(qiáng)度作戰(zhàn)任務(wù),組織架構(gòu)、人員等信息屬絕密

揚(yáng)子晚報(bào)
2026-01-04 17:45:18
大陸公布沈伯洋住家衛(wèi)星照,賴清德急了,沈伯洋沉默,不簡單

大陸公布沈伯洋住家衛(wèi)星照,賴清德急了,沈伯洋沉默,不簡單

落梅如雪亂飛
2026-01-05 02:45:18
2026-01-05 12:40:49
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
5988文章數(shù) 26739關(guān)注度
往期回顧 全部

科技要聞

雷軍新年首播:確認(rèn)汽車業(yè)務(wù)降速

頭條要聞

媒體:美國捉拿馬杜羅后 多位專家示警賴清德

頭條要聞

媒體:美國捉拿馬杜羅后 多位專家示警賴清德

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎臺憶往昔

財(cái)經(jīng)要聞

李迅雷:擴(kuò)內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車要聞

不是9S是8X!極氪全新高性能旗艦SUV命名官宣

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
手機(jī)
旅游
公開課

房產(chǎn)要聞

再次登頂海南樓市!超越阿那亞的,只有阿那亞!

數(shù)碼要聞

REDMI Turbo 5系列官宣本月見:首次推出Turbo 5 Max!

手機(jī)要聞

聯(lián)想moto X70 Air Pro新機(jī)配置曝光:搭載第五代驍龍8,支持手寫筆

旅游要聞

烏拉圭記者感嘆:中國旅游勝地令人心馳神往

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版