国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小米發(fā)了個(gè) 310B:性能不一定最強(qiáng),但路線很現(xiàn)實(shí)

0
分享至

今天我有一個(gè)考試,考試前的半個(gè)小時(shí)刷twitter,看到了小米發(fā)布的模型,但是沒顧得上仔細(xì)看,晚上再看的時(shí)候。

覺得這貌似是前DeepSeek的核心參與者Fuli Luo,到新公司小米之后正式發(fā)布的第一條twitter,所以從含金量上來說肯定是拉滿了。


當(dāng)然事實(shí)上也的確是,從小米的huggingface上可以看到,MiMo-V2-Flash是一個(gè)單獨(dú)的系列,相比起其他系列,這個(gè)系列最大的特點(diǎn)就是大,足足有310B,而其他的都只有8B。


很明顯的,8B的模型唯一的優(yōu)勢就是速度快,但是要談到能用的程序,還遠(yuǎn)遠(yuǎn)不夠。

而310B這個(gè)量級,基本上可以說是夠用了。

為什么說是夠用呢,因?yàn)樾∶走@種公司本身就不是搞AI的,所以把AI刷到世界第一既不可能,也沒有太大的必要。

最重要的是夠用和好用,最好是能跟小米的整個(gè)硬件生態(tài)關(guān)聯(lián)上。

有些人可能會提到這不就是刷Benchmark嗎?這話怎么說的。沒有新出的大模型不刷Benchmark的,因?yàn)槿绻麤]有在benchmark上達(dá)到sota,那就根本沒有發(fā)布的意義。


其實(shí)刷benchmark也是有策略的,大多數(shù)情況就是小米這樣,拿通用的benchmark跑一遍,跑到大多數(shù)達(dá)到sota即可。

而有些公司,比如OpenAI,他們是發(fā)現(xiàn)普通的benchmark都被刷爛了,再刷也很難體現(xiàn)他們的斷崖式領(lǐng)先了,所以他們會有動力搞新的benchmark,這就是所謂的規(guī)則制定者。

所以,刷榜正常也非常的必要。

至于真實(shí)的使用性能,我覺得對于小米的模型來說,能夠?qū)崿F(xiàn)deepseek級別的理解能力,其余的都應(yīng)該放到efficient上。

而實(shí)際上小米的整個(gè)模型也是這么干的。

01

小米模型的技術(shù)策略

第一,架構(gòu)設(shè)計(jì)

5層Sliding Window Attenion(SWA)+1層Global Attention(GA),然后重復(fù)8次,可以大多數(shù)的層都很省,只有1/9的層在做大批量運(yùn)算。



但SWA的窗口很小,所以出現(xiàn)attention sink,看起來MiMO專門在這個(gè)地方打了補(bǔ)丁。

第二,Lightweight Multi-Token Prediction(MTP):輕量多 token 預(yù)測

傳統(tǒng)的大模型一個(gè)token一個(gè)token的吐,慢和貴,一次性吐好幾個(gè)肯定快,但是穩(wěn)定性就很難說了。

它這里提到的Speculative Decoding(投機(jī)解碼),就是用一個(gè)小模型先“草擬一串 token”,大模型再驗(yàn)證/修正。

看起來MiMO模型原生的集成了這個(gè)模塊,讓大模型自己在一步里“預(yù)測多個(gè)未來 token”,而不是傳統(tǒng)的另外訓(xùn)練一個(gè)“草稿模型”。

基本上就是用hybrid attention(SWA +GA) + MTP這倆工具把“長上下文 + 推理速度”這兩大痛點(diǎn)壓下去(省顯存、省算力、輸出更快),打造出了這一款最新的國產(chǎn)大模型。

速度肯定是快,因?yàn)楹芏嗲伤级加迷诹怂俣群托噬稀?/p>

但是天下沒有免費(fèi)的午餐。

性能肯定不會拔尖,但是我覺得對于小米來說關(guān)系不大,快和能用比較重要。

02

小米模型的性能優(yōu)化

在性能上,看起來小米干了三件事:

Multi-Teacher On-Policy Distillation (MOPD)

第一個(gè)很有意思,最近看了一個(gè)帖子,說是的2025年最流行的Policy Optimization algorithms,看起來小米自己也做了一個(gè)MOPD,不過好不好用現(xiàn)在還很難說,過幾個(gè)月看有多少人用就知道了。

PPO (Proximal Policy Optimization)

GRPO (Group Relative)

GSPO (Group Sequence)

DAPO (Decoupled Clip and Dynamic sAmpling)

BAPO (BAlanced)

ARPO (Agentic Reinforced)

Scaling Agentic RL

第二個(gè),Scaling Agentic RL

我覺得這應(yīng)該是小米的強(qiáng)項(xiàng),因?yàn)樗男∶咨鷳B(tài)里面有太多的任務(wù)可以拿來測試了,甚至這應(yīng)該是小米未來最強(qiáng)的點(diǎn)。

就跟Nano Banana之于Google一樣,人家的強(qiáng)項(xiàng)就是數(shù)據(jù),OpenAI的圖像生成你再怎么搞也不可能老大。

而小米的優(yōu)勢就是硬件生態(tài),甚至說能搞出豆包AI手機(jī)一樣的東西也不是不可能。

Advanced RL Infrastructure

第三個(gè),Advanced RL Infrastructure

講的是大規(guī)模訓(xùn)練時(shí)候的細(xì)節(jié)問題,本質(zhì)上就是“你論文里寫一句話,工程上要填一萬個(gè)坑”的那種東西:MoE 的路由一致性、rollout 和訓(xùn)練對齊、前綴緩存、多輪工具調(diào)用的資源調(diào)度、長尾任務(wù)拖慢 GPU 利用率,都是這種體系一旦做大就繞不開的臟活累活。

這部分一般不太容易刷出一個(gè)“新算法名字”,但反而最能體現(xiàn)一個(gè)團(tuán)隊(duì)到底有沒有真把系統(tǒng)跑起來。

所以我對 MiMo-V2-Flash 的整體判斷很簡單:它不是那種要拿第一名的模型,而是那種“為了能落地、能跑得快、能接得上產(chǎn)品”而做出來的模型。

如果小米接下來能把它真正放進(jìn)自己的硬件生態(tài)里,讓它變成一個(gè)穩(wěn)定可用的能力層(而不是停留在論文和榜單里),那它的意義會比單純刷幾個(gè)分大得多。

至于它最后能走多遠(yuǎn),其實(shí)就看兩件事:

第一,有多少開發(fā)者愿意用它、圍繞它做應(yīng)用。

第二,小米能不能把“模型”變成“系統(tǒng)能力”,從手機(jī)到家電到車機(jī),真正連成一條鏈。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
小米也漲價(jià)了!內(nèi)存壓力傳導(dǎo)至手機(jī)廠商,業(yè)界稱終端再不漲明年必定虧損

小米也漲價(jià)了!內(nèi)存壓力傳導(dǎo)至手機(jī)廠商,業(yè)界稱終端再不漲明年必定虧損

澎湃新聞
2025-12-26 20:22:27
3-0,40歲C羅騰空轉(zhuǎn)體180度:雙響+無敵腳后跟破門+率隊(duì)10連勝領(lǐng)跑

3-0,40歲C羅騰空轉(zhuǎn)體180度:雙響+無敵腳后跟破門+率隊(duì)10連勝領(lǐng)跑

側(cè)身凌空斬
2025-12-28 00:46:09
利物浦淚奔!1.36億水貨斬首球+獲MVP 炸裂7次過人 3送妙傳遭吐餅

利物浦淚奔!1.36億水貨斬首球+獲MVP 炸裂7次過人 3送妙傳遭吐餅

我愛英超
2025-12-28 01:25:30
中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

回旋鏢
2025-12-27 19:14:15
貝克漢姆26歲長子跟富豪岳父拍全家福,抱嬌妻很滿足,與父母斷聯(lián)

貝克漢姆26歲長子跟富豪岳父拍全家福,抱嬌妻很滿足,與父母斷聯(lián)

譯言
2025-12-27 09:33:47
比韓建林還硬!徐湖平大靠山,竟是江蘇“一把手”,父親的老戰(zhàn)友

比韓建林還硬!徐湖平大靠山,竟是江蘇“一把手”,父親的老戰(zhàn)友

阿天愛旅行
2025-12-28 00:49:02
一新能源汽車高速上電量耗盡,2人慢車道上推車被撞身亡,距服務(wù)區(qū)約500米

一新能源汽車高速上電量耗盡,2人慢車道上推車被撞身亡,距服務(wù)區(qū)約500米

臺州交通廣播
2025-12-27 09:15:55
律師全部失業(yè)!佛山一律所被吊銷執(zhí)照,起因是非法“購買案源”…

律師全部失業(yè)!佛山一律所被吊銷執(zhí)照,起因是非法“購買案源”…

火山詩話
2025-12-27 14:50:55
金燦榮與“聽風(fēng)的蠶”首次同框,開聊中美關(guān)系

金燦榮與“聽風(fēng)的蠶”首次同框,開聊中美關(guān)系

大象新聞
2025-12-26 12:41:08
終于明白了!為啥農(nóng)民寧愿斷繳醫(yī)保,也不愿再掏這400塊錢?

終于明白了!為啥農(nóng)民寧愿斷繳醫(yī)保,也不愿再掏這400塊錢?

復(fù)轉(zhuǎn)這些年
2025-12-25 23:30:29
他們吸過毒,曾經(jīng)是“爛人”,想要個(gè)機(jī)會

他們吸過毒,曾經(jīng)是“爛人”,想要個(gè)機(jī)會

大風(fēng)新聞
2025-12-27 15:04:03
全線暴漲、斷貨限購!有人一覺醒來賺18萬,有人后悔搶少了!史詩級行情來了?

全線暴漲、斷貨限購!有人一覺醒來賺18萬,有人后悔搶少了!史詩級行情來了?

新民晚報(bào)
2025-12-27 21:53:15
銀行女經(jīng)理挪用12個(gè)儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

銀行女經(jīng)理挪用12個(gè)儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

觀世記
2025-12-27 15:02:35
中新網(wǎng)報(bào)道:中國赴柬埔寨游客增長43.5%,你會去俄、柬旅游嗎?

中新網(wǎng)報(bào)道:中國赴柬埔寨游客增長43.5%,你會去俄、柬旅游嗎?

名人茍或
2025-12-27 06:04:21
“萬稅之國”加拿大被冤枉了?實(shí)際稅負(fù)比例竟然比中國還要低

“萬稅之國”加拿大被冤枉了?實(shí)際稅負(fù)比例竟然比中國還要低

回旋鏢
2025-12-27 13:46:40
老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報(bào): 已刑拘

老人被城管推翻后續(xù)!老人去世,其單位受牽連,警方通報(bào): 已刑拘

社會日日鮮
2025-12-27 05:29:43
交警私下透露:車險(xiǎn)別買全險(xiǎn),只買這2樣,每年白省2000塊

交警私下透露:車險(xiǎn)別買全險(xiǎn),只買這2樣,每年白省2000塊

老特有話說
2025-12-27 14:45:28
林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

千言娛樂記
2025-12-27 20:07:06
南博前院長被帶走不到12小時(shí),令人"厭惡"的事發(fā)生了,不止一件

南博前院長被帶走不到12小時(shí),令人"厭惡"的事發(fā)生了,不止一件

社會日日鮮
2025-12-26 11:09:21
我發(fā)現(xiàn),80%的中產(chǎn)還沒意識到降息的嚴(yán)重性。

我發(fā)現(xiàn),80%的中產(chǎn)還沒意識到降息的嚴(yán)重性。

流蘇晚晴
2025-12-27 17:34:29
2025-12-28 07:48:49
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

山西大同一小區(qū)物業(yè)禁止新能源車進(jìn)入地庫:擔(dān)心自燃

頭條要聞

山西大同一小區(qū)物業(yè)禁止新能源車進(jìn)入地庫:擔(dān)心自燃

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

家居
數(shù)碼
健康
教育
時(shí)尚

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

數(shù)碼要聞

2025全球智能手表出貨量預(yù)計(jì)回暖 重回增長軌道

這些新療法,讓化療不再那么痛苦

教育要聞

劉嘉教授:教貧窮的人有自尊會刺傷對方

穿好雪地靴的4個(gè)訣竅,還挺有效!

無障礙瀏覽 進(jìn)入關(guān)懷版