国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

羅福莉小米首秀直擊核心!定調(diào)下一代模型方向

0
分享至



2025年小米人車家全生態(tài)合作伙伴大會上,一個名字和一款模型同時引爆AI圈。被傳“雷軍花千萬年薪挖來”的AI大牛羅福莉,首次以小米MiMo大模型負(fù)責(zé)人的身份公開亮相,帶來了小米新一代自研大語言模型MiMo-V2-Flash——不僅性能對標(biāo)頂尖開源模型,還以“3090億總參數(shù)+150億活躍參數(shù)”的MoE架構(gòu)實現(xiàn)極致效率,更關(guān)鍵的是,它剛發(fā)布就全線開源。



在大模型賽道還在比拼“參數(shù)越大越厲害”的當(dāng)下,小米反其道而行之,用“跑得快、跑得久、被高頻調(diào)用也跑得起”的設(shè)計理念,給行業(yè)澆了一盆清醒劑。這款模型背后,既有羅福莉團(tuán)隊的技術(shù)取舍,更藏著小米對AGI(通用人工智能)的獨特思考:智能不是“讀”出來的,而是“活”出來的。

一、幕后推手:從頂會學(xué)霸到小米AI掌舵人

要理解MiMo-V2-Flash的創(chuàng)新邏輯,先得認(rèn)識它的“操盤手”羅福莉。這位北大計算機碩士出身的技術(shù)大牛,學(xué)生時代就創(chuàng)下“一次性在國際頂會ACL中標(biāo)8篇論文”的紀(jì)錄,其中2篇以第一作者身份發(fā)表,一度沖上知乎熱搜,成為AI圈公認(rèn)的“潛力股”。



畢業(yè)后,羅福莉先后加盟阿里巴巴達(dá)摩院、DeepSeek母公司幻方量化,在幻方期間深度參與了DeepSeek-V2等爆款模型的研發(fā),積累了從基礎(chǔ)研究到工程落地的全鏈條經(jīng)驗。2025年11月,她正式官宣加入小米,這次大會是她入職后的首次公開演講。



盡管略顯緊張,但羅福莉條理清晰地傳遞了核心觀點:“大模型解碼了人類思維的文本投影,卻沒真正理解物理世界”。正是這種清醒的認(rèn)知,讓MiMo-V2-Flash跳出了“參數(shù)競賽”的怪圈,走上了“實用主義”的道路。

二、技術(shù)拆解:為什么它能“又快又便宜”?

普通人可能看不懂“3090億總參數(shù)”“150億活躍參數(shù)”的差距,但只要記住一個核心:MiMo-V2-Flash用更小的“運行成本”,實現(xiàn)了和頂尖模型相當(dāng)?shù)男阅?。這背后是兩大關(guān)鍵技術(shù)的支撐:

1.MoE架構(gòu):只“點亮”需要的部分

MiMo-V2-Flash采用了當(dāng)下最先進(jìn)但工程難度極高的MoE(混合專家)架構(gòu)。簡單說,這個模型就像一個“專家團(tuán)隊”,總共有3090億個“專家”(參數(shù)),但處理任務(wù)時,只需要150億個“相關(guān)專家”上陣,其他專家可以“休息”。

這種設(shè)計的好處顯而易見:既保留了大模型的綜合能力,又大大降低了推理時的算力消耗。打個比方,這就像請了一支全能樂隊,但演出時只需要根據(jù)歌曲風(fēng)格,安排對應(yīng)的樂手上場,既保證了演出質(zhì)量,又節(jié)省了場地和設(shè)備成本。

2.MTP技術(shù):讓輸出速度“翻倍”

如果說MoE架構(gòu)解決了“輕量化”問題,那么MTP(多詞元預(yù)測)技術(shù)就解決了“速度”問題。羅福莉團(tuán)隊在預(yù)訓(xùn)練和微調(diào)階段都加入了MTP層,推理時更是采用三層MTP并行推理,讓模型輸出速度直接提升2-2.6倍。



根據(jù)社區(qū)測試數(shù)據(jù),MiMo-V2-Flash在單機環(huán)境下,每秒能處理5000-15000個token(相當(dāng)于2-7.5萬字),單請求輸出速度也能達(dá)到150token/s(約75字/秒)。對比來看,它的推理速度是DeepSeek-V3.2的3倍左右,而成本卻更低;和綜合能力相近的Gemini2.5Pro相比,成本直接低了20倍。

除此之外,小米還創(chuàng)新了HybridAttention(混合注意力)結(jié)構(gòu)和MOPD(多教師在線蒸餾)范式,前者兼顧了長短文本處理能力和推理效率,后者則讓模型在強化學(xué)習(xí)階段快速吸收多個“專家模型”的優(yōu)點,用更少的算力實現(xiàn)能力升級。

三、實測實力:在核心賽道沖進(jìn)“第一梯隊”

光有技術(shù)創(chuàng)新還不夠,模型好不好用,得用數(shù)據(jù)說話。小米官方公布了MiMo-V2-Flash在7項主流評測中的成績,對手包括開源的DeepSeek-V3.2、K2-Thinking,以及閉源的ClaudeSonnet4.5、GPT-5(High)等頂尖模型。

結(jié)果顯示,MiMo-V2-Flash在Agent(智能體)、代碼、工具調(diào)用、復(fù)雜任務(wù)執(zhí)行這四大核心場景中,已經(jīng)躋身全球第一梯隊。尤其在權(quán)威的SWE-Bench軟件工程測試中,它以71.7%的準(zhǔn)確率拿下多語言模式第一,證明了其在實際工業(yè)場景中的實用價值。



對于開發(fā)者和企業(yè)來說,這意味著什么?以前需要高昂成本才能接入的頂尖模型能力,現(xiàn)在通過開源的MiMo-V2-Flash就能免費獲得。無論是WebCoding、IDE工具集成,還是智能終端的Agent交互,都能以極低的成本實現(xiàn)高效部署。



四、行業(yè)啟示:開源+實用,小米的AGI路線圖

羅福莉在演講中反復(fù)強調(diào):“這只是我們在AGI路線圖上的第二步”。這句話的背后,是小米對AI未來的清晰判斷:

首先,大模型的競爭已經(jīng)從“預(yù)訓(xùn)練規(guī)?!鞭D(zhuǎn)向“后訓(xùn)練效率”。隨著Agent場景的普及,模型需要持續(xù)通過強化學(xué)習(xí)迭代升級,穩(wěn)定、可擴展的訓(xùn)練體系比單純的參數(shù)規(guī)模更重要。

其次,開源是縮短技術(shù)差距的關(guān)鍵。在羅福莉看來,開源不只是共享代碼和權(quán)重,更是一種“分布式技術(shù)加速機制”。通過開源,小米能匯聚全球開發(fā)者的力量,共同優(yōu)化模型,讓AGI更快走向普惠。

最后,下一代智能體必須“落地現(xiàn)實”。當(dāng)前大模型之所以會出現(xiàn)“具身幻覺”,比如不懂重力、不理解時空關(guān)系,核心是因為它們只從文本中學(xué)習(xí),沒有真正和物理世界交互。羅福莉認(rèn)為,未來的智能體需要構(gòu)建“統(tǒng)一的世界模型”,從“回答問題”轉(zhuǎn)向“完成任務(wù)”,從“文本模擬”走向“實體交互”。

結(jié)語:效率革命背后的AI新方向

MiMo-V2-Flash的發(fā)布,不僅是小米在AI賽道的一次重要突破,更給整個行業(yè)帶來了新的思考:大模型的終極目標(biāo)不是“更聰明”,而是“更好用”。當(dāng)其他廠商還在比拼參數(shù)規(guī)模時,小米已經(jīng)用工程優(yōu)化實現(xiàn)了“性價比拉滿”的效果,這或許就是未來大模型的核心競爭力。

隨著開源生態(tài)的完善和Agent場景的普及,MiMo-V2-Flash可能會成為更多開發(fā)者和企業(yè)的首選基座模型。而羅福莉提出的“智能要在交互中活出來”的理念,也預(yù)示著AI行業(yè)將從“文本大模型”時代,逐步邁向“具身智能”時代。

對于普通人來說,這意味著未來的智能設(shè)備會更懂需求、響應(yīng)更快、使用成本更低——或許不久后,我們在小米手機、智能眼鏡、汽車?yán)锔惺艿降腁I交互,都將源自這個“跑得快、用得起”的大模型。而這,只是小米AGI路線圖的第二步,更精彩的還在后面。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
郭富城大房:掌管郭富城20億身家,卻30年沒有名分,甘愿為郭帶娃

郭富城大房:掌管郭富城20億身家,卻30年沒有名分,甘愿為郭帶娃

玥來玥好講故事
2025-12-27 17:01:58
斗智:烏克蘭人的“無間道”戰(zhàn)術(shù)

斗智:烏克蘭人的“無間道”戰(zhàn)術(shù)

近距離
2026-01-02 10:55:21
特朗普真正的“克星”來了,一枚高超音速導(dǎo)彈升空,直指美方本土

特朗普真正的“克星”來了,一枚高超音速導(dǎo)彈升空,直指美方本土

流史歲月
2026-01-07 12:25:07
中信證券第3次出現(xiàn)巨額壓單后,今天A股發(fā)生了這些變化

中信證券第3次出現(xiàn)巨額壓單后,今天A股發(fā)生了這些變化

每經(jīng)牛眼
2026-01-08 15:32:18
超越哈蘭德姆巴佩,18歲的亞馬爾重新定義了身價天花板

超越哈蘭德姆巴佩,18歲的亞馬爾重新定義了身價天花板

籃球看比賽
2026-01-08 11:43:12
亞足聯(lián)官網(wǎng):中國隊在U23亞洲杯共輸球10場,為該賽事輸球最多的球隊

亞足聯(lián)官網(wǎng):中國隊在U23亞洲杯共輸球10場,為該賽事輸球最多的球隊

懂球帝
2026-01-08 11:50:35
鄭欽文更新西班牙動態(tài)!澳網(wǎng)參賽前景微妙,或遭遇德約相同困境

鄭欽文更新西班牙動態(tài)!澳網(wǎng)參賽前景微妙,或遭遇德約相同困境

一枚野球君
2026-01-08 08:32:08
世界上最大的一塊無主領(lǐng)土,面積比我國還大,日本早已提前布局

世界上最大的一塊無主領(lǐng)土,面積比我國還大,日本早已提前布局

小熊侃史
2026-01-08 07:55:03
餐館推“石槽火鍋”被調(diào)侃神似“豬食槽”;老板:能容納8人用餐,衛(wèi)生安全沒問題;網(wǎng)友:很難洗干凈,養(yǎng)過豬的絕對下不去嘴

餐館推“石槽火鍋”被調(diào)侃神似“豬食槽”;老板:能容納8人用餐,衛(wèi)生安全沒問題;網(wǎng)友:很難洗干凈,養(yǎng)過豬的絕對下不去嘴

揚子晚報
2026-01-08 10:17:26
是不是覺得很奇怪:日本打遍了大半個中國,為什么沒有染指陜西?

是不是覺得很奇怪:日本打遍了大半個中國,為什么沒有染指陜西?

史之銘
2026-01-08 07:21:57
女演員關(guān)凌自曝對不起兒子!硬擠兒子臉上痘,卻導(dǎo)致做手術(shù)縫4針

女演員關(guān)凌自曝對不起兒子!硬擠兒子臉上痘,卻導(dǎo)致做手術(shù)縫4針

小徐講八卦
2026-01-06 08:17:44
笑發(fā)財了!男子去相親,長相可以卻被吐槽歪瓜裂棗,評論區(qū)炸鍋!

笑發(fā)財了!男子去相親,長相可以卻被吐槽歪瓜裂棗,評論區(qū)炸鍋!

另子維愛讀史
2026-01-07 21:00:20
惠州這些道路建設(shè)征地超66萬平方米,涉及多個村!

惠州這些道路建設(shè)征地超66萬平方米,涉及多個村!

南方都市報
2026-01-08 12:18:12
奶奶去世大姑沒有哭,葬禮結(jié)束大姑要走,父親:算完賬再走也不遲

奶奶去世大姑沒有哭,葬禮結(jié)束大姑要走,父親:算完賬再走也不遲

人間百態(tài)大全
2025-12-09 06:30:04
美高官:先打中國再打朝鮮,打不過就核戰(zhàn),因為中國火箭軍太強大

美高官:先打中國再打朝鮮,打不過就核戰(zhàn),因為中國火箭軍太強大

有牙的兔紙
2026-01-04 21:07:55
徐明任上海楊浦區(qū)副區(qū)長

徐明任上海楊浦區(qū)副區(qū)長

中國經(jīng)濟(jì)網(wǎng)
2026-01-08 11:03:17
零容忍!國家出手官媒批評閆學(xué)晶毫不留情句句捅心窩子引百姓共鳴

零容忍!國家出手官媒批評閆學(xué)晶毫不留情句句捅心窩子引百姓共鳴

娛樂小丸子
2026-01-08 09:36:28
太子集團(tuán)創(chuàng)始人陳志被曝已遣返中國,外交部:打擊網(wǎng)賭電詐是國際社會共同責(zé)任

太子集團(tuán)創(chuàng)始人陳志被曝已遣返中國,外交部:打擊網(wǎng)賭電詐是國際社會共同責(zé)任

澎湃新聞
2026-01-08 15:34:26
1992年,大陸老太飛抵臺灣,十幾輛豪車排隊接機,她下車只說了一句話,在場人都愣了

1992年,大陸老太飛抵臺灣,十幾輛豪車排隊接機,她下車只說了一句話,在場人都愣了

源溯歷史
2026-01-06 22:53:23
新華社痛批!多地加油站瘋狂作弊,網(wǎng)友:罰2000是在鼓勵犯罪嗎?

新華社痛批!多地加油站瘋狂作弊,網(wǎng)友:罰2000是在鼓勵犯罪嗎?

徐德文科學(xué)頻道
2026-01-08 15:05:15
2026-01-08 16:12:49
魏家東 incentive-icons
魏家東
一個人的營銷商學(xué)院!
2241文章數(shù) 12130關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

中方被指正考慮進(jìn)一步收緊中重稀土出口 日本業(yè)界慌了

頭條要聞

中方被指正考慮進(jìn)一步收緊中重稀土出口 日本業(yè)界慌了

體育要聞

約基奇倒下后,一位故人邪魅一笑

娛樂要聞

2026春節(jié)檔將有六部電影強勢上映

財經(jīng)要聞

微軟CTO韋青:未來人類會花錢"戒手機"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

旅游
游戲
時尚
健康
手機

旅游要聞

6萬羽候鳥 20萬游客 東古湖,憑什么出圈成為全國觀鳥勝地

歐洲評級泄露《奇異人生》新游 但是開發(fā)商沒公布

藍(lán)色+灰色、紅色+棕色,這4組配色怎么搭都好看!

這些新療法,讓化療不再那么痛苦

手機要聞

華為Pura X2曝光:翻書式橫向折疊,外屏尺寸增大

無障礙瀏覽 進(jìn)入關(guān)懷版