国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“雷軍的AI秘密武器”羅福莉首秀:詳解小米AGI之路

0
分享至



作者|郭曉靜

12月17日,2025小米“人車家全生態(tài)合作伙伴大會”舉辦。在這次大會上,小米MiMo團隊負(fù)責(zé)人羅福莉完成了首秀演講。作為前DeepSeek核心成員,羅福莉自從加入小米,就被視為小米AI研發(fā)走向“正規(guī)軍化”和“極客化”的里程碑。

市場曾期待她能帶來像DeepSeek那樣顛覆性的“小而美”模型,而羅福莉身上AI時代的極客特質(zhì),也許能與小米初創(chuàng)時期的極客基因完美相融,產(chǎn)生新的化學(xué)反應(yīng)。

羅福莉的首秀略顯緊張,但不負(fù)眾望,她帶來了一個高效的模型MiMo-V2-Flash,也拋出了新的AGI夢想。

在她看來,現(xiàn)在的模型大多只是“完美的語言外殼,沒有錨定現(xiàn)實世界的物理模型”;“真正的智能是從交互中活出來的”,通往AGI的必經(jīng)之路,不是打造一個程序,而是“推演整個世界的運作邏輯,打造一個虛擬宇宙”。

這次首秀,羅福莉確實帶來了鮮明的“DeepSeek 基因”,比如MoE架構(gòu)、MTP技術(shù)和對極致效率的追求。

此次開源的MiMo-V2-Flash模型,它具備三個核心特點:

高效推理

雖然總參高達309B,但通過MoE架構(gòu)僅激活15B,結(jié)合被低估的MTP(多令牌預(yù)測)技術(shù),生成速度達到150 tokens/秒。這帶來約2.5倍加速,主要為了解決車機、助手等端側(cè)交互對延遲的敏感。

創(chuàng)新的長文本架構(gòu)

設(shè)計上追求“簡單優(yōu)雅”,采用Hybrid SWA機制,鎖定128 tokens的“神奇窗口”。這不僅支持256K長上下文,固定了KV緩存以降低硬件壓力,還在代碼生成上刷新了SOTA。

極高的性價比

落地層面非常務(wù)實,后訓(xùn)練階段采用MOPD技術(shù),用極低的計算量(不到標(biāo)準(zhǔn)流程1/50)復(fù)刻教師模型性能,意在降低大規(guī)模部署的成本。


這場首秀被安排在“人車家全生態(tài)”大會上,意義耐人尋味。羅福莉在小米的職責(zé)很明確:主導(dǎo)大模型研發(fā),通過高效推理與智能體技術(shù),推動AI從“語言交互”跨越到“物理世界”,賦能全生態(tài)。

但客觀來看,端側(cè)AI智能、賦能全生態(tài)的理想還在路上,現(xiàn)在的硬件依然難以支撐這樣一個已經(jīng)“極致效率”的模型。

以當(dāng)前最高端的旗艦手機為例,端側(cè)模型的舒適區(qū)依然停留在3B到7B參數(shù)之間。MiMo-V2-Flash的15B激活參數(shù),對移動設(shè)備而言依然是“房間里的大象”。

所謂的“高效推理”,更多是指在云端數(shù)據(jù)中心實現(xiàn)了高吞吐量,對于用戶手中的終端,這依然是一個重度依賴網(wǎng)絡(luò)的“云端模型”。

雖然有驚喜,但是此次小米并沒有打破端側(cè)AI的算力天花板,對于期待“AI手機”變革的用戶而言,還需要繼續(xù)等待。

但今天的羅福莉,確實在給小米,講了一個可圍繞“人車家生態(tài)的”、新的AGI故事。


以下為演講實錄(為優(yōu)化閱讀體驗,做了二次編輯、刪減):

01

從生物演變看 AI 發(fā)展路徑

今天我想帶大家換一個視角,從 10 億年生物進化的長河中,重新去審視我們正在經(jīng)歷的這一場 AI 變革。

如果我們回到生命進化的歷程,會發(fā)現(xiàn)自然界在構(gòu)建智能這座金字塔時,遵循著非常嚴(yán)密的邏輯:在 6 億年前,生命首先學(xué)會了控制身體與環(huán)境互動;緊接著進化出了多巴胺系統(tǒng),通過強化學(xué)習(xí)進一步提升生存能力;在 2 億年前,哺乳動物的大腦首次具備了在行動前先在大腦里模擬未來的能力;最終我們發(fā)現(xiàn),人類才登上了智能的塔尖,掌握了語言這一抽象的符號系統(tǒng)。

所以我們能看到,生物演化的規(guī)律是先具備對物理世界的感知和生存體驗,最后才誕生了語言。但大家都能發(fā)現(xiàn),到現(xiàn)在為止,大模型的發(fā)展路徑其實跟生物進化路徑是不同步的,甚至說是一種倒敘,或者說是一種跳躍。


生物是先從行動進化到思考,再進化到語言;但是大模型是先學(xué)會了語言,再去補齊它的思考能力,最后再去補齊對物理世界的模擬以及具身感知。

為什么大模型智能的產(chǎn)生首先是在語言領(lǐng)域?因為語言不僅僅是一種符號的排列組合,更是人類思維以及對于世界的一種描述。在文本領(lǐng)域的投射,本質(zhì)上是一種有損壓縮。當(dāng)大模型通過 Next Token Prediction(下一詞預(yù)測)這種范式在海量文本里進行學(xué)習(xí),試圖把 Loss(損失函數(shù))降到最低的時候,我們發(fā)現(xiàn)它不僅僅是在擬合一個統(tǒng)計規(guī)律,而是在壓縮人類數(shù)十億年間關(guān)于這個世界的認(rèn)知同構(gòu)。

這種壓縮的過程,在我們看來就是一種智能。所以,大模型通過語言的爆發(fā),通過 Scaling(擴展)算力和數(shù)據(jù),從而理解了人類的思維和對世界的理解。但其實它并不真正像人類一樣具備對整個物理世界的感知。嚴(yán)謹(jǐn)來說,它應(yīng)該是成功地解碼了人類思維在文本空間的一個投影。大家都能看到,這其實是一種自頂向下的捷徑,因為它是在學(xué)習(xí)一種智能的結(jié)果,來倒推智能產(chǎn)生的過程。

02

MiMo-V2-Flash 的誕生,

解決三大核心問題

不管怎么說,語言包含了人類對世界極致的壓縮,是智慧的結(jié)晶,也是高階智能體之間高效協(xié)作的工具。因此,小米從語言出發(fā),構(gòu)建了全新一代面向 Agent(智能體)的基座模型——MiMo-V2-Flash。

MiMo-V2-Flash 在研發(fā)之初,主要圍繞著三個非常關(guān)鍵的問題展開:

第一,我們認(rèn)為當(dāng)代的智能體必須要有一個高效的溝通語言,即代碼能力和工具調(diào)用能力。

第二,目前智能體之間的溝通帶寬非常低,如何加速帶寬?這需要一個推理效率極高的模型結(jié)構(gòu)。

第三,Scaling 的范式已經(jīng)逐步從預(yù)訓(xùn)練(Pre-train)轉(zhuǎn)向后訓(xùn)練(Post-train),我們?nèi)绾渭ぐl(fā)后訓(xùn)練的潛能?這就需要一個穩(wěn)定的范式,以便在強化學(xué)習(xí)(RL)上投入更多的 Compute(算力)。

在這三個問題的驅(qū)動下,我們看到了 MiMo-V2-Flash 超強的基座潛能。雖然它的總參數(shù)在我看來非常小——總參數(shù) 309B,激活參數(shù)只有 15B,我甚至都不愿意稱它為“大”模型——但它的代碼能力和 Agent 能力在世界級公開公正的評估榜單上,已經(jīng)進入了全球開源模型 Top 1-2 的行列。

基本上,大部分評估基準(zhǔn)已經(jīng)超過或者與 DeepSeek-V3、Kimi、Qwen 等模型相當(dāng),而這些模型的總參數(shù)量通常是 MiMo-V2-Flash 的兩倍到三倍。


03

性能與成本的平衡,

挑戰(zhàn)推理不可能三角

這個圖展示了全球相同水位大模型在價格和速度上的比較:橫軸是推理價格(從大到小),縱軸是推理速度(從小到大)。我們能看到 MiMo 在右上角,代表了低成本、高速度。

舉兩個模型進行對比: 比如 DeepSeek-V3.2,MiMo-V2-Flash 比它更便宜一點,但推理速度大概是 V3.2 的三倍左右。

再比如 Gemini 2.5 Pro,雖然綜合性能相當(dāng),且推理速度差不多,但 Gemini 2.5 Pro 的推理成本比 MiMo-V2-Flash 貴了整整 20 倍。

04

架構(gòu)創(chuàng)新與 MTP 加速

那么我們是怎么做到這一切的呢?核心關(guān)鍵在于圍繞“極致推理效率”重新設(shè)計模型結(jié)構(gòu),主要依靠兩個創(chuàng)新。

第一個是Hybrid Attention(混合注意力)結(jié)構(gòu)。我們采用了 Hybrid Sliding Window Attention(混合滑動窗口注意力)和 Full Attention(全局注意力),比例大概是 5:1。

為什么選 Sliding Window Attention?因為它看起來非常簡單,只關(guān)注鄰域的 128 個 Token。經(jīng)過大量實驗驗證,我們發(fā)現(xiàn)一些看似復(fù)雜的 Linear Attention(線性注意力)結(jié)構(gòu),在兼顧長短文推理和知識檢索的綜合性能上,其實并不如簡單的 Sliding Window Attention。更重要的是,它的 KV Cache 是固定的,能非常好地適配當(dāng)代主流的 Infra(基礎(chǔ)設(shè)施)推理框架。


圖:全局注意力(GA)和滑動窗口注意力(SWA)的1:5混合結(jié)構(gòu)

第二個是挖掘 MTP(Multi-Token Prediction,多令牌預(yù)測)的潛力。MTP 一開始被提出是用于做推理加速的,后來 DeepSeek 將其用于提升基座模型能力。我們在訓(xùn)練時加入了一層 MTP 層以提升基座潛能,并且在微調(diào)時加入了更多層的 MTP,用少量算力就提升了 MTP 層的接受率。

最終推理時,我們使用了三層 MTP 進行加速并行 Token 驗證。在實際場景中,這種方式能做到 2.2 到 2.6 倍的推理加速。

在社區(qū)關(guān)于三層 MTP 的情況下,我們來看模型輸出吞吐:在單機吞吐能做到 5,000~15,000 Tokens/秒的基礎(chǔ)上,單請求吞吐也能做到 150~155 Tokens/秒。使用 MTP 相比不使用,整體速度提升了 2 到 3 倍。

05

訓(xùn)練范式革新:

MOPD 與自進化

除了關(guān)注預(yù)訓(xùn)練結(jié)構(gòu)的高效性,我們還在思考如何擴展強化學(xué)習(xí)訓(xùn)練的 Compute。強化學(xué)習(xí)訓(xùn)練通常非常不穩(wěn)定,因此我們提出了MOPD(Multi-Teacher On-Policy Distillation,多教師在線策略蒸餾)范式。


它的核心在于 On-Policy,依賴稠密的 Token Level Reward(令牌級獎勵)進行監(jiān)督學(xué)習(xí)。通常 Post-train 范式會通過 SFT 和 RL 拿到各領(lǐng)域?qū)<夷P?。MOPD 則會讓 Student(學(xué)生)模型基于自身概率分布 Roll out(生成)一些序列,然后用專家模型對這些序列進行打分,提供非常稠密的監(jiān)督信號。

我們發(fā)現(xiàn)這種學(xué)習(xí)效率極高,通過簡短的幾十步就能將各領(lǐng)域?qū)<业哪芰焖僬麴s到 Student 模型上。

此外,我們還有一個意外發(fā)現(xiàn):當(dāng) Student 很快超越 Teacher 時,我們正在嘗試將 Teacher 替換成更強的 Student,繼續(xù)自我迭代提升,這是一個正在進行中的工作。

06

邁向物理世界:

從語言模擬到真實交互

MiMo-V2 已經(jīng)初步具備在語言空間模擬世界的能力。比如,我們可以通過 HTML 讓它寫一個操作系統(tǒng),很多功能都是可實現(xiàn)的;或者寫一個 HTML 模擬太陽系;甚至做一個畫圣誕樹并產(chǎn)生交互的小 Demo。


MiMo-V2-Flash 已經(jīng)在昨天發(fā)布,我們開源了所有模型權(quán)重,同步了技術(shù)報告細(xì)節(jié),并提供了 API 供開發(fā)者接入 Web Coding IDE。我們的體驗 Web 也已上線,大家可以掃描試用。

雖然現(xiàn)在的大模型能聊天、能寫代碼,但我相信大家還是不放心把身邊復(fù)雜的任務(wù)交給它。我認(rèn)為真正的下一代智能體系統(tǒng),不應(yīng)該只是一個語言模擬器,而是需要跟世界共存。

下一代智能體必須具備兩個潛能: 第一,從“回答問題”變成“完成任務(wù)”。 這不僅需要記憶、推理、規(guī)劃能力,更需要一個 Omni(全模態(tài))的感知能力。做一個統(tǒng)一的動態(tài)系統(tǒng)非常必要,這是理解世界的基礎(chǔ)。有了這個基礎(chǔ),模型才能無縫嵌入到像眼鏡這樣的智能終端,融入我們的生活流。


第二,構(gòu)建物理模型。 回到開頭的話題,現(xiàn)有大模型本質(zhì)上是用算力的“暴力美學(xué)”攻克了頂層的語言和第二層的強化學(xué)習(xí),但跳過了中間對世界的感知和模擬,以及底層的實體交互。這就是為什么大模型能做奧數(shù)、模仿莎士比亞,卻不懂重力等物理法則,經(jīng)常產(chǎn)生具身幻覺。

因此,AI 進化的下一個起點,一定要有一個可以跟真實環(huán)境交互的物理模型。我們要打造的本質(zhì)上不是一個程序,而是一個具備物理一致性、時空連貫性的虛擬宇宙。

這意味著 AI 能力的本質(zhì)跨越——不僅僅是看懂畫面,而是理解背后的物理規(guī)律;不僅僅是處理文本,而是推演世界的運作邏輯。真正的智能絕對不是在文本里讀出來的,而是在交互里“活”出來的。

>End

本文轉(zhuǎn)載自“騰訊科技”,原標(biāo)題《“雷軍的AI秘密武器”羅福莉首秀:詳解小米AGI之路》。

為分享前沿資訊及有價值的觀點,太空與網(wǎng)絡(luò)微信公眾號轉(zhuǎn)載此文,并經(jīng)過編輯。

未按照規(guī)范轉(zhuǎn)載及引用者,我們保留追究相應(yīng)責(zé)任的權(quán)利

部分圖片難以找到原始出處,故文中未加以標(biāo)注,如若侵犯了您的權(quán)益,請第一時間聯(lián)系我們。

HISTORY/往期推薦

充滿激情的新時代,

充滿挑戰(zhàn)的新疆域,

與踔厲奮發(fā)的引領(lǐng)者,

卓爾不群的企業(yè)家,

一起開拓,

一起體驗,

一起感悟,

共同打造更真品質(zhì),

共同實現(xiàn)更高價值,

共同見證商業(yè)航天更大的跨越!

——《太空與網(wǎng)絡(luò)》,觀察,記錄,傳播,引領(lǐng)。

·《衛(wèi)星與網(wǎng)絡(luò)》創(chuàng)始人:劉雨菲

·《衛(wèi)星與網(wǎng)絡(luò)》副社長:王俊峰

·微信公眾號(ID:satnetdy)團隊

編輯:艷玲、哈玫,周泳、邱莉、黃榕、娜娜

主筆記者:李剛、魏興、張雪松、霍劍、樂瑜、稻子、趙棟

策劃部:楊艷、若?、李真子

視覺總監(jiān):董濘

專業(yè)攝影:馮小京、宋偉

設(shè)計部:顧錳、潘希峎、楊小明

行政部:姜河、林紫

業(yè)務(wù)部:王錦熙、瑾怡

原創(chuàng)文章轉(zhuǎn)載授權(quán)、轉(zhuǎn)載文章侵權(quán)、投稿等事宜,請加微信:15910858067

商務(wù)合作;展覽展廳設(shè)計、企業(yè)VI/CI及室內(nèi)設(shè)計、企業(yè)文化建設(shè)及品牌推廣;企業(yè)口碑傳播及整體營銷傳播等,請加微信:13811260603

雜志訂閱,請加微信:wangxiaoyu9960

·衛(wèi)星與網(wǎng)絡(luò)各分部:

成都分部負(fù)責(zé)人:沈淮

長沙分部負(fù)責(zé)人:賓鴻浦

西安分部負(fù)責(zé)人:郭朝暉

青島分部負(fù)責(zé)人:江偉

·衛(wèi)星與網(wǎng)絡(luò)總部負(fù)責(zé)人:農(nóng)燕

·會議活動部負(fù)責(zé)人喬顥益、許克新、董今福

· 投融資及戰(zhàn)略層面合作:劉雨菲

·本平臺簽約設(shè)計公司:一畫開天(北京)文化創(chuàng)意設(shè)計有限公司

· 航天加(深圳)股權(quán)投資基金管理負(fù)責(zé)人:楊艷

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國男籃歷史上最厲害的控球后衛(wèi),是以下五位球員

中國男籃歷史上最厲害的控球后衛(wèi),是以下五位球員

陳腕特色體育解說
2025-12-02 01:15:06
僅剩一天!若日媒預(yù)言成真,中日關(guān)系還要惡化,就看高市選哪條路

僅剩一天!若日媒預(yù)言成真,中日關(guān)系還要惡化,就看高市選哪條路

杰絲聊古今
2025-12-27 04:28:48
現(xiàn)身北京,全紅嬋回歸夢之隊?去向曝光,恩師晉升,陳若琳期待

現(xiàn)身北京,全紅嬋回歸夢之隊?去向曝光,恩師晉升,陳若琳期待

懂球社
2025-12-27 00:19:27
石破茂終于被惹火了,他讓全體日本人想清楚,和中國為敵的下場

石破茂終于被惹火了,他讓全體日本人想清楚,和中國為敵的下場

風(fēng)信子的花
2025-12-25 21:19:38
就看明天,高市早苗若敢去拜神廁,看看我們會不會登上釣魚島吧!

就看明天,高市早苗若敢去拜神廁,看看我們會不會登上釣魚島吧!

我心縱橫天地間
2025-12-25 23:26:39
不到48小時,高市曝驚天反轉(zhuǎn),超90%青年站隊,右翼徹底坐不住了

不到48小時,高市曝驚天反轉(zhuǎn),超90%青年站隊,右翼徹底坐不住了

知鑒明史
2025-12-25 19:00:25
APP終于上架了,那個程序員卻哭了

APP終于上架了,那個程序員卻哭了

畫生筆記
2025-12-26 09:57:48
知三當(dāng)三、陪睡上位?遭央視開除,被傳與小尼結(jié)婚的她如今怎樣了

知三當(dāng)三、陪睡上位?遭央視開除,被傳與小尼結(jié)婚的她如今怎樣了

喜歡歷史的阿繁
2025-12-27 01:02:10
張震岳硬核回懟朱孝天

張震岳硬核回懟朱孝天

究竟誰主沉浮
2025-12-25 20:41:29
美媒:短短1年不到,從存亡邊緣到超級大國,中國是怎么做到的?

美媒:短短1年不到,從存亡邊緣到超級大國,中國是怎么做到的?

南宮一二
2025-12-26 13:12:25
3-2!孫穎莎退賽、蒯曼遭爆冷,平野美宇貢獻2分,決賽首隊產(chǎn)生

3-2!孫穎莎退賽、蒯曼遭爆冷,平野美宇貢獻2分,決賽首隊產(chǎn)生

大秦壁虎白話體育
2025-12-26 14:33:54
龐家還有后手,捐贈記錄不僅完好無損,還在龐氏舊宅公開展出

龐家還有后手,捐贈記錄不僅完好無損,還在龐氏舊宅公開展出

扶蘇聊歷史
2025-12-26 17:45:17
弘一法師:如果有人辜負(fù)了你,不要去怨恨他,你只需要停止付出

弘一法師:如果有人辜負(fù)了你,不要去怨恨他,你只需要停止付出

杏花煙雨江南的碧園
2025-12-24 13:29:44
山楂樹下真的急了?竟找山東美女打廣告?本人回應(yīng)太剛了

山楂樹下真的急了?竟找山東美女打廣告?本人回應(yīng)太剛了

朗威談星座
2025-12-24 10:28:24
歐拉弄真頭鐵,甩臉不滿蘇提達王后當(dāng)她仆人,轉(zhuǎn)頭泰王又公開站她

歐拉弄真頭鐵,甩臉不滿蘇提達王后當(dāng)她仆人,轉(zhuǎn)頭泰王又公開站她

另子維愛讀史
2025-12-26 16:21:17
2026年1月1日起6類日常行為違法!罰款拘留跑不了別等踩坑才后悔

2026年1月1日起6類日常行為違法!罰款拘留跑不了別等踩坑才后悔

原廣工業(yè)
2025-12-27 00:01:10
恒大的悲歌。從許家印兩個兒子的學(xué)歷,對比中美教育的成果

恒大的悲歌。從許家印兩個兒子的學(xué)歷,對比中美教育的成果

鷹視狼顧之天下
2025-12-20 12:19:05
快手變快播?深夜上萬直播間同時"搞黃色"裸聊,年度最大網(wǎng)絡(luò)事故

快手變快播?深夜上萬直播間同時"搞黃色"裸聊,年度最大網(wǎng)絡(luò)事故

派大星紀(jì)錄片
2025-12-23 16:49:00
外媒:俄精密機床遠(yuǎn)程鎖死變廢鐵,工廠已停頓,我們也要小心!

外媒:俄精密機床遠(yuǎn)程鎖死變廢鐵,工廠已停頓,我們也要小心!

近史談
2025-12-26 21:53:11
江西一校花好漂亮,五官精致,膚白貌美,美的犯規(guī)。太美了

江西一?;ê闷?,五官精致,膚白貌美,美的犯規(guī)。太美了

手工制作阿殲
2025-11-29 01:59:57
2025-12-27 06:08:49
太空與網(wǎng)絡(luò) incentive-icons
太空與網(wǎng)絡(luò)
衛(wèi)星應(yīng)用領(lǐng)域全媒體平臺
6267文章數(shù) 8170關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

態(tài)度原創(chuàng)

旅游
本地
健康
親子
軍事航空

旅游要聞

百年老街變身!上海新天地東臺里開業(yè),解鎖冬日消費新范式

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

這些新療法,讓化療不再那么痛苦

親子要聞

2025年即將過去,準(zhǔn)備好一大波溫暖瞬間來襲

軍事要聞

烏最新20點俄烏和平草案遞交莫斯科 俄方拒絕

無障礙瀏覽 進入關(guān)懷版