国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

雷軍的AI福將?羅福莉交出萬億參數模型大作業(yè),林俊旸點贊

0
分享至



出品|搜狐科技

作者|常博碩

編輯| 楊 錦

真相大白了,Hunter Alpha原來是小米羅福莉的“作業(yè)”。

事情還要回溯到3月11日,當天全球最大API聚合平臺OpenRouter上突然出現了一個代號為Hunter Alpha的模型。短短七天內,累計調用量突破1萬億Token,連續(xù)多日登頂榜單。


這個模型沒有標注開發(fā)者身份,于3月11日以“隱身模型”形式發(fā)布,且向開發(fā)者提供免費訪問。測試顯示,該系統(tǒng)具備1萬億參數規(guī)模和高達100萬token的上下文窗口。

由于模型自稱是主要以中文訓練的中國AI模型,知識截止時間為2025年5月,不管是性能參數還是知識時間節(jié)點都和DeepSeek之前的模型風格很相似,于是市場便紛紛猜測這可能是DeepSeek在正式發(fā)布前對其下一代系統(tǒng)進行的秘密測試。

然而,昨天小米 MiMo 團隊正式認領了該模型,Hunter Alpha是小米旗艦模型MiMo-V2-Pro的內部測試版本。目前,小米AI團隊領軍人物是前DeepSeek 核心研究員羅福莉,或許這也是為什么Hunter Alpha會讓大家“幻視”DeepSeek吧。


小米也想上桌

在小米新品發(fā)布會上,雷軍正式發(fā)布小米首款自研旗艦大模型Xiaomi MiMo-V2-Pro,此外,小米還推出了相關系列模型MiMo-V2-Omni 和 TTS。

過去一年,小米在AI領域的存在感并不強。既沒有阿里那樣做基模也不像DeepSeek 在社區(qū)靠開源爆火,更像是硬件和生態(tài)玩家。但這次Hunter Alpha的表現直接說明,小米已經擁有一支能做萬億級模型的團隊。

此次小米共發(fā)布三款模型,MiMo-V2-Pro(原Hunter Alpha)是一款面向Agent時代的旗艦基座模型。總參數量1萬億,激活參數控制在42B,并支持1M超長上下文。

MiMo-V2-Omni(原Healer Alpha):全模態(tài)理解模型。專為需要快速反應和低延遲的真實場景打造,能夠同時處理文本、圖像、音頻乃至長達一小時的視頻輸入。

MiMo-V2-TTS則是一款擬人語音大模型。

具體來看,MiMo-V2-Pro是此次受關注最高的一款模型,也是小米正式進軍智能體時代的標志。與傳統(tǒng)以對話體驗為核心優(yōu)化目標的語言模型不同,它的設計起點并非“生成回答”,而是作為 Agent 系統(tǒng)的中樞,能夠理解目標、規(guī)劃步驟、調用外部工具,并在多階段執(zhí)行過程中持續(xù)修正路徑,最終完成任務閉環(huán)。

從模型架構來看,MiMo-V2-Pro 采用超大規(guī)模稀疏化設計,總參數規(guī)模達到萬億級(1T),其中單次推理的激活參數約為 42B。

這一結構本質上是對 MoE(Mixture-of-Experts)體系的進一步工程化實現,大規(guī)模專家網絡承載知識容量,同時在推理階段僅激活部分子網絡,這就能夠在不增加計算成本的情況下擴展模型表達能力。

在注意力機制上,MiMo-V2-Pro 引入改進后的路由注意力(Hybrid Attention)結構,將局部窗口注意力與全局注意力進行分層組合。通過窗口化機制限制計算復雜度的同時還能通過全局路徑保留長距離依賴。

這就使得模型能夠在長上下文場景下維持穩(wěn)定推理,不會出現典型的注意力退化問題。

MiMo-V2-Pro的上下文窗口進一步擴展至100萬Token。在多步驟任務執(zhí)行中,模型可以在單次上下文內保留完整的中間狀態(tài)、工具調用結果以及歷史決策路徑,從而避免頻繁的上下文重建或外部檢索。這一特性對于Agent系統(tǒng)尤為關鍵,使其能夠在長鏈路任務中保持一致性與連貫性。

在此前以Hunter Alpha代號進行的匿名測試階段,這些能力已經有所體現。根據OpenRouter官網的調用數據,模型在上線后使用場景更多是代碼生成、開發(fā)工具與自動化任務。

從跑分上來看,MiMo-V2-Pro表現確實很不錯。

在通用Agent能力評估(ClawEval)中,MiMo-V2-Pro得分61.5,逼近Claude Opus 4.6;在PinchBench測試中排名全球前三。在編碼能力方面,其表現甚至超過Claude Sonnet 4.6,接近更高端的Opus級別。

定價上,MiMo-V2-Pro在256K上下文長度內,輸入token單價為每百萬1美元,輸出為每百萬3美元;即使擴展到100萬上下文,輸入也只需每百萬2美元,輸出每百萬6美元,價格約Claude Opus 4.6的五分之一。


林俊旸點贊羅福莉

羅福莉,是這次 MiMo 模型體系中一個繞不開的關鍵人物。她本科畢業(yè)于北京師范大學計算機專業(yè),碩士畢業(yè)于北京大學計算語言學研究所。曾任職于阿里巴巴達摩院、幻方量化及DeepSeek(深度求索)。

在阿里期間,她主導開發(fā)了多語言預訓練模型VECO;在DeepSeek期間,她是MoE大模型DeepSeek-V2的關鍵開發(fā)者之一。2025年11月,羅福莉加入小米,負責領導MiMo大模型團隊。

這次的MiMo-V2-Pro,是羅福莉加入小米后交的第一份大作業(yè)。

在模型公布后,她在自己的社交主頁寫道:MiMo-V2-Pro、Omni 和 TTS 正式發(fā)布。這是我們首個真正為智能體時代打造的全棧模型系列。我稱之為一次悄無聲息的突襲——并非因為我們事先計劃好的,而是因為從聊天模式到智能體模式的轉變發(fā)生得太快,連我們自己都難以置信。在這期間,我們經歷了一個既激動人心又痛苦不堪,同時又令人著迷的過程。

據羅福莉表示,1T 基礎模型早在幾個月前就開始訓練了。最初的目標是提高長上下文推理的效率;旌献⒁饬C制帶來了真正的創(chuàng)新,卻又不至于過度擴張。事實證明,它正是智能體時代的理想基礎。1M 的上下文窗口。MTP 推理技術實現了超低延遲和成本。這些架構決策并非一時風尚,而是我們在需要之前就構建的結構性優(yōu)勢。真正改變一切的是第一次體驗到復雜的智能體框架。

她還透露,自己給團隊下了硬性指標:MiMo團隊中,每天與AI對話少于100次的人都可以辭職。

在羅福莉看來,一旦團隊的想象力被智能系統(tǒng)的功能所激發(fā),這種想象力就直接轉化為研發(fā)速度。

她還透露,當模型足夠穩(wěn)定值得開源的時候,她會選擇開源。隨后,前阿里巴巴通義千問(Qwen)系列大模型核心技術負責人林俊旸點贊了該帖,并評論道:“太棒了!


模型發(fā)布后,雷軍第一時間表示,“我們剛發(fā)布萬億參數大模型 Mimo-V2-Pro。在全球大模型綜合智能排行榜 Artificial Analysis 上,位列全球第八。按大模型品牌來排名,排在全球第五,超過了xAI Grok。我們模型剛剛完成,未來一段時間,還會快速迭代增強!

同時他也承認,小米一直以來在AI領域相對比較低調,實際進展可能比大家看到的要快很多。

對于進軍AI這件事,雷軍并不吝嗇,他表示:“我們今年的研發(fā)和資本投入就將超過160億元。我相信,只要我們堅持持續(xù)投入,小米在AI時代一定會交出一份靚麗的答卷!



運營編輯 |曹倩審核|孟莎莎




特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
醫(yī)生坦言:只要體檢里沒有這2個箭頭,腦梗風險就不用太焦慮

醫(yī)生坦言:只要體檢里沒有這2個箭頭,腦梗風險就不用太焦慮

路醫(yī)生健康科普
2026-04-18 21:25:03
解放軍編隊劃了條線,052D貼岸航行提醒日本人,琉球主權可還沒定

解放軍編隊劃了條線,052D貼岸航行提醒日本人,琉球主權可還沒定

別吵吵
2026-04-21 09:56:45
日艦硬闖臺海三天后,賴清德通告全球,語氣很囂張,蔣萬安不忍了

日艦硬闖臺海三天后,賴清德通告全球,語氣很囂張,蔣萬安不忍了

舍長阿爺談事
2026-04-21 02:58:52
長的太漂亮了,真正的珠圓玉潤,標準的東方美

長的太漂亮了,真正的珠圓玉潤,標準的東方美

生活新鮮市
2026-03-27 07:21:32
76年譚啟龍給華國鋒寫信:我要當官,華老回復:去青海當省委書記

76年譚啟龍給華國鋒寫信:我要當官,華老回復:去青海當省委書記

棠棣分享
2026-04-15 17:42:48
造謠日本男童遇害案嫌犯為“中國人”,臺媒鄭重致歉

造謠日本男童遇害案嫌犯為“中國人”,臺媒鄭重致歉

參考消息
2026-04-20 14:23:54
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
亞冠精英擴軍32隊中超增加0.5席位 國安直通正賽

亞冠精英擴軍32隊中超增加0.5席位 國安直通正賽

體壇周報
2026-04-21 10:00:15
武漢市武昌區(qū)政府副區(qū)長,區(qū)公安分局局長徐舫擬提名為市州副市州長人選

武漢市武昌區(qū)政府副區(qū)長,區(qū)公安分局局長徐舫擬提名為市州副市州長人選

觀星賞月
2026-04-20 18:26:12
油價或迎來今年首次下調

油價或迎來今年首次下調

大象新聞
2026-04-21 10:23:04
美軍有多可怕?美專家:一旦出動全部軍力,全球聯(lián)合也沒法抗衡!

美軍有多可怕?美專家:一旦出動全部軍力,全球聯(lián)合也沒法抗衡!

健身狂人
2026-04-20 18:36:21
國防部曾發(fā)出最后通牒:關于如何處理賴清德,大陸早考慮好了

國防部曾發(fā)出最后通牒:關于如何處理賴清德,大陸早考慮好了

南宗歷史
2026-04-19 23:07:54
海外版“砍一刀”被美國消費者瘋狂吐槽:這質量就是中國制造?

海外版“砍一刀”被美國消費者瘋狂吐槽:這質量就是中國制造?

可達鴨面面觀
2026-04-20 16:18:29
沈陽又聽勸了,立即拆除!

沈陽又聽勸了,立即拆除!

沈陽公交網小林
2026-04-21 00:10:09
第1!勇士第1。惣{德有望聯(lián)手庫里

第1!勇士第1啊!倫納德有望聯(lián)手庫里

籃球實戰(zhàn)寶典
2026-04-20 16:52:33
黃圣依曬瑞士留學照!穿高跟鞋拎愛馬仕遛狗,兒子眉清目秀不像爸

黃圣依曬瑞士留學照!穿高跟鞋拎愛馬仕遛狗,兒子眉清目秀不像爸

阿鳧愛吐槽
2026-04-20 10:34:16
勇士隊內部人士:庫里目前合同剩1年6260萬美元,計劃今夏續(xù)約2年

勇士隊內部人士:庫里目前合同剩1年6260萬美元,計劃今夏續(xù)約2年

好火子
2026-04-21 00:24:13
麥當娜:睡過100+猛男,2段婚姻全敗,如今又戀上兒子29歲教練

麥當娜:睡過100+猛男,2段婚姻全敗,如今又戀上兒子29歲教練

七阿姨愛八卦
2026-04-15 17:12:30
與孔令輝分手12年,被黑人托在肩上的馬蘇,終是為自己的風流買單

與孔令輝分手12年,被黑人托在肩上的馬蘇,終是為自己的風流買單

情感大頭說說
2026-04-18 21:06:00
騎士12連勝,哈登存兩瑕疵!米切爾一點真該夸,湖人舊將也該棄用

騎士12連勝,哈登存兩瑕疵!米切爾一點真該夸,湖人舊將也該棄用

魚崖大話籃球
2026-04-21 10:07:55
2026-04-21 11:24:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號
4775文章數 7984關注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

頭條要聞

牛彈琴:特朗普成美伊談判最大障礙 伊朗果然勃然大怒

體育要聞

“被優(yōu)化”8年后,國乒方博決定換一條路重新上場

娛樂要聞

周潤發(fā)時隔16年再賣樓,變現數億資產

財經要聞

減速機訂單已排到明年!

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

教育
旅游
時尚
親子
軍事航空

教育要聞

“學碩不讓讀,專碩21.8萬!”復旦讓普通人看清現實:沒錢別硬卷

旅游要聞

2026八達嶺夜長城4月30日起煥新開放

“爆冷”又如何?陳法拉的人生本就是一場逆襲大戲

親子要聞

孩子休學躺平,我做的第一件事,是放過自己

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進入關懷版