国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

我們拷打了小米最新大模型:全模態(tài)很驚艷,但聯(lián)網(wǎng)檢索仍是短板

0
分享至

4月23日,小米MiMo V2.5系列模型開啟公測。根據(jù)官方介紹,該系列模型具有更強的推理能力、更穩(wěn)定的Agent。

另外,它還有多模態(tài)感知能力,不僅能看懂文本,還能理解圖片、音頻等信息。而且,在Artificial Analysis榜單中,Xiaomi MiMo-V2.5-Pro綜合智能指數(shù)位列全球開源大模型第一。



(圖源:小米)

既然小米這款大模型能力這么強,我們就來實際測試一下,看看它在哪些場景下有出色的表現(xiàn),同時又有哪些要改進的地方。

MiMo V2.5實測:模型能力很強,聯(lián)網(wǎng)檢索稍弱

目前,MiMo V2.5系列已經(jīng)開放公測,所有小米用戶都能在MiMo官網(wǎng)直接體驗MiMo V2.5、MiMo V2.5 Pro等模型產(chǎn)品。

網(wǎng)頁端這種使用場景不能百分百發(fā)揮出大模型的潛力,但作為摸底考試來說問題不大。我們結(jié)合日常實際使用習慣,通過五個具體案例,來看看MiMo V2.5的真實實力。

案例一:文章總結(jié)

長文概括總結(jié)基本是當下主流大模型的基礎能力,作為這次實測的開胃菜再合適不過了。

我們把雷科技(ID:leitech)最近寫的一篇關于ChatGPT Images 2.0評測的圖文內(nèi)容鏈接丟給它分析, MiMo V2.5 Pro的反應很迅速,2秒鐘就生成了結(jié)果。它對文章內(nèi)容的概括非常準確,把文章中針對ChatGPT Images 2.0的優(yōu)缺點評價都提煉了出來。



(圖源:雷科技)

當然,這只是基本功,主流大模型一般都能比較好地完成這項任務,接下來我們就要加大力度了。

案例二:盤點一下小米2025年發(fā)布過的手機型號

這個問題主要考驗的是MiMo-V2.5 Pro的信息聯(lián)網(wǎng)檢索能力,坦率說,它表現(xiàn)得比較一般。

首先,MiMo-V2.5 Pro羅列出的小米15系列是2024年發(fā)布的,并不是2025年的機型。



(圖源:雷科技)

查看其信息來源后,我們發(fā)現(xiàn)它是被一篇博客文章誤導了,這篇博文羅列了多款小米手機發(fā)布時間,但很多是錯的,甚至很有可能本身也是AI生成的。



(顯示錯誤信息的網(wǎng)頁,圖源:雷科技)

其次,不少機型被遺漏了,比如最重要的小米17系列。另外,它還出現(xiàn)了一些錯誤,MiMo-V2.5 Pro在檢索了早期的爆料信息后,誤以為小米15S Pro還沒發(fā)布,但實際上它就是一款2025年發(fā)布的機型。



(圖源:雷科技)

當然,圍繞這個問題,其他大模型的表現(xiàn)也都很難稱得上完美。公認聯(lián)網(wǎng)搜索能力很強的Gemini 3.1 Pro就翻車了,它出現(xiàn)嚴重幻覺,居然虛構(gòu)出了小米16系列。而DeepSeek反而是表現(xiàn)相對較好的,把小米和紅米機型基本都盤點全了,還顧及到了很多大模型忽略的海外品牌POCO,當然它也遺漏了小米15S Pro。



(圖源:雷科技)

案例三:去洗車店洗車應該走路去還是開車去?

這是之前非常經(jīng)典的「忽悠」大模型的問題,曾經(jīng)ChatGPT等知名模型都翻車了,它主要考驗的就是模型本身的邏輯推理能力。一個在真人看來很簡單的邏輯題,但對沒有針對性做過訓練的大模型來說,就很容易掉坑里。

面對這個問題,MiMo V2.5 Pro沒有被繞進去,而是直接了當?shù)刂赋隽岁P鍵:要洗的是車,不是人,洗車的前提是車必須得過去。



(圖源:雷科技)

案例四:幫我看看醫(yī)院的檢驗報告

MiMo V2.5有一個重要亮點就是支持多模態(tài),根據(jù)官方介紹,它在文本和代碼之外,還支持圖像、視頻和語音(MiMo V2.5 Pro暫不支持)。所以,我們可以以圖片等多媒體文件的形式進行輸入。實際體驗中,我找了一張醫(yī)院檢查的圖片給它,MiMo V2.5很快識別出了是哪項檢查,并且結(jié)合獲取到的數(shù)據(jù),給出了具體的結(jié)論和建議。



(圖源:雷科技)

另外,普通的照片也能丟給它,比如我塞給它一張很模糊的、logo被遮擋的Switch圖片,MiMo-V2.5準確識別出了它是Switch,并且表示是OLED版。

這項功能放在具體的終端設備上的話,可以進一步拓展使用場景,比如手機打開相機就能把畫面實時交給AI分析、導航時根據(jù)相機識別出用戶所在的精準坐標等。



(圖源:雷科技)

案例五:做一個瀏覽器能運行的小游戲

一直以來,大模型的代碼能力都很被看重。作為一個編程小白,我更關心的是它能不能根據(jù)我的需求生成一個能直接運行的程序,不用再做任何額外的工作。

首先,我提了一個基礎編程課上的簡單案例:生成一個解一元二次方程的程序。MiMo-V2.5 Pro很快就開始寫代碼了,馬上做出了一個可以在瀏覽器上直接運行的HTML文件。我只要在程序界面填入對應的數(shù)字,它就能算出結(jié)果。



(圖源:雷科技)

然后,我們加大了難度,讓它寫一個圍棋的程序,它的代碼更加復雜,還要圍繞UI設計做很多工作。MiMo-V2.5 Pro處理這項任務也毫無壓力,將它生成的代碼直接運行,就能在圍棋程序里面下棋了。



(圖源:雷科技)

MiMo Claw來了,小米「龍蝦」好用嗎?

伴隨著MiMo-V2.5系列的發(fā)布,小米還同步上線了MiMo Claw。不過,這款龍蝦目前還處于測試階段,通過在網(wǎng)頁端運行的模式提供給用戶使用。

它的單次體驗限時1小時,超時后原有的數(shù)據(jù)會被銷毀,用戶可以重新創(chuàng)建一個Claw項目再次體驗。我們通過新聞抓取、財報分析和文檔優(yōu)化三個場景來測試這款龍蝦的實際表現(xiàn)。

場景一:新聞抓取

我給MiMo Claw出了一個不大不小的難題:搜索當天的科技要聞,并且按照指定的懷舊風格生成一張海報。這主要考驗它的兩個能力,一是信息檢索,二是作圖。

從實測結(jié)果來看,作為一款還在公測的「龍蝦」,它的表現(xiàn)還可以,至少模仿90年代雜志風格這方面做得挺不錯的,而且排版基本沒出現(xiàn)大問題。

當然,還是老問題,它的信息聯(lián)網(wǎng)檢索能力一般,搜集了一些舊聞,時效性差點意思。但整體來說,這個效果已經(jīng)很好了,效率也比人工高。



(圖源:雷科技)

場景二:財報分析

很多海外大公司發(fā)布的財報文件,篇幅很長、數(shù)據(jù)很多,而且基本是英文,國內(nèi)投資者要看懂看透,難度不小。我們嘗試把一份28頁的蘋果財報PDF文件丟給MiMo Claw,讓它來分析和總結(jié)。



(圖源:雷科技)

MiMo Claw的表現(xiàn)很給力,比較精準地概括了這份財報數(shù)據(jù)的重點,并且給出了結(jié)論:

1. iPhone 是絕對功臣
2. 研發(fā)投入暴增31.7%
3. 服務業(yè)務穩(wěn)健增長但增速放緩
4. Mac和可穿戴拖后腿
5. 現(xiàn)金流極其充沛



(圖源:雷科技)

在查看MiMo Claw的工作流時,我們發(fā)現(xiàn),它首先會把PDF文件中的文本信息全部提取出來,在云端以TXT文件保存,再將這份文檔進行翻譯、分析,最后歸納總結(jié)。不過,由于它是基于網(wǎng)頁端運行的,所以實際體驗沒能和主流的網(wǎng)頁端大模型拉開很大的差距。

場景三:文檔優(yōu)化

對于MiMo Claw的能力,小米官方提到了它與金山生態(tài)達成了合作,在Office文檔處理方面會有優(yōu)勢。我個人一直都是PPT苦手,難點不在于內(nèi)容填充,主要是排版。畢竟,PPT給人的第一印象往往是由版面美觀度決定的。

為了「拷打」MiMo Claw,我特意找了個排版風格非常陳舊的大學課件,這個PPT一打開,完全是90年代的風格,而且毫無排版設計可言。



(圖源:雷科技)

我們將這個PPT喂給MiMo Claw,并且要求它著重美化排版,具體參考科技公司的Keynote。坦率說,我對最后的成品沒有抱太多期待,主要是因為PPT美化的難度比純粹修改文本高很多,需要龍蝦工具在模型、智能體和Skills方面都有很強的能力。

然后,從MiMo Claw最后生成的PPT文件來看,整體排版效果好了非常多,至少字體顏色比原版正常很多,看著更舒服。別的不說,原版PPT那種陳舊毫無美觀度可言的版面,總算消失了。



(圖源:雷科技)

終端品牌入局大模型,小米有長遠打算

由于還在公測階段,MiMo-V2.5系列大模型以及MiMo Claw在實際使用中自然還會存在一些問題,但我們已經(jīng)能感受它較為出色的模型和Agent能力。

同時,這次的大規(guī)模公測,大量用戶的實測和反饋,也能給小米提供一些改進的方向。從小米的規(guī)劃來看,MiMo-V2.5系列不僅面向普通用戶,更面向廣大開發(fā)者。伴隨這次公測,小米MiMo-V2.5系列的Token付費服務也一并上線。

當然,我們也認為,對于小米而言,不遺余力地迭代大模型,絕不僅僅是為了在發(fā)布會上秀技術(shù)肌肉和賺點服務費,其真正的野心在于深度賦能旗下龐大的消費核心業(yè)務。

就拿我們最熟悉的小愛同學來說,如果融入MiMo-V2.5系列的全模態(tài)能力,它將迎來一次跨越式的進化。固有印象中的小愛同學,更多是一個被動的指令執(zhí)行工具,用戶發(fā)號施令,它按部就班地開關電器或是定鬧鐘。

但在全模態(tài)大模型的加持下,它正在轉(zhuǎn)型成為一位真正的超級管家。它不僅能直接看懂用戶手機或平板屏幕上的內(nèi)容并進行深度交互,更能敏銳地聽懂家庭場景中那些模糊的自然語言,理解背后復雜的真實意圖。



(圖源:小米)

小米自家的AI技術(shù),不僅能應用到手機這類單品中,還能廣泛融入小米的「人車家」生態(tài)中,為更多產(chǎn)品、更多應用場景提供支持??梢灶A見的是,小米未來的產(chǎn)品藍圖肯定不局限于智能家居和汽車,還將包括人形機器人、其他形式的AI硬件等。

可以說,如今的大模型已經(jīng)徹底跳出了發(fā)布會上那些干巴巴跑分和技術(shù)指標,成長為真正打通并盤活各種智能場景生態(tài)的核心大腦。從更行業(yè)視角來看,這不僅是小米一家的戰(zhàn)略,更是整個智能終端賽道的共識。

小米正依托大模型不斷深化其人車家全生態(tài),而榮耀等廠商也在掌舵人李建的帶領下,加速推進底層AI的全面重構(gòu),榮耀的人形機器人剛在馬拉松賽道上奪冠,就是這一證明。這標志著曾經(jīng)單純卷硬件參數(shù)的手機廠商們,都在默契地跨越傳統(tǒng)的邊界,從終端硬件品牌全面向AI生態(tài)品牌轉(zhuǎn)型。

2026第十九屆北京國際汽車展覽會將于4月24日至5月3日在北京?中國國際展覽中心(順義館)和首都國際會展中心(新國展二期)舉行,本屆車展以“領時代·智未來”為主題,集中展現(xiàn)汽車工業(yè)的更多黑科技。
比亞迪、小米、鴻蒙智行(問界等)、小鵬、蔚來、嵐圖等頭部品牌集結(jié),多款重磅新車首秀;地平線、Momenta、卓馭等供應商集體秀肌肉,AI大模型深度賦能,高階智駕、動力電池、超快充技術(shù)等前沿科技集中亮相,看點拉滿!
雷科技旗下「電車通」將派出報道團直擊現(xiàn)場,以“關注電動車,更懂智能化”的專業(yè)視角,帶來一線獨家報道,敬請關注!



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
胡錫進譴責打女司機的保安:善良的男人是不會這樣打女人的!

胡錫進譴責打女司機的保安:善良的男人是不會這樣打女人的!

映射生活的身影
2026-04-23 13:09:09
有專家說出實話:火車有上千名乘客,為什么幾十份盒飯也賣不掉?

有專家說出實話:火車有上千名乘客,為什么幾十份盒飯也賣不掉?

網(wǎng)絡易不易
2026-04-22 12:14:48
敢接么?以進球數(shù)登頂榜首,曼城給槍手下了封最公平最殘忍的戰(zhàn)書

敢接么?以進球數(shù)登頂榜首,曼城給槍手下了封最公平最殘忍的戰(zhàn)書

濤哥侃球
2026-04-23 18:59:01
24歲進球效率堪比大羅,26歲卻被穆里尼奧退貨,實力派錯估形勢

24歲進球效率堪比大羅,26歲卻被穆里尼奧退貨,實力派錯估形勢

足籃大世界
2026-04-23 17:57:01
美剛宣布 "大勝",伊朗就從地下挖出整個“司令部”,白宮懵了

美剛宣布 "大勝",伊朗就從地下挖出整個“司令部”,白宮懵了

新動察
2026-04-22 10:12:07
“見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網(wǎng)笑柄

“見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網(wǎng)笑柄

妍妍教育日記
2026-04-15 09:30:09
新加坡寶爸爆料:在當鋪花$35800買勞力士手表送兒子,當場崩潰..

新加坡寶爸爆料:在當鋪花$35800買勞力士手表送兒子,當場崩潰..

新加坡萬事通
2026-04-22 20:55:03
美股三大指數(shù)低開,大型科技股下挫,特斯拉、微軟跌超3%,IBM跌超10%,中國金龍指數(shù)跌超2%|美股開盤

美股三大指數(shù)低開,大型科技股下挫,特斯拉、微軟跌超3%,IBM跌超10%,中國金龍指數(shù)跌超2%|美股開盤

每日經(jīng)濟新聞
2026-04-23 22:32:53
教宗吶喊:戳破特朗普叢林法則假面

教宗吶喊:戳破特朗普叢林法則假面

烽火瞭望者
2026-04-23 20:12:12
人民海軍第四艘航母官宣,或一語雙關:是河艦也是核艦

人民海軍第四艘航母官宣,或一語雙關:是河艦也是核艦

觸摸史跡
2026-04-23 08:04:50
剛剛,直線猛拉!芯片巨頭,重磅利好!

剛剛,直線猛拉!芯片巨頭,重磅利好!

數(shù)據(jù)寶
2026-04-23 21:48:38
高校輔導員催學生趕快簽工作,現(xiàn)在基本不會有央國企再來招聘了!

高校輔導員催學生趕快簽工作,現(xiàn)在基本不會有央國企再來招聘了!

燈錦年
2026-04-23 15:24:39
一個消息震驚歐洲,意大利夜總會被端,一查竟發(fā)現(xiàn)不少體壇大腕!

一個消息震驚歐洲,意大利夜總會被端,一查竟發(fā)現(xiàn)不少體壇大腕!

老范談史
2026-04-23 01:45:57
58歲湖北國貿(mào)集團董事長劉忠義去世

58歲湖北國貿(mào)集團董事長劉忠義去世

澎湃新聞
2026-04-23 17:40:27
身上突然冒出來的小紅點是什么?2種可能是癌癥先兆,別不當回事

身上突然冒出來的小紅點是什么?2種可能是癌癥先兆,別不當回事

垚垚分享健康
2026-04-22 17:10:07
女子被丈夫殺害拋尸,丈夫一審被判無期徒刑,女方父親:我成失獨老人,只剩外孫了

女子被丈夫殺害拋尸,丈夫一審被判無期徒刑,女方父親:我成失獨老人,只剩外孫了

瀟湘晨報
2026-04-23 20:49:21
沈醉晚年赴香港探親,小女孩問:你為何用竹簽刺江姐?他如何回答

沈醉晚年赴香港探親,小女孩問:你為何用竹簽刺江姐?他如何回答

浩渺青史
2026-04-19 17:44:00
曝馬寧出任亞冠決賽第四官員!獲亞足聯(lián)認可,沙特媒體被打臉

曝馬寧出任亞冠決賽第四官員!獲亞足聯(lián)認可,沙特媒體被打臉

奧拜爾
2026-04-23 18:52:23
5億打水漂!積壓7年的《鬼吹燈》電影直接網(wǎng)播,成為了一個笑話

5億打水漂!積壓7年的《鬼吹燈》電影直接網(wǎng)播,成為了一個笑話

電影聚焦
2026-04-21 14:01:52
史上最貴iPhone!iPhone Fold模具上手:比iPad mini還小

史上最貴iPhone!iPhone Fold模具上手:比iPad mini還小

快科技
2026-04-23 18:35:22
2026-04-23 23:16:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36916文章數(shù) 812046關注度
往期回顧 全部

數(shù)碼要聞

799元!小米推出米家無線吸塵器4C:170AW大吸力、75分鐘長續(xù)航

頭條要聞

媒體:莫氏雞煲陷入怪圈 在流量裹挾下真實反饋沒人聽

頭條要聞

媒體:莫氏雞煲陷入怪圈 在流量裹挾下真實反饋沒人聽

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經(jīng)要聞

關于AI算力鏈"瓶頸" 這是高盛的最新看法

科技要聞

馬斯克喊出"史上最大產(chǎn)品",但量產(chǎn)難預測

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態(tài)度原創(chuàng)

數(shù)碼
親子
藝術(shù)
游戲
公開課

數(shù)碼要聞

鎧俠發(fā)布主流級PCIe Gen5 cSSD產(chǎn)品BG8,順序讀取達10300MB/s

親子要聞

新華讀報|打乒乓球有助提高兒童注意力

藝術(shù)要聞

快看!世界新第一高樓,已蓋到100層!

《極限競速:地平線5》PS5版銷量已超500萬

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版