国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

蘋果在WWDC提到的本地模型,這家公司把它提速了220倍

0
分享至

你有沒有注意到,在昨晚的蘋果WWDC大會上,除了褒貶不一的新iOS系統(tǒng)之外,整個資本市場和開發(fā)者們真正關(guān)注的都是,蘋果下一代系統(tǒng)和AI之間的關(guān)系會是什么樣的。

蘋果也確實(shí)給出了他們的答案,簡單來說就是:蘋果正式開放了本地語言模型的API。

是的,那一刻起,我們手上的iPhone,不再只是一個拍照好、生態(tài)強(qiáng)的消費(fèi)電子產(chǎn)品,而是真正擁有了“AI大腦”的能力。

但很快你會發(fā)現(xiàn),即便蘋果這次開放的本地模型性能對標(biāo)GPT-3.5,開發(fā)者要真正在端側(cè)跑起來AI應(yīng)用,仍然會遇到一個老問題:慢。不只是模型體積問題,更是推理速度不夠快,尤其在處理長文本任務(wù)時,性能掉得厲害。

然而,就在幾乎同一時間,一家國產(chǎn)AI團(tuán)隊(duì)發(fā)布了一個性能驚人的新模型——MiniCPM 4.0。他們在端側(cè)處理128K長文本時,實(shí)現(xiàn)了常規(guī)場景5倍提速,解碼速度最高220倍提升,并且開源了。

本地模型的黃金時代正在開啟

我們都知道云端大模型雖然強(qiáng)大,但也貴得離譜,AI創(chuàng)業(yè)者經(jīng)常要面對這樣一個選擇:

  • 用云端大模型,用戶體驗(yàn)好,但成本跟著調(diào)用次數(shù)線性上漲,越火越虧錢;

  • 用云端低成本模型,雖然能控成本,但要么模型效果差,要么依然無法解決本地運(yùn)行的隱私問題,用戶留不住。

本地模型(也叫“端側(cè)模型”)則是這一局博弈中的“第三條路”:

  1. 響應(yīng)快:所有計(jì)算本地完成,沒有網(wǎng)絡(luò)延遲。

  2. 更安全:隱私數(shù)據(jù)不出設(shè)備,天然符合合規(guī)要求。

  3. 不花錢:開發(fā)者不再為每次調(diào)用買單,邊際成本幾乎為零。

蘋果這次的發(fā)布就是在推這件事:把基礎(chǔ)模型塞進(jìn)每臺iPhone、iPad、Mac里,直接變成AI開發(fā)的“新基建”。而這對模型廠商來說,意味著一個億級設(shè)備體量的新戰(zhàn)場已經(jīng)打開。

MiniCPM 4.0

說回MiniCPM 4.0,它來自一家名叫面壁智能的團(tuán)隊(duì),專注做端側(cè)模型已經(jīng)很多年,這次他們做出了一個極具想象力的“小鋼炮”。

在極限場景下,MiniCPM 4.0的長文本推理速度可以實(shí)現(xiàn)最快220倍提升,常規(guī)場景下也有5倍提速。對于端側(cè)設(shè)備來說,這不是性能優(yōu)化,這是質(zhì)變:

  • 以前手機(jī)只能做簡單問答,現(xiàn)在可以一秒內(nèi)讀懂整篇論文、分析代碼,真正成為生產(chǎn)力工具;

  • 原本AI對話還會卡頓,現(xiàn)在你點(diǎn)一下模型就瞬間回你;

  • 不需要聯(lián)網(wǎng),不依賴云端,你自己的AI,離你更近了。


提速背后的秘密

要在手機(jī)、PC等端側(cè)設(shè)備上實(shí)現(xiàn)這么夸張的提速,我覺得實(shí)在是有點(diǎn)離譜,所以我很好奇MiniCPM是怎么做到的,國產(chǎn)大模型公司怎么會有那么多“黑科技”。

所以,為了搞懂這件事,我把面壁這次隨模型發(fā)布的43頁開源論文《MiniCPM4: Ultra-EfficientLLMson End Devices》丟給了AI,嘗試進(jìn)行理解。我覺得用一句話概括就是:不是簡單“減肥”,而是“系統(tǒng)級瘦身 + 增強(qiáng)”。

他們的速度升級來自四個層面的創(chuàng)新:

  1. 架構(gòu)層:采用升級版的稀疏注意力機(jī)制 InfLLM v2,只計(jì)算最相關(guān)的信息,大幅減少計(jì)算量;

  2. 訓(xùn)練層:只用同類模型22%的訓(xùn)練數(shù)據(jù),就達(dá)到了相當(dāng)甚至更強(qiáng)的能力;

  3. 推理層:自研 CPM.cu 推理框架,結(jié)合量化、投機(jī)解碼等技術(shù),實(shí)現(xiàn)了輕量級、低延遲的本地運(yùn)行;

  4. 系統(tǒng)層:通過 ArkInfer 框架,實(shí)現(xiàn)跨平臺端側(cè)部署,適配主流芯片,如高通、華為、Intel等。

這里可以特別說一句:雖然蘋果開放了模型API,但真正要把模型“跑起來”,一個高效穩(wěn)定的推理框架幾乎是剛需。而這類框架在開源社區(qū)中其實(shí)非常稀缺。面壁這次隨MiniCPM 4.0一起開源的ArkInfer和CPM.cu組合,恰好補(bǔ)上了這個缺口——不僅跑得快、平臺適配廣,而且開發(fā)門檻低,幾行代碼就能部署到端側(cè),這對于開發(fā)者來說是非常實(shí)用的“剛需型工具”。

簡單來說,這不是靠“堆GPU”搞出來的,而是F1賽車一樣,每一寸系統(tǒng)都在為效率而生。

不止是“快”

AI開發(fā)者會知道,這種從“幾秒”到“幾百毫秒”的體驗(yàn)提升,會引發(fā)三個重要變化:

首先,用AI交互變得說話一樣順暢,無論是旅行場景下的實(shí)時翻譯、智能助理還是游戲NPC,瞬時響應(yīng)會成為“標(biāo)配體驗(yàn)”;

其次,更多AI任務(wù)可以本地完成,比如信息摘要、文檔寫作、代碼生成,對于現(xiàn)在少了AI幾乎就不會做任何工作的我來說,坐飛機(jī)、高鐵等網(wǎng)絡(luò)不穩(wěn)定的場景下,我也能工作了;

最后是開發(fā)者生態(tài)被重新激活,未來不僅是手機(jī)App,還有無數(shù)穿戴設(shè)備、邊緣終端,都可以跑得動自己的AI。以我自己來說,雖然我已經(jīng)用AI開發(fā)了很多產(chǎn)品,但少有AI產(chǎn)品,因?yàn)樽鲇蠥I功能的產(chǎn)品面臨的最直接的問題就是成本問題,你需要能保證你提供的產(chǎn)品價(jià)值能覆蓋調(diào)用的AI API成本,而且你需要思考清楚商業(yè)策略讓用戶愿意付費(fèi),這期是難倒了一大批的獨(dú)立開發(fā)者,也會讓你做產(chǎn)品時很難抉擇,但是端側(cè)模型的“0成本”調(diào)用完全可以解放這部分估計(jì),你只需要去想象創(chuàng)新的可能就好了。

AI在你手上

蘋果率先提供了端側(cè)AI的舞臺(估計(jì)Google為安卓系統(tǒng)提供的模型也快趕上了),而MiniCPM 4.0讓我們看到真正能“跑起來”的主角長什么樣。

隨著模型越來越高效、部署越來越便捷,我們正站在一個新階段的門口:

AI不再只是“線上服務(wù)”,而是像操作系統(tǒng)、電池一樣,成為每臺設(shè)備的內(nèi)建能力。

就像智能手機(jī)點(diǎn)燃了App經(jīng)濟(jì)那樣,下一輪AI浪潮,將由“跑得動”、“用得上”、“快到飛起”的端側(cè)模型引爆。

而MiniCPM 4.0,就是那臺準(zhǔn)備好沖線的“AI小鋼炮”。

如果你是開發(fā)者,強(qiáng)烈推薦去 GitHub 看看這款模型的表現(xiàn);這是個從模型參數(shù)到預(yù)訓(xùn)練數(shù)據(jù)集,再到端側(cè)推理框架都開源的真開源模型;

如果你是AI產(chǎn)品創(chuàng)業(yè)者,不妨考慮下下一版是不是可以用端側(cè)方案來做出點(diǎn)“爽感”不一樣的體驗(yàn);

畢竟,在今天的大模型時代,“快”從來不是一個小指標(biāo),它可能是一整個產(chǎn)品邏輯的起點(diǎn)。

MiniCPM GitHub鏈接:https://github.com/OpenBMB/MiniCPM

Huggingface鏈接:https://huggingface.co/openbmb/MiniCPM4-8B

43頁開源論文:https://github.com/OpenBMB/MiniCPM/blob/main/report/MiniCPM_4_Technical_Report.pdf

https://arxiv.org/pdf/2506.07900

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1956年毛主席罕見發(fā)問:東來順羊肉咋回事?陳云一查,根子不在師傅,問題出在“新規(guī)矩”

1956年毛主席罕見發(fā)問:東來順羊肉咋回事?陳云一查,根子不在師傅,問題出在“新規(guī)矩”

歷史回憶室
2025-12-23 10:19:17
志愿軍首戰(zhàn)殲滅美軍一萬五,主席卻提筆改成六千,麥克阿瑟看完戰(zhàn)報(bào)笑得合不攏嘴,結(jié)果幾十萬大軍一頭扎進(jìn)死胡同,這招示弱太絕了

志愿軍首戰(zhàn)殲滅美軍一萬五,主席卻提筆改成六千,麥克阿瑟看完戰(zhàn)報(bào)笑得合不攏嘴,結(jié)果幾十萬大軍一頭扎進(jìn)死胡同,這招示弱太絕了

歷史回憶室
2025-12-26 11:42:28
為啥"唐氏兒"都長著同一張臉?醫(yī)生一般不說,父母最好要知道

為啥"唐氏兒"都長著同一張臉?醫(yī)生一般不說,父母最好要知道

大果小果媽媽
2025-12-28 11:33:24
孟村殺妻案結(jié)果公布,判決前金昊母子照片曝光,兩人狀態(tài)截然不同

孟村殺妻案結(jié)果公布,判決前金昊母子照片曝光,兩人狀態(tài)截然不同

歷史偉人錄
2025-12-27 21:34:16
袁天罡農(nóng)家躲雨,主人只掃屋心,他面色驟變:三代之內(nèi)必出大人物

袁天罡農(nóng)家躲雨,主人只掃屋心,他面色驟變:三代之內(nèi)必出大人物

小豫講故事
2025-12-28 06:00:08
李瑞環(huán)說:葉選平是葉帥的兒子,但水平比我高,為什么不能當(dāng)省長

李瑞環(huán)說:葉選平是葉帥的兒子,但水平比我高,為什么不能當(dāng)省長

章荳解說體育
2025-12-11 21:56:41
柬埔寨國王,72歲了,沒錢沒權(quán),沒結(jié)婚沒孩子,和老母親相依為命

柬埔寨國王,72歲了,沒錢沒權(quán),沒結(jié)婚沒孩子,和老母親相依為命

趣文說娛
2025-12-23 17:34:34
童瑤胸貼露出來了

童瑤胸貼露出來了

手工制作阿殲
2025-12-15 12:20:21
中山一商場展車撞入手機(jī)店,車企工作人員:小孩誤觸所致,無人受傷

中山一商場展車撞入手機(jī)店,車企工作人員:小孩誤觸所致,無人受傷

極目新聞
2025-12-28 13:48:03
錢再多也沒用!向太曝馬伊琍已再婚,原來當(dāng)年文章過不了心里那關(guān)

錢再多也沒用!向太曝馬伊琍已再婚,原來當(dāng)年文章過不了心里那關(guān)

一娛三分地
2025-12-15 13:26:07
一個男人如果不正經(jīng),通過這2個模樣,一看便知!

一個男人如果不正經(jīng),通過這2個模樣,一看便知!

加油丁小文
2025-12-01 08:00:12
殲-15幾乎全部退役,淪為全球最短命艦載機(jī)!它究竟有哪些短板?

殲-15幾乎全部退役,淪為全球最短命艦載機(jī)!它究竟有哪些短板?

小莜讀史
2025-12-27 14:55:11
201米!40億!騰訊西南總部,世界“第一扭”摩天樓

201米!40億!騰訊西南總部,世界“第一扭”摩天樓

GA環(huán)球建筑
2025-12-25 23:00:32
原來他早已去世,15歲演戲44歲走紅,47歲患癌離世,哥哥是熟面孔

原來他早已去世,15歲演戲44歲走紅,47歲患癌離世,哥哥是熟面孔

故事講電影
2025-12-28 20:01:41
“后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

“后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

詩意世界
2025-11-30 11:04:47
馬卡:弗洛倫蒂諾使巴薩財(cái)務(wù)難題徹底解決,應(yīng)拿巴薩金質(zhì)勛章

馬卡:弗洛倫蒂諾使巴薩財(cái)務(wù)難題徹底解決,應(yīng)拿巴薩金質(zhì)勛章

懂球帝
2025-12-28 20:59:23
溥儀9歲仍在吃奶,給他當(dāng)乳娘有2規(guī)矩:一是喂奶,另一個毫無人性

溥儀9歲仍在吃奶,給他當(dāng)乳娘有2規(guī)矩:一是喂奶,另一個毫無人性

小豫講故事
2025-12-27 06:00:06
中國股市:炒股成功的人到底有多可怕?從窮人到富人的全過程!

中國股市:炒股成功的人到底有多可怕?從窮人到富人的全過程!

股經(jīng)縱橫談
2025-12-28 18:53:25
天氣預(yù)報(bào)丨新一輪降溫即將到來 重慶高海拔地區(qū)有雪

天氣預(yù)報(bào)丨新一輪降溫即將到來 重慶高海拔地區(qū)有雪

上游新聞
2025-12-28 17:24:02
廣東vs山西,對抗強(qiáng)度拉滿,胡明軒奎因表現(xiàn)糟糕,杜鋒投訴迪亞洛

廣東vs山西,對抗強(qiáng)度拉滿,胡明軒奎因表現(xiàn)糟糕,杜鋒投訴迪亞洛

鄒維體育
2025-12-28 20:06:15
2025-12-28 21:20:49
AI進(jìn)化論花生 incentive-icons
AI進(jìn)化論花生
AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
102文章數(shù) 47關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

藝術(shù)
旅游
家居
手機(jī)
軍事航空

藝術(shù)要聞

驚艷!陳紅20年前沙發(fā)照曝光,宛如人間尤物!

旅游要聞

大理的櫻花之美一如杭州的桂花之香,滿城皆是,隨處可聞

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

手機(jī)要聞

HMD新機(jī)曝光:高刷LCD屏+大電池

軍事要聞

與特朗普會晤前 澤連斯基亮明“紅線”

無障礙瀏覽 進(jìn)入關(guān)懷版