国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

以小小小小勝大!Google 最強小模型剛剛發(fā)布,手機也能跑

0
分享至


「開放」和「開源」,并非一字之差。

Google 的 Gemma 系列發(fā)布已有兩年,開發(fā)者能下載、能本地運行,但用途受限,再分發(fā)受限,改了也不能隨便傳播。充其量說,這只能算「開放」,還達不到 AI 圈「開源」的標準。


▲Google DeepMind CEO Demis Hassabis

就在剛剛,Google 發(fā)布四款 Gemma 4 系列模型,支持 Apache 2.0 全面開源,其中最小的版本可以在樹莓派上完全離線運行。Gemma 小模型,第一次真正意義上地落到了每個人手里。

以小小小小勝大

Gemma 4 共發(fā)布四個尺寸,底層技術(shù)與 Gemini 3 同源,覆蓋從邊緣設(shè)備到高性能工作站的硬件:

E2B / E4B:專為手機和 IoT 設(shè)備設(shè)計,與 Google Pixel 團隊及高通、聯(lián)發(fā)科深度合作優(yōu)化。推理時分別僅激活 2B 和 4B 參數(shù),以盡量節(jié)省內(nèi)存和電量。

支持 128K 上下文窗口,具備圖片、視頻和原生音頻輸入能力,可在 Pixel 手機、樹莓派、Jetson Orin Nano 上完全離線運行,延遲接近于零。Android 開發(fā)者現(xiàn)在可通過 AICore 開發(fā)者預(yù)覽版提前體驗 Agent Mode。


26B MoE:混合專家架構(gòu),推理時僅激活全部參數(shù)中的 3.8B,在保證極快推理速度的同時維持較高質(zhì)量,Arena AI 文本評分達到 1441,位列開源模型第六。

31B Dense:追求極致原始性能,Arena AI 文本評分達到 1452,位列開源模型第三。未量化的 bfloat16 權(quán)重可在單張 80GB NVIDIA H100 上運行,量化版本支持消費級 GPU,為本地微調(diào)提供強力基礎(chǔ)。

在能力層面,四款模型高度一致:均支持多步推理和復(fù)雜邏輯;原生支持函數(shù)調(diào)用、JSON 結(jié)構(gòu)化輸出和系統(tǒng)指令,可構(gòu)建能與外部工具和 API 交互的自主 Agent;支持圖片和視頻輸入,擅長 OCR 和圖表理解等視覺任務(wù);預(yù)訓練語言超過 140 種。

26B 和 31B 的上下文窗口進一步擴展至 256K,可在單次提示中傳入完整代碼庫或長文檔。


基準測試的數(shù)字,能更直觀地說明這一代的升級幅度。

與上一代 Gemma 3 27B 相比,Gemma 4 31B 在數(shù)學推理基準 AIME 2026 上從 20.8% 跳升至 89.2%,代碼能力基準 LiveCodeBench v6 從 29.1% 升至 80.0%,衡量 Agent 工具調(diào)用能力的 τ2-bench 則從 6.6% 大幅提升至 86.4%。

這三項數(shù)據(jù)尤為關(guān)鍵,因為它們直接對應(yīng)推理、編程和 Agent 三個當下最核心的應(yīng)用場景。

參數(shù)效率是另一個值得關(guān)注的維度。從「模型性能對比參數(shù)量」的散點圖來看,Gemma 4 用 26B 和 31B 的體量,拿到了通常需要數(shù)百億乃至千億參數(shù)才能達到的 Elo 分數(shù)。

26B MoE 的 Arena AI 評分接近參數(shù)量約 15 倍的 Qwen3.5-397B-A17B,31B Dense 的評分則與體量在 600B 以上的 GLM-5 處于同一梯隊。Google 將其概括為「單位參數(shù)智能密度前所未有」,至少數(shù)字顯得有理有據(jù)。


邊緣端模型同樣值得關(guān)注。

E2B 在多語言問答基準 MMMLU 上達到 60.0%,在科學知識基準 GPQA Diamond 上達到 43.4%,要知道,這僅僅是一個只激活 2B 參數(shù)、可以跑在手機上的模型。相比之下,Gemma 3 27B 在 GPQA Diamond 上的得分是 42.4%,兩者幾乎持平。

換句話說,手機上的 2B 模型,已經(jīng)追上了上一代 270 億參數(shù)的桌面模型。

在硬件生態(tài)層面,NVIDIA 與 Google 已就 Gemma 4 在 RTX GPU、DGX Spark 個人 AI 超級計算機及 Jetson Orin Nano 上的推理優(yōu)化展開合作。

NVIDIA Tensor Core 和 CUDA 軟件棧為 Gemma 4 提供了開箱即用的高吞吐、低延遲支持。本地 Agent 應(yīng)用 OpenClaw 也已適配最新模型,可調(diào)用用戶本地文件和應(yīng)用上下文自動化執(zhí)行任務(wù)。


從「開放」到「開源」,打開另一種可能性

理解這次發(fā)布,需要先搞清楚 Gemma 和 Gemini 的關(guān)系。兩者基于同一套研究和技術(shù)體系構(gòu)建,區(qū)別在于 Gemini 是訂閱制的閉源產(chǎn)品,Gemma 則是可以免費下載、本地運行的開放模型。

Gemma 系列歷代產(chǎn)品一直使用 Google 自有條款授權(quán)。

開發(fā)者雖然可以下載和本地運行,但用途和再分發(fā)受到限制,嚴格來說只能算「開放」,算不上「開源」。Google 依然握著這根韁繩。

Gemma 4 正式切換至 Apache 2.0 協(xié)議。在這套許可證下,開發(fā)者可以將模型用于任何目的,包括個人、商業(yè)和企業(yè)用途,無需支付版稅,也無任何用途限制,修改和再分發(fā)同樣自由。

Apache 2.0 還內(nèi)置了專利保護機制:貢獻者的專利自動授權(quán)給用戶,若用戶反過來以專利侵權(quán)起訴他人,則自動喪失使用授權(quán)。這套雙向條款為企業(yè)級用戶提供了額外的法律保障。

這次開源的實質(zhì)意義在于,Gemma 4 現(xiàn)在可以合法打包進產(chǎn)品、服務(wù)和硬件設(shè)備中一并交付。對于醫(yī)療、金融等有數(shù)據(jù)主權(quán)或合規(guī)要求的行業(yè)用戶,完全本地運行意味著數(shù)據(jù)不必上傳云端,同時又能獲得前沿的 AI 能力。

Hugging Face 聯(lián)合創(chuàng)始人兼 CEO Clément Delangue 將此次授權(quán)切換稱為「一個重要的里程碑」。自 2024 年 2 月首代發(fā)布至今,Gemma 系列總下載量已超 4 億次,社區(qū)衍生變體超過 10 萬個。

現(xiàn)在,模型權(quán)重已經(jīng)上架 Hugging Face、Kaggle 和 Ollama,Transformers、TRL、vLLM、llama.cpp、MLX、Unsloth、SGLang、Keras 等主流框架均已于發(fā)布當天提供支持。


本地部署可通過 Ollama 或 llama.cpp 配合 GGUF 格式權(quán)重快速上手,Unsloth Studio 同步提供量化模型的微調(diào)和部署支持。如需云端擴展,Google Vertex AI、Cloud Run 和 GKE 同步可用。

以 Gemma 4 為代表的小模型有著更深遠的意義,因為它重新回答了一個基礎(chǔ)問題:AI 應(yīng)該在哪里運行。

過去兩年,這個問題的答案幾乎是默認的:

數(shù)據(jù)中心。用戶通過網(wǎng)絡(luò)接口調(diào)用云端模型,數(shù)據(jù)必須上傳,使用依賴連接,成本由服務(wù)商定價。這套模式在消費場景里運轉(zhuǎn)尚可,但對數(shù)據(jù)主權(quán)有要求的行業(yè),比如醫(yī)療、金融、工業(yè),始終是一道難以逾越的門檻。

Gemma 4 提供了另一種可能。

手機、樹莓派、沒有外網(wǎng)的工廠終端,都可以在本地完成完整的模型推理。數(shù)據(jù)不離開設(shè)備,決策不經(jīng)過云端。Apache 2.0 的授權(quán)則進一步打開了落地空間:模型可以合法打包進硬件產(chǎn)品,預(yù)裝進行業(yè)設(shè)備,不再受限于調(diào)用協(xié)議和數(shù)據(jù)出境的合規(guī)約束。


能力層面的數(shù)字也印證了這條路的可行性。E2B 在科學知識基準 GPQA Diamond 上的得分,已經(jīng)與上一代 270 億參數(shù)的桌面模型基本持平,而它推理時只激活 20 億參數(shù),可以完全離線跑在手機上。

「更便宜」或「更方便」已經(jīng)不足以描述這個變化,它更接近于一次覆蓋范圍的擴張,AI 能力開始有條件真正進入那些長期被排除在外的場景。

操作系統(tǒng)的普及經(jīng)歷過類似的過程:從專業(yè)機構(gòu)的專用工具,逐漸嵌進每一臺個人設(shè)備,直到人們不再意識到它的存在。AI 離那個階段還很遠,工程、交互、可靠性上的問題都還沒有完整的答案,但可以跑在任意設(shè)備上,一定是這條路上最基礎(chǔ)也是最重要的一步。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
何超蕸私生活曝光!信德員工證實:相伴多年伴侶,3位密友陪伴

何超蕸私生活曝光!信德員工證實:相伴多年伴侶,3位密友陪伴

一盅情懷
2026-04-14 09:47:33
特朗普的嘴,世界上最值錢的嘴

特朗普的嘴,世界上最值錢的嘴

南風窗
2026-04-14 15:01:16
中國巨人!張子宇2027年將獲WNBA選秀資格 知名網(wǎng)站預(yù)測成榜眼

中國巨人!張子宇2027年將獲WNBA選秀資格 知名網(wǎng)站預(yù)測成榜眼

醉臥浮生
2026-04-14 12:03:23
演員袁成杰探店文章面館,當被問為啥開店,文章:“純屬是為了自己有一口吃的”

演員袁成杰探店文章面館,當被問為啥開店,文章:“純屬是為了自己有一口吃的”

新浪財經(jīng)
2026-04-14 13:33:43
聯(lián)合國前主席稱:中國人的風俗,世界上沒有一個國家能夠?qū)W得來

聯(lián)合國前主席稱:中國人的風俗,世界上沒有一個國家能夠?qū)W得來

番外行
2026-04-14 12:56:10
AI涉黃曝光:幾句話就能手搓讓人滿意的大尺度視頻

AI涉黃曝光:幾句話就能手搓讓人滿意的大尺度視頻

3DM游戲
2026-04-13 18:15:07
向太自曝三個子女兩個躺平,尤其是向佑,虧光幾百萬只想繼承家產(chǎn)

向太自曝三個子女兩個躺平,尤其是向佑,虧光幾百萬只想繼承家產(chǎn)

眼底星碎
2026-04-14 14:24:23
41歲還能拿周最佳!頭號詹黑公開怒噴,詹姆斯簡直是在打NBA的臉

41歲還能拿周最佳!頭號詹黑公開怒噴,詹姆斯簡直是在打NBA的臉

小路看球
2026-04-14 15:26:24
山東一24歲準新娘在私人診所輸液,突發(fā)休克昏迷近3個月未醒;涉事診所已變生鮮超市,無證醫(yī)生賠了20萬元后失聯(lián)

山東一24歲準新娘在私人診所輸液,突發(fā)休克昏迷近3個月未醒;涉事診所已變生鮮超市,無證醫(yī)生賠了20萬元后失聯(lián)

大風新聞
2026-04-14 09:48:12
今晚10點準時封鎖!美總統(tǒng)沒料到:中東貴客現(xiàn)身北京,中國出招了

今晚10點準時封鎖!美總統(tǒng)沒料到:中東貴客現(xiàn)身北京,中國出招了

夢史
2026-04-14 01:40:13
越鬧越大!奧迪加油站逃單后續(xù),不到一天就落網(wǎng),司機身份被公開

越鬧越大!奧迪加油站逃單后續(xù),不到一天就落網(wǎng),司機身份被公開

云舟史策
2026-04-13 07:19:48
曾志偉73歲大壽席開60桌,子女齊聚罕見同臺,邱淑貞穿著素雅現(xiàn)身

曾志偉73歲大壽席開60桌,子女齊聚罕見同臺,邱淑貞穿著素雅現(xiàn)身

阿纂看事
2026-04-13 15:49:54
中共中央批準,開除韓占武黨籍

中共中央批準,開除韓占武黨籍

新京報
2026-04-13 11:34:06
05年跑川藏線,老板硬把剛成年的千金塞進駕駛室,沒想到一路奇遇

05年跑川藏線,老板硬把剛成年的千金塞進駕駛室,沒想到一路奇遇

白云故事
2025-12-16 14:55:05
教育部通知!9月入學迎來顛覆性改革,孩子上學不用再拼家底了

教育部通知!9月入學迎來顛覆性改革,孩子上學不用再拼家底了

今朝牛馬
2026-04-10 22:35:42
“你真美,是不是嫌我老?”:手機被沒收后,女子用手表錄16分鐘

“你真美,是不是嫌我老?”:手機被沒收后,女子用手表錄16分鐘

江山揮筆
2026-04-14 10:48:18
山東青島膠州網(wǎng)約車司機為搶充電樁殺人?官方回應(yīng)

山東青島膠州網(wǎng)約車司機為搶充電樁殺人?官方回應(yīng)

半島官網(wǎng)
2026-04-13 17:09:18
鄭麗文返臺后,島內(nèi)民調(diào)曝光,位列倒數(shù)第三,與沈伯洋幾乎持平?

鄭麗文返臺后,島內(nèi)民調(diào)曝光,位列倒數(shù)第三,與沈伯洋幾乎持平?

異常清晰的夢
2026-04-14 12:07:46
臺灣島內(nèi)徹底亂了!就在4月13日,臺國民黨突然發(fā)布嚴正聲明

臺灣島內(nèi)徹底亂了!就在4月13日,臺國民黨突然發(fā)布嚴正聲明

小馬姨
2026-04-14 10:14:05
國乒三條消息: 張繼科復(fù)出、馬龍坐鎮(zhèn)成都、王曼昱跨界新身份

國乒三條消息: 張繼科復(fù)出、馬龍坐鎮(zhèn)成都、王曼昱跨界新身份

羅納爾說個球
2026-04-13 22:28:20
2026-04-14 16:15:00
愛范兒 incentive-icons
愛范兒
消費科技第一媒體
38694文章數(shù) 2601475關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴對華芯片法案來了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴對華芯片法案來了

體育要聞

他做對了所有事,卻被整個職業(yè)網(wǎng)壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財經(jīng)要聞

許家印受審當庭表示認罪悔罪

汽車要聞

長城歐拉5限定版純電版上市 限量99臺售價13.38萬元

態(tài)度原創(chuàng)

家居
教育
數(shù)碼
時尚
軍事航空

家居要聞

現(xiàn)代融合 自然靈動

教育要聞

初中數(shù)學,根式運算

數(shù)碼要聞

榮耀WIN游戲本首發(fā)東風尾噴散熱引擎,WIN生態(tài)全面提速

今年科切拉的風吹向了誰?

軍事要聞

伊朗要求五個中東國家賠償戰(zhàn)爭損失

無障礙瀏覽 進入關(guān)懷版