国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌重磅開源Gemma 4!手機(jī)離線跑 Agent、還降內(nèi)存,Qwen 被拉進(jìn)正面對決

0
分享至


整理 | 褚杏娟

剛剛,谷歌正式發(fā)布 Gemma 4,稱“這是其迄今為止最智能的開放模型系列”。該系列面向復(fù)雜推理與智能體工作流設(shè)計,采用商業(yè)許可的 Apache 2.0 許可證開源。

Gemma 4 提供四種規(guī)格:Effective 2B(E2B)、Effective 4B(E4B)、26B 混合專家模型(MoE)和 31B 稠密模型(Dense)。

在端側(cè),E2B 和 E4B 模型針對移動和物聯(lián)網(wǎng)設(shè)備優(yōu)化,推理時分別激活約 20 億和 40 億參數(shù),以降低內(nèi)存和電量消耗。據(jù)介紹,這兩個模型已與谷歌 Pixel 團(tuán)隊、高通和聯(lián)發(fā)科等硬件廠商合作,可在手機(jī)、Raspberry Pi、NVIDIA Jetson Nano 等設(shè)備上離線運行,延遲接近零。

與此同時,研究人員表示,26B MoE 模型有一個巧妙之處:在推理任務(wù)中,它只會激活 38 億參數(shù),因此既能保持較高運行速度,又不會犧牲大模型所具備的深厚知識儲備。

26B 和 31B 模型提供面向 IDE、編程助手和 Agent 工作流的高級推理能力。模型針對消費級 GPU 進(jìn)行了優(yōu)化,讓學(xué)生、研究人員和開發(fā)者能夠把自己的工作站變成以本地優(yōu)先為核心的 AI 服務(wù)器。

谷歌 DeepMind 研究人員 Clement Farabet 和 Olivier Lacombe 表示,在 Gemma 4 上,他們設(shè)法進(jìn)一步壓榨出了更多“單位參數(shù)智能”,讓這些模型能夠顯著實現(xiàn)“越級發(fā)揮”。例如,31B Dense 版本目前在行業(yè)標(biāo)準(zhǔn)榜單的開源模型中排名第三。

Gemma 4 建立在與 Gemini 3 相同的架構(gòu)基礎(chǔ)之上,旨在處理復(fù)雜推理任務(wù),并支持在工作站、智能手機(jī)等低功耗設(shè)備上本地運行的自主 AI Agent。這次關(guān)鍵提升包括:

  • 推理能力更強(qiáng):該系列所有模型都面向復(fù)雜推理任務(wù)進(jìn)行了優(yōu)化,并提供可配置的“思考”模式;

  • 多模態(tài)能力進(jìn)一步擴(kuò)展:所有模型都支持文本和圖像輸入,其中圖像支持可變寬高比和不同分辨率;E2B 和 E4B 還原生支持視頻與音頻輸入;

  • 上下文窗口更大:端側(cè)模型為 128K,較大模型(26B/31B)最高 256K;

  • 編碼與智能體能力增強(qiáng):模型在代碼能力基準(zhǔn)測試中有明顯提升,同時內(nèi)置函數(shù)調(diào)用支持,能夠更好地驅(qū)動自主 Agent 執(zhí)行任務(wù);

  • 原生支持系統(tǒng)提示詞:Gemma 4 內(nèi)置了 system role 支持,讓對話結(jié)構(gòu)更清晰,也更容易控制模型行為。


Farabet 和 Lacombe 解釋稱,每個 Gemma 4 模型都更適合用于運行 AI Agent。此前幾代 Gemma 模型往往需要開發(fā)者額外調(diào)整設(shè)計,才能與其他軟件工具交互;而 Gemma 4 已原生支持函數(shù)調(diào)用和結(jié)構(gòu)化 JSON 輸出、原生系統(tǒng)指令以及超過 140 種語言。這意味著,開發(fā)者可以用它們來驅(qū)動自主 Agent,與第三方工具交互,并執(zhí)行多步驟任務(wù)規(guī)劃。


根據(jù) Arena AI 文本排行榜(截至 2026 年 2 月 1 日),31B 模型排名全球開放模型第 3 位,26B MoE 模型排名第 6 位。


谷歌表示,Gemma 4 在部分基準(zhǔn)測試中表現(xiàn)優(yōu)于參數(shù)大 20 倍的模型。


不過,有網(wǎng)友自己測算結(jié)果 Qwen3.5-27B 要略優(yōu)于 Gemma 4 31B。


還有網(wǎng)友評價道,“最讓人眼前一亮的部分在于:一共四種尺寸,全部都為 Agent 場景做好了準(zhǔn)備,而且全都可以在本地運行。我們一直都在呼吁,需要那種不用每次‘思考’都把數(shù)據(jù)傳回云端的模型?,F(xiàn)在他們終于聽進(jìn)去了,而且給出的東西甚至比預(yù)期還多?!?/p>

開源 + 本地,谷歌擴(kuò)大優(yōu)勢

此次,Gemma 4 繼續(xù)采用 Apache 2.0 許可證,允許商業(yè)使用、自由修改和部署。谷歌稱,這一選擇旨在給予開發(fā)者對數(shù)據(jù)、基礎(chǔ)設(shè)施和模型的完全控制權(quán),支持本地或云端環(huán)境的安全部署。這消除了其他一些 AI 模型在商業(yè)使用上的諸多限制,或會成為企業(yè)應(yīng)用開發(fā)者的理想選擇。

此外,谷歌還詳細(xì)列出了使用各種大小的 Gemma 4 模型版本運行推理所需的大致 GPU 或 TPU 內(nèi)存。


Gemma 4 在架構(gòu)設(shè)計上進(jìn)一步兼顧了效率與部署現(xiàn)實。E2B 和 E4B 中的 “E” 指的是“有效參數(shù)”,這兩款小模型采用了 PLE(每層嵌入)技術(shù),以提升端側(cè)部署時的參數(shù)利用效率。需要注意的是,PLE 雖然不會增加模型層數(shù),但會為每層解碼器中的每個 token 配置獨立的小型嵌入,因此模型實際加載到內(nèi)存中的靜態(tài)權(quán)重,往往會高于“有效參數(shù)規(guī)?!北砻嫔蠈?yīng)的占用。

26B 版本采用了混合專家(MoE)架構(gòu),雖然生成時每個 token 實際只會激活約 40 億參數(shù),但為了保證路由和推理速度,全部 260 億參數(shù)仍需提前載入內(nèi)存,所以它的實際顯存需求更接近稠密 26B 模型,而不是 4B 模型。

此外,官方給出的內(nèi)存估算通常只覆蓋靜態(tài)模型權(quán)重本身,并不包含運行框架、上下文窗口和 KV Cache 帶來的額外顯存開銷;如果進(jìn)一步進(jìn)行微調(diào),顯存需求還會明顯高于推理階段,具體占用則取決于開發(fā)框架、批量大小,以及采用全參數(shù)微調(diào)還是 LoRA 等參數(shù)高效微調(diào)方案。

這次發(fā)布再次凸顯了谷歌想要主導(dǎo)“本地 AI”產(chǎn)業(yè)的雄心。Constellation Research 分析師 Holger Mueller 表示,即便是較大規(guī)模的 Gemma 4,也小到足以在單張圖形處理器上運行,因此它們非常適合邊緣場景以及那些對低延遲和數(shù)字主權(quán)有較高要求的應(yīng)用。

他認(rèn)為,“谷歌正在擴(kuò)大自己在 AI 領(lǐng)域的領(lǐng)先優(yōu)勢,不只是依靠 Gemini,也包括通過 Gemma 4 家族這樣的開放模型。這些模型對于構(gòu)建 AI 開發(fā)者生態(tài)非常重要,也將幫助公司切入不同設(shè)備形態(tài)下的功能型和垂直行業(yè)應(yīng)用場景。谷歌在此前發(fā)布 Gemma 3 時已經(jīng)樹立了很高的門檻,因此這次發(fā)布也承載了很多期待?!?/p>

現(xiàn)在,開發(fā)者可以通過谷歌云直接訪問這些模型,也可以在 Hugging Face、Kaggle 和 Ollama 上獲取模型及其開放權(quán)重。Android 開發(fā)者可在 AICore Developer Preview 中試用智能體工作流原型。

此外,谷歌提供了多種推理和微調(diào)路徑,包括:Hugging Face、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM 和 NeMo、LM Studio、Unsloth、SGLang、Cactus、Docker、MaxText、Tunix、Keras。云上部署支持 Vertex AI、Cloud Run、GKE、Sovereign Cloud 及 TPU 加速服務(wù)。

Gemma 4 開箱支持 NVIDIA(從 Jetson Nano 到 Blackwell GPU)、AMD GPU(通過開源 ROCm? 棧)以及 Google Cloud TPU。谷歌方面稱,新模型采用與谷歌專有模型相同等級的基礎(chǔ)設(shè)施安全協(xié)議,適用于企業(yè)和主權(quán)機(jī)構(gòu)的高標(biāo)準(zhǔn)安全與可靠性要求。

https://deepmind.google/models/gemma/gemma-4/-and-e4b

聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

QCon 全球軟件開發(fā)大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節(jié)跳動、小米、百度等一線科技企業(yè)與創(chuàng)新團(tuán)隊的技術(shù)專家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進(jìn)展開深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進(jìn)行咨詢。

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
130萬皇馬球迷請愿離隊!姆巴佩心碎發(fā)聲:等我走了你們才會后悔

130萬皇馬球迷請愿離隊!姆巴佩心碎發(fā)聲:等我走了你們才會后悔

體育閑話說
2026-05-07 08:05:06
吳宜澤奪冠后首度現(xiàn)身國內(nèi),在西安機(jī)場受球迷接機(jī)送花,之后還將舉行見面會,此前他曾表示想回國吃美食、見朋友

吳宜澤奪冠后首度現(xiàn)身國內(nèi),在西安機(jī)場受球迷接機(jī)送花,之后還將舉行見面會,此前他曾表示想回國吃美食、見朋友

極目新聞
2026-05-07 07:12:51
“我要去中國了” 51歲老馬退出斯諾克元老賽 火箭:為錢我會參加

“我要去中國了” 51歲老馬退出斯諾克元老賽 火箭:為錢我會參加

風(fēng)過鄉(xiāng)
2026-05-07 07:56:33
行業(yè)第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

行業(yè)第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

商悟社
2026-05-07 00:07:04
740萬觀眾的選擇:這部英劇為何讓刻薄女人成了主角

740萬觀眾的選擇:這部英劇為何讓刻薄女人成了主角

娛圈觀察員
2026-05-06 15:15:55
同濟(jì)大學(xué)教師王某團(tuán)隊一年兩登《自然》的論文被指造假,本人曾稱“十年磨一劍” 學(xué)校正調(diào)查

同濟(jì)大學(xué)教師王某團(tuán)隊一年兩登《自然》的論文被指造假,本人曾稱“十年磨一劍” 學(xué)校正調(diào)查

紅星新聞
2026-04-16 21:08:20
豆包搜索黎元洪跳出演員范偉圖片,官方回應(yīng):系媒體大量報道

豆包搜索黎元洪跳出演員范偉圖片,官方回應(yīng):系媒體大量報道

PChome電腦之家
2026-05-06 10:22:59
丟了7年的手機(jī)突然發(fā)回定位 還自動拍下了使用者的照片 失主:已經(jīng)成功要回了手機(jī)

丟了7年的手機(jī)突然發(fā)回定位 還自動拍下了使用者的照片 失主:已經(jīng)成功要回了手機(jī)

閃電新聞
2026-05-06 12:58:59
GPT-5.5 Instant 突然全員免費了!

GPT-5.5 Instant 突然全員免費了!

新浪財經(jīng)
2026-05-07 04:41:37
罪有應(yīng)得!以色列,正被全世界集體孤立!

罪有應(yīng)得!以色列,正被全世界集體孤立!

毛豆論道
2026-05-05 17:35:52
日本部署消耗性超廉價紙板無人機(jī):售價2000美元 可在5到10分鐘內(nèi)組裝完成

日本部署消耗性超廉價紙板無人機(jī):售價2000美元 可在5到10分鐘內(nèi)組裝完成

快科技
2026-05-05 10:29:05
黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

魔都姐姐雜談
2026-05-07 15:17:15
國乒男團(tuán)VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

國乒男團(tuán)VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

體育大學(xué)僧
2026-05-07 10:52:38
高校畢業(yè)生創(chuàng)新高 上海打出組合拳護(hù)航就業(yè)

高校畢業(yè)生創(chuàng)新高 上海打出組合拳護(hù)航就業(yè)

看看新聞Knews
2026-05-06 19:32:02
1958年毛澤東視察濟(jì)南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

1958年毛澤東視察濟(jì)南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

史海孤雁
2026-05-05 17:07:19
問題果然出現(xiàn)了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

問題果然出現(xiàn)了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

混沌錄
2026-05-06 23:01:06
江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對話語權(quán)?

江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對話語權(quán)?

觀察眼看世界
2026-05-07 11:02:46
馬刺用104歲三塔慶祝!創(chuàng)9紀(jì)錄晉級概率升75% 文班:反彈意料之中

馬刺用104歲三塔慶祝!創(chuàng)9紀(jì)錄晉級概率升75% 文班:反彈意料之中

顏小白的籃球夢
2026-05-07 18:13:57
普京不想再打了,俄軍打下來的領(lǐng)土,足夠給1億俄羅斯人一個交待

普京不想再打了,俄軍打下來的領(lǐng)土,足夠給1億俄羅斯人一個交待

混沌錄
2026-05-05 13:50:21
1933年希特勒接見中國青年潘德明,說了一句話令在場德國軍官震驚

1933年希特勒接見中國青年潘德明,說了一句話令在場德國軍官震驚

超人強(qiáng)動物俱樂部
2026-05-07 15:07:42
2026-05-07 18:48:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1477文章數(shù) 149關(guān)注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

媒體:不是中國離不開世界杯 是世界杯更需要中國

頭條要聞

媒體:不是中國離不開世界杯 是世界杯更需要中國

體育要聞

巴黎再進(jìn)歐冠決賽,最尷尬的情況還是發(fā)生了

娛樂要聞

孫楊強(qiáng)迫拉張豆豆手那一幕,我看笑了,也看怒了

財經(jīng)要聞

金融“風(fēng)暴”,AI制造

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

態(tài)度原創(chuàng)

游戲
家居
時尚
本地
軍事航空

《命運石之門:重啟版》確認(rèn)8月20日發(fā)售 追加新結(jié)局

家居要聞

破繭成蝶 土味精裝房爆改

穿黑褲子別只會搭白T恤!看看這些顯瘦的搭配,高級感拉滿

本地新聞

用青花瓷的方式,打開西溪濕地

軍事要聞

特朗普:美伊"很可能"達(dá)成協(xié)議

無障礙瀏覽 進(jìn)入關(guān)懷版