国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌重磅開(kāi)源Gemma 4!手機(jī)離線跑 Agent、還降內(nèi)存,Qwen 被拉進(jìn)正面對(duì)決

0
分享至


整理 | 褚杏娟

剛剛,谷歌正式發(fā)布 Gemma 4,稱(chēng)“這是其迄今為止最智能的開(kāi)放模型系列”。該系列面向復(fù)雜推理與智能體工作流設(shè)計(jì),采用商業(yè)許可的 Apache 2.0 許可證開(kāi)源。

Gemma 4 提供四種規(guī)格:Effective 2B(E2B)、Effective 4B(E4B)、26B 混合專(zhuān)家模型(MoE)和 31B 稠密模型(Dense)。

在端側(cè),E2B 和 E4B 模型針對(duì)移動(dòng)和物聯(lián)網(wǎng)設(shè)備優(yōu)化,推理時(shí)分別激活約 20 億和 40 億參數(shù),以降低內(nèi)存和電量消耗。據(jù)介紹,這兩個(gè)模型已與谷歌 Pixel 團(tuán)隊(duì)、高通和聯(lián)發(fā)科等硬件廠商合作,可在手機(jī)、Raspberry Pi、NVIDIA Jetson Nano 等設(shè)備上離線運(yùn)行,延遲接近零。

與此同時(shí),研究人員表示,26B MoE 模型有一個(gè)巧妙之處:在推理任務(wù)中,它只會(huì)激活 38 億參數(shù),因此既能保持較高運(yùn)行速度,又不會(huì)犧牲大模型所具備的深厚知識(shí)儲(chǔ)備。

26B 和 31B 模型提供面向 IDE、編程助手和 Agent 工作流的高級(jí)推理能力。模型針對(duì)消費(fèi)級(jí) GPU 進(jìn)行了優(yōu)化,讓學(xué)生、研究人員和開(kāi)發(fā)者能夠把自己的工作站變成以本地優(yōu)先為核心的 AI 服務(wù)器。

谷歌 DeepMind 研究人員 Clement Farabet 和 Olivier Lacombe 表示,在 Gemma 4 上,他們?cè)O(shè)法進(jìn)一步壓榨出了更多“單位參數(shù)智能”,讓這些模型能夠顯著實(shí)現(xiàn)“越級(jí)發(fā)揮”。例如,31B Dense 版本目前在行業(yè)標(biāo)準(zhǔn)榜單的開(kāi)源模型中排名第三。

Gemma 4 建立在與 Gemini 3 相同的架構(gòu)基礎(chǔ)之上,旨在處理復(fù)雜推理任務(wù),并支持在工作站、智能手機(jī)等低功耗設(shè)備上本地運(yùn)行的自主 AI Agent。這次關(guān)鍵提升包括:


  • 推理能力更強(qiáng):該系列所有模型都面向復(fù)雜推理任務(wù)進(jìn)行了優(yōu)化,并提供可配置的“思考”模式;

  • 多模態(tài)能力進(jìn)一步擴(kuò)展:所有模型都支持文本和圖像輸入,其中圖像支持可變寬高比和不同分辨率;E2B 和 E4B 還原生支持視頻與音頻輸入;

  • 上下文窗口更大:端側(cè)模型為 128K,較大模型(26B/31B)最高 256K;

  • 編碼與智能體能力增強(qiáng):模型在代碼能力基準(zhǔn)測(cè)試中有明顯提升,同時(shí)內(nèi)置函數(shù)調(diào)用支持,能夠更好地驅(qū)動(dòng)自主 Agent 執(zhí)行任務(wù);

  • 原生支持系統(tǒng)提示詞:Gemma 4 內(nèi)置了 system role 支持,讓對(duì)話結(jié)構(gòu)更清晰,也更容易控制模型行為。



Farabet 和 Lacombe 解釋稱(chēng),每個(gè) Gemma 4 模型都更適合用于運(yùn)行 AI Agent。此前幾代 Gemma 模型往往需要開(kāi)發(fā)者額外調(diào)整設(shè)計(jì),才能與其他軟件工具交互;而 Gemma 4 已原生支持函數(shù)調(diào)用和結(jié)構(gòu)化 JSON 輸出、原生系統(tǒng)指令以及超過(guò) 140 種語(yǔ)言。這意味著,開(kāi)發(fā)者可以用它們來(lái)驅(qū)動(dòng)自主 Agent,與第三方工具交互,并執(zhí)行多步驟任務(wù)規(guī)劃。


根據(jù) Arena AI 文本排行榜(截至 2026 年 2 月 1 日),31B 模型排名全球開(kāi)放模型第 3 位,26B MoE 模型排名第 6 位。


谷歌表示,Gemma 4 在部分基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于參數(shù)大 20 倍的模型。


不過(guò),有網(wǎng)友自己測(cè)算結(jié)果 Qwen3.5-27B 要略優(yōu)于 Gemma 4 31B。


還有網(wǎng)友評(píng)價(jià)道,“最讓人眼前一亮的部分在于:一共四種尺寸,全部都為 Agent 場(chǎng)景做好了準(zhǔn)備,而且全都可以在本地運(yùn)行。我們一直都在呼吁,需要那種不用每次‘思考’都把數(shù)據(jù)傳回云端的模型?,F(xiàn)在他們終于聽(tīng)進(jìn)去了,而且給出的東西甚至比預(yù)期還多?!?/p>

開(kāi)源 + 本地,谷歌擴(kuò)大優(yōu)勢(shì)

此次,Gemma 4 繼續(xù)采用 Apache 2.0 許可證,允許商業(yè)使用、自由修改和部署。谷歌稱(chēng),這一選擇旨在給予開(kāi)發(fā)者對(duì)數(shù)據(jù)、基礎(chǔ)設(shè)施和模型的完全控制權(quán),支持本地或云端環(huán)境的安全部署。這消除了其他一些 AI 模型在商業(yè)使用上的諸多限制,或會(huì)成為企業(yè)應(yīng)用開(kāi)發(fā)者的理想選擇。

此外,谷歌還詳細(xì)列出了使用各種大小的 Gemma 4 模型版本運(yùn)行推理所需的大致 GPU 或 TPU 內(nèi)存。


Gemma 4 在架構(gòu)設(shè)計(jì)上進(jìn)一步兼顧了效率與部署現(xiàn)實(shí)。E2B 和 E4B 中的 “E” 指的是“有效參數(shù)”,這兩款小模型采用了 PLE(每層嵌入)技術(shù),以提升端側(cè)部署時(shí)的參數(shù)利用效率。需要注意的是,PLE 雖然不會(huì)增加模型層數(shù),但會(huì)為每層解碼器中的每個(gè) token 配置獨(dú)立的小型嵌入,因此模型實(shí)際加載到內(nèi)存中的靜態(tài)權(quán)重,往往會(huì)高于“有效參數(shù)規(guī)模”表面上對(duì)應(yīng)的占用。

26B 版本采用了混合專(zhuān)家(MoE)架構(gòu),雖然生成時(shí)每個(gè) token 實(shí)際只會(huì)激活約 40 億參數(shù),但為了保證路由和推理速度,全部 260 億參數(shù)仍需提前載入內(nèi)存,所以它的實(shí)際顯存需求更接近稠密 26B 模型,而不是 4B 模型。

此外,官方給出的內(nèi)存估算通常只覆蓋靜態(tài)模型權(quán)重本身,并不包含運(yùn)行框架、上下文窗口和 KV Cache 帶來(lái)的額外顯存開(kāi)銷(xiāo);如果進(jìn)一步進(jìn)行微調(diào),顯存需求還會(huì)明顯高于推理階段,具體占用則取決于開(kāi)發(fā)框架、批量大小,以及采用全參數(shù)微調(diào)還是 LoRA 等參數(shù)高效微調(diào)方案。

這次發(fā)布再次凸顯了谷歌想要主導(dǎo)“本地 AI”產(chǎn)業(yè)的雄心。Constellation Research 分析師 Holger Mueller 表示,即便是較大規(guī)模的 Gemma 4,也小到足以在單張圖形處理器上運(yùn)行,因此它們非常適合邊緣場(chǎng)景以及那些對(duì)低延遲和數(shù)字主權(quán)有較高要求的應(yīng)用。

他認(rèn)為,“谷歌正在擴(kuò)大自己在 AI 領(lǐng)域的領(lǐng)先優(yōu)勢(shì),不只是依靠 Gemini,也包括通過(guò) Gemma 4 家族這樣的開(kāi)放模型。這些模型對(duì)于構(gòu)建 AI 開(kāi)發(fā)者生態(tài)非常重要,也將幫助公司切入不同設(shè)備形態(tài)下的功能型和垂直行業(yè)應(yīng)用場(chǎng)景。谷歌在此前發(fā)布 Gemma 3 時(shí)已經(jīng)樹(shù)立了很高的門(mén)檻,因此這次發(fā)布也承載了很多期待。”

現(xiàn)在,開(kāi)發(fā)者可以通過(guò)谷歌云直接訪問(wèn)這些模型,也可以在 Hugging Face、Kaggle 和 Ollama 上獲取模型及其開(kāi)放權(quán)重。Android 開(kāi)發(fā)者可在 AICore Developer Preview 中試用智能體工作流原型。

此外,谷歌提供了多種推理和微調(diào)路徑,包括:Hugging Face、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM 和 NeMo、LM Studio、Unsloth、SGLang、Cactus、Docker、MaxText、Tunix、Keras。云上部署支持 Vertex AI、Cloud Run、GKE、Sovereign Cloud 及 TPU 加速服務(wù)。

Gemma 4 開(kāi)箱支持 NVIDIA(從 Jetson Nano 到 Blackwell GPU)、AMD GPU(通過(guò)開(kāi)源 ROCm? 棧)以及 Google Cloud TPU。谷歌方面稱(chēng),新模型采用與谷歌專(zhuān)有模型相同等級(jí)的基礎(chǔ)設(shè)施安全協(xié)議,適用于企業(yè)和主權(quán)機(jī)構(gòu)的高標(biāo)準(zhǔn)安全與可靠性要求。

https://deepmind.google/models/gemma/gemma-4/-and-e4b

聲明:本文為 InfoQ 整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

會(huì)議推薦

QCon 全球軟件開(kāi)發(fā)大會(huì)·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會(huì)以“Agentic AI 時(shí)代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來(lái)自阿里、騰訊、字節(jié)跳動(dòng)、小米、百度等一線科技企業(yè)與創(chuàng)新團(tuán)隊(duì)的技術(shù)專(zhuān)家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進(jìn)展開(kāi)深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進(jìn)行咨詢。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
廣告使用“清朝長(zhǎng)辮”被指辱華,法國(guó)品牌Lemaire致歉

廣告使用“清朝長(zhǎng)辮”被指辱華,法國(guó)品牌Lemaire致歉

南方都市報(bào)
2026-04-26 20:40:18
男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢(qián)也怕堵車(chē)

男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢(qián)也怕堵車(chē)

丫頭舫
2026-04-27 17:39:57
38歲王思聰近照認(rèn)不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

38歲王思聰近照認(rèn)不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

橙星文娛
2026-04-27 14:17:09
2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補(bǔ)時(shí)絕平,曼聯(lián)險(xiǎn)勝

2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補(bǔ)時(shí)絕平,曼聯(lián)險(xiǎn)勝

足球狗說(shuō)
2026-04-28 05:07:09
“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

未央看點(diǎn)
2026-04-27 22:13:40
從排隊(duì)入籍到集體觀望?美國(guó)入籍申請(qǐng)?bào)E降,綠卡人群態(tài)度變了?

從排隊(duì)入籍到集體觀望?美國(guó)入籍申請(qǐng)?bào)E降,綠卡人群態(tài)度變了?

紐約時(shí)間
2026-04-28 02:29:16
看完女排最新集訓(xùn),心里五味雜陳!別說(shuō)里約,連倫敦周期都比不上

看完女排最新集訓(xùn),心里五味雜陳!別說(shuō)里約,連倫敦周期都比不上

金毛愛(ài)女排
2026-04-28 00:00:04
Deepseek,光通信之后的下一個(gè)主升浪

Deepseek,光通信之后的下一個(gè)主升浪

靜姐的財(cái)富第六感
2026-04-26 22:31:06
淚目 趙心童曬兒時(shí)與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

淚目 趙心童曬兒時(shí)與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

風(fēng)過(guò)鄉(xiāng)
2026-04-27 06:15:09
有的人為了當(dāng)官,把老婆送給領(lǐng)導(dǎo)睡

有的人為了當(dāng)官,把老婆送給領(lǐng)導(dǎo)睡

斜杠人生
2026-04-28 00:00:04
金價(jià):大家不用等候了!不出意外,金價(jià)可能將歷史重演!

金價(jià):大家不用等候了!不出意外,金價(jià)可能將歷史重演!

殘夢(mèng)重生來(lái)
2026-04-28 04:40:09
不到72小時(shí),俞敏洪再迎兩大壞消息,主播集體辭職只是“開(kāi)胃菜”

不到72小時(shí),俞敏洪再迎兩大壞消息,主播集體辭職只是“開(kāi)胃菜”

阿廢冷眼觀察所
2026-04-28 00:24:36
皮蛋再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

皮蛋再次成為關(guān)注對(duì)象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

健康科普365
2026-04-25 09:27:08
七萬(wàn)匹東洋大馬的覆滅:國(guó)民黨三年敗光日本四十五年心血

七萬(wàn)匹東洋大馬的覆滅:國(guó)民黨三年敗光日本四十五年心血

小莜讀史
2026-04-26 22:44:33
特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

線裝史冊(cè)
2026-04-28 02:38:29
東南亞隱藏的“電詐大佬”,一個(gè)個(gè)正在浮出水面

東南亞隱藏的“電詐大佬”,一個(gè)個(gè)正在浮出水面

現(xiàn)實(shí)的聲音
2026-04-27 20:36:14
大姑子一家9口住進(jìn)來(lái),老公說(shuō)他5200養(yǎng)活全家足夠,我?guī)夯啬锛?>
    </a>
        <h3>
      <a href=麥子情感故事
2026-04-27 21:34:15
沒(méi)人再提激光雷達(dá)數(shù)量?直擊北京車(chē)展:今年智能駕駛“卷”什么

沒(méi)人再提激光雷達(dá)數(shù)量?直擊北京車(chē)展:今年智能駕駛“卷”什么

時(shí)代周報(bào)
2026-04-26 18:14:26
涉黃被傳喚,馬斯克出事了

涉黃被傳喚,馬斯克出事了

營(yíng)銷(xiāo)頭版
2026-04-27 14:42:14
中國(guó)排協(xié)官宣!16點(diǎn)30分,女排訓(xùn)練將直播,第二批球員恐揭曉

中國(guó)排協(xié)官宣!16點(diǎn)30分,女排訓(xùn)練將直播,第二批球員恐揭曉

跑者排球視角
2026-04-27 23:48:17
2026-04-28 05:28:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
12309文章數(shù) 51863關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實(shí)測(cè)出來(lái)了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類(lèi)馬拉松"破二"新紀(jì)元,一場(chǎng)跑鞋軍備競(jìng)賽

娛樂(lè)要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財(cái)經(jīng)要聞

Meta 140億收購(gòu)Manus遭中國(guó)發(fā)改委否決

汽車(chē)要聞

不那么小眾也可以 smart的路會(huì)越走越寬

態(tài)度原創(chuàng)

游戲
數(shù)碼
家居
教育
公開(kāi)課

《AC黑旗》重制版新增專(zhuān)屬劇情!原版編劇親自執(zhí)筆

數(shù)碼要聞

6K/3K雙模切換!三星這款顯示器什么水平?

家居要聞

江景風(fēng)格 流動(dòng)的秩序

教育要聞

你不說(shuō)這是計(jì)算障礙,我真以為我是智障呢

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版