国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌Gemma 4深夜突降,31B爆殺20倍巨頭!手機跑全血「龍蝦」

0
分享至


新智元報道

編輯:好困 桃子

【新智元導(dǎo)讀】谷歌深夜掏家底!Gemma 4全系開源,僅用31B越級斬殺20倍體量巨頭。數(shù)學(xué)能力暴漲68%,硬生生把前代打成計量單位,開源界迎來終極大洗牌!

谷歌這次,把家底都掏了。

凌晨,谷歌DeepMind正式發(fā)布Gemma 4,一口氣放出四款開源模型。

從能塞進(jìn)手機的2B,到可以單卡跑滿的31B,四個尺寸全覆蓋,全部基于Gemini 3同源打造。


時隔一年,Gemma 4終于來了,實力迎來史詩級躍遷。

最炸的一個數(shù)字,31B Dense在Arena AI文本榜單上拿下開源第三,Elo評分1452。

排在它前面的,一個600多億參數(shù),一個超過1000億。Gemma 4用31B的體量,硬生生擠進(jìn)了這個量級的牌桌。

26B MoE更離譜:260億參數(shù),推理時只激活38億,Elo打到1441,排開源第六。



看一眼成績單,Gemma 4幾乎沒有弱點,簡直就是對上一代的「血脈壓制」——

  • 數(shù)學(xué)(AIME 2026):89.2% vs 21.2%,暴力拉升68個百分點;

  • 編程(LiveCodeBench):80% vs 29.1%,實力堪稱代際斷層;

  • 智能體(t2-bench):Gemma 4狂攬86.4%,Gemma 3僅有6.6%,差距大到「沒眼看」。

另外,在多語言推理、知識問答的基準(zhǔn)測試中,Gemma 4均實現(xiàn)了40%性能飆升。


令全網(wǎng)背脊發(fā)涼的是,一個31B Gemma 4,越級斬殺體量是其20倍的模型。



一臺Mac mimi即可跑Gemma 4,還有人手機已經(jīng)用上了。



Hugging Face CEO Clément Delangue的評價只有一句話,「這是一個巨大的里程碑?!?/p>

四款模型,從口袋到工作站全覆蓋

先看Gemma 4「全家桶」具體成員——


每個尺寸都提供base和instruction-tuned兩個版本。


E2B和E4B負(fù)責(zé)端側(cè),跟谷歌Pixel團(tuán)隊、高通、聯(lián)發(fā)科聯(lián)合優(yōu)化,能在手機、樹莓派、Jetson Orin Nano上離線運行,延遲接近零。

31B和26B面向開發(fā)者工作站和服務(wù)器,31B追求極致質(zhì)量,26B靠MoE架構(gòu)換取極致速度。


對開發(fā)者來說,31B的bfloat16權(quán)重可以塞進(jìn)一張80GB的H100;量化版本在消費級顯卡上就能跑。

26B MoE因為只激活3.8B參數(shù),出token速度極快,適合需要低延遲的Agent場景。


值得一提的是,Gemma 4還支持「被曝抄襲」的TurboQuant壓縮算法。



跑分碾壓,跨級暴打

看完定位看跑分。

31B在數(shù)學(xué)推理上的表現(xiàn)尤其驚人。AIME 2026拿到89.2%,對比Gemma 3 27B的20.8%,提升超過四倍。

GPQA Diamond(科學(xué)知識)84.3%,同樣把前代遠(yuǎn)遠(yuǎn)甩開。

編程能力同樣炸裂。LiveCodeBench v6上31B拿到80%,Codeforces Elo達(dá)到2150,相當(dāng)于一個紫名選手的水平。26B MoE也不弱,LiveCodeBench 77.1%,Codeforces 1718。


多模態(tài)方面,MMMU Pro(多模態(tài)推理)31B拿到76.9%,26B拿到73.8%,都大幅領(lǐng)先前代的49.7%。

長上下文能力同樣有質(zhì)的飛躍。MRCR v2 8-needle 128K測試中,31B拿到66.4%,26B拿到44.1%,Gemma 3 27B只有13.5%。

小尺寸也沒拉胯,E4B在AIME上42.5%,LiveCodeBench 52%,對一個只有45億有效參數(shù)的選手來說,這個成績放在一年前是旗艦級的。

三個架構(gòu)設(shè)計

讓小模型打出大模型的牌

Gemma 4的架構(gòu)沒有堆砌花哨的新概念,反而是把幾個經(jīng)過驗證的技術(shù)組合到了最優(yōu)狀態(tài)。

谷歌明確表示,他們?nèi)サ袅薃ltup等「效果不確定」的組件,只保留了真正有用的東西。

逐層嵌入(Per-Layer Embeddings,PLE)

傳統(tǒng)Transformer里,每個token在輸入層獲得一個嵌入向量,后面所有層都基于這個初始表示做計算。問題在于,這要求嵌入層一次性把所有信息打包進(jìn)去,負(fù)擔(dān)很重。

PLE的做法是給每一層都配一個專屬的低維信號通道。

每個token在每一層都能收到一個定制化的向量,由token本身的身份信息和上下文信息共同生成。

打個比方,傳統(tǒng)做法像是出門前把一天要用的所有東西塞進(jìn)一個背包;PLE像是每到一個地方,都有人遞給你當(dāng)下最需要的工具。

因為PLE的維度遠(yuǎn)小于主隱藏層,額外開銷很小,但每一層都獲得了專屬的調(diào)節(jié)能力。這個設(shè)計在小模型上效果尤其明顯,是E2B和E4B能以極小體量跑出好成績的關(guān)鍵。

共享KV緩存

最后N層不再自己計算Key和Value投影,而是直接復(fù)用前面層的KV張量。同類型的注意力層(滑動窗口或全局注意力)共享同一組KV狀態(tài)。

效果是推理時的顯存占用和計算量都下降了,長上下文生成和端側(cè)部署尤其受益。谷歌稱這對質(zhì)量的影響「微乎其微」。

交替注意力機制

模型交替使用局部滑動窗口注意力和全局全上下文注意力。

小模型用512 token的滑動窗口,大模型用1024。全局層配合等比例RoPE拉長上下文覆蓋范圍,滑動層用標(biāo)準(zhǔn)RoPE保持局部建模效率。

這三個設(shè)計的共同目標(biāo)只有一個,讓每一個參數(shù)都盡可能高效地被利用。

看圖、聽聲、讀視頻

一個Gemma全搞定

Gemma 4全系能處理圖像和視頻輸入,E2B和E4B還額外兼容音頻。

視覺編碼器相比Gemma 3做了兩個關(guān)鍵升級,一是可變寬高比(不再強制裁切),二是可配置的圖像token預(yù)算(70/140/280/560/1120五檔可選)

低預(yù)算適合分類和描述,高預(yù)算適合OCR和文檔解析。開發(fā)者可以根據(jù)場景在速度和精度之間自由取舍。


GUI元素檢測

給一張網(wǎng)頁截圖,問「view recipe按鈕在哪」,四個尺寸都能以JSON格式返回精確的邊界框坐標(biāo),不需要任何特殊提示詞。31B的定位最精準(zhǔn),E2B稍有偏差但基本可用。

視頻理解

用一段現(xiàn)場演唱會視頻做測試。E4B準(zhǔn)確描述了舞臺畫面,也從音軌中提取了歌詞主題。

26B和31B沒有音頻輸入能力,但對純視覺內(nèi)容的理解同樣到位,甚至識別出了屏幕上的贊助商品牌名。

音頻轉(zhuǎn)寫。

E4B對一段英文演講的轉(zhuǎn)寫幾乎完美,標(biāo)點和斷句都很自然。E2B偶爾會出現(xiàn)幻覺,但整體可用。

多模態(tài)函數(shù)調(diào)用。

給一張曼谷寺廟的照片,問「這是哪個城市?幫我查一下當(dāng)?shù)靥鞖狻埂?/p>

四個尺寸都正確識別出曼谷,并自動調(diào)用了get_weather工具。全程不需要額外的提示工程。

函數(shù)調(diào)用是從訓(xùn)練階段就內(nèi)置的,基于去年底發(fā)布的FunctionGemma研究成果,能處理多輪多工具的Agent工作流。這跟之前靠提示詞「哄」模型做工具調(diào)用的路線完全不同。


Apache 2.0,谷歌終于放手了

這次發(fā)布最大的非技術(shù)新聞,是Gemma 4首次采用Apache 2.0協(xié)議。

之前的Gemma系列用的是谷歌自定義許可證,里面有「有害使用」限制條款和歸屬要求,企業(yè)法務(wù)團(tuán)隊需要逐條審查才能確認(rèn)是否可以商用。


Apache 2.0一步到位,沒有自定義條款,沒有灰色地帶,修改、分發(fā)、商用完全自由。

自Gemma初代發(fā)布以來,累計下載量超過4億次,社區(qū)衍生版本超過10萬個。Apache 2.0的加持下,這個數(shù)字大概率還會加速增長。

開源模型,規(guī)則變了

Gemma 4的發(fā)布,讓谷歌的雙線策略徹底成型。

頂層是Gemini系列閉源模型,占據(jù)榜單前列,通過API變現(xiàn)。底層是Gemma系列開源模型,用同源技術(shù)喂養(yǎng)開發(fā)者生態(tài),搶占本地部署、端側(cè)推理、Agent開發(fā)的入口。

一個做收入,一個做生態(tài)。彼此不沖突,反而互相放大。

對開發(fā)者來說,選擇已經(jīng)擺在面前。

一個31B的體量,能在單卡上跑出接近千億參數(shù)級別的效果,Apache 2.0隨便用,從手機到服務(wù)器全覆蓋,微調(diào)工具鏈完整。

參數(shù)效率這條路,谷歌跑在了最前面。31B打贏20倍體量的對手,2B塞進(jìn)手機口袋。

開源模型的比賽,規(guī)則已經(jīng)變了。

參考資料:

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
別再幻想了,如果國民黨沒失敗,中國只會更慘

別再幻想了,如果國民黨沒失敗,中國只會更慘

歷史小破站
2026-04-12 04:45:03
網(wǎng)盤禁止分享美???天塌了

網(wǎng)盤禁止分享美???天塌了

來看美劇
2026-04-12 16:08:02
標(biāo)120W的充電器實際功率僅22.5W,商家:120W是產(chǎn)品型號

標(biāo)120W的充電器實際功率僅22.5W,商家:120W是產(chǎn)品型號

極目新聞
2026-04-11 00:53:31
套現(xiàn)300億闖“美圈”的潘石屹,回國了!深夜突然發(fā)聲:我命由天

套現(xiàn)300億闖“美圈”的潘石屹,回國了!深夜突然發(fā)聲:我命由天

火星方陣
2026-04-12 08:57:28
阿爾忒彌斯2號無動力返回到底難在哪?

阿爾忒彌斯2號無動力返回到底難在哪?

漢宮秋
2026-04-12 18:24:08
1959年,18歲陳麗華與北京電信系統(tǒng)某位高管結(jié)婚,生下一子二女

1959年,18歲陳麗華與北京電信系統(tǒng)某位高管結(jié)婚,生下一子二女

鑒史錄
2026-04-12 20:00:55
談了個通宵,還是談崩了?

談了個通宵,還是談崩了?

中國新聞周刊
2026-04-12 16:46:16
我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

草莓解說體育
2026-04-12 17:05:01
0-1!熱刺14輪不勝+近8場僅1分 無緣逃離降級區(qū) 德澤爾比遭開門黑

0-1!熱刺14輪不勝+近8場僅1分 無緣逃離降級區(qū) 德澤爾比遭開門黑

我愛英超
2026-04-12 23:07:29
突發(fā):王石被抓?。。?>
    </a>
        <h3>
      <a href=大嘴説
2026-04-12 18:30:38
參加會見連正裝都不穿了!鄭麗文抵達(dá)首都第2天更加放松了!

參加會見連正裝都不穿了!鄭麗文抵達(dá)首都第2天更加放松了!

阿龍聊軍事
2026-04-12 12:09:16
內(nèi)塔尼亞胡,將重新接受刑事審判?

內(nèi)塔尼亞胡,將重新接受刑事審判?

大風(fēng)新聞
2026-04-12 19:55:16
賭王女兒何超蕸病逝,常年和乳癌斗爭,120多億遺產(chǎn)由姐弟繼承

賭王女兒何超蕸病逝,常年和乳癌斗爭,120多億遺產(chǎn)由姐弟繼承

素素娛樂
2026-04-12 16:24:23
一張折線圖揭露人類壽命暴增的真正秘密!是兒童死亡率從50%跌到4.3%

一張折線圖揭露人類壽命暴增的真正秘密!是兒童死亡率從50%跌到4.3%

三言四拍
2026-04-12 10:37:11
含劇毒,無解藥!每家每戶都有,千萬別亂吃,哪怕煮爛了也沒用!

含劇毒,無解藥!每家每戶都有,千萬別亂吃,哪怕煮爛了也沒用!

路醫(yī)生健康科普
2026-04-11 20:50:03
史上最冤枉的差評!

史上最冤枉的差評!

果粉之家
2026-04-11 12:57:38
3人同日發(fā)聲!特朗普:美國“贏了”;佩澤希齊揚:以勇敢的態(tài)度進(jìn)行談判;內(nèi)塔尼亞胡:對伊打擊尚未結(jié)束

3人同日發(fā)聲!特朗普:美國“贏了”;佩澤希齊揚:以勇敢的態(tài)度進(jìn)行談判;內(nèi)塔尼亞胡:對伊打擊尚未結(jié)束

大象新聞
2026-04-12 09:45:02
接下來你可能會見證人類歷史上最大規(guī)模的化債歷程。

接下來你可能會見證人類歷史上最大規(guī)模的化債歷程。

流蘇晚晴
2026-04-11 17:57:14
有人用銼刀把MacBook棱角磨圓了,蘋果設(shè)計師看了沉默

有人用銼刀把MacBook棱角磨圓了,蘋果設(shè)計師看了沉默

爬蟲飼養(yǎng)員
2026-04-12 09:20:43
巴西將比亞迪列入“恥辱名單”

巴西將比亞迪列入“恥辱名單”

深度報
2026-04-11 22:22:26
2026-04-13 01:07:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14954文章數(shù) 66768關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

頭條要聞

特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭

財經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

親子
教育
手機
數(shù)碼
藝術(shù)

親子要聞

“晚上疼得睡不著”!8歲女童雙眼、身上被灼傷!警惕這東西,不少人家里有

教育要聞

小班教學(xué),9月開校,樹德派校長!這所中學(xué),正在招老師

手機要聞

華為闊折疊設(shè)計圖曝光!這外觀你喜歡嗎?

數(shù)碼要聞

蘋果版套娃 買臺Mac Pro回家:打開一看里面還藏著一臺Mac Pro

藝術(shù)要聞

揭開她筆下女人的神秘面紗,豪放灑脫的魅力令人驚嘆!

無障礙瀏覽 進(jìn)入關(guān)懷版