国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

Byte for Byte,谷歌開源最強模型Gemma 4 殺入手機端

0
分享至


北京時間2026年4月3日凌晨,Google DeepMind正式發(fā)布新一代開放模型系列——Gemma 4。官方博客標題寫:“Byte for byte, the most capable open models”——逐字節(jié)衡量,這是迄今為止最強悍的開源模型。

據(jù)官方發(fā)布的博客,在Arena AI文本排行榜上,Gemma 4的31B Dense模型以307億參數(shù)規(guī)模登上開源模型全球第三,26B A4B MoE模型位居第六,后者推理時僅激活38億參數(shù),卻擊敗了參數(shù)量數(shù)百億乃至數(shù)千億級別的競品。

當整個行業(yè)還在為大模型“越大越好”的軍備競賽焦慮時,谷歌選擇用工程效率與推理密度的極致優(yōu)化,給出了一條截然不同的技術路徑。

四款模型,四個戰(zhàn)場

Gemma 4此次一口氣釋放了四個規(guī)格,覆蓋了從端側嵌入式設備到本地開發(fā)工作站的完整算力梯度:


從關鍵技術數(shù)據(jù)看,26B A4B MoE模型推理時僅激活38億參數(shù)(總參252億),卻在Arena AI排行榜擊敗了多款參數(shù)量達數(shù)百億甚至數(shù)千億級別的競品,包括通義千問Qwen3-235B(2350億)和Meta Llama-3.1-405B(4050億)等。31B Dense未量化版本可在單張80GB NVIDIA H100上運行,量化后可部署于消費級GPU。

邊緣模型E2B/E4B支持原生音頻輸入,可進行語音識別與理解。全系列模型均原生支持視頻與圖像處理,支持可變分辨率輸入。

這一產品矩陣的邏輯在于:小模型打“無處不在”,大模型打“無處不在的前沿智能”

E2B和E4B被谷歌定義為核心戰(zhàn)略——“移動優(yōu)先AI”(mobile-first AI),專為數(shù)十億Android設備及物聯(lián)網終端設計;26B和31B則瞄準本地開發(fā)、IDE輔助和Agent工作流。

與Gemini 3同源的技術底座

一個容易被忽略但至關重要的信息是:Gemma 4基于與閉源旗艦模型Gemini 3相同的研究成果與技術架構構建。這意味著,開源社區(qū)獲得了與谷歌內部頂級閉源模型處于同一技術世代的推理能力。

這種“開源共享底層技術”的做法,在Gemma系列中一直延續(xù),但在第四代上更進一步。Gemma 4在以下能力維度上實現(xiàn)提升:

? 高級推理(Advanced Reasoning):支持多步規(guī)劃與深度邏輯鏈,在數(shù)學和指令遵循基準測試上表現(xiàn)顯著提升,不再止步于簡單對話,而是能夠處理復雜邏輯與Agent工作流。

? Agentic工作流原生支持:內置函數(shù)調用(function-calling)、結構化JSON輸出、原生系統(tǒng)指令,使開發(fā)者能夠直接構建自主智能體,與外部工具和API可靠交互并執(zhí)行完整工作流。

? 高質量離線代碼生成:將本地工作站轉變?yōu)楸镜貎?yōu)先的AI編程助手。

? 多模態(tài)原生:全部模型原生處理視頻和圖像,支持可變分辨率輸入,在OCR和圖表理解等視覺任務上表現(xiàn)突出。E2B和E4B還支持原生音頻輸入。

? 超長上下文:邊緣模型支持128K上下文窗口,大模型最高支持256K,可在單次提示中處理代碼倉庫或長篇文檔。

? 140+語言原生訓練:原生支持超過140種語言,覆蓋全球用戶群體。

Gemma 4的另一層重大信號,在于其許可證選擇——Apache 2.0。

此前Gemma系列采用的條件性許可協(xié)議曾引發(fā)社區(qū)持續(xù)爭論。此次轉向Apache 2.0——業(yè)界最寬松、對商業(yè)用途最友好的開源許可證之一——意味著開發(fā)者獲得了完全的數(shù)據(jù)主權、基礎設施控制權和模型控制權,可在本地或云端自由構建和部署。

“Gemma 4以Apache 2.0許可證發(fā)布是一個巨大的里程碑。我們非常激動能在發(fā)布首日就在Hugging Face上支持Gemma 4家族?!?strong>Clément Delangue,Hugging Face聯(lián)合創(chuàng)始人兼CEO表示。

谷歌官方在博文中明確表示,這一變化直接回應了開發(fā)者社區(qū)的反饋:“構建AI的未來需要協(xié)作方式,我們相信在不設限制性障礙的情況下賦能開發(fā)者生態(tài)系統(tǒng)。”

或許,對谷歌來說,許可證變更意味著一次戰(zhàn)略定位的調整。當Meta的Llama系列已經以寬松許可占據(jù)開源生態(tài)心智時,谷歌如果繼續(xù)在許可條款上設限,只會加速開發(fā)者向競品生態(tài)遷移。Apache 2.0是參與開源競爭的“入場券”,而非“加分項”。

從邊緣到云端:端側AI的“填滿”攻勢

Gemma 4最值得產業(yè)界關注的戰(zhàn)略動作,可能是其邊緣側布局。

E2B和E4B從底層為計算與內存效率而設計,推理時僅分別激活20億和40億參數(shù),以保護設備的RAM和電池壽命。谷歌Pixel團隊與高通(Qualcomm)、聯(lián)發(fā)科(MediaTek)深度合作,使這些多模態(tài)模型能在手機、樹莓派、NVIDIA Jetson Orin Nano等設備上完全離線運行,且延遲接近于零。

端側生態(tài)整合要點:

? Android開發(fā)者可通過AICore Developer Preview進行Agent流程原型設計,與未來的Gemini Nano 4保持向前兼容。 ? Android Studio中可驅動Agent Mode進行應用開發(fā)。 ? ML Kit GenAI Prompt API支持生產級Android應用構建。 ? Google AI Edge Gallery提供E4B和E2B的即時體驗入口。

這釋放了一個明確的信號:谷歌正在將端側AI從“實驗品”推向“基礎設施”。當4B參數(shù)級別模型能夠在手機端實現(xiàn)多模態(tài)推理、OCR、語音識別,且完全離線運行,“云端依賴”便不再是AI能力的必要前提。結合256K上下文窗口的處理能力,“長文檔本地分析”“離線代碼審查”等場景將從概念走向日常。

在發(fā)布首日,Gemma 4就獲得了主流AI工具鏈的全面支持,這在開源模型發(fā)布史上并不多見:


從Hugging Face到NVIDIA NIM,從Apple MLX到AMD ROCm,從Docker到Google Cloud——Gemma 4的部署路徑覆蓋了消費級硬件、企業(yè)級基礎設施和三大云平臺。值得注意的是,谷歌還提供了Kaggle上的“Gemma 4 Good Challenge”競賽,鼓勵開發(fā)者利用該模型構建有社會影響力的應用,延續(xù)Gemma系列的社區(qū)運營傳統(tǒng)。

自第一代發(fā)布以來,Gemma系列累計下載量已超過4億次,衍生變體超過10萬個。Apache 2.0許可之下,這一生態(tài)有望在第四代上實現(xiàn)更大幅度的擴張。

開源模型進入“效率競賽”階段

Gemma 4的發(fā)布,使開源大模型競爭進入了一個新階段——“效率競賽”取代“規(guī)模競賽”成為核心敘事。

當26B A4B MoE模型能以38億激活參數(shù)擊敗參數(shù)量數(shù)百倍的競品,“參數(shù)效率”(intelligence-per-parameter)成為衡量開源模型價值的新標尺。這不僅是工程能力的體現(xiàn),更是商業(yè)策略的選擇:在消費級硬件上實現(xiàn)前沿推理能力,意味著更低的部署成本、更快的推理速度、更廣泛的適用場景。

與閉源模型不同,開源模型的競爭邏輯天然是多維的——許可證寬松度、硬件適配廣度、社區(qū)生態(tài)活躍度、微調友好度,每一項都可能成為決定勝負的關鍵變量。Gemma 4在Apache 2.0許可、四規(guī)格矩陣、140+語言覆蓋、首日工具鏈全支持上的組合拳,顯然是經過精密計算的戰(zhàn)略布局。

對于中國開發(fā)者而言,Gemma 4的256K上下文窗口和原生中文支持(140+語言包含中文),配合Apache 2.0的完全自由部署權,意味著在國內合規(guī)框架下也有本地化落地的技術空間。

Gemma 4的發(fā)布不是一次簡單的模型更新,而是開源AI領域的一次結構性位移。當端側4B參數(shù)模型能夠處理多模態(tài)、語音、長上下文任務,當307億參數(shù)模型可以在單張H100上運行且躋身開源排行榜前三,“本地AI”與“云端AI”的能力邊界正在被重新定義。

谷歌選擇了同時開放所有模型權重、擁抱Apache 2.0、覆蓋從手機到云端的全硬件?!@種“全棧開源”策略,既是對Meta Llama系列和Mistral等開源競品的正面回應,也是對“閉源才能維持技術壁壘”這一傳統(tǒng)認知的直接挑戰(zhàn)。

開源模型的下一個臨界點,或許不再是“誰參數(shù)更大”,而是“誰在更小的體積內裝進了更多的智能”。Gemma 4給出的答案,至少在今天是:byte for byte,它是目前最強的。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
兩個狀元全部退出!正式失去資格,只剩文班亞馬

兩個狀元全部退出!正式失去資格,只剩文班亞馬

德譯洋洋
2026-04-03 13:55:54
京滬廈一個都躲不掉!廣東隊慘遭王博“做局”,杜鋒總決賽沒戲了

京滬廈一個都躲不掉!廣東隊慘遭王博“做局”,杜鋒總決賽沒戲了

緋雨兒
2026-04-03 12:39:24
脊柱斷裂、前夫已死,62歲"亞洲天后"韋唯,現(xiàn)狀曝光讓人唏噓不已

脊柱斷裂、前夫已死,62歲"亞洲天后"韋唯,現(xiàn)狀曝光讓人唏噓不已

丹妮觀
2026-04-02 14:43:02
存款變保險,老人存中信銀行10萬元,取錢只有7萬元?中信銀行回應!涉事方要求“先刪視頻再談賠償”

存款變保險,老人存中信銀行10萬元,取錢只有7萬元?中信銀行回應!涉事方要求“先刪視頻再談賠償”

山西經濟日報
2026-04-02 15:48:45
奇葩案件引熱議,網友稱本是小事卻釀成大禍!

奇葩案件引熱議,網友稱本是小事卻釀成大禍!

特約前排觀眾
2026-04-03 10:51:19
中國殲36突破2萬米高度,美空軍感到絕望

中國殲36突破2萬米高度,美空軍感到絕望

孫餛北漂拍客
2026-04-01 15:14:58
關于伊朗戰(zhàn)爭,某國媒體正在進行信息投毒

關于伊朗戰(zhàn)爭,某國媒體正在進行信息投毒

黔有虎
2026-04-03 13:01:39
繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

削桐作琴
2026-04-02 18:15:11
2女3狗拒付4000車費后續(xù):全網出名,同事認出小區(qū)曝光,警方介入

2女3狗拒付4000車費后續(xù):全網出名,同事認出小區(qū)曝光,警方介入

離離言幾許
2026-04-02 15:41:08
家里有多少錢,才算有錢人?銀行行長:3個條件,達到一個就是!

家里有多少錢,才算有錢人?銀行行長:3個條件,達到一個就是!

巢客HOME
2026-04-03 08:40:07
官宣決定!拒絕退役!全紅嬋終于正式發(fā)聲,國家隊會召全紅嬋嗎?

官宣決定!拒絕退役!全紅嬋終于正式發(fā)聲,國家隊會召全紅嬋嗎?

喜歡歷史的阿繁
2026-04-03 09:24:14
吹大了!張本美和賽前放話拿金牌,被王藝迪橫掃,破防大哭拒采訪

吹大了!張本美和賽前放話拿金牌,被王藝迪橫掃,破防大哭拒采訪

八斗小先生
2026-04-03 11:28:45
終于有農村老人道出實話:城里人去農村上墳,為啥很少有管飯的?

終于有農村老人道出實話:城里人去農村上墳,為啥很少有管飯的?

阿纂看事
2026-04-02 18:04:34
當著高市早苗的面,法國總統(tǒng)馬克龍承諾:不邀請中國參加G7峰會

當著高市早苗的面,法國總統(tǒng)馬克龍承諾:不邀請中國參加G7峰會

阿龍聊軍事
2026-04-02 18:59:10
古力娜扎:真空上陣是放飛自我還是資本博弈?

古力娜扎:真空上陣是放飛自我還是資本博弈?

娛樂領航家
2026-04-02 21:00:03
寧夏復仇魔鬼麻永東伏法:被注射死刑前高呼值了,他爹卻哭斷腸

寧夏復仇魔鬼麻永東伏法:被注射死刑前高呼值了,他爹卻哭斷腸

罪案洞察者
2025-05-09 11:19:15
炸鍋了!鄭麗文訪陸前,大陸甩出“統(tǒng)一大禮包”

炸鍋了!鄭麗文訪陸前,大陸甩出“統(tǒng)一大禮包”

娛樂小可愛蛙
2026-04-03 09:29:50
這個男士是郭延軍,他的鼻子的寬度、面積、體積為普通人2倍以上

這個男士是郭延軍,他的鼻子的寬度、面積、體積為普通人2倍以上

歲月有情1314
2026-04-01 11:25:58
布倫特原油現(xiàn)貨價格飆升至每桶141美元,創(chuàng)2008年金融危機以來最高水平

布倫特原油現(xiàn)貨價格飆升至每桶141美元,創(chuàng)2008年金融危機以來最高水平

新浪財經
2026-04-03 05:45:40
魯山舅舅案還沒完!外甥女再曝新證據(jù),事前人已被拘,果然有貓膩

魯山舅舅案還沒完!外甥女再曝新證據(jù),事前人已被拘,果然有貓膩

青橘罐頭
2026-04-03 07:24:17
2026-04-03 14:59:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
131766文章數(shù) 862051關注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

牛彈琴:美國干了一件令人發(fā)指的事 全世界都無法接受

頭條要聞

牛彈琴:美國干了一件令人發(fā)指的事 全世界都無法接受

體育要聞

沖擊世界杯失敗,80歲老帥一氣之下病倒了

娛樂要聞

《浪姐7》最新人氣TOP 曾沛慈斷層第一

財經要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠房親戚長得很像嗎?

態(tài)度原創(chuàng)

手機
數(shù)碼
親子
時尚
公開課

手機要聞

小米推出Xiaomi MiMo Token Plan:提供四檔套餐,每月39元起

數(shù)碼要聞

蘋果計劃掃光內存?犧牲利潤只為阻擊競爭對手的供應

親子要聞

八個月的寶寶離乳又離人,本以為是他離不開媽媽,結果是媽媽離不開他

為什么“這個顏色”成為今年頂流?這樣穿好看又治愈

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版