国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

谷歌祭出Gemma 4,”死磕企業(yè)級(jí)市場(chǎng)!25.6萬(wàn)上下文打造本地編程神器

0
分享至

4月3日消息,谷歌周四發(fā)布全新Gemma 4系列開放權(quán)重(open-weights)模型。該系列針對(duì)AI智能體及編程場(chǎng)景進(jìn)行了優(yōu)化,并改用更為寬松的Apache 2.0許可協(xié)議,意在擴(kuò)大企業(yè)級(jí)市場(chǎng)份額。


此舉正值中國(guó)大語(yǔ)言模型(LLM)快速發(fā)展之際。目前,月之暗面、阿里巴巴千問(wèn)等中國(guó)企業(yè)推出的多款模型,在性能指標(biāo)上已具備與OpenAI及Anthropic旗下頭部模型競(jìng)爭(zhēng)的能力。

面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),谷歌借Gemma 4向企業(yè)客戶拋出了一套安全可控的本地化部署方案。其核心賣點(diǎn)直擊企業(yè)數(shù)據(jù)安全痛點(diǎn):明確承諾絕不“竊取”企業(yè)的私有敏感數(shù)據(jù)用于未來(lái)迭代模型的訓(xùn)練。

作為谷歌DeepMind團(tuán)隊(duì)的最新力作,Gemma 4迎來(lái)了全面進(jìn)化。新模型引入了“高級(jí)推理”機(jī)制,大幅強(qiáng)化了數(shù)學(xué)運(yùn)算與指令遵循(instruction-following)能力。同時(shí),其應(yīng)用邊界得到極大拓展,不僅原生支持140多種語(yǔ)言和函數(shù)調(diào)用(native function calling),更打通了音視頻多模態(tài)輸入。

延續(xù)此前的分級(jí)策略,谷歌此次提供多種參數(shù)規(guī)模的模型版本,以適配從單板計(jì)算機(jī)、智能手機(jī)到筆記本電腦及企業(yè)數(shù)據(jù)中心等不同層級(jí)的硬件環(huán)境。

該系列中參數(shù)規(guī)模最大的為一款310億參數(shù)大語(yǔ)言模型。谷歌方面稱,經(jīng)微調(diào)后,該模型可提供同系列中最優(yōu)的輸出質(zhì)量。

這一參數(shù)體量既避免了與谷歌大型閉源模型形成內(nèi)部競(jìng)爭(zhēng),又保持了相對(duì)輕量化的特性,使企業(yè)無(wú)需投入高昂的GPU服務(wù)器成本即可進(jìn)行本地運(yùn)行或微調(diào)。

算力門檻的顯著降低是此次升級(jí)的一大亮點(diǎn)。谷歌表示該模型16位未量化版本可在單塊80GB顯存的H100顯卡上運(yùn)行。若采用4位精度并結(jié)合Llama.cpp或Ollama等框架,該模型可在24GB顯存的消費(fèi)級(jí)顯卡(如英偉達(dá)RTX 4090或AMD RX 7900 XTX)上部署。

針對(duì)低延遲應(yīng)用場(chǎng)景,Gemma 4系列推出了一款260億參數(shù)的混合專家(MoE)架構(gòu)模型。在推理(inference)階段,該模型僅激活128個(gè)專家網(wǎng)絡(luò)中的子集(約38億激活參數(shù))來(lái)處理和生成詞元(token)。在顯存充足的條件下,其生成速度顯著高于同等規(guī)模的稠密模型(dense model)。

盡管這種機(jī)制不可避免地會(huì)在輸出質(zhì)量上做出微小妥協(xié),但在筆記本電腦或消費(fèi)級(jí)顯卡等受限于顯存帶寬的設(shè)備上,這種“以質(zhì)量換速度”的策略無(wú)疑極具現(xiàn)實(shí)意義。

值得一提的是,上述兩款主力模型均配備了高達(dá)25.6萬(wàn)詞元的超大上下文窗口。這一特性使其成為本地AI代碼助手的絕佳底座,這也是谷歌在發(fā)布會(huì)上著墨最多的核心落地場(chǎng)景。

面向下沉的端側(cè)市場(chǎng),谷歌還為智能手機(jī)及樹莓派(Raspberry Pi)等算力受限的邊緣硬件“量身定制”了兩款微型模型,分別具備20億和40億的“有效參數(shù)”。這里的“有效”大有玄機(jī):兩款模型的物理參數(shù)量實(shí)為51億和80億,但谷歌通過(guò)引入逐層嵌入技術(shù),硬生生將其推理時(shí)的實(shí)際計(jì)算負(fù)擔(dān)壓縮至23億和45億級(jí)別。這一技術(shù)魔術(shù)讓模型在低算力、依賴電池供電的移動(dòng)設(shè)備上得以高效運(yùn)轉(zhuǎn)。

盡管參數(shù)規(guī)模較小,這兩款邊緣模型仍支持12.8萬(wàn)個(gè)詞元的上下文窗口及多模態(tài)功能,在特定的E2B/E4B版本中,它們不僅能理解文本,還能直接解析視覺(jué)與音頻輸入。

從谷歌公布的成績(jī)單來(lái)看,Gemma 4較上一代Gemma 3在各項(xiàng)核心AI基準(zhǔn)測(cè)試中均實(shí)現(xiàn)了跨越式增長(zhǎng)。


許可協(xié)議的變更是此次發(fā)布的另一核心。Gemma 4全面轉(zhuǎn)向更為寬松的Apache 2.0許可協(xié)議。此前,Gemma的專屬許可協(xié)議對(duì)模型的特定使用場(chǎng)景設(shè)有嚴(yán)格限制,并保留了對(duì)違規(guī)用戶的訪問(wèn)終止權(quán)。改用Apache 2.0協(xié)議后,企業(yè)在模型部署與商業(yè)化應(yīng)用方面獲得了更高的自主權(quán),降低了因協(xié)議條款變動(dòng)引發(fā)的合規(guī)風(fēng)險(xiǎn)。

生態(tài)布局方面,Gemma 4已全線登陸谷歌自家的AI Studio與AI Edge Gallery平臺(tái),并同步上線Hugging Face、Kaggle及Ollama等主流開源社區(qū)。谷歌指出,該模型在發(fā)布首日已兼容vLLM、SGLang、Llama.cpp及MLX等十余種主流推理框架。(易句)

(本文由AI翻譯,網(wǎng)易編輯負(fù)責(zé)校對(duì))

相關(guān)推薦
熱點(diǎn)推薦
女星別整容!看《白日提燈》,迪麗熱巴張儷同框,就懂了

女星別整容!看《白日提燈》,迪麗熱巴張儷同框,就懂了

情感大頭說(shuō)說(shuō)
2026-04-03 03:13:08
真準(zhǔn)!伊朗局勢(shì)正按照艾躍進(jìn)當(dāng)年的預(yù)判進(jìn)行

真準(zhǔn)!伊朗局勢(shì)正按照艾躍進(jìn)當(dāng)年的預(yù)判進(jìn)行

賤議你讀史
2026-03-11 01:43:36
張雪:將拍賣奪冠賽車的1:1復(fù)刻版,全部收入捐贈(zèng)嫣然天使基金

張雪:將拍賣奪冠賽車的1:1復(fù)刻版,全部收入捐贈(zèng)嫣然天使基金

懂球帝
2026-04-03 11:44:18
馬卡:恩德里克用15分鐘鎖定世界杯席位,可完美替代內(nèi)馬爾

馬卡:恩德里克用15分鐘鎖定世界杯席位,可完美替代內(nèi)馬爾

天光破云來(lái)
2026-04-03 17:34:40
戰(zhàn)后伊朗會(huì)怎樣?分析人士:更加憤怒和桀驁不馴,影響力或擴(kuò)展到中東以外

戰(zhàn)后伊朗會(huì)怎樣?分析人士:更加憤怒和桀驁不馴,影響力或擴(kuò)展到中東以外

紅星新聞
2026-04-02 18:29:11
不用中方動(dòng)手,“高市辭職”已傳遍東京,日本靠百姓守住道義底線

不用中方動(dòng)手,“高市辭職”已傳遍東京,日本靠百姓守住道義底線

朝子亥
2026-04-03 18:25:03
河南一高校啟用新浴室,每升熱水計(jì)費(fèi)0.045元,有學(xué)生稱洗澡10分鐘計(jì)費(fèi)3元至7元,校方稱按流量定價(jià),試運(yùn)營(yíng)期間免費(fèi)使用吹風(fēng)機(jī)

河南一高校啟用新浴室,每升熱水計(jì)費(fèi)0.045元,有學(xué)生稱洗澡10分鐘計(jì)費(fèi)3元至7元,校方稱按流量定價(jià),試運(yùn)營(yíng)期間免費(fèi)使用吹風(fēng)機(jī)

大風(fēng)新聞
2026-04-02 17:06:05
歌手張政直播后突然捂住胸口并大喊“不要碰我,我這里痛”,隨后抽搐暈倒,被救護(hù)車緊急送醫(yī)

歌手張政直播后突然捂住胸口并大喊“不要碰我,我這里痛”,隨后抽搐暈倒,被救護(hù)車緊急送醫(yī)

都市快報(bào)橙柿互動(dòng)
2026-04-01 12:54:51
這兩天彭博小作文,中國(guó)要對(duì)離岸信托征稅了

這兩天彭博小作文,中國(guó)要對(duì)離岸信托征稅了

WEALTH財(cái)富管理
2026-04-03 10:34:45
當(dāng)場(chǎng)開罵!印度政壇女將炮轟莫迪:親美賣國(guó),五年承諾全成空

當(dāng)場(chǎng)開罵!印度政壇女將炮轟莫迪:親美賣國(guó),五年承諾全成空

阿纂看事
2026-04-03 12:47:44
熱搜第一!毛曉彤造型殺瘋了,生圖唇紅齒白,這才是國(guó)泰民安臉

熱搜第一!毛曉彤造型殺瘋了,生圖唇紅齒白,這才是國(guó)泰民安臉

橙星文娛
2026-04-03 15:41:15
摩博會(huì)名場(chǎng)面!張雪一路小跑彎腰握左宗申,這才是國(guó)產(chǎn)摩托的傳承

摩博會(huì)名場(chǎng)面!張雪一路小跑彎腰握左宗申,這才是國(guó)產(chǎn)摩托的傳承

行者聊官
2026-04-03 08:59:09
特朗普再次向北約發(fā)出通牒,不到24小時(shí),G7聯(lián)手發(fā)聲,打響第一槍

特朗普再次向北約發(fā)出通牒,不到24小時(shí),G7聯(lián)手發(fā)聲,打響第一槍

小叨娛樂(lè)
2026-04-02 05:36:43
伊朗尋求中國(guó)為?;鹛峁┌踩珦?dān)保?外交部回應(yīng)

伊朗尋求中國(guó)為?;鹛峁┌踩珦?dān)保?外交部回應(yīng)

新京報(bào)
2026-04-02 19:57:10
國(guó)臺(tái)辦果然沒(méi)看錯(cuò),鄭麗文真面目被徹底揭露!小算盤到此為止了

國(guó)臺(tái)辦果然沒(méi)看錯(cuò),鄭麗文真面目被徹底揭露!小算盤到此為止了

比利
2026-01-23 12:41:53
局勢(shì)再度升級(jí)!首艘開往中國(guó)的油輪遭到襲擊,是誤傷還是警告

局勢(shì)再度升級(jí)!首艘開往中國(guó)的油輪遭到襲擊,是誤傷還是警告

諦聽骨語(yǔ)本尊
2026-04-03 16:21:28
消息稱由于無(wú)人機(jī)襲擊能源設(shè)施 俄羅斯面臨石油產(chǎn)量削減

消息稱由于無(wú)人機(jī)襲擊能源設(shè)施 俄羅斯面臨石油產(chǎn)量削減

財(cái)聯(lián)社
2026-04-02 19:10:10
意大利名帥也下場(chǎng)了,卡佩羅直接發(fā)飆:奇恥大辱!我氣得整宿沒(méi)睡

意大利名帥也下場(chǎng)了,卡佩羅直接發(fā)飆:奇恥大辱!我氣得整宿沒(méi)睡

激情與榮耀并存
2026-04-02 18:28:13
伊朗新型防空系統(tǒng)發(fā)飆!不到12小時(shí),兩架F-35墜毀,黑色戰(zhàn)斧升空

伊朗新型防空系統(tǒng)發(fā)飆!不到12小時(shí),兩架F-35墜毀,黑色戰(zhàn)斧升空

共工之錨
2026-04-03 18:28:01
緬甸總統(tǒng)選舉團(tuán)將于3日投票選舉總統(tǒng)

緬甸總統(tǒng)選舉團(tuán)將于3日投票選舉總統(tǒng)

澎湃新聞
2026-04-02 16:36:03
2026-04-03 19:03:00

科技要聞

5萬(wàn)輛庫(kù)存車,給了特斯拉一記重拳

頭條要聞

記者問(wèn)阿富汗和巴基斯坦是否在烏魯木齊和談 中方回應(yīng)

頭條要聞

記者問(wèn)阿富汗和巴基斯坦是否在烏魯木齊和談 中方回應(yīng)

體育要聞

沖擊世界杯失敗,80歲老帥一氣之下病倒了

娛樂(lè)要聞

《浪姐7》最新人氣TOP 曾沛慈斷層第一

財(cái)經(jīng)要聞

專家稱長(zhǎng)期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠(yuǎn)房親戚長(zhǎng)得很像嗎?

態(tài)度原創(chuàng)

本地
教育
健康
數(shù)碼
公開課

本地新聞

跟著歌聲游安徽,聽古村回響

教育要聞

教育部:義務(wù)教育學(xué)校嚴(yán)禁設(shè)立重點(diǎn)班、實(shí)驗(yàn)班、快慢班

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

數(shù)碼要聞

VAIO宣布自4月23日起提高日本市場(chǎng)家用與商用PC定價(jià)

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版
×