国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ollama v0.20.0 更新:Gemma 4 全家桶發(fā)布,音頻、視覺(jué)、MoE、BPE 支持全面升級(jí)

0
分享至




2026年4月3日,ollama 發(fā)布了v0.20.0版本。
這次更新的核心非常明確:Gemma 4 正式加入支持,并且圍繞模型推理、音頻能力、Tokenizer、視覺(jué)測(cè)試、轉(zhuǎn)換器、OpenAI 音頻接口等多個(gè)方向進(jìn)行了集中增強(qiáng)。

如果你關(guān)注本次更新,可以直接從兩個(gè)關(guān)鍵詞理解:

  • ?Gemma 4

  • ?音頻與推理能力升級(jí)

下面按照本次版本更新內(nèi)容,逐項(xiàng)整理成一篇完整的技術(shù)更新說(shuō)明。

一、Gemma 4 正式加入支持

本次 v0.20.0 最重要的變化,就是Gemma 4相關(guān)支持的加入。
更新中給出了多個(gè)可直接運(yùn)行的模型規(guī)格:

1)Effective 2B(E2B)

運(yùn)行命令:

ollama run gemma4:e2b

這是 Gemma 4 的有效 2B 版本,適合輕量場(chǎng)景使用。

2)Effective 4B(E4B)

運(yùn)行命令:

ollama run gemma4:e4b

這是 Gemma 4 的有效 4B 版本,在能力和資源消耗之間做了更平衡的選擇。

3)26B(Mixture of Experts model with 4B active parameters)

運(yùn)行命令:

ollama run gemma4:26b

這是一個(gè)MoE(Mixture of Experts)模型,描述中說(shuō)明其4B active parameters

4)31B(Dense)

運(yùn)行命令:

ollama run gemma4:31b

這是 Gemma 4 的31B Dense版本,屬于更大規(guī)模的稠密模型。

從這次發(fā)布的信息來(lái)看,Gemma 4 已經(jīng)形成了較完整的規(guī)格覆蓋,從輕量到大模型都提供了支持方式,用戶(hù)可以按資源和場(chǎng)景選擇對(duì)應(yīng)版本。

二、What's Changed:本次更新涉及的關(guān)鍵內(nèi)容

本次版本的更新記錄非常集中,主要圍繞 Gemma 4、音頻、Tokenizer、文檔、推理與測(cè)試展開(kāi)。下面逐條梳理。

三、文檔更新

首先是文檔相關(guān)更新:

  • ?docs: update pi docs

這說(shuō)明本次版本中對(duì) pi 相關(guān)文檔進(jìn)行了更新。
雖然內(nèi)容本身不多,但說(shuō)明文檔層面同步跟進(jìn)了新版本變化,方便用戶(hù)查閱和使用。

四、Tokenizer 增強(qiáng):支持 SentencePiece-style BPE

本次更新中有一個(gè)非常關(guān)鍵的底層能力變化:

  • ?tokenizer: add SentencePiece-style BPE support

這表示 Tokenizer 新增了SentencePiece 風(fēng)格的 BPE 支持。
這一變化對(duì)于模型適配和分詞處理非常重要,尤其是在處理不同模型格式與分詞規(guī)則時(shí),可以提升兼容性。

與此同時(shí),后續(xù)也有與 tokenizer 相關(guān)的配套修復(fù):

  • ?mlx: respect tokenizer add_bos_token setting in pipeline

這個(gè)改動(dòng)說(shuō)明在 pipeline 中會(huì)尊重 tokenizer 的add_bos_token設(shè)置。
換句話(huà)說(shuō),Tokenizer 的行為會(huì)更貼合配置,避免在處理輸入時(shí)出現(xiàn)不一致情況。

五、Gemma 4 的模型支持與轉(zhuǎn)換器更新 1)Gemma 4 GGML 模型支持

更新中明確寫(xiě)到:

  • ?gemma4: add Gemma 4 GGML model support

這表示 Gemma 4 的 GGML 模型支持已經(jīng)加入。

2)轉(zhuǎn)換器更新:適配新的 weight drop 命名

  • ?gemma4: update converter for new weight drop naming

這說(shuō)明 Gemma 4 相關(guān)轉(zhuǎn)換器已經(jīng)根據(jù)新的 weight drop 命名進(jìn)行了更新。
這是模型轉(zhuǎn)換流程中非常關(guān)鍵的一環(huán),確保新版本模型文件命名和導(dǎo)入過(guò)程能夠順利對(duì)接。

六、音頻能力大幅增強(qiáng)

這次 v0.20.0 在音頻方向的變化非常密集,可以說(shuō)是重點(diǎn)之一。

1)添加音頻支持,使用 USM conformer encoder

更新內(nèi)容:

  • ?gemma4: add audio support with USM conformer encoder

這表明 Gemma 4 新增了音頻支持,并且使用的是USM conformer encoder。

2)OpenAI 音頻 API 支持與能力檢測(cè)

更新內(nèi)容:

  • ?gemma4: add OpenAI audio API support and capability detection

這說(shuō)明本次版本已經(jīng)加入了OpenAI 音頻 API 支持,并且還包含capability detection,也就是能力檢測(cè)機(jī)制。

3)音頻輸入支持

更新內(nèi)容:

  • ?gemma4: add audio input support for run command

這意味著在 run 命令中已經(jīng)支持音頻輸入。

4)新增轉(zhuǎn)寫(xiě)命令

更新內(nèi)容:

  • ?gemma4: add transcribe command (ollama transcribe MODEL)

這次新增了一個(gè)轉(zhuǎn)寫(xiě)命令:

ollama transcribe MODEL

這對(duì)于音頻轉(zhuǎn)文字場(chǎng)景非常直接,命令形式也很清晰。

5)增加 OpenAI 音頻轉(zhuǎn)寫(xiě) API 和 input_audio 支持

更新內(nèi)容:

  • ?gemma4: add OpenAI audio transcription API and input_audio support

這進(jìn)一步完善了音頻能力,不僅是輸入和轉(zhuǎn)寫(xiě),還補(bǔ)充了與 OpenAI 音頻轉(zhuǎn)寫(xiě) API 相關(guān)的支持,以及 input_audio 能力。

6)音頻輸入改為 dropped file attachments

更新內(nèi)容:

  • ?cmd: simplify audio input to dropped file attachments

這說(shuō)明音頻輸入在命令層面被簡(jiǎn)化為dropped file attachments,使用方式更直接。

從這一組更新可以看出,v0.20.0 在音頻方向完成了從輸入、轉(zhuǎn)寫(xiě)、API 到命令行體驗(yàn)的一整套補(bǔ)強(qiáng)。

七、Gemma 4 解析、渲染與集成測(cè)試支持

本次更新還有一組圍繞 Gemma 4 的基礎(chǔ)設(shè)施改進(jìn):

  • ?gemma4: add parser, renderer, and integration test plumbing

這說(shuō)明已經(jīng)加入了parser、renderer、integration test plumbing
也就是說(shuō),Gemma 4 在解析、渲染以及集成測(cè)試方面的配套設(shè)施已經(jīng)補(bǔ)上。

1)渲染器修復(fù):輸出 BOS token

  • ?gemma4: fix renderer to emit BOS token

這是一個(gè)非常具體的修復(fù),說(shuō)明 renderer 現(xiàn)在會(huì)正確輸出BOS token

2)渲染器重寫(xiě):與 HF Jinja2 模板完全一致

  • ?gemma4: rewrite renderer to match HF Jinja2 template exactly

這說(shuō)明渲染器被重寫(xiě),以確保與 HF Jinja2 模板保持完全一致。

這個(gè)變化通常意味著模型輸入模板的行為會(huì)更加標(biāo)準(zhǔn)化,減少模板差異帶來(lái)的結(jié)果偏差。

八、MoE 相關(guān)增強(qiáng)與修復(fù)

Gemma 4 的 26B 版本是 MoE 模型,因此 MoE 相關(guān)改動(dòng)非常關(guān)鍵。

1)為 MoE router 增加 per_expert_scale,并修復(fù) moe_intermediate 問(wèn)題

更新內(nèi)容:

  • ?gemma4: add per_expert_scale to MoE router and fix moe_intermediate_s…

雖然后半部分在記錄中被截?cái)?,但已?jīng)明確看到兩個(gè)重點(diǎn):

  • ? 為 MoE router 增加per_expert_scale

  • ? 修復(fù)moe_intermediate_s...相關(guān)問(wèn)題

2)修復(fù) MoE fused gate_up split 和 multiline tool-call arg parsing

更新內(nèi)容:

  • ?gemma4: fix MoE fused gate_up split and multiline tool-call arg parsing

這說(shuō)明本次對(duì) MoE 的 fused gate_up split 做了修復(fù),同時(shí)還修復(fù)了multiline tool-call arg parsing。

3)MoE block 字段對(duì)齊格式調(diào)整

更新內(nèi)容:

  • ?Format Gemma4 MoE block field alignment

這是一個(gè)格式層面的整理,說(shuō)明 Gemma4 MoE block 的字段對(duì)齊做了統(tǒng)一和規(guī)范化。

從這些信息可以看出,Gemma 4 的 MoE 版本在結(jié)構(gòu)、解析、格式與計(jì)算路徑方面都做了較完整的修復(fù)和優(yōu)化。

九、視覺(jué)測(cè)試與 thinking 測(cè)試增強(qiáng)

更新中還有測(cè)試相關(guān)增強(qiáng):

  • ?integration: improve vision test robustness and add thinking tests

這表示集成測(cè)試進(jìn)一步增強(qiáng)了視覺(jué)測(cè)試的穩(wěn)定性,同時(shí)新增了 thinking tests。
從結(jié)果上看,這類(lèi)更新主要是為了提升整體驗(yàn)證能力,讓新版本在視覺(jué)相關(guān)場(chǎng)景和推理相關(guān)場(chǎng)景下更加可靠。

十、Gemma 4 音頻測(cè)試與 OpenAI API 覆蓋

音頻相關(guān)不僅有能力支持,也同步加入了測(cè)試覆蓋:

  • ?integration: add gemma4 audio tests including OpenAI API coverage

這說(shuō)明本次版本已經(jīng)加入了 Gemma 4 音頻測(cè)試,并且包括 OpenAI API 的覆蓋。
這和前面音頻能力的增強(qiáng)是相互呼應(yīng)的,說(shuō)明該版本并不是只做了功能接入,也同步補(bǔ)齊了對(duì)應(yīng)驗(yàn)證。

十一、Gemma 4 視覺(jué)模型注釋與字段格式調(diào)整

更新記錄中還有一些針對(duì)模型結(jié)構(gòu)和代碼可讀性的整理:

  • ?Remove redundant comments in gemma4 vision model

  • ?Format Gemma4 MoE block field alignment

前者表示移除了 Gemma 4 視覺(jué)模型中的冗余注釋。
后者則對(duì) Gemma4 MoE block 的字段對(duì)齊格式進(jìn)行了調(diào)整。

這類(lèi)更新雖然看起來(lái)偏細(xì)節(jié),但對(duì)于代碼維護(hù)、結(jié)構(gòu)統(tǒng)一和后續(xù)協(xié)作非常重要。

十二、內(nèi)存緩存與推理緩存優(yōu)化

本次更新里還有一項(xiàng)和緩存相關(guān)的改動(dòng):

  • ?use 4096 kvcache.NewSWAMemCache

  • ?gemma4: use full SWA memory for better cache reuse

這說(shuō)明緩存機(jī)制做了調(diào)整:

  • ? 使用了4096 kvcache.NewSWAMemCache

  • ? 同時(shí)使用full SWA memory來(lái)獲得更好的 cache reuse

這類(lèi)優(yōu)化通常和推理效率、上下文緩存復(fù)用體驗(yàn)有關(guān),是底層能力增強(qiáng)的一部分。

十三、Gemma 4 clamps 初始化與后端加載修復(fù)

更新記錄中還有:

  • ?gemma4: initialize clamps after backend load

這表示 clamps 的初始化時(shí)機(jī)調(diào)整到了 backend load 之后。
從描述來(lái)看,這是一個(gè)初始化順序上的修復(fù),用于保證加載流程更穩(wěn)定。

十四、Gemma 4 GGML 改進(jìn)合并

更新記錄最后還有一個(gè)重要的合并信息:

  • ?Merge pull request from gemma4-ggml-improvements

這說(shuō)明本次版本把 Gemma 4 的 GGML 改進(jìn)進(jìn)行了合并,和前面提到的 GGML model support、converter 更新等內(nèi)容形成閉環(huán)。

十五、本次 v0.20.0 更新總結(jié)

整體來(lái)看,ollama v0.20.0 這次更新可以概括為幾個(gè)核心方向:

  1. 1.Gemma 4 正式上線(xiàn)

  • ? 提供了 E2B、E4B、26B、31B 多種規(guī)格

  • ? 支持 GGML 模型

2.音頻能力全面增強(qiáng)

  • ? 支持音頻輸入

  • ? 新增轉(zhuǎn)寫(xiě)命令

  • ? 增加 OpenAI 音頻 API 與 transcription API 支持

  • ? 支持 input_audio

  • ? 簡(jiǎn)化音頻輸入方式

3.Tokenizer 和模板能力增強(qiáng)

  • ? 增加 SentencePiece-style BPE 支持

  • ? pipeline 尊重 add_bos_token

  • ? renderer 重寫(xiě)并修復(fù) BOS token 輸出

4.MoE 與推理路徑優(yōu)化

  • ? 增加 per_expert_scale

  • ? 修復(fù) MoE 相關(guān)問(wèn)題

  • ? 調(diào)整字段格式和分裂邏輯

  • ? 改進(jìn)緩存復(fù)用

5.測(cè)試與工程能力增強(qiáng)

  • ? 視覺(jué)測(cè)試穩(wěn)定性提升

  • ? 新增 thinking tests

  • ? 補(bǔ)充 Gemma 4 音頻測(cè)試與 OpenAI API 覆蓋


我們相信人工智能為普通人提供了一種“增強(qiáng)工具”,并致力于分享全方位的AI知識(shí)。在這里,您可以找到最新的AI科普文章、工具評(píng)測(cè)、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來(lái)發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
新冠后遺癥的長(zhǎng)期侵襲,無(wú)數(shù)人在不知不覺(jué)中深陷困境

新冠后遺癥的長(zhǎng)期侵襲,無(wú)數(shù)人在不知不覺(jué)中深陷困境

律法刑道
2026-04-01 10:15:47
伊朗宣布勝利:美國(guó)已原則上承諾撤出戰(zhàn)斗部隊(duì)、解除制裁、支付賠償、承認(rèn)海峽控制權(quán)等!特朗普也宣布勝利:伊朗可以重建了

伊朗宣布勝利:美國(guó)已原則上承諾撤出戰(zhàn)斗部隊(duì)、解除制裁、支付賠償、承認(rèn)海峽控制權(quán)等!特朗普也宣布勝利:伊朗可以重建了

每日經(jīng)濟(jì)新聞
2026-04-08 17:32:20
馬克龍簽涉臺(tái)聲明后,中方雙管齊下,朱鳳蓮強(qiáng)硬發(fā)聲,法國(guó)賭輸了

馬克龍簽涉臺(tái)聲明后,中方雙管齊下,朱鳳蓮強(qiáng)硬發(fā)聲,法國(guó)賭輸了

小陸搞笑日常
2026-04-09 10:03:37
陳光標(biāo)公布1000萬(wàn)元善款用途:用于嫣然醫(yī)院患兒救助、支付房租等;善款系原計(jì)劃贈(zèng)予張雪的勞斯萊斯幻影變現(xiàn)所得

陳光標(biāo)公布1000萬(wàn)元善款用途:用于嫣然醫(yī)院患兒救助、支付房租等;善款系原計(jì)劃贈(zèng)予張雪的勞斯萊斯幻影變現(xiàn)所得

揚(yáng)子晚報(bào)
2026-04-08 22:22:11
歐冠1米95巨無(wú)霸殺瘋了:14戰(zhàn)巴薩轟7球!比肩兩大傳奇

歐冠1米95巨無(wú)霸殺瘋了:14戰(zhàn)巴薩轟7球!比肩兩大傳奇

葉青足球世界
2026-04-09 11:12:14
一個(gè)女人變老的標(biāo)志,以下10條能占一半,說(shuō)明你已經(jīng)老了

一個(gè)女人變老的標(biāo)志,以下10條能占一半,說(shuō)明你已經(jīng)老了

風(fēng)起見(jiàn)你
2026-04-08 17:46:35
“全球最便宜麗思卡爾頓”宣告流拍!8.65億起拍,無(wú)人報(bào)名

“全球最便宜麗思卡爾頓”宣告流拍!8.65億起拍,無(wú)人報(bào)名

文軒財(cái)經(jīng)
2026-04-08 16:52:09
掃墓才知道家里有長(zhǎng)輩是餓死的!網(wǎng)友:原來(lái)荒誕的從來(lái)都只是人生

掃墓才知道家里有長(zhǎng)輩是餓死的!網(wǎng)友:原來(lái)荒誕的從來(lái)都只是人生

夜深?lèi)?ài)雜談
2026-04-08 17:04:46
被騙千萬(wàn)傳聞?wù)嫦啻蟀變H1天,郭艾倫又出大動(dòng)作,牽連周深太意外

被騙千萬(wàn)傳聞?wù)嫦啻蟀變H1天,郭艾倫又出大動(dòng)作,牽連周深太意外

暖心萌阿菇?jīng)?/span>
2026-04-09 03:47:21
人民幣站上C位!中東危機(jī)爆發(fā)后,中國(guó)為何成為全球資金避風(fēng)港?

人民幣站上C位!中東危機(jī)爆發(fā)后,中國(guó)為何成為全球資金避風(fēng)港?

丁丁鯉史紀(jì)
2026-04-08 15:35:23
中電萬(wàn)維信息技術(shù)有限責(zé)任公司原總經(jīng)理蔣哲峰接受審查調(diào)查

中電萬(wàn)維信息技術(shù)有限責(zé)任公司原總經(jīng)理蔣哲峰接受審查調(diào)查

界面新聞
2026-04-08 17:13:04
央視3次怒批電動(dòng)車(chē)解限速,25km/h的龜速,不如給電摩上綠牌?

央視3次怒批電動(dòng)車(chē)解限速,25km/h的龜速,不如給電摩上綠牌?

小怪吃美食
2026-04-06 14:39:17
85花中年喪偶!?

八卦瘋叔
2026-04-09 11:00:41

38歲老板娘淪為陪睡工具:揭秘黑茶高端騙局,入局者10有9個(gè)離婚

38歲老板娘淪為陪睡工具:揭秘黑茶高端騙局,入局者10有9個(gè)離婚

云景侃記
2026-02-12 22:21:30
烏克蘭攻擊俄最大的沃羅涅日化工廠(chǎng)!跨境攻擊首次超過(guò)俄軍

烏克蘭攻擊俄最大的沃羅涅日化工廠(chǎng)!跨境攻擊首次超過(guò)俄軍

項(xiàng)鵬飛
2026-04-07 19:12:08
詹姆斯哭了!安東尼愿拿50萬(wàn)底薪加盟湖人,只因一句話(huà):他救過(guò)我的命

詹姆斯哭了!安東尼愿拿50萬(wàn)底薪加盟湖人,只因一句話(huà):他救過(guò)我的命

寒律
2026-04-09 03:00:57
文班缺陣福克斯25+5+7+3,榜眼秀化身全能戰(zhàn)士,馬刺力克開(kāi)拓者

文班缺陣??怂?5+5+7+3,榜眼秀化身全能戰(zhàn)士,馬刺力克開(kāi)拓者

釘釘陌上花開(kāi)
2026-04-09 11:58:31
向比亞迪、小米等發(fā)起沖擊!大眾啟動(dòng)在華最大規(guī)模電動(dòng)化攻勢(shì) 平均每?jī)芍芤豢钚萝?chē)上市

向比亞迪、小米等發(fā)起沖擊!大眾啟動(dòng)在華最大規(guī)模電動(dòng)化攻勢(shì) 平均每?jī)芍芤豢钚萝?chē)上市

快科技
2026-04-08 09:29:10
女生要主動(dòng)起來(lái)跟想象中完全不一樣!網(wǎng)友:讓我遞毛巾 瞬間開(kāi)竅了

女生要主動(dòng)起來(lái)跟想象中完全不一樣!網(wǎng)友:讓我遞毛巾 瞬間開(kāi)竅了

另子維愛(ài)讀史
2026-01-26 18:39:06
日本主婦驚訝:京瓷壟斷40年的天價(jià)陶瓷刀,重慶榮昌只賣(mài)十分之一

日本主婦驚訝:京瓷壟斷40年的天價(jià)陶瓷刀,重慶榮昌只賣(mài)十分之一

戶(hù)外阿嶄
2026-04-08 16:18:35
2026-04-09 12:32:51
moonfdd incentive-icons
moonfdd
福大大架構(gòu)師每日一題
1172文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

牛彈琴:?;饠?shù)小時(shí)后發(fā)生可怕屠殺 三點(diǎn)實(shí)在太詭異

頭條要聞

牛彈琴:?;饠?shù)小時(shí)后發(fā)生可怕屠殺 三點(diǎn)實(shí)在太詭異

體育要聞

40歲,但實(shí)力倒退12年

娛樂(lè)要聞

具俊曄最新露面,又黑又瘦情緒低迷

財(cái)經(jīng)要聞

談判基礎(chǔ)已被破壞!霍爾木茲海峽關(guān)閉

汽車(chē)要聞

8155芯片+L2智駕 瑞虎5運(yùn)動(dòng)版上市 置換補(bǔ)貼價(jià)6.79萬(wàn)元起

態(tài)度原創(chuàng)

家居
教育
本地
公開(kāi)課
軍事航空

家居要聞

清新自然 復(fù)古風(fēng)尚

教育要聞

“這種人誰(shuí)敢錄?”39歲華東師范考生舉報(bào)第一名,學(xué)?;貞?yīng)來(lái)了

本地新聞

建水Color Walk | 古城慢調(diào),掉進(jìn)春天的調(diào)色盤(pán)里

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

霍爾木茲海峽已再次關(guān)閉

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版