国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ollama v0.17.6 發(fā)布:重大解析修復(fù)與 Qwen3.5 完整支持,全鏈路優(yōu)化模型渲染與工具調(diào)用

0
分享至




2026 年 3 月 5 日,Ollama 正式發(fā)布了v0.17.6版本。這是一次極具實(shí)用價(jià)值的改進(jìn)版本,在保持系統(tǒng)穩(wěn)定的基礎(chǔ)上,重點(diǎn)修復(fù)了多個(gè)長期存在的細(xì)節(jié)性問題,包括GLM-OCR 的 Prompt 渲染錯(cuò)誤、Qwen 3.5 工具調(diào)用與解析邏輯, 并帶來了對模型渲染、工具鏈、配置兼容性等方面的進(jìn)一步完善。

本篇文章將全面解析 v0.17.6 的變更列表、核心代碼結(jié)構(gòu)調(diào)整、測試覆蓋改進(jìn)及潛在影響,幫助開發(fā)者清晰理解此次升級的深度與意義。

一、版本概覽

發(fā)布日期:2026 年 3 月 5 日
版本號:v0.17.6
更新重點(diǎn):

  1. 1. 修復(fù)GLM-OCR模型因 prompt 渲染錯(cuò)誤導(dǎo)致無法工作的問題

  2. 2. 修復(fù)Qwen 3.5模型工具調(diào)用的解析與渲染問題

  3. 3. 優(yōu)化模型配置文件命名兼容,例如Ollama (local)自動遷移為Ollama

  4. 4. 移除舊版本imagegenLLM 模型與peak memoryAPI 字段

  5. 5. 引入全新的 Qwen3.5 渲染及解析模塊,全面支持thinking模式

此次更新共包含12 次提交、修改51 個(gè)文件,由 7 名開發(fā)人員完成。從 diff 記錄看,涉及到新增代碼超過 3900 行,同時(shí)刪除舊邏輯 4010 行,可見是一次覆蓋范圍較大的“重構(gòu) + 修復(fù)”整合版本。

二、總體改動組成 1. API 層變化:移除PeakMemory字段

api/types.go文件中刪除了Metrics結(jié)構(gòu)體中的PeakMemory相關(guān)字段與輸出邏輯。
其原始功能用于在模型推理時(shí)統(tǒng)計(jì)峰值內(nèi)存占用,但由于mlx(Memory Layout Executor)層的 API 已移除此項(xiàng)指標(biāo),因此不再返回該值。

舊結(jié)構(gòu):

type Metrics struct {
TotalDuration time.Duration `json:"total_duration,omitempty"`
PeakMemory uint64 `json:"peak_memory,omitempty"`
}

刪除后:

type Metrics struct {
TotalDuration time.Duration `json:"total_duration,omitempty"`
}

同時(shí)刪除了相關(guān)的格式化函數(shù)formatPeakMemory、控制臺輸出內(nèi)容,更新后的日志輸出更加簡潔,避免“空指標(biāo)”誤導(dǎo)用戶。

這也意味著未來 Ollama 將更聚焦性能時(shí)間維度指標(biāo),而非硬件狀態(tài)統(tǒng)計(jì)。

2. 命令行層更新:移除imagegen運(yùn)行參數(shù)

cmd/cmd.go文件中刪除了--imagegen標(biāo)志相關(guān)邏輯,不再通過 CLI 參數(shù)控制圖像生成模型使用內(nèi)部 Runner。

這體現(xiàn)了 v0.17.6 開始逐步統(tǒng)一模型調(diào)用接口,將生成型與多模態(tài)模型整合至統(tǒng)一 runner 體系中,從設(shè)計(jì)上簡化用戶調(diào)用路徑。

3. 配置遷移優(yōu)化:Ollama (local) → Ollama

在配置管理模塊cmd/config/opencode.go中新增了名稱遷移邏輯,解決了配置兼容問題。
許多開發(fā)者此前使用本地 provider 時(shí),其配置如下:

{
"provider":{
"ollama":{
"name":"Ollama (local)",
"npm":"@ai-sdk/openai-compatible",
"options":{"baseURL":"http://localhost:11434/v1"}
}
}
}

新版本中,當(dāng)檢測到Ollama (local)名稱時(shí)會自動遷移為Ollama,保證現(xiàn)有配置無需手動修改即可被識別。

同時(shí),新單元測試驗(yàn)證邏輯如下:

  • ? 自動遷移本地 provider 名稱。

  • ? 保留自定義 provider 名稱(即不會覆蓋非默認(rèn)配置)。

  • ? 刪除模型時(shí)保留非 Ollama 模型的子項(xiàng)。

這確保了升級后配置文件兼容性 100%,不會破壞舊有項(xiàng)目結(jié)構(gòu)。

三、模型解析層全面升級:Qwen 3.5 Parser

v0.17.6 最為關(guān)鍵的更新在于模型解析器部分。
新增文件model/parsers/qwen35.go(238 行新增)正式引入了Qwen3.5 專屬解析器 Qwen35Parser,取代原有的通用Qwen3Parser

(1) 核心特性

  • ? 完整支持thinking推理標(biāo)簽 ...

  • ? 增強(qiáng)對分塊流式輸出的識別能力(跨 token stream 漸進(jìn)渲染)

  • ? 可區(qū)分思考內(nèi)容(thinking content)與輸出內(nèi)容(response content)

  • ? 在思考區(qū)間不解析 ,避免錯(cuò)把 reasoning 內(nèi)部結(jié)構(gòu)誤識別為工具調(diào)用

(2) 狀態(tài)機(jī)設(shè)計(jì)

新增狀態(tài):

const (
qwen35ParserStateCollectingThinking
qwen35ParserStateThinkingDoneEatingWhitespace
qwen35ParserStateCollectingContent
)

解析邏輯以有限狀態(tài)機(jī)(FSM)形式實(shí)現(xiàn)。當(dāng)遇到 起始標(biāo)簽進(jìn)入思考模式,遇到切換到內(nèi)容模式。
與此同時(shí),對流式數(shù)據(jù)的分段處理更加精準(zhǔn),支持不完整的關(guān)閉標(biāo)簽(如+nk>分兩次到達(dá)),確保輸出不會斷裂。

(3) 異常情況處理

  • ? 若 未關(guān)閉,自動將后續(xù)內(nèi)容視為思考過程輸出;

  • ? 若 Assistant 消息為續(xù)寫(帶 prefill),默認(rèn)跳過起始思考階段;

  • ? 處理 嵌套、空格、換行符自動剔除,輸出純凈的 reasoning 文本。

(4) 測試覆蓋 (model/parsers/qwen35_test.go)

測試文件新增382 行,覆蓋以下場景:

  • ? 工具調(diào)用 XML 格式識別;

  • ? 含顯式 標(biāo)簽的 reasoning 內(nèi)容提?。?/p>

  • ? Assistant 預(yù)填充(prefill)場景;

  • ? 思考階段中誤判工具調(diào)用;

  • ? 標(biāo)簽被分片情況;

  • ? 未閉合標(biāo)簽情況下的安全輸出。

這些測試使 Qwen 3.5 解析流程從多線程推理到斷流恢復(fù)都具備強(qiáng)魯棒性。

四、模型渲染層優(yōu)化:全面更新 Qwen3.5 與 GLM-OCR Renderer

渲染器層:model/renderers/目錄新增了兩大核心組件:

1.Qwen35Renderer

文件model/renderers/qwen35.go,新增 389 行。
該渲染器對應(yīng) Qwen3.5 模型 prompt 生成邏輯,旨在讓模型完全遵循 XML 函數(shù)調(diào)用格式與 思考框架。

功能亮點(diǎn):

  • ? 支持 指令區(qū)塊嵌入,格式嚴(yán)格遵循模型需求;

  • ? 自動拼接系統(tǒng)提示與函數(shù)聲明;

  • ? 支持生成 塊,帶 ;

  • ? 邏輯層支持多工具順序調(diào)用,多次 塊組裝;

  • ? 思考與輸出完美分離,緊密銜接模型訓(xùn)練格式。

渲染示例結(jié)構(gòu):

<|im_start|>assistant

I need to fetch the data first.

Here is my analysis.



42

<|im_end|>
其他改進(jìn):
  • ? 支持useImgTags圖片標(biāo)記嵌入([img-0], [img-1]),兼容多模態(tài);

  • ? 提供emitEmptyThinkOnNoThink參數(shù),用于未啟用思考模式時(shí)補(bǔ)充空 模塊;

  • ? 對工具多次調(diào)用場景支持批量寫入;

  • ? 對assistant prefill保留最后階段輸出,不關(guān)閉<|im_start|>塊。

測試文件model/renderers/qwen35_test.go共新增 389 行,涵蓋:

  • ? 多輪對話、函數(shù)調(diào)用遞歸;

  • ? Back-to-back 工具響應(yīng);

  • ? 思考與工具交錯(cuò)場景;

  • ? Assistant 預(yù)填充完整性校驗(yàn)。

該模塊的引入使得 Ollama 在多模型推理框架下更貼合阿里 Qwen3.5 推理接口的真實(shí)結(jié)構(gòu)。

2.GLM-OCR Renderer 大幅修復(fù)

文件model/renderers/glmocr.go修改 99 行。
這次修復(fù)針對核心問題:GLM-OCR 模型無法正確渲染帶圖像的 prompt。

更新要點(diǎn):

  • ? 新增GlmOcrRenderer結(jié)構(gòu)體屬性useImgTags

  • ? 引入內(nèi)部函數(shù)renderContent(),根據(jù)配置動態(tài)選擇是否添加[img-x]標(biāo)記;

  • ? 改善 ImageOffset(圖片計(jì)數(shù)偏移)管理;

  • ? 用戶消息按[img-0][img-1]順序標(biāo)識多圖輸入;

  • ? 流程中修正原先message.Content與圖片塊拼接順序。

渲染前后差異:

舊版輸出(無法識別圖片位):

<|user|>請識別圖片內(nèi)容。

新版輸出(帶多圖標(biāo)記):

<|user|>
[img-0][img-1]請識別圖片內(nèi)容。

同時(shí)新增glmocr_test.go文件(99 行),驗(yàn)證包括以下 5 種情況:

  1. 1. 單張圖片;

  2. 2. 多張圖片;

  3. 3. 多輪對話圖像偏移;

  4. 4. 默認(rèn)模式不添加圖像標(biāo)簽;

  5. 5. 無圖像場景內(nèi)容保持一致。

這意味著以后 GLM-OCR 模型將可以在多圖輸入下穩(wěn)定進(jìn)行 OCR 推理,輸出定位將完整無誤。

3. 渲染器選擇邏輯更新

model/renderers/renderer.go中更新了模型映射:

case "qwen3.5":
renderer := &Qwen35Renderer{isThinking: true, emitEmptyThinkOnNoThink: true, useImgTags: RenderImgTags}
case "glm-ocr":
return &GlmOcrRenderer{useImgTags: RenderImgTags}

即:

  • ? 將原來的Qwen3VLRenderer替換為新的Qwen35Renderer;

  • ? 為GLM-OCR渲染器開啟全局圖片標(biāo)簽選項(xiàng)。

這使兩個(gè)模型在渲染階段均獲得一致的上下文構(gòu)造與多模態(tài)支持。

五、服務(wù)器邏輯補(bǔ)充更新

server.go中,刪除了CompletionResponse返回體的PeakMemory字段,使 API 輸出與 Metrics 同步調(diào)整。
這確保了傳輸數(shù)據(jù)更輕量化、字段結(jié)構(gòu)一致。

六、測試體系增強(qiáng)

此次更新新增測試覆蓋超過 1000 行,主要針對以下方向:

  • ?配置遷移測試
    確保舊配置自動升級為標(biāo)準(zhǔn)名稱;

  • ?GLM-OCR 多圖輸入測試
    確認(rèn)每張圖片得到正確索引;

  • ?Qwen3.5 渲染與解析系統(tǒng)測試
    模擬思考場景、函數(shù)嵌套、流式數(shù)據(jù)拼接;

  • ?工具調(diào)用與 reasoning 多階段測試
    驗(yàn)證多工具連續(xù)調(diào)用的 XML 結(jié)構(gòu)合法性;

  • ?Streaming 行為測試
    分塊輸入下保持狀態(tài)一致性。

針對復(fù)雜推理模型,如 Qwen3.5 這種包含 的混合流式結(jié)構(gòu),此輪測試確保無論在并發(fā)推理還是斷流恢復(fù)場景下都不丟失內(nèi)容。

七、移除舊模型與無效依賴

本次更新清理了歷史遺留的imagegen LLM模型,以及云模型拉取過程中的存根要求,進(jìn)一步簡化了部署過程。
Revert提交中體現(xiàn)了多次回滾與重放操作,表明研發(fā)團(tuán)隊(duì)對云端模型加載機(jī)制進(jìn)行深度優(yōu)化與驗(yàn)證。

八、總結(jié)與展望

Ollama v0.17.6 是一次結(jié)構(gòu)性的重要版本更新。它沒有去追求新增功能,而是聚焦于底層穩(wěn)定性、模型兼容與推理一致性的打磨,體現(xiàn)出平臺從實(shí)驗(yàn)型向工業(yè)化過渡的信號。

核心收益總結(jié):

  1. 1.GLM-OCR修復(fù)后,OCR 模型可穩(wěn)定處理多圖輸入。

  2. 2.Qwen3.5渲染與解析系統(tǒng)配套上線,支持完整 思考標(biāo)簽鏈路。

  3. 3.配置文件自動遷移,升級成本為零。

  4. 4.API 數(shù)據(jù)結(jié)構(gòu)簡化,輸出更清晰、兼容性更高。

  5. 5.測試覆蓋度大幅提升,確保行為穩(wěn)定與準(zhǔn)確。

通過對 v0.17.6 的更新,可以預(yù)見 Ollama 在未來版本中將繼續(xù)強(qiáng)化多模態(tài)與 reasoning 模式集成,為 LLM 本地部署與企業(yè)多模型協(xié)作提供更堅(jiān)實(shí)的基礎(chǔ)。

結(jié)語

代碼地址:github.com/ollama/ollama

Ollama v0.17.6 雖非大版本跳躍,但卻在細(xì)節(jié)上體現(xiàn)了極高的工程重視度。
從配置遷移到渲染邏輯,再到工具調(diào)用與流式解析,幾乎每個(gè)子模塊都在朝著更統(tǒng)一、更可靠、更智能的方向演進(jìn)。

我們相信人工智能為普通人提供了一種“增強(qiáng)工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
馬斯克修改算法,意外揭開日本真面目,引發(fā)全球網(wǎng)友“抗日”

馬斯克修改算法,意外揭開日本真面目,引發(fā)全球網(wǎng)友“抗日”

青煙小先生
2026-04-08 11:46:25
24歲小伙愛上51歲大媽,大媽性欲高還虐待他,結(jié)果被小伙砍成5段

24歲小伙愛上51歲大媽,大媽性欲高還虐待他,結(jié)果被小伙砍成5段

胖胖侃咖
2024-04-22 08:00:09
2cm小生的勁爆錄音!京圈太子被小花約膩了!

2cm小生的勁爆錄音!京圈太子被小花約膩了!

八卦瘋叔
2026-04-07 11:30:11
兄弟倆名震甲A,退役后靠餐飲發(fā)家,如今財(cái)富自由,哥哥身居要職

兄弟倆名震甲A,退役后靠餐飲發(fā)家,如今財(cái)富自由,哥哥身居要職

削桐作琴
2026-04-08 16:30:30
華為取消:員工主動離職 N + 1 補(bǔ)償

華為取消:員工主動離職 N + 1 補(bǔ)償

云頭條
2026-04-08 21:33:42
美國警告賴清德當(dāng)局:大陸決定動手那一刻,“臺獨(dú)”只剩一個(gè)結(jié)局

美國警告賴清德當(dāng)局:大陸決定動手那一刻,“臺獨(dú)”只剩一個(gè)結(jié)局

朝子亥
2026-04-05 13:25:03
沒有哪個(gè)男人,能抗拒女人的主動

沒有哪個(gè)男人,能抗拒女人的主動

加油丁小文
2026-03-28 10:30:05
基民血虧超30%,自己投資卻賺5000萬!泰康基金桂躍強(qiáng),悄悄在愚人節(jié)離職

基民血虧超30%,自己投資卻賺5000萬!泰康基金桂躍強(qiáng),悄悄在愚人節(jié)離職

南財(cái)社V
2026-04-08 20:47:49
曝陳麗華去世不到3小時(shí),“大人物”出面,幾百億遺產(chǎn)早就有規(guī)劃

曝陳麗華去世不到3小時(shí),“大人物”出面,幾百億遺產(chǎn)早就有規(guī)劃

青梅侃史啊
2026-04-08 11:53:27
退休新規(guī):1980年后生的人面臨雙重壓力。

退休新規(guī):1980年后生的人面臨雙重壓力。

歲月有情1314
2026-04-08 08:02:19
黎巴嫩宣布全國哀悼

黎巴嫩宣布全國哀悼

南方都市報(bào)
2026-04-09 09:24:03
舞池里的偏愛:為何舞女們都愛找退休大爺跳舞

舞池里的偏愛:為何舞女們都愛找退休大爺跳舞

成都人的故事
2026-04-09 06:59:32
畢業(yè)生破1270萬!2026下半年開始,大部分家庭將直面“4大難題”

畢業(yè)生破1270萬!2026下半年開始,大部分家庭將直面“4大難題”

復(fù)轉(zhuǎn)這些年
2026-04-05 18:00:42
不在群里為全紅嬋說話?陳芋汐遭無妄之災(zāi)!她被網(wǎng)暴時(shí) 全妹也無力阻止

不在群里為全紅嬋說話?陳芋汐遭無妄之災(zāi)!她被網(wǎng)暴時(shí) 全妹也無力阻止

東方不敗然多多
2026-04-09 07:30:10
日本老人存款8000萬,大吃大喝高消費(fèi)只為"死前財(cái)產(chǎn)清零",和孩子因此關(guān)系疏遠(yuǎn),但他并不后悔…

日本老人存款8000萬,大吃大喝高消費(fèi)只為"死前財(cái)產(chǎn)清零",和孩子因此關(guān)系疏遠(yuǎn),但他并不后悔…

英國那些事兒
2026-03-21 23:16:20
美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺灣

美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺灣

別讓往昔的悲傷和對未來的恐懼
2026-04-09 00:05:19
全紅嬋報(bào)警!282人集體群聊霸凌,陳芋汐卷入漩渦沉默令人寒心

全紅嬋報(bào)警!282人集體群聊霸凌,陳芋汐卷入漩渦沉默令人寒心

林大師熱點(diǎn)
2026-04-08 16:38:38
這樣的“規(guī)則”太“霸王” !無法說話,四肢癱瘓,16歲女孩誤購演唱會門票求退票,平臺規(guī)則“概不退票”

這樣的“規(guī)則”太“霸王” !無法說話,四肢癱瘓,16歲女孩誤購演唱會門票求退票,平臺規(guī)則“概不退票”

新民晚報(bào)
2026-04-08 12:58:55
10年內(nèi)入獄2次,爆火后“包一晚”40萬,如今的她過得怎么樣?

10年內(nèi)入獄2次,爆火后“包一晚”40萬,如今的她過得怎么樣?

寶哥精彩賽事
2026-04-07 15:43:13
7戰(zhàn)6場被雪藏!火箭7連勝,1人成雞肋?休賽期搭上首輪也要交易他

7戰(zhàn)6場被雪藏!火箭7連勝,1人成雞肋?休賽期搭上首輪也要交易他

熊哥愛籃球
2026-04-09 10:23:37
2026-04-09 10:56:49
moonfdd incentive-icons
moonfdd
福大大架構(gòu)師每日一題
1172文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

福建45歲女子駕車墜河5人遇難有3名兒童 家屬最新發(fā)聲

頭條要聞

福建45歲女子駕車墜河5人遇難有3名兒童 家屬最新發(fā)聲

體育要聞

40歲,但實(shí)力倒退12年

娛樂要聞

具俊曄最新露面,又黑又瘦情緒低迷

財(cái)經(jīng)要聞

談判基礎(chǔ)已被破壞!霍爾木茲海峽關(guān)閉

汽車要聞

8155芯片+L2智駕 瑞虎5運(yùn)動版上市 置換補(bǔ)貼價(jià)6.79萬元起

態(tài)度原創(chuàng)

親子
健康
房產(chǎn)
家居
時(shí)尚

親子要聞

如何判斷孩子肚子里有沒有蛔蟲?兒科醫(yī)生來教你

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

房產(chǎn)要聞

超級卷王登場!海口首個(gè)抬板四代宅,徹底刷新認(rèn)知!

家居要聞

清新自然 復(fù)古風(fēng)尚

ED網(wǎng)紅病,正在掏空年輕女性

無障礙瀏覽 進(jìn)入關(guān)懷版