国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ollama v0.19.0 發(fā)布!Web 搜索插件上線、多模型兼容修復、MLX 與 KV 緩存全面優(yōu)化,本地大模型體驗再升級

0
分享至




ollama v0.19.0于2026年3月30日正式發(fā)布,作為本地大模型部署與運行的核心工具,本次更新聚焦用戶體驗優(yōu)化、功能增強與底層問題修復,覆蓋應用交互、插件能力、API性能、模型兼容、MLX運行器、注意力機制等多個核心維度,同時包含26次提交、58個文件改動,全面提升ollama的穩(wěn)定性、兼容性與實用性。

一、核心功能更新

  1. 1.應用體驗優(yōu)化
    ollama應用將不再錯誤顯示“模型已過時”提示,徹底解決此前版本中模型狀態(tài)判斷異常的問題,避免用戶被無效提示干擾,提升使用流暢度。

  2. 2.Web搜索插件集成
    ollama launch pi功能新增內(nèi)置Web搜索插件,該插件直接使用ollama官方Web搜索能力,無需額外配置即可讓本地模型具備聯(lián)網(wǎng)搜索能力,拓展本地大模型的信息獲取邊界,支持實時檢索最新數(shù)據(jù)。

  3. 3.Anthropic兼容API性能提升
    優(yōu)化使用Anthropic兼容API時的KV緩存命中率,減少重復計算與資源消耗,提升API調(diào)用的響應速度與效率,尤其在高頻、長對話場景下效果顯著。

  4. 4.Qwen3.5模型工具調(diào)用修復
    修復Qwen3.5模型工具調(diào)用解析問題,解決此前版本中工具調(diào)用內(nèi)容被錯誤輸出在思考模塊的問題,確保工具調(diào)用邏輯清晰、結(jié)果準確,保障Qwen3.5模型的函數(shù)調(diào)用能力正常生效。

  5. 5.MLX運行器增強

  • ? MLX運行器在提示詞處理過程中會創(chuàng)建周期性快照,實現(xiàn)狀態(tài)的持續(xù)備份,避免處理中斷導致的進度丟失;

  • ? 修復MLX運行器中KV緩存快照的內(nèi)存泄漏問題,優(yōu)化內(nèi)存資源占用,提升長時間運行的穩(wěn)定性;

  • ? 優(yōu)化MLX運行器的緩存驅(qū)逐與LRU跟蹤邏輯,提升緩存管理效率;

  • ? 合并setStateRaw與setStateDetached為setState,簡化API調(diào)用邏輯,降低開發(fā)與使用復雜度。

  1. 6.模型兼容與機制修復

  • ? 修復Grok模型的Flash Attention錯誤啟用問題,確保Grok模型在ollama中運行時,注意力機制配置符合模型特性,避免性能異?;蚣嫒菪詥栴};

  • ? 解決qwen3-next:80b模型無法在ollama中加載的問題,完善對該大參數(shù)模型的支持,拓展ollama可運行的模型范圍。

二、提交與改動詳情(按時間梳理) 2026年3月25日
  • ? ggml模塊:強制關閉Grok模型的Flash Attention,從底層解決Grok模型注意力機制配置錯誤問題。

2026年3月26日
  • ? MLX模塊:修復KV緩存快照內(nèi)存泄漏,優(yōu)化內(nèi)存管理;

  • ? MLX運行器:改進緩存驅(qū)逐與LRU跟蹤邏輯,提升緩存效率;

  • ? MLX運行器:在預填充階段調(diào)度周期性快照,實現(xiàn)狀態(tài)自動備份;

  • ? MLX運行器:合并setState相關接口,簡化調(diào)用邏輯;

  • ? 文檔:更新VS Code相關文檔,完善開發(fā)工具集成說明;

  • ? launch模塊:隱藏VS Code集成入口、Cline集成入口;

  • ? launch/vscode模塊:優(yōu)先使用已知VS Code路徑,而非PATH中的code命令,提升工具調(diào)用準確性。

2026年3月27日
  • ? TUI模塊:更新聊天標題,優(yōu)化交互界面展示;

  • ? CI模塊:在Linux系統(tǒng)中包含MLX JIT頭文件,完善編譯依賴;

  • ? launch模塊:對本地模型,當服務器上下文長度低于64k時發(fā)出警告,幫助用戶提前規(guī)避長文本處理問題;

  • ? CI模塊:強化CUDA包含路徑處理,提升GPU環(huán)境兼容性;

  • ? 模型解析器:修復Qwen3.5工具塊在思考塊中啟動時的關閉邏輯,解決工具調(diào)用解析異常;

  • ? 解析器:優(yōu)化Qwen3.5流式工具調(diào)用解析,并添加回歸測試,保障功能穩(wěn)定性;

  • ? 應用模塊:修復模型“過時”錯誤提示,優(yōu)化用戶體驗;

  • ? Anthropic模塊:修復因工具調(diào)用參數(shù)重排序?qū)е碌腒V緩存復用降級問題,提升API性能;

  • ? launch模塊:跳過MLX模型的上下文長度警告,并顯示模型名稱,優(yōu)化提示邏輯;

  • ? Anthropic模塊:修復內(nèi)容塊中的空輸入問題,避免API調(diào)用異常;

  • ? 服務器模塊:拉取模型時保留原始清單字節(jié),保障模型完整性。

2026年3月28日
  • ? MLX模塊:修復視覺能力與最低版本兼容問題,完善多模態(tài)支持;

  • ? launch模塊:自動安裝pi并管理Web搜索生命周期,簡化插件使用流程;

  • ? launch模塊:優(yōu)化已添加模型的多選功能,提升操作便捷性;

  • ? 回滾上下文長度警告變更,調(diào)整提示策略。

2026年3月29日
  • ? 模型模塊:為qwen3-next添加對傳統(tǒng)ssm_in投影的兼容性,解決模型加載失敗問題;

  • ? 命令模塊:在配置中設置OpenCode默認模型,優(yōu)化模型調(diào)用默認配置。

三、更新總結(jié)

代碼地址:bgithub.xyz/ollama/ollama

ollama v0.19.0版本從用戶體驗、功能拓展、底層性能、模型兼容四大方向發(fā)力,新增Web搜索插件拓展本地模型能力,修復多模型(Qwen3.5、Grok、qwen3-next:80b)的核心問題,優(yōu)化MLX運行器與KV緩存機制,同時完善API、CI、工具集成等模塊的細節(jié),全面提升ollama的穩(wěn)定性、兼容性與易用性,為本地大模型開發(fā)者與用戶提供更優(yōu)質(zhì)的運行環(huán)境。

我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關注“福大大架構師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
數(shù)據(jù)戳穿真相!馬競精準針對巴薩,歐冠宿命對決再占上風!

數(shù)據(jù)戳穿真相!馬競精準針對巴薩,歐冠宿命對決再占上風!

田先生籃球
2026-04-09 11:36:44
新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
《人民日報》叫停這8件事:你以為的養(yǎng)生,其實是在養(yǎng)病

《人民日報》叫停這8件事:你以為的養(yǎng)生,其實是在養(yǎng)病

深度報
2026-04-08 22:43:35
?;?4小時就翻臉?特朗普剛宣布偉大勝利,伊朗怒斥你已違約!

?;?4小時就翻臉?特朗普剛宣布偉大勝利,伊朗怒斥你已違約!

菁菁子衿
2026-04-09 11:47:56
損失數(shù)千萬終破局,全紅嬋離隊后首簽代言讓周繼紅沉默了

損失數(shù)千萬終破局,全紅嬋離隊后首簽代言讓周繼紅沉默了

卿子書
2026-02-16 12:43:28
伊朗電力部門已部署3萬人待命保障供電

伊朗電力部門已部署3萬人待命保障供電

海外網(wǎng)
2026-04-08 07:11:04
湖人更新傷情報告:詹姆斯能出戰(zhàn)勇士,東契奇、里夫斯仍缺陣

湖人更新傷情報告:詹姆斯能出戰(zhàn)勇士,東契奇、里夫斯仍缺陣

懂球帝
2026-04-09 10:17:16
好消息!高速免費了,告別收費時代

好消息!高速免費了,告別收費時代

泡泡網(wǎng)
2026-04-08 11:11:12
繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

潮鹿逐夢
2026-04-02 12:31:48
香蕉被點名!醫(yī)生:香蕉放黑 2 天,抗性淀粉翻倍,控糖護腸

香蕉被點名!醫(yī)生:香蕉放黑 2 天,抗性淀粉翻倍,控糖護腸

岐黃傳人孫大夫
2026-04-06 21:25:03
世界冠軍威爾遜:世錦賽上我最不愿意碰上的,就是這位中國球員!

世界冠軍威爾遜:世錦賽上我最不愿意碰上的,就是這位中國球員!

余憁搞笑段子
2026-04-08 18:10:33
判了,無期!斂財3.8億,偽裝了7年的勵志網(wǎng)紅,最終還是露餡了

判了,無期!斂財3.8億,偽裝了7年的勵志網(wǎng)紅,最終還是露餡了

蜉蝣說
2025-10-21 09:19:12
今天,A股突然縮量下跌,做好準備了,不出意外,很可能這樣走

今天,A股突然縮量下跌,做好準備了,不出意外,很可能這樣走

丁丁鯉史紀
2026-04-09 11:58:26
3-2力克U19世界第2!中國女乒16歲新星崛起:無懼對抗日乒新星

3-2力克U19世界第2!中國女乒16歲新星崛起:無懼對抗日乒新星

李喜林籃球絕殺
2026-04-08 15:33:37
?;馃o效 以色列戰(zhàn)機持續(xù)轟炸黎巴嫩 伊朗再次關閉霍爾木茲海峽

?;馃o效 以色列戰(zhàn)機持續(xù)轟炸黎巴嫩 伊朗再次關閉霍爾木茲海峽

聚峰軍評
2026-04-09 11:24:30
父親40年攢下的千億帝國,兒子4年敗光

父親40年攢下的千億帝國,兒子4年敗光

大貓財經(jīng)Pro
2026-04-08 16:09:55
11:2!最后24小時,中方兩次關鍵出手,激烈談判后特朗普妥協(xié)了

11:2!最后24小時,中方兩次關鍵出手,激烈談判后特朗普妥協(xié)了

軍機Talk
2026-04-08 11:58:54
深感痛心!深圳市衛(wèi)健委深夜發(fā)布情況說明

深感痛心!深圳市衛(wèi)健委深夜發(fā)布情況說明

梅斯醫(yī)學
2026-04-09 09:21:21
救護車違反調(diào)度指令,家屬稱因延誤搶救致死,官方通報

救護車違反調(diào)度指令,家屬稱因延誤搶救致死,官方通報

觀察者網(wǎng)
2026-04-09 08:42:37
奇瑞突然官宣:6.99萬起,新車正式上市

奇瑞突然官宣:6.99萬起,新車正式上市

高科技愛好者
2026-04-08 23:23:53
2026-04-09 12:27:00
moonfdd incentive-icons
moonfdd
福大大架構師每日一題
1172文章數(shù) 63關注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

牛彈琴:?;饠?shù)小時后發(fā)生可怕屠殺 三點實在太詭異

頭條要聞

牛彈琴:?;饠?shù)小時后發(fā)生可怕屠殺 三點實在太詭異

體育要聞

40歲,但實力倒退12年

娛樂要聞

具俊曄最新露面,又黑又瘦情緒低迷

財經(jīng)要聞

談判基礎已被破壞!霍爾木茲海峽關閉

汽車要聞

8155芯片+L2智駕 瑞虎5運動版上市 置換補貼價6.79萬元起

態(tài)度原創(chuàng)

藝術
旅游
家居
房產(chǎn)
健康

藝術要聞

龐茂琨 2026油畫寫生新作

旅游要聞

坐著高鐵去賞花!山東“牡丹號”賞花列車上新 憑車票享門票3.6折優(yōu)惠

家居要聞

清新自然 復古風尚

房產(chǎn)要聞

超級卷王登場!??谑讉€抬板四代宅,徹底刷新認知!

干細胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進入關懷版