国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ollama v0.18.1 版本完整更新詳解:OpenClaw 聯(lián)網(wǎng)搜索、無頭模式、模型基準(zhǔn)測試全解析

0
分享至




前言

Ollama 作為當(dāng)下最流行的本地大模型運行工具,憑借極簡的部署方式、豐富的模型支持、跨平臺兼容能力,成為 AI 開發(fā)者、運維人員、后端工程師本地運行、測試、集成大模型的首選方案。在 2026 年 3 月 17 日,Ollama 正式推出 v0.18.1 版本,這是一次面向工程化、自動化、聯(lián)網(wǎng)能力、性能測試的重量級更新。

本次版本核心圍繞 OpenClaw 集成、Web Search、無頭運行模式、模型基準(zhǔn)測試工具、系統(tǒng)兼容性、顯卡驅(qū)動支持等方面進行了大量重構(gòu)與增強。對于經(jīng)常在本地運行模型、需要做 CI/CD 集成、做模型性能對比、在容器環(huán)境部署 Ollama 的開發(fā)者來說,v0.18.1 解決了大量實際工程痛點。

本文將基于官方發(fā)布內(nèi)容,完整、細致、無遺漏地講解 ollama v0.18.1 所有更新內(nèi)容、使用方式、命令示例、配置變化、代碼改動與適配說明,幫助大家快速上手新版本所有能力。

一、ollama v0.18.1 版本整體概覽

ollama v0.18.1 于 2026 年 3 月 17 日正式發(fā)布,本次更新主要包含以下幾大方向:

  1. 1. OpenClaw 集成官方 Ollama 認(rèn)證與模型服務(wù),不再使用第三方授權(quán)。

  2. 2. 為 OpenClaw 提供官方 Web Search 與 Web Fetch 插件,本地模型與云端模型均可使用聯(lián)網(wǎng)能力。

  3. 3. 新增ollama launch無頭(非交互、headless)運行模式,支持 Docker、CI/CD、自動化腳本。

  4. 4. 大幅優(yōu)化內(nèi)置 Go 語言編寫的模型基準(zhǔn)測試工具,支持 TTFT、VRAM 監(jiān)控、預(yù)熱、CSV 輸出。

  5. 5. 完善 Linux 環(huán)境下 systemd 不存在時的兼容邏輯,自動跳過守護進程安裝。

  6. 6. 修復(fù)底層模型分配、錯誤捕獲、版本對比、插件校驗等問題。

  7. 7. 完善 AMD GPU 驅(qū)動約束說明,明確 ROCm 7 版本要求,優(yōu)化顯卡問題排查。

本次提交共計 7 次提交,涉及 10 個文件修改,5 位貢獻者參與,代碼新增 1684 行、刪除 418 行,屬于功能與穩(wěn)定性并重的版本。

二、OpenClaw 全新集成:官方 Ollama 授權(quán) + 網(wǎng)頁搜索與抓取

OpenClaw 是 Ollama 生態(tài)中非常重要的助手集成框架,在 v0.18.1 中,Ollama 對 OpenClaw 進行了徹底重構(gòu),統(tǒng)一使用 Ollama 官方賬號體系與模型服務(wù),同時帶來了最受期待的聯(lián)網(wǎng)搜索、網(wǎng)頁內(nèi)容抓取能力。

2.1 Web Search 與 Web Fetch 插件

ollama v0.18.1 為 OpenClaw 內(nèi)置了 Ollama 官方的網(wǎng)頁搜索與網(wǎng)頁抓取插件,這意味著:

  • ? Ollama 的本地模型與云端模型,都可以通過 OpenClaw 訪問互聯(lián)網(wǎng)最新內(nèi)容、新聞、資料。

  • ? OpenClaw 可以抓取網(wǎng)頁并提取可讀文本,交給模型進行理解、總結(jié)、處理。

  • ? 該功能不會執(zhí)行 JavaScript,保證安全、輕量、無風(fēng)險。

2.1.1 使用本地模型 + 網(wǎng)頁搜索的前提

在 OpenClaw 中使用本地模型并開啟網(wǎng)頁搜索,必須先完成 Ollama 登錄:

ollama signin

登錄完成后,直接啟動 OpenClaw:

ollama launch openclaw
2.1.2 單獨安裝網(wǎng)頁搜索插件

如果你已經(jīng)配置并正常使用 OpenClaw,可以不重新初始化,直接安裝插件:

openclaw plugins install @ollama/openclaw-web-search
2.2 OpenClaw 授權(quán)與初始化邏輯重構(gòu)

在舊版本中,OpenClaw 有獨立的引導(dǎo)流程與授權(quán)體系,v0.18.1 做出以下關(guān)鍵修改:

  1. 1.ollama launch openclaw統(tǒng)一使用 Ollama 官方認(rèn)證體系與模型提供商。

  2. 2. 初始化流程改為非交互模式,自動完成配置、網(wǎng)關(guān)設(shè)置、模型綁定。

  3. 3. 自動覆蓋舊版 openclaw.json 配置,并重新應(yīng)用模型配置。

  4. 4. 安裝時會優(yōu)先自動更新 OpenClaw,確保使用最新引導(dǎo)參數(shù)。

  5. 5. 新增--auth-choice ollama標(biāo)識,直接使用 Ollama 賬號體系。

  6. 6. 自動配置自定義網(wǎng)關(guān)地址與模型 ID,不再需要手動修改配置文件。

2.3 插件版本自動校驗機制

為了保證聯(lián)網(wǎng)功能穩(wěn)定,ollama v0.18.1 增加了嚴(yán)格的插件版本檢查:

  • ? 網(wǎng)頁搜索插件最低要求版本:0.2.1

  • ? 程序會自動檢查package.json中的版本號。

  • ? 低于最低版本時,會自動重新安裝插件。

  • ? 支持語義化版本比較,自動處理帶 v 與不帶 v 的版本號格式。

同時,系統(tǒng)會自動:

  • ? 注冊插件并設(shè)置為啟用狀態(tài)。

  • ? 關(guān)閉 OpenClaw 內(nèi)置的網(wǎng)頁搜索與抓取,避免沖突。

  • ? 將ollama_web_searchollama_web_fetch加入白名單,確保權(quán)限通過策略校驗。

2.4 守護進程安裝兼容優(yōu)化

在 Linux 環(huán)境中,很多 Docker 容器、精簡系統(tǒng)沒有 systemd。ollama v0.18.1 增加了自動判斷邏輯:

  • ? 判斷/run/systemd/system是否存在。

  • ? 判斷環(huán)境變量XDG_RUNTIME_DIR是否存在。

  • ? 不滿足條件時,自動跳過--install-daemon參數(shù),不再嘗試安裝系統(tǒng)服務(wù)。

  • ? 無 systemd 環(huán)境直接以前臺進程方式運行網(wǎng)關(guān),保證在容器內(nèi)正常運行。

這一改動極大提升了在 Docker、Kubernetes、精簡 Linux 系統(tǒng)上的兼容性。

三、ollama launch 無頭(非交互)運行模式

這是本次更新對運維、自動化、CI/CD、開發(fā)流水線最有價值的功能:ollama launch支持無頭(非交互、headless)模式。

3.1 無頭模式適用場景

  1. 1.Docker / 容器環(huán)境
    在構(gòu)建流水線中啟動模型集成,運行評估、測試提示詞、驗證模型行為,任務(wù)結(jié)束后自動銷毀。

  2. 2.CI/CD 流水線
    在自動化流程中執(zhí)行代碼審查、安全檢查、批量生成、模型驗證等任務(wù)。

  3. 3.腳本與自動化任務(wù)
    使用 Ollama 與 Claude 相關(guān)能力編寫自動化腳本,無人值守運行。

3.2 無頭模式使用規(guī)則
  1. 1. 必須使用--model指定模型,不能使用交互式選擇。

  2. 2. 可使用--yes自動拉取缺失模型,跳過所有選擇交互。

  3. 3. 無終端輸入輸出時,會直接拋出明確錯誤,引導(dǎo)用戶使用無頭模式。

3.3 無頭模式使用示例

基礎(chǔ)啟動命令:

ollama launch claude --model kimi-k2.5:cloud --yes -- -p "how does this repository work?"

在 OpenClaw 中使用子代理執(zhí)行任務(wù):

ollama launch claude --model kimi-k2.5:cloud --yes -- -p "how does this repository work?" using a subagent

這種方式可以完全在腳本、CI 中運行,不需要人工干預(yù),是企業(yè)級 AI 自動化的關(guān)鍵能力。

3.4 終端交互判斷邏輯

ollama v0.18.1 在代碼層面增加了終端判斷:

  • ? 檢查標(biāo)準(zhǔn)輸入、標(biāo)準(zhǔn)輸出是否為終端。

  • ? 非終端環(huán)境下禁止交互式模型選擇。

  • ? 直接提示:模型選擇需要交互式終端,請使用--model運行在無頭模式。

這讓腳本、后臺運行、管道調(diào)用時不會卡住,而是直接報錯并給出解決方案,非常工程化。

四、Ollama 基準(zhǔn)測試工具全面增強

ollama v0.18.1 對內(nèi)置的ollama-bench基準(zhǔn)測試工具進行了大規(guī)模升級,該工具由 Go 語言編寫,用于模型性能壓測、對比、數(shù)據(jù)輸出。

4.1 新版 Benchmark 工具核心功能

  1. 1. 一次運行測試多個模型。

  2. 2. 支持文本與圖像提示詞。

  3. 3. 可配置溫度、最大 Token、隨機種子等生成參數(shù)。

  4. 4. 支持預(yù)熱階段(warmup),讓測試結(jié)果更穩(wěn)定。

  5. 5. 支持 TTFT(首詞時延)監(jiān)控。

  6. 6. 實時監(jiān)控 VRAM 與 CPU 內(nèi)存占用。

  7. 7. 支持固定提示詞 Token 長度,保證測試可復(fù)現(xiàn)。

  8. 8. 輸出格式支持:benchstat、CSV。

  9. 9. 展示模型參數(shù)、量化等級、模型系列、體積、顯存占用。

4.2 可觀測指標(biāo)說明

工具會輸出以下關(guān)鍵性能指標(biāo):

  1. 1.prefill:提示詞處理時間,單位 ns/token。

  2. 2.generate:文本生成時間,單位 ns/token。

  3. 3.ttft:從請求到輸出第一個字符的時延。

  4. 4.load:模型加載耗時(一次性開銷)。

  5. 5.total:請求總耗時。

同時會輸出模型信息:

  • ? Params:參數(shù)量(如 4.3B)

  • ? Quant:量化等級(如 Q4_K_M)

  • ? Family:模型系列(如 gemma3)

  • ? Size:模型文件大小

  • ? VRAM:顯卡顯存占用(Size > VRAM 表示部分加載到內(nèi)存)

4.3 編譯與運行方式 4.3.1 編譯二進制

go build -o ollama-bench ./cmd/bench

運行:

./ollama-bench -model gemma3 -epochs 6 -format csv
4.3.2 直接 go run 運行

go run ./cmd/bench -model gemma3 -epochs 3
4.4 常用命令示例 4.4.1 基礎(chǔ)性能測試

./ollama-bench -model llama3 -epochs 10 -temperature 0.7 -max-tokens 500 -seed 42 -warmup 2 -format csv -output results.csv
4.4.2 圖片模型測試

./ollama-bench -model qwen3-vl -image photo.jpg -epochs 6 -max-tokens 100 -p "Describe this image"
4.4.3 固定提示詞 Token 數(shù)量

./ollama-bench -model gemma3 -epochs 6 -prompt-tokens 512
4.5 benchstat 格式使用

benchstat 是 Go 生態(tài)標(biāo)準(zhǔn)性能分析工具,ollama-bench 默認(rèn)輸出該格式。

保存結(jié)果:

./ollama-bench -model gemma3 -epochs 6 > gemma3.bench

按階段統(tǒng)計:

benchstat -col /step gemma3.bench

對比兩次優(yōu)化前后性能:

./ollama-bench -model gemma3 -epochs 6 > before.bench
# 修改后重新測試
./ollama-bench -model gemma3 -epochs 6 > after.bench
benchstat before.bench after.bench
4.6 CSV 機器可讀格式

可直接導(dǎo)出為 CSV,用于 Excel、Python 繪圖、報表、數(shù)據(jù)庫入庫:

./ollama-bench -model gemma3 -format csv -output result.csv

CSV 包含字段:名稱、階段、計數(shù)、每計數(shù)納秒、每秒 Token 數(shù),方便后續(xù)數(shù)據(jù)分析。

4.7 命令行參數(shù)完整說明

  • ?-model:待測試模型,必填,支持多個用逗號分隔。

  • ?-epochs:每個模型運行輪次,默認(rèn) 6。

  • ?-max-tokens:最大生成 Token,默認(rèn) 200。

  • ?-temperature:生成溫度,默認(rèn) 0.0。

  • ?-seed:隨機種子,0 為隨機。

  • ?-timeout:超時時間,單位秒。

  • ?-p:提示詞內(nèi)容。

  • ?-image:圖片路徑,用于多模態(tài)測試。

  • ?-k:保活時間。

  • ?-format:輸出格式 benchstat / csv。

  • ?-output:輸出文件,默認(rèn)標(biāo)準(zhǔn)輸出。

  • ?-warmup:預(yù)熱次數(shù),默認(rèn) 1。

  • ?-prompt-tokens:指定提示詞 Token 長度。

  • ?-v:詳細日志。

  • ?-debug:調(diào)試日志。

五、模型拉取邏輯優(yōu)化

ollama v0.18.1 優(yōu)化了模型不存在時的提示信息:

  • ? 舊版僅提示執(zhí)行ollama pull。

  • ? 新版提示:可手動 pull,或使用--yes自動拉取模型。

配合無頭模式,在自動化腳本中直接使用--yes即可實現(xiàn)全自動環(huán)境初始化,不需要人工判斷模型是否存在。

六、錯誤修復(fù)與底層優(yōu)化 6.1 模型分配錯誤修復(fù)

修復(fù)了allocModel中錯誤被吞掉的問題:

  • ? 舊版在圖資源預(yù)留失敗時直接返回 nil,錯誤丟失。

  • ? 新版會返回真實錯誤,方便排查顯存不足、資源搶占問題。

6.2 網(wǎng)頁搜索插件修復(fù)
  • ? 修復(fù)網(wǎng)頁搜索底層邏輯問題。

  • ? 增加網(wǎng)頁抓?。╢etch)能力。

  • ? 本地模型與云端模型統(tǒng)一啟用聯(lián)網(wǎng)能力。

6.3 無頭模式守衛(wèi)邏輯

增加多項校驗,確保無頭模式必須攜帶--model,避免非法運行。

七、AMD GPU 支持與驅(qū)動兼容說明

ollama v0.18.1 完善了 AMD 顯卡支持文檔,明確驅(qū)動要求與排查方案。

7.1 ROCm 驅(qū)動版本要求

Linux 下使用 AMD GPU必須升級到 ROCm 7 驅(qū)動,Ollama 內(nèi)置的 ROCm 7 庫不兼容舊版驅(qū)動。

如果使用 ROCm 6.x 及更早版本,會出現(xiàn):

  • ? GPU 發(fā)現(xiàn)超時。

  • ? 一直卡在 GPU 初始化。

  • ? 最終自動降級到 CPU 運行。

升級方式:使用amdgpu-install工具安裝 ROCm 7 官方驅(qū)動,升級后重啟系統(tǒng)。

7.2 GPU 問題排查方法

  1. 1. 開啟調(diào)試日志:

OLLAMA_DEBUG=1
  1. 2. 查看內(nèi)核日志:

sudo dmesg | grep -i amdgpu
sudo dmesg | grep -i kfd
  1. 3. 檢查驅(qū)動版本是否為 ROCm 7。

  2. 4. 多卡環(huán)境出現(xiàn)亂輸出,需要參考官方多卡適配方案。

八、ollama v0.18.1 對開發(fā)者的實際價值
  1. 1.本地模型終于可以聯(lián)網(wǎng)
    過去本地模型只能使用訓(xùn)練數(shù)據(jù),現(xiàn)在通過 OpenClaw 插件直接獲取實時信息,實用性大幅提升。

  2. 2.真正支持生產(chǎn)級自動化
    無頭模式 + CI/CD + Docker,讓 Ollama 從玩具工具變成可用于自動化、測試、流水線的工程組件。

  3. 3.標(biāo)準(zhǔn)化性能測試
    內(nèi)置 Go 基準(zhǔn)測試工具,支持量化、顯存、TTFT、吞吐量、預(yù)熱、復(fù)現(xiàn)測試,非常適合模型優(yōu)化、硬件對比。

  4. 4.Linux/容器兼容性極大增強
    自動判斷 systemd、自動跳過守護進程、非交互運行,在云原生環(huán)境幾乎零報錯。

  5. 5.OpenClaw 走向官方化、統(tǒng)一化
    不再分散授權(quán),全部接入 Ollama 生態(tài),后續(xù)更新與維護更穩(wěn)定。

九、總結(jié)

代碼地址:github.com/ollama/ollama

ollama v0.18.1 是一次偏向工程化、自動化、企業(yè)化的重要版本,不再只是簡單的模型運行工具,而是朝著:

  • ? 本地模型 + 聯(lián)網(wǎng)能力

  • ? 云原生、容器、CI/CD 友好

  • ? 標(biāo)準(zhǔn)化性能測試與評估

  • ? 高兼容、高穩(wěn)定、可觀測


我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
數(shù)據(jù)戳穿真相!馬競精準(zhǔn)針對巴薩,歐冠宿命對決再占上風(fēng)!

數(shù)據(jù)戳穿真相!馬競精準(zhǔn)針對巴薩,歐冠宿命對決再占上風(fēng)!

田先生籃球
2026-04-09 11:36:44
新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
《人民日報》叫停這8件事:你以為的養(yǎng)生,其實是在養(yǎng)病

《人民日報》叫停這8件事:你以為的養(yǎng)生,其實是在養(yǎng)病

深度報
2026-04-08 22:43:35
?;?4小時就翻臉?特朗普剛宣布偉大勝利,伊朗怒斥你已違約!

停火24小時就翻臉?特朗普剛宣布偉大勝利,伊朗怒斥你已違約!

菁菁子衿
2026-04-09 11:47:56
損失數(shù)千萬終破局,全紅嬋離隊后首簽代言讓周繼紅沉默了

損失數(shù)千萬終破局,全紅嬋離隊后首簽代言讓周繼紅沉默了

卿子書
2026-02-16 12:43:28
伊朗電力部門已部署3萬人待命保障供電

伊朗電力部門已部署3萬人待命保障供電

海外網(wǎng)
2026-04-08 07:11:04
湖人更新傷情報告:詹姆斯能出戰(zhàn)勇士,東契奇、里夫斯仍缺陣

湖人更新傷情報告:詹姆斯能出戰(zhàn)勇士,東契奇、里夫斯仍缺陣

懂球帝
2026-04-09 10:17:16
好消息!高速免費了,告別收費時代

好消息!高速免費了,告別收費時代

泡泡網(wǎng)
2026-04-08 11:11:12
繼德國之后,英國也開始貼出“中文標(biāo)語”?中國游客:不能夠接受

繼德國之后,英國也開始貼出“中文標(biāo)語”?中國游客:不能夠接受

潮鹿逐夢
2026-04-02 12:31:48
香蕉被點名!醫(yī)生:香蕉放黑 2 天,抗性淀粉翻倍,控糖護腸

香蕉被點名!醫(yī)生:香蕉放黑 2 天,抗性淀粉翻倍,控糖護腸

岐黃傳人孫大夫
2026-04-06 21:25:03
世界冠軍威爾遜:世錦賽上我最不愿意碰上的,就是這位中國球員!

世界冠軍威爾遜:世錦賽上我最不愿意碰上的,就是這位中國球員!

余憁搞笑段子
2026-04-08 18:10:33
判了,無期!斂財3.8億,偽裝了7年的勵志網(wǎng)紅,最終還是露餡了

判了,無期!斂財3.8億,偽裝了7年的勵志網(wǎng)紅,最終還是露餡了

蜉蝣說
2025-10-21 09:19:12
今天,A股突然縮量下跌,做好準(zhǔn)備了,不出意外,很可能這樣走

今天,A股突然縮量下跌,做好準(zhǔn)備了,不出意外,很可能這樣走

丁丁鯉史紀(jì)
2026-04-09 11:58:26
3-2力克U19世界第2!中國女乒16歲新星崛起:無懼對抗日乒新星

3-2力克U19世界第2!中國女乒16歲新星崛起:無懼對抗日乒新星

李喜林籃球絕殺
2026-04-08 15:33:37
?;馃o效 以色列戰(zhàn)機持續(xù)轟炸黎巴嫩 伊朗再次關(guān)閉霍爾木茲海峽

?;馃o效 以色列戰(zhàn)機持續(xù)轟炸黎巴嫩 伊朗再次關(guān)閉霍爾木茲海峽

聚峰軍評
2026-04-09 11:24:30
父親40年攢下的千億帝國,兒子4年敗光

父親40年攢下的千億帝國,兒子4年敗光

大貓財經(jīng)Pro
2026-04-08 16:09:55
11:2!最后24小時,中方兩次關(guān)鍵出手,激烈談判后特朗普妥協(xié)了

11:2!最后24小時,中方兩次關(guān)鍵出手,激烈談判后特朗普妥協(xié)了

軍機Talk
2026-04-08 11:58:54
深感痛心!深圳市衛(wèi)健委深夜發(fā)布情況說明

深感痛心!深圳市衛(wèi)健委深夜發(fā)布情況說明

梅斯醫(yī)學(xué)
2026-04-09 09:21:21
救護車違反調(diào)度指令,家屬稱因延誤搶救致死,官方通報

救護車違反調(diào)度指令,家屬稱因延誤搶救致死,官方通報

觀察者網(wǎng)
2026-04-09 08:42:37
奇瑞突然官宣:6.99萬起,新車正式上市

奇瑞突然官宣:6.99萬起,新車正式上市

高科技愛好者
2026-04-08 23:23:53
2026-04-09 12:27:00
moonfdd incentive-icons
moonfdd
福大大架構(gòu)師每日一題
1172文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

牛彈琴:停火數(shù)小時后發(fā)生可怕屠殺 三點實在太詭異

頭條要聞

牛彈琴:?;饠?shù)小時后發(fā)生可怕屠殺 三點實在太詭異

體育要聞

40歲,但實力倒退12年

娛樂要聞

具俊曄最新露面,又黑又瘦情緒低迷

財經(jīng)要聞

談判基礎(chǔ)已被破壞!霍爾木茲海峽關(guān)閉

汽車要聞

8155芯片+L2智駕 瑞虎5運動版上市 置換補貼價6.79萬元起

態(tài)度原創(chuàng)

本地
房產(chǎn)
親子
手機
軍事航空

本地新聞

建水Color Walk | 古城慢調(diào),掉進春天的調(diào)色盤里

房產(chǎn)要聞

超級卷王登場!??谑讉€抬板四代宅,徹底刷新認(rèn)知!

親子要聞

寶寶初體驗摘草莓,寶寶第一視角

手機要聞

OPPO A6s Pro官宣4月14日發(fā)布,號稱“顏值天花板”

軍事要聞

霍爾木茲海峽已再次關(guān)閉

無障礙瀏覽 進入關(guān)懷版