国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

lmdeploy v0.11.1 版本發(fā)布:全面支持DeepSeek V3.2與DPTP,多項性能優(yōu)化與Bug修復(fù)

0
分享至




lmdeploy v0.11.1 于 2025 年 12 月 24 日正式發(fā)布。本次版本更新圍繞功能增強、性能與架構(gòu)優(yōu)化、問題修復(fù)、文檔完善以及工程與測試體系建設(shè)等多個方面展開,進一步提升了模型部署、推理服務(wù)和多模態(tài)場景下的整體可用性與穩(wěn)定性。以下為本次版本更新的詳細解讀。

一、新增功能(Features)

在功能層面,v0.11.1 引入了多項重要支持能力。
首先,Ascend 平臺新增了對 dptp 的支持,進一步增強了在特定硬件環(huán)境下的部署靈活性。
其次,正式支持 Deepseek v32 模型,使 lmdeploy 能夠覆蓋更多新一代大模型推理需求。

這些功能擴展為用戶在不同模型和不同硬件架構(gòu)下的部署提供了更廣泛的選擇。

二、改進與增強(Improvements)

在性能和功能增強方面,本次版本更新內(nèi)容尤為豐富。

  1. 1. 監(jiān)控與指標(biāo)體系
    對 metrics 進行了改進,使性能監(jiān)控和運行狀態(tài)統(tǒng)計更加完善,有助于生產(chǎn)環(huán)境中的觀測與調(diào)優(yōu)。

  2. 2. 調(diào)度與引擎優(yōu)化
    重構(gòu)了調(diào)度器與 engine.py,優(yōu)化了內(nèi)部結(jié)構(gòu),提高了整體執(zhí)行效率和可維護性。同時對 dp 超時時間進行了更新,使分布式場景下的任務(wù)調(diào)度更加穩(wěn)定。

  3. 3. 模型與多模態(tài)支持增強
    針對 Qwen3-VL 模型進行了多項改進,包括新增 vision id、增加多模態(tài)處理器參數(shù),以及整體能力優(yōu)化,顯著提升了多模態(tài)推理的一致性與可擴展性。

  4. 4. 推理與請求處理能力
    在請求被取消時,系統(tǒng)現(xiàn)在能夠返回已路由的專家信息,提升了推理過程中的可解釋性。
    同時,v1/chat/completions 接口新增對 chat_template_kwargs 的支持,使對話模板配置更加靈活。

  5. 5. 內(nèi)部結(jié)構(gòu)與內(nèi)存處理
    為 dummy 輸入預(yù)留 block,優(yōu)化了內(nèi)存使用策略;在預(yù)填充階段構(gòu)建 block trie 并增加命中率統(tǒng)計,提升了緩存與推理效率。

三、問題修復(fù)(Bug Fixes)

v0.11.1 對多個已知問題進行了修復(fù),顯著增強了系統(tǒng)穩(wěn)定性和安全性。

  1. 1. 推理與路由相關(guān)修復(fù)
    修復(fù)了按 query 長度拆分路由專家的問題,解決了部分場景下結(jié)果異常的問題。
    修復(fù)了混合請求返回 logprobs 時的請求處理異常。

  2. 2. 多進程與分布式問題
    修復(fù)了多進程環(huán)境下 HuggingFace 模塊讀寫沖突的問題。
    修復(fù)了特定硬件環(huán)境中 ray 與內(nèi)存同步相關(guān)的問題。

  3. 3. 量化與數(shù)值處理修復(fù)
    修復(fù)了多項與量化相關(guān)的問題,包括 quant8 的 fillkv、量化 scale-fmt 處理錯誤以及相關(guān)格式問題,保障了低精度推理的正確性。

  4. 4. 模型與處理器修復(fù)
    修復(fù)了處理器參數(shù)錯誤、fope 相關(guān)問題,并移除了在 RPC 調(diào)用中可能引發(fā) pickle 配置錯誤的 get_model_config 調(diào)用。

  5. 5. 安全性修復(fù)
    修復(fù)了在調(diào)用 torch.load 時可能存在的不安全反序列化問題,進一步提升了系統(tǒng)安全性。

四、文檔更新(Documentations)

在文檔方面,本次版本新增了 VLMEvalKit 使用指南,為多模態(tài)模型評測提供了更清晰的參考說明,有助于用戶快速上手和規(guī)范化評測流程。

五、其他更新(Other)

代碼地址:github.com/InternLM/lmdeploy

在工程與測試體系方面,v0.11.1 也進行了多項補充與完善。

  1. 1. 新增 FA3 支持,擴展了底層能力選項。

  2. 2. 新增分布式測試用例和生成測試用例,提升了版本質(zhì)量保障能力。

  3. 3. 在持續(xù)集成流程中加入了多模態(tài)大模型評測。

  4. 4. Ascend 相關(guān)代碼進行了重構(gòu),使結(jié)構(gòu)更加清晰。

  5. 5. Docker 鏡像構(gòu)建過程中新增自動安裝 serve.txt,簡化部署流程。

  6. 6. 版本號正式更新至 v0.11.1。

總結(jié)來看,lmdeploy v0.11.1 是一次內(nèi)容全面且扎實的版本更新,不僅擴展了模型與硬件支持范圍,也在性能、穩(wěn)定性、安全性和工程化能力上進行了系統(tǒng)性提升,非常適合在生產(chǎn)和研究環(huán)境中升級使用。

我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
網(wǎng)友好奇:網(wǎng)暴全紅嬋的群主是誰?群內(nèi)真有現(xiàn)役運動員嗎?

網(wǎng)友好奇:網(wǎng)暴全紅嬋的群主是誰?群內(nèi)真有現(xiàn)役運動員嗎?

羅納爾說個球
2026-04-08 23:08:09
四小時摧毀伊朗,法國提前動手,中方罕見表態(tài),伊朗:美國中計了

四小時摧毀伊朗,法國提前動手,中方罕見表態(tài),伊朗:美國中計了

萬物知識圈
2026-04-09 07:48:18
一場136-119讓火箭如愿以償!掘金值得欽佩,湖人主場優(yōu)勢不保了

一場136-119讓火箭如愿以償!掘金值得欽佩,湖人主場優(yōu)勢不保了

小徐講八卦
2026-04-09 11:46:09
炸了!出海越南中企集體翻車,40% 虧損撤資?為啥水土不服?

炸了!出海越南中企集體翻車,40% 虧損撤資?為啥水土不服?

小嵩
2026-04-08 19:40:40
為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

標(biāo)體
2026-04-07 16:23:59
王平河系列:高人出手(5/11)

王平河系列:高人出手(5/11)

金昔說故事
2026-04-09 13:35:08
鄭麗文真是一個狠人!竟公開承認自己身世之謎!宋楚瑜題字火出圈

鄭麗文真是一個狠人!竟公開承認自己身世之謎!宋楚瑜題字火出圈

素衣讀史
2026-02-03 11:49:44
湘軍打下城池,基本都是屠城、屠村,殺光,燒光,搶光。

湘軍打下城池,基本都是屠城、屠村,殺光,燒光,搶光。

歷史按察使司
2026-03-30 23:05:07
張雪再次飆淚 封王12天后終捧世界冠軍獎杯 將“無人區(qū)”搬上蛋糕

張雪再次飆淚 封王12天后終捧世界冠軍獎杯 將“無人區(qū)”搬上蛋糕

風(fēng)過鄉(xiāng)
2026-04-09 07:43:15
迎回老大!哈登踢到鐵板了!西部季后賽兩組對決確定!

迎回老大!哈登踢到鐵板了!西部季后賽兩組對決確定!

格斗聯(lián)盟有話說
2026-04-09 13:03:55
上海阿婆崩潰,買近30年的保險全被退!警方:若繼續(xù)持有價值百萬

上海阿婆崩潰,買近30年的保險全被退!警方:若繼續(xù)持有價值百萬

青梅侃史啊
2026-04-08 22:23:53
央視3次怒批電動車解限速,電動車限速25km/h,不如給電摩上綠牌

央視3次怒批電動車解限速,電動車限速25km/h,不如給電摩上綠牌

電動車的那些事兒
2026-04-09 07:50:14
拉亞4分鐘連撲2單刀,阿森納門將位被"二房東"整活了

拉亞4分鐘連撲2單刀,阿森納門將位被"二房東"整活了

熱血體育社
2026-04-09 14:17:16
湖人球星東契奇,為什么對莎拉波娃的豪宅“情有獨鐘”?

湖人球星東契奇,為什么對莎拉波娃的豪宅“情有獨鐘”?

老吳教育課堂
2026-04-09 13:22:43
佛系超巨!約基奇8次出手便拿下三雙,掘金豪取生涯首次10連勝!

佛系超巨!約基奇8次出手便拿下三雙,掘金豪取生涯首次10連勝!

田先生籃球
2026-04-09 13:27:44
WTT太原常規(guī)賽:接連“大屠殺”!國乒新星爆發(fā),溫瑞博大戰(zhàn)兇神

WTT太原常規(guī)賽:接連“大屠殺”!國乒新星爆發(fā),溫瑞博大戰(zhàn)兇神

生活新鮮市
2026-04-09 13:04:11
別再被主力洗傻!回調(diào)和下跌的核心區(qū)別,記住1條鐵律就夠了

別再被主力洗傻!回調(diào)和下跌的核心區(qū)別,記住1條鐵律就夠了

一方聊市
2026-04-09 00:07:06
04年,父親把雙胞胎女兒送人,20年后瘋狂尋找,只想知道過得如何

04年,父親把雙胞胎女兒送人,20年后瘋狂尋找,只想知道過得如何

哄動一時啊
2026-04-07 17:29:34
女生長的太漂亮是什么體驗?網(wǎng)友:母以子貴,父以女榮

女生長的太漂亮是什么體驗?網(wǎng)友:母以子貴,父以女榮

另子維愛讀史
2026-03-10 22:56:08
太火爆!大學(xué)生一天猛賺1800多元,提前一周就約滿

太火爆!大學(xué)生一天猛賺1800多元,提前一周就約滿

深圳晚報
2026-04-08 21:02:17
2026-04-09 14:36:49
moonfdd incentive-icons
moonfdd
福大大架構(gòu)師每日一題
1172文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

達賴深度卷入愛潑斯坦權(quán)色網(wǎng) 印媒再披露驚人新證據(jù)

頭條要聞

達賴深度卷入愛潑斯坦權(quán)色網(wǎng) 印媒再披露驚人新證據(jù)

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場上

娛樂要聞

金莎官宣結(jié)婚 與老公孫丞瀟相差18歲

財經(jīng)要聞

談判基礎(chǔ)已被破壞!霍爾木茲海峽關(guān)閉

汽車要聞

8155芯片+L2智駕 瑞虎5運動版上市 置換補貼價6.79萬元起

態(tài)度原創(chuàng)

房產(chǎn)
旅游
本地
公開課
軍事航空

房產(chǎn)要聞

超級卷王登場!??谑讉€抬板四代宅,徹底刷新認知!

旅游要聞

“北京超級周末”空降!最全攻略來了,還有專屬優(yōu)惠→

本地新聞

建水Color Walk | 古城慢調(diào),掉進春天的調(diào)色盤里

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

黎真主黨發(fā)射火箭彈 回應(yīng)以違反?;饏f(xié)議

無障礙瀏覽 進入關(guān)懷版