国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

比現(xiàn)有框架快22倍,浙大開源EasySteer:LLM Steering統(tǒng)一框架

0
分享至



大語言模型 (LLM) 在部署后如何靈活地控制其行為,一直是業(yè)界面臨的核心挑戰(zhàn)。微調(diào)代價高昂且存在災(zāi)難性遺忘風險,提示工程又只能提供表層的控制,缺乏行為保證。LLM Steering 技術(shù)通過在推理階段對模型隱藏狀態(tài)進行定向操作,在不修改模型權(quán)重的情況下實現(xiàn)精準行為控制,為這一問題提供了一條輕量且可行的路徑。

近年來,社區(qū)已涌現(xiàn)出 repeng、pyreft、EasyEdit2 等代表性框架,分別在分析式向量提取、學習式表征微調(diào)、綜合編輯等方向做出了重要探索。不過,隨著 Steering 技術(shù)從單一實驗場景走向多目標、大規(guī)模的生產(chǎn)部署,現(xiàn)有框架在推理效率、控制粒度和算法擴展性上仍有進一步提升的空間。

在此背景下,浙江大學研究團隊提出了EasySteer——一個基于 vLLM 構(gòu)建的高性能、可擴展 LLM Steering 統(tǒng)一框架。該框架通過與 vLLM 推理引擎的深度集成,相比現(xiàn)有 Steering 框架實現(xiàn)了 10.8-22.3 倍的推理加速,同時提供更細粒度的干預(yù)控制,并為八大應(yīng)用場景提供了預(yù)計算 Steering 向量與完整復(fù)現(xiàn)示例,方便研究者快速上手和對照復(fù)現(xiàn)。



  • 論文地址:https://arxiv.org/abs/2509.25175
  • 開源代碼:https://github.com/ZJU-REAL/EasySteer
  • 演示視頻:https://www.youtube.com/watch?v=3rRGzZmhrXg
  • 簡易 demo:https://huggingface.co/spaces/zjuxhl/EasySteer

設(shè)計動機:從研究原型到生產(chǎn)部署的新需求

隨著 Steering 技術(shù)在安全控制、推理優(yōu)化、幻覺緩解等方向不斷取得進展,實際應(yīng)用中對框架提出了更高的要求。研究者總結(jié)了三個關(guān)鍵方向:


高吞吐推理:一方面,Steering 研究中大量的評測、消融實驗需要反復(fù)推理,低效的推理后端會嚴重拖慢科研迭代速度;另一方面,生產(chǎn)環(huán)境通常需要處理大規(guī)模并發(fā)請求,只有具備足夠的吞吐能力,Steering 技術(shù)才具備實際部署的可能性。利用 vLLM 等專用推理引擎的連續(xù)批處理能力,可以同時在科研效率和生產(chǎn)落地兩個層面帶來實質(zhì)性提升。


精細粒度控制:現(xiàn)有框架大多支持層級和位置級別的干預(yù),但在更細粒度的場景下仍有局限。例如,token 級別的條件干預(yù)(如僅在特定 token 出現(xiàn)時觸發(fā))、多向量協(xié)同等能力,對于復(fù)雜場景(如推理步邊界的選擇性干預(yù))至關(guān)重要。


便捷的算法集成:Steering 方法迭代迅速,框架需要提供低門檻的插件機制,方便研究者快速實現(xiàn)和對比新算法。



框架設(shè)計

EasySteer 由四個模塊組成,覆蓋從向量生成到應(yīng)用部署的完整流程:




Steering 向量生成模塊:同時支持分析式(CAA、PCA、線性探針、SAE 等)和學習式(LoReFT、LM-Steer 等)兩大類方法,通過統(tǒng)一的隱藏狀態(tài)捕獲接口,研究者可以在同一框架內(nèi)便捷地生成和對比不同類型的 Steering 向量。

Steering 向量應(yīng)用模塊:是 EasySteer 的核心,主要解決三個問題:通過非侵入式的動態(tài)模型包裝器兼容多種 LLM 架構(gòu);通過解耦的算法接口支持自定義 Steering 算法的即插即用;通過精細的參數(shù)控制支持條件干預(yù)、多向量協(xié)同等高級策略。


交互式演示系統(tǒng):提供基于 Web 的界面,集成推理、多輪對話、向量提取和訓(xùn)練功能,支持基線與 Steering 輸出的并排對比。


資源庫:提供覆蓋安全、推理、知識、真實性、語言、情感、人格、風格八大場景的預(yù)計算 Steering 向量,每個場景都附帶從數(shù)據(jù)準備到應(yīng)用的完整復(fù)現(xiàn)流程。



性能評估

框架推理效率

研究者在 NVIDIA A6000 GPU (48GB) 上,使用 DeepSeek-R1-Distill-Qwen-1.5B 進行了系統(tǒng)性基準測試。



在 Steering 開銷方面,EasySteer 在全層干預(yù)的批量推理場景下,短序列吞吐量為 8991 tokens/s,長序列為 7074 tokens/s,相比無 Steering 基線(10248 / 7563 tokens/s)分別下降約 12% 和 6%。即使同時應(yīng)用三個 Steering 向量到所有層,長序列吞吐仍保持在 6854 tokens/s,為基線的約 91%。整體來看,Steering 操作帶來的額外開銷較為可控。

在框架對比方面,以長序列批量推理為例,EasySteer 的吞吐量(7074 tokens/s)約為 pyreft(653 tokens/s)的 10.8 倍、repeng(317 tokens/s)的 22.3 倍。

框架有效性驗證


過度思考緩解:研究者參照 SEAL 方法,從 1000 個 MATH 訓(xùn)練樣本中提取三種行為向量(執(zhí)行、反思、轉(zhuǎn)換),在推理步邊界處增強執(zhí)行向量、抑制反思和轉(zhuǎn)換向量。在 DeepSeek-R1-Distill-Qwen-1.5B 上,SEAL Steering 將 GSM8K 準確率從 79.6% 提升至 82.3%,同時 token 使用量減少約 40%。MATH500 上準確率從 70.8% 提升至 78.4%。7B 模型同樣展現(xiàn)了效率收益,GSM8K 和 MATH500 分別減少了 13.3% 和 16.8% 的 token 消耗。


幻覺緩解:在 TruthfulQA 數(shù)據(jù)集上進行兩折交叉驗證,分析式方法和學習式方法均取得了不同程度的提升。其中,PCA 方法在 Llama-3.1-8B-Instruct 上將多選準確率從 50.55% 提升至 62.67%;LoReFT 在 Qwen2.5-1.5B-Instruct 上將開放式問答準確率從 27.17% 提升至 33.41%。分析式方法在提升準確率的同時通常能較好地保持語言流暢度,學習式方法則在準確率和流暢度之間存在一定的權(quán)衡。


定性效果:EasySteer 在八大場景中均展現(xiàn)了有效的行為控制能力。例如,安全場景下可將模型從生成不當內(nèi)容引導(dǎo)為拒絕回答;推理場景下可將簡單算術(shù)題的冗長推演簡化為直接輸出結(jié)果;語言場景下可將回復(fù)從英文切換為中文輸出。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“中園石化”被立案調(diào)查

“中園石化”被立案調(diào)查

每日經(jīng)濟新聞
2026-03-25 11:13:18
何超瓊沒想到,倒貼14億嫁東北小伙的何超盈,如今竟給她狠狠長臉

何超瓊沒想到,倒貼14億嫁東北小伙的何超盈,如今竟給她狠狠長臉

往史過眼云煙
2026-03-26 20:33:55
猝死三件套:熬夜、咖啡、跑步——人生最后一課

猝死三件套:熬夜、咖啡、跑步——人生最后一課

水滴的聲音
2026-03-25 08:36:43
張雪峰湯建魏華等猝死引起重視,多地衛(wèi)健委推專題普及心源性疾病知識,國家衛(wèi)健委官微詳解:為何年輕男性發(fā)病風險高

張雪峰湯建魏華等猝死引起重視,多地衛(wèi)健委推專題普及心源性疾病知識,國家衛(wèi)健委官微詳解:為何年輕男性發(fā)病風險高

極目新聞
2026-03-26 20:56:20
女子空置房2個月用水1961噸,費用近1.2萬元,“水管封死水表仍走字”,水務(wù)公司拒回應(yīng)

女子空置房2個月用水1961噸,費用近1.2萬元,“水管封死水表仍走字”,水務(wù)公司拒回應(yīng)

觀威海
2026-03-26 10:39:05
“我用房子貸的款卻進了他們口袋”,佛山一男子稱遭遇套路貸;警方立案偵查,3人被批捕后取保候?qū)?>
    </a>
        <h3>
      <a href=大風新聞
2026-03-26 16:56:40
小雨!中雨!局地大雨或暴雨+雷暴大風冰雹!未來7天廣西有3輪降雨......

小雨!中雨!局地大雨或暴雨+雷暴大風冰雹!未來7天廣西有3輪降雨......

廣西氣象
2026-03-26 19:34:30
張雪峰去世事件升級!很多人連夜下單AED,有店鋪一天銷售100多臺

張雪峰去世事件升級!很多人連夜下單AED,有店鋪一天銷售100多臺

火山詩話
2026-03-26 07:32:38
A股:今天收3889.08,尾盤已明確,做好準備,明天周五,要變盤了

A股:今天收3889.08,尾盤已明確,做好準備,明天周五,要變盤了

虎哥閑聊
2026-03-26 15:09:13
“鳥面媽媽”王小妞:不聽勸阻生二胎,兒子遺傳其外貌,現(xiàn)如何

“鳥面媽媽”王小妞:不聽勸阻生二胎,兒子遺傳其外貌,現(xiàn)如何

觀察者海風
2026-03-24 23:04:30
越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場

越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場

林輕吟
2026-03-26 07:34:21
伊媒:伊朗若遭美國地面入侵將打擊曼德海峽

伊媒:伊朗若遭美國地面入侵將打擊曼德海峽

參考消息
2026-03-26 11:02:08
伊朗外長:霍爾木茲海峽只對敵人關(guān)閉 中國、俄羅斯等國船只都安全通過了

伊朗外長:霍爾木茲海峽只對敵人關(guān)閉 中國、俄羅斯等國船只都安全通過了

閃電新聞
2026-03-26 10:48:55
A股“分紅王”來了,擬10股派70元

A股“分紅王”來了,擬10股派70元

數(shù)據(jù)寶
2026-03-26 22:16:46
52歲北京炒股冠軍罕見發(fā)聲:如果手里有10萬,建議死啃美人肩戰(zhàn)法

52歲北京炒股冠軍罕見發(fā)聲:如果手里有10萬,建議死啃美人肩戰(zhàn)法

股經(jīng)縱橫談
2026-03-16 21:56:42
Manus終于喝下自己藏好的毒

Manus終于喝下自己藏好的毒

藍媒匯財經(jīng)plus
2026-03-25 21:27:26
馬斯克最新回復(fù)來了

馬斯克最新回復(fù)來了

新浪財經(jīng)
2026-03-26 19:29:33
為什么閑魚很多賣家只支持自提?網(wǎng)友:等你碰上到手刀的就老實了

為什么閑魚很多賣家只支持自提?網(wǎng)友:等你碰上到手刀的就老實了

另子維愛讀史
2026-03-22 22:34:48
“橄欖綠”今年爆火,太顯白了!

“橄欖綠”今年爆火,太顯白了!

超級數(shù)學建模
2026-03-25 22:39:01
“抱抱我,不炸了...” 極端分子去炸醫(yī)院,竟被路人大哥嘴炮感化,當場自首?!

“抱抱我,不炸了...” 極端分子去炸醫(yī)院,竟被路人大哥嘴炮感化,當場自首?!

英國那些事兒
2026-03-25 23:14:43
2026-03-26 23:48:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12608文章數(shù) 142594關(guān)注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

時尚
健康
數(shù)碼
本地
軍事航空

400萬人愛過的女孩,被黃謠網(wǎng)暴180天后

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動,支持B70 / B65顯卡

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復(fù)仇了一萬遍

軍事要聞

擔心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

無障礙瀏覽 進入關(guān)懷版