国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI智能體也有「蜘蛛感應」,防御延時驟降至8.3%

0
分享至


新智元報道

編輯:LRST

【新智元導讀】不再依賴像「安檢站」一樣每步必停的外部插件,首創(chuàng)「內(nèi)源感知+分層篩選」機制,將Agent防御延時從200%+降至8.3%,安全與效率均達到SOTA級表現(xiàn)!

傳統(tǒng)的Agent防御機制通常采用強制進行安全檢查的方式,即在 Agent 執(zhí)行的特定階段,包括Query、Plan、Action、Observation等階段,都強制插入外部安全檢測。這種做法雖然有效,但會切斷了Agent的思維流,導致嚴重的延時積累,成本高昂且反應遲鈍。

來自上海財經(jīng)大學、新加坡國立大學、卡耐基梅隆大學等高校和學術組織的研究者們聯(lián)合重磅推出Spider-Sense智能體防御框架,通過兩大核心技術打破了這一僵局:利用Intrinsic Risk Sensing將風險意識植入Agent認知流,實現(xiàn)全鏈路的內(nèi)源性感知;配合Hierarchical Adaptive Screening機制,動態(tài)平衡向量檢索與深度推理,實現(xiàn)威脅的自適應篩選。


論文鏈接:https://arxiv.org/abs/2602.05386

開源鏈接:https://github.com/aifinlab/Spider-Sense

基準鏈接:https://huggingface.co/datasets/aifinlab/S2Bench

該框架讓Agent告別了被動防御,在 Mind2Web和EICU這些主流數(shù)據(jù)集上在大部分評估標準下均取得最優(yōu),在構建出的攻擊數(shù)據(jù)集上實現(xiàn)了SOTA級的安全與效率雙優(yōu)表現(xiàn)。

Spider-Sense提出了一種變革性的思路:防御應該是內(nèi)源的、選擇性的,而非外掛的、強制的。

該框架賦予Agent一種維持內(nèi)源性感知風險的能力。Agent 在執(zhí)行任務的過程中,會自主進行內(nèi)源性風險感知。

只有當Agent 「感覺」到工具輸出可疑或者指令中有陷阱等異常的時侯,才會像蜘蛛俠感知到危險一樣,動態(tài)觸發(fā)防御機制。隨后,系統(tǒng)通過分層自適應篩選,在效率和精度之間找到最佳平衡點。

關于Spider Sense的解釋:蜘蛛俠平時總是保持放松且高效的行進狀態(tài),只有在突發(fā)危險引發(fā)「激靈」預警的瞬間,才會下意識地觸發(fā)閃避或攔截動作。


核心優(yōu)勢與技術突破



內(nèi)源性風險感知

IRS(Intrinsic Risk Sensing)賦予Agent 「原生直覺」,從「外掛監(jiān)控」到「原生直覺」的進化,傳統(tǒng)防御強制進行安全檢查,笨重且遲鈍。而 Spider-Sense 的靈魂——IRS,則是將安全意識通過指令微調(diào)植入 Agent 的推理邏輯中。

  • 全鏈路無死角感知: IRS 并不只盯著用戶的輸入,而是滲透在 Agent 執(zhí)行任務的四個關鍵生命周期中:

    • Query 階段:審視用戶指令是否存在陷阱。

    • Plan 階段:監(jiān)控記憶檢索和規(guī)劃生成,防止記憶中毒或惡意規(guī)劃。

    • Action 階段:審計工具參數(shù)是否存在風險。

    • Observation 階段:檢查工具的返回結果,如網(wǎng)頁內(nèi)容、API 返回值等。

  • 按需觸發(fā): Agent 只有在感知到異常時,才會自主生成特定的感知信號,如 會在 Action 階段觸發(fā)。 這說明在 99% 的安全交互中,防御機制是「隱形」的,零延時損耗;只有在真正的危機時刻,它才會像蜘蛛俠的感應一樣瞬間激活。


分層自適應篩選

當IRS感知到風險后,HAS(Hierarchical Adaptive Screening)就發(fā)揮作用了。

為了解決大模型推理延遲高與輕量化模型識別精度不足的問題,一旦防御被觸發(fā),系統(tǒng)采用分層式篩選:

  • 粗粒度檢測(Coarse-grained)

    • 機制:系統(tǒng)維護了四個階段的攻擊向量數(shù)據(jù)庫(Attack Vector Databases)。HAS將可疑內(nèi)容向量化,與已知攻擊模式進行余弦相似度匹配。

  • 細粒度分析(Fine-grained)

    • 機制:只有當相似度低于閾值,但又不完全安全時,系統(tǒng)會檢索 Top-K 相關案例,并調(diào)用 LLM 進行深度對比分析。


全生命周期防護

不同于以往僅關注文本輸入輸出的防御,Spider-Sense 覆蓋了 Agent 交互的全鏈路——從用戶輸入(Query)、內(nèi)部記憶規(guī)劃(Plan)、工具參數(shù)審計(Action)到觀察工具調(diào)用后(Observation),無死角防御。


實驗結果

兼并速度與安全

為了驗證效果,研究團隊構建了一個包含多場景、真實工具調(diào)用、多階段攻擊以及高質(zhì)量假陽性樣本的高質(zhì)量基準測試集

高質(zhì)量假陽性樣本指那些在結構與操作模式上酷似惡意攻擊、但本質(zhì)意圖完全無害的「高難度」測試用例,專門用于考驗防御系統(tǒng)是否會因過度敏感而誤傷合法的用戶操作

在實驗中,Spider-Sense展現(xiàn)了令人印象深刻的性能優(yōu)勢,特別是在處理復雜的多步Agent交互時:

  1. 極低的延遲損耗:相比于基線方法以及 Guardagent 和 AGrail 動輒 197% 到 381% 的額外時間開銷,Spider-Sense 僅多了8.3%的延時。

  2. 主流數(shù)據(jù)集的表現(xiàn):框架在Mind2Web和EICU這些主流數(shù)據(jù)集上展現(xiàn)了卓越的綜合性能。除少數(shù)指標外,該方法在大部分評估標準下均取得最優(yōu)。

  3. SOTA 級防御表現(xiàn):在全新構建的基準測試中,Spider-Sense取得了最低的攻擊成功率(ASR)

  4. 極低的誤報率:實現(xiàn)了最低的誤報率(FPR),證明了它不僅防得住,而且不會因為過度防御而打斷用戶的正常操作。



案例研究

一次真實的攻擊攔截

看一個具體的工具返回注入攻擊(Tool Return Injection)案例:

  1. 場景:一個臨床分析 Agent 調(diào)用工具獲取患者記錄。

  2. 攻擊:工具返回的內(nèi)容被篡改,包含隱藏的惡意代碼(import fake_module),試圖誘導 Agent 執(zhí)行。

  3. 感知:Agent 在 Observation(工具調(diào)用后階段) 敏銳地感知到了工具返回值的異常,觸發(fā) 信號。

  4. 篩選:首先進行數(shù)據(jù)庫檢索,發(fā)現(xiàn)與已知攻擊模式相似,隨即調(diào)用深度對比分析,判定該代碼與上下文無關且具有危害性。

  5. 結果:Agent自主決定終止執(zhí)行,攻擊失敗。

整個過程Agent自主完成,既沒有因噎廢食,也沒有漏過任何蛛絲馬跡。


結論與展望

內(nèi)源驅(qū)動,降本增效,Spider-Sense將安全防御從「外掛監(jiān)控」轉(zhuǎn)變?yōu)椤冈庇X」。依靠IRS和HAS兩大機制,以僅8.3%的延時代價在上實現(xiàn)了 SOTA 級防御效果,完美解決了安全與效率的沖突。

參考資料:

https://arxiv.org/abs/2602.05386


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2勝8負,凈輸65分!東部霸主變成紙老虎,這么打東部懸念就不大了

2勝8負,凈輸65分!東部霸主變成紙老虎,這么打東部懸念就不大了

老梁體育漫談
2026-02-26 23:05:40
2015年,山東小伙被吉爾吉斯坦包工頭強行安排與其小12歲女兒成婚

2015年,山東小伙被吉爾吉斯坦包工頭強行安排與其小12歲女兒成婚

南權先生
2026-02-26 15:40:57
別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

不似少年游
2026-02-24 19:46:25
瘋狂一夜!中國男籃掀翻日本,韓國爆冷輸臺北,世預賽徹底亂了

瘋狂一夜!中國男籃掀翻日本,韓國爆冷輸臺北,世預賽徹底亂了

吳蛛旅行ing
2026-02-27 05:49:19
藏得太深!星鏈離不開的7家中國公司,每一家都是全球頂尖!

藏得太深!星鏈離不開的7家中國公司,每一家都是全球頂尖!

Thurman在昆明
2026-02-26 16:52:11
業(yè)內(nèi)人士:上汽奧迪銷售和售后等將并入一汽奧迪

業(yè)內(nèi)人士:上汽奧迪銷售和售后等將并入一汽奧迪

CNMO科技
2026-02-26 10:14:52
德國總理再用中文發(fā)帖:愿今年成為德中合作與發(fā)展之年

德國總理再用中文發(fā)帖:愿今年成為德中合作與發(fā)展之年

環(huán)球網(wǎng)資訊
2026-02-26 18:57:11
佛山順德一4A景區(qū)灰塑被人拿下,官方通報

佛山順德一4A景區(qū)灰塑被人拿下,官方通報

南方都市報
2026-02-26 12:58:14
遠征親友團!趙繼偉與高詩巖妻子一同現(xiàn)場觀賽,這一場真提氣了!

遠征親友團!趙繼偉與高詩巖妻子一同現(xiàn)場觀賽,這一場真提氣了!

籃球資訊達人
2026-02-27 00:53:43
塵白取消和中國郵政聯(lián)動!曾因尺度過大遭抵制

塵白取消和中國郵政聯(lián)動!曾因尺度過大遭抵制

游民星空
2026-02-26 18:03:34
瓜帥終要離城?老東家拋天價橄欖枝,曼城王朝懸了

瓜帥終要離城?老東家拋天價橄欖枝,曼城王朝懸了

奶蓋熊本熊
2026-02-27 06:41:07
前曼聯(lián)助教談球隊沒有簽下奧斯梅恩的原因;卡里克:看到庫尼亞,讓我想起特維斯

前曼聯(lián)助教談球隊沒有簽下奧斯梅恩的原因;卡里克:看到庫尼亞,讓我想起特維斯

MUREDS
2026-02-26 23:52:02
跳高王子朱建華:退役定居美國,為養(yǎng)家糊口再次回國,后來怎樣了

跳高王子朱建華:退役定居美國,為養(yǎng)家糊口再次回國,后來怎樣了

笑飲孤鴻非
2026-02-27 03:09:47
明星都心疼!演員王寧去杭州吃面,2188元一碗吃不起,老板戴金牌

明星都心疼!演員王寧去杭州吃面,2188元一碗吃不起,老板戴金牌

一娛三分地
2026-02-25 18:20:47
特朗普剛定下訪華時間,中方反手給美方,提出取消關稅的要求

特朗普剛定下訪華時間,中方反手給美方,提出取消關稅的要求

時光在作祟
2026-02-27 07:13:04
全球最大毒梟斃命!栽在300萬粉絲網(wǎng)紅情人手里,更多殘暴行為曝光

全球最大毒梟斃命!栽在300萬粉絲網(wǎng)紅情人手里,更多殘暴行為曝光

卷史
2026-02-26 13:56:44
陳麗君臺灣首演火出圈,粉絲把現(xiàn)場圍得水泄不通

陳麗君臺灣首演火出圈,粉絲把現(xiàn)場圍得水泄不通

都市快報橙柿互動
2026-02-26 20:31:39
變天!賴清德一夜收權,鄭麗文轉(zhuǎn)向軍購!臺海火藥桶這次真要炸?

變天!賴清德一夜收權,鄭麗文轉(zhuǎn)向軍購!臺?;鹚幫斑@次真要炸?

薛小榮
2026-02-26 19:11:54
威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

小火箭愛體育
2026-02-26 09:05:55
傅彪兒子近照曝光!過年和張一山聚餐,生活奢華難掩35歲滿頭白發(fā)

傅彪兒子近照曝光!過年和張一山聚餐,生活奢華難掩35歲滿頭白發(fā)

離離言幾許
2026-02-24 10:04:27
2026-02-27 07:59:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領航智能+時代
14598文章數(shù) 66644關注度
往期回顧 全部

科技要聞

英偉達業(yè)績亮眼仍跌5% 兩大因素成核心隱憂

頭條要聞

高市早苗有麻煩了 日本政界人士:令人難以抑制憤怒

頭條要聞

高市早苗有麻煩了 日本政界人士:令人難以抑制憤怒

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

旅游
教育
家居
藝術
軍事航空

旅游要聞

春節(jié)假期9天 廣東旅游“吸金”近850億

教育要聞

女生學材料科學與工程別慌!揭秘高需求領域

家居要聞

歸隱于都市 慢享自由

藝術要聞

紫氣東來,好運一整年!

軍事要聞

美國11架F-22隱形戰(zhàn)機抵達以色列

無障礙瀏覽 進入關懷版