国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

打臉整個AI圈!清華用“笨辦法”解決世界難題,專家直呼想不到

0
分享至

打臉整個AI圈!清華用“笨辦法”解決世界難題,專家直呼想不到

最近AI圈被一份報告炸開了鍋。

斯坦福大學(xué)最新研究顯示,2025年以來,針對多模態(tài)AI的視覺攻擊案例暴漲300%,其中67%的黑客把惡意指令藏進圖片里,讓AI在毫無察覺的情況下輸出違規(guī)內(nèi)容。

就在全球為AI安全頭疼的當下,清華大學(xué)人工智能學(xué)院在AAAI 2025頂會上扔出了一枚“深水炸彈”——DAVSP技術(shù)。

這項研究猶如給AI裝上了“防毒軟件”,在幾乎不損傷模型智商的前提下,將惡意攻擊的識別率提升到90%以上。今天咱們就來扒一扒,這項技術(shù)到底牛在哪里。

說實話,現(xiàn)在的AI安全防護簡直像是在打地鼠。你剛堵住文本漏洞,黑客就轉(zhuǎn)戰(zhàn)圖片領(lǐng)域。

比如有攻擊者把“如何制作炸彈”的指令藏進一張貓咪圖片的像素里,AI在看到這幅人畜無害的圖片時,竟然乖乖輸出詳細的操作指南。

當前主流的防護手段有兩種路子,但都漏洞百出:

一種是文本安全提示,就是在用戶問題前加一句“請遵守倫理規(guī)范”。這招對純文本還好使,但面對藏在圖片里的惡意指令,簡直形同虛設(shè)。



另一種是視覺安全擾動,相當于給圖片加上一層“馬賽克”噪聲。但這方法有個致命傷——安全性和實用性成了死對頭。就好比為了防病毒,直接把電腦鍵盤鎖死,結(jié)果正常功能也癱瘓了。

有個數(shù)據(jù)很能說明問題:2025年9月,伯克利的研究人員發(fā)現(xiàn),使用當前最先進的ESIII防護技術(shù)后,模型在MME評測基準上的得分從1818分暴跌到1403分。

這相當于讓一個清華學(xué)霸突然變成及格線徘徊的學(xué)渣。

更諷刺的是,即便付出如此代價,面對FigStep基準的惡意圖片時,仍有30%的漏洞率。



問題的根源在于,傳統(tǒng)方法只是治標不治本。模型學(xué)會的不是真正識別危險,而是機械模仿“拒絕話術(shù)”。

這就好比小孩背會了“不能給陌生人開門”,卻不理解為什么不能開。于是經(jīng)常出現(xiàn)AI先禮貌地說“抱歉不能幫忙”,轉(zhuǎn)頭就詳細講解如何實施網(wǎng)絡(luò)攻擊的荒誕場面。

面對這個行業(yè)難題,清華大學(xué)人工智能學(xué)院的李佳助理教授團隊另辟蹊徑,提出了DAVSP(深度對齊視覺安全提示)技術(shù)。

這項研究之所以能獲得AAAI 2025的最高評分,關(guān)鍵在于它同時解決了“防不住”和“變笨了”兩大痛點。

第一招:視覺安全提示(VSP)——給圖片加個“智能邊框”。

想象一下,給每張圖片裝上一個智能門禁系統(tǒng)。傳統(tǒng)方法是在整張圖片上撒胡椒面似的加噪聲,而清華團隊獨辟蹊徑,只在圖片外圍加一圈可訓(xùn)練的邊框。這個設(shè)計暗藏玄機:

實驗數(shù)據(jù)很有說服力:使用VSP后,模型在MME良性任務(wù)上的表現(xiàn)與未加防護時基本持平,而在FigStep惡意攻擊測試中,識別率飆升至94.5%。



這相當于既給AI穿上了防彈衣,又沒影響它跑步速度。

第二招:深度對齊(DA)——從“機械背誦”到“真正理解”。

如果說VSP是給AI配了副好眼鏡,那深度對齊就是教會AI用腦子思考。研究團隊有個驚人發(fā)現(xiàn):AI內(nèi)部其實自帶“危險嗅覺”。

就像老刑警能憑直覺識別嫌疑人,AI處理惡意內(nèi)容和正常內(nèi)容時,神經(jīng)元的激活模式確實存在差異。團隊通過比較海量樣本,在AI大腦中定位出了“危險感知區(qū)”。



具體操作分兩步走:

這就好比教孩子不是簡單背誦“不能碰電源”,而是讓他理解觸電的后果。經(jīng)過這種深度訓(xùn)練的AI,看到危險圖片時是真的“心里一激靈”,而不是機械地說“我不能幫忙”。

DAVSP在實戰(zhàn)中的表現(xiàn)堪稱驚艷。在MultiGuard、FigStep等多個權(quán)威測試中,其惡意攻擊識別率比現(xiàn)有最好技術(shù)高出26個百分點。

更難得的是,它對正常任務(wù)的影響微乎其微,在圖像描述、視覺問答等測試中,性能波動控制在1%以內(nèi)。

最讓人驚喜的是它的泛化能力。一個在LLaVA模型上訓(xùn)練的安全邊框,直接移植到InstruCTBLIP模型上,仍然保持85%以上的防護效果。

這意味著未來可能開發(fā)出通用安全模塊,像手機殺毒軟件一樣方便安裝。

當然,技術(shù)還有進化空間。比如在復(fù)雜圖像遮擋情況下的穩(wěn)定性,以及對新型攻擊手法的適應(yīng)性等,團隊已經(jīng)在GitHub開源代碼,邀請全球開發(fā)者共同完善。



DAVSP技術(shù)的突破,給整個AI安全領(lǐng)域帶來了新思路。它證明了安全與性能不是非此即彼的選擇題。

就像汽車安全裝置不是簡單限速,而是通過安全帶、氣囊等智能防護,在保障安全的同時不影響駕駛體驗。

隨著AI融入醫(yī)療、駕駛、金融等關(guān)鍵領(lǐng)域,這種“深度安全”理念顯得尤為重要。試想,如果醫(yī)療AI因為安全防護而看錯CT片子,或者自動駕駛AI因過度防護而反應(yīng)遲鈍,后果都將不堪設(shè)想。

AI安全進化史,就是從“打補丁”到“建免疫系統(tǒng)”的升級。清華DAVSP技術(shù)的價值,不僅在于解決了當前的多模態(tài)安全難題,更開創(chuàng)了“深度對齊”的安全新范式。



當AI不僅能識別危險,更能理解危險背后的邏輯,我們才能真正信任這些智能助手。

未來,如果這項技術(shù)推廣到語音、視頻等更多場景,或許能從根本上構(gòu)建AI的安全防線。畢竟,讓機器真正懂得善惡底線,比單純追求更聰明更重要。



這項研究就像給AI世界裝上了“智慧大腦”,讓技術(shù)在快速發(fā)展的同時,始終走在安全的軌道上。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
0-3遭橫掃后,沒想到向鵬這樣評價張本智和:心態(tài)崩了,實力差距

0-3遭橫掃后,沒想到向鵬這樣評價張本智和:心態(tài)崩了,實力差距

十點街球體育
2026-01-10 00:00:03
美媒:中國洲際隱身轟炸機高清照首次亮相。遠超B21

美媒:中國洲際隱身轟炸機高清照首次亮相。遠超B21

世家寶
2026-01-07 11:59:10
伊朗,“不是委內(nèi)瑞拉”

伊朗,“不是委內(nèi)瑞拉”

中國新聞周刊
2026-01-09 08:52:33
不只是臺灣!日本必須歸還的中國領(lǐng)土,遠比你想象的多

不只是臺灣!日本必須歸還的中國領(lǐng)土,遠比你想象的多

優(yōu)趣紀史記
2026-01-09 23:14:17
摩爾線程,你在打誰的臉?

摩爾線程,你在打誰的臉?

風風順
2025-12-13 01:00:04
賀江川落馬,在北京國企圈子里,妥妥是金字塔尖的大佬。

賀江川落馬,在北京國企圈子里,妥妥是金字塔尖的大佬。

百態(tài)人間
2025-12-19 16:54:12
買紅妹:我那“拋妻棄子”的前夫,與潘蔚再婚后,面相都變了!

買紅妹:我那“拋妻棄子”的前夫,與潘蔚再婚后,面相都變了!

瓜汁橘長Dr
2025-12-31 18:03:17
圖片報:多特認為小貝林厄姆體型相對偏壯,希望他減肌

圖片報:多特認為小貝林厄姆體型相對偏壯,希望他減肌

懂球帝
2026-01-09 20:05:06
張本智和連克兩大國乒猛將晉級8強,激情慶祝引關(guān)注

張本智和連克兩大國乒猛將晉級8強,激情慶祝引關(guān)注

劉剮說體壇
2026-01-10 00:30:24
A股:剛剛,中央權(quán)威發(fā)布,重磅信號來襲,下周一將迎來新的變化

A股:剛剛,中央權(quán)威發(fā)布,重磅信號來襲,下周一將迎來新的變化

云鵬敘事
2026-01-10 00:00:05
這把是虧了!都靈退租國米23歲中場隊員,實力不濟太令人失望

這把是虧了!都靈退租國米23歲中場隊員,實力不濟太令人失望

里芃芃體育
2026-01-10 00:35:06
這回真被打疼了!新加坡做了20年美國“好朋友”,反手就被收割?

這回真被打疼了!新加坡做了20年美國“好朋友”,反手就被收割?

知識TNT
2026-01-09 14:10:05
樂高往積木里塞了個電腦,這是半世紀以來最大的一次進化|CES 2026

樂高往積木里塞了個電腦,這是半世紀以來最大的一次進化|CES 2026

愛范兒
2026-01-08 18:06:01
王石陪田樸珺理發(fā)力破婚變傳聞!5歲女兒罕見露面,側(cè)面像極爸爸

王石陪田樸珺理發(fā)力破婚變傳聞!5歲女兒罕見露面,側(cè)面像極爸爸

古希臘掌管松餅的神
2026-01-09 20:07:30
太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

好賢觀史記
2025-12-23 18:14:27
小姐姐緊身連體瑜伽褲一穿,長腿優(yōu)勢直接拉滿,辣到讓人心跳

小姐姐緊身連體瑜伽褲一穿,長腿優(yōu)勢直接拉滿,辣到讓人心跳

小喬古裝漢服
2025-12-19 16:23:17
中國債市供給創(chuàng)下天量!

中國債市供給創(chuàng)下天量!

邊際財經(jīng)實驗室
2026-01-09 10:44:58
于正怕是比吃蒼蠅還難受!被他棄用的兩個好苗子,如今紅的發(fā)燙

于正怕是比吃蒼蠅還難受!被他棄用的兩個好苗子,如今紅的發(fā)燙

小椰的奶奶
2026-01-09 09:46:17
美軍沒有政委,為什么能把軍隊管得服服帖帖?

美軍沒有政委,為什么能把軍隊管得服服帖帖?

扶蘇聊歷史
2026-01-06 15:25:46
孫千這組照片太敢!黑褲包裹蜜桃臀,蝴蝶釘在胸前,這身材絕了?

孫千這組照片太敢!黑褲包裹蜜桃臀,蝴蝶釘在胸前,這身材絕了?

娛樂領(lǐng)航家
2026-01-09 22:00:03
2026-01-10 02:08:49
春序娛樂
春序娛樂
感恩歷史里的人與事。
4566文章數(shù) 738關(guān)注度
往期回顧 全部

科技要聞

市場偏愛MiniMax:開盤漲42%,市值超700億

頭條要聞

佩特羅:“特朗普對我說已在策劃軍事行動”

頭條要聞

佩特羅:“特朗普對我說已在策劃軍事行動”

體育要聞

金元時代最后的外援,來中國8年了

娛樂要聞

關(guān)曉彤鹿晗風波后露面 不受影響狀態(tài)佳

財經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

助跑三年的奇瑞 接下來是加速還是起跳?

態(tài)度原創(chuàng)

游戲
時尚
本地
親子
手機

怎么會有游戲上來就說自己的新服活不過10天???"/> 主站 商城 論壇 自運營 登錄 注冊 怎么會有游戲上來就說自己的新服活不過10天??? 廉頗 202...

推廣中獎名單-更新至2025年12月19日推廣

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

親子要聞

“國學(xué)馴化”從娃娃抓起?

手機要聞

vivo X200T詳細參數(shù)曝光,X300 Ultra待發(fā)布

無障礙瀏覽 進入關(guān)懷版