国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

打臉整個(gè)AI圈!清華用“笨辦法”解決世界難題,專(zhuān)家直呼想不到

0
分享至

打臉整個(gè)AI圈!清華用“笨辦法”解決世界難題,專(zhuān)家直呼想不到

最近AI圈被一份報(bào)告炸開(kāi)了鍋。

斯坦福大學(xué)最新研究顯示,2025年以來(lái),針對(duì)多模態(tài)AI的視覺(jué)攻擊案例暴漲300%,其中67%的黑客把惡意指令藏進(jìn)圖片里,讓AI在毫無(wú)察覺(jué)的情況下輸出違規(guī)內(nèi)容。

就在全球?yàn)锳I安全頭疼的當(dāng)下,清華大學(xué)人工智能學(xué)院在AAAI 2025頂會(huì)上扔出了一枚“深水炸彈”——DAVSP技術(shù)。

這項(xiàng)研究猶如給AI裝上了“防毒軟件”,在幾乎不損傷模型智商的前提下,將惡意攻擊的識(shí)別率提升到90%以上。今天咱們就來(lái)扒一扒,這項(xiàng)技術(shù)到底牛在哪里。

說(shuō)實(shí)話,現(xiàn)在的AI安全防護(hù)簡(jiǎn)直像是在打地鼠。你剛堵住文本漏洞,黑客就轉(zhuǎn)戰(zhàn)圖片領(lǐng)域。

比如有攻擊者把“如何制作炸彈”的指令藏進(jìn)一張貓咪圖片的像素里,AI在看到這幅人畜無(wú)害的圖片時(shí),竟然乖乖輸出詳細(xì)的操作指南。

當(dāng)前主流的防護(hù)手段有兩種路子,但都漏洞百出:

一種是文本安全提示,就是在用戶問(wèn)題前加一句“請(qǐng)遵守倫理規(guī)范”。這招對(duì)純文本還好使,但面對(duì)藏在圖片里的惡意指令,簡(jiǎn)直形同虛設(shè)。



另一種是視覺(jué)安全擾動(dòng),相當(dāng)于給圖片加上一層“馬賽克”噪聲。但這方法有個(gè)致命傷——安全性和實(shí)用性成了死對(duì)頭。就好比為了防病毒,直接把電腦鍵盤(pán)鎖死,結(jié)果正常功能也癱瘓了。

有個(gè)數(shù)據(jù)很能說(shuō)明問(wèn)題:2025年9月,伯克利的研究人員發(fā)現(xiàn),使用當(dāng)前最先進(jìn)的ESIII防護(hù)技術(shù)后,模型在MME評(píng)測(cè)基準(zhǔn)上的得分從1818分暴跌到1403分。

這相當(dāng)于讓一個(gè)清華學(xué)霸突然變成及格線徘徊的學(xué)渣。

更諷刺的是,即便付出如此代價(jià),面對(duì)FigStep基準(zhǔn)的惡意圖片時(shí),仍有30%的漏洞率。



問(wèn)題的根源在于,傳統(tǒng)方法只是治標(biāo)不治本。模型學(xué)會(huì)的不是真正識(shí)別危險(xiǎn),而是機(jī)械模仿“拒絕話術(shù)”。

這就好比小孩背會(huì)了“不能給陌生人開(kāi)門(mén)”,卻不理解為什么不能開(kāi)。于是經(jīng)常出現(xiàn)AI先禮貌地說(shuō)“抱歉不能幫忙”,轉(zhuǎn)頭就詳細(xì)講解如何實(shí)施網(wǎng)絡(luò)攻擊的荒誕場(chǎng)面。

面對(duì)這個(gè)行業(yè)難題,清華大學(xué)人工智能學(xué)院的李佳助理教授團(tuán)隊(duì)另辟蹊徑,提出了DAVSP(深度對(duì)齊視覺(jué)安全提示)技術(shù)。

這項(xiàng)研究之所以能獲得AAAI 2025的最高評(píng)分,關(guān)鍵在于它同時(shí)解決了“防不住”和“變笨了”兩大痛點(diǎn)。

第一招:視覺(jué)安全提示(VSP)——給圖片加個(gè)“智能邊框”。

想象一下,給每張圖片裝上一個(gè)智能門(mén)禁系統(tǒng)。傳統(tǒng)方法是在整張圖片上撒胡椒面似的加噪聲,而清華團(tuán)隊(duì)獨(dú)辟蹊徑,只在圖片外圍加一圈可訓(xùn)練的邊框。這個(gè)設(shè)計(jì)暗藏玄機(jī):

實(shí)驗(yàn)數(shù)據(jù)很有說(shuō)服力:使用VSP后,模型在MME良性任務(wù)上的表現(xiàn)與未加防護(hù)時(shí)基本持平,而在FigStep惡意攻擊測(cè)試中,識(shí)別率飆升至94.5%。



這相當(dāng)于既給AI穿上了防彈衣,又沒(méi)影響它跑步速度。

第二招:深度對(duì)齊(DA)——從“機(jī)械背誦”到“真正理解”。

如果說(shuō)VSP是給AI配了副好眼鏡,那深度對(duì)齊就是教會(huì)AI用腦子思考。研究團(tuán)隊(duì)有個(gè)驚人發(fā)現(xiàn):AI內(nèi)部其實(shí)自帶“危險(xiǎn)嗅覺(jué)”。

就像老刑警能憑直覺(jué)識(shí)別嫌疑人,AI處理惡意內(nèi)容和正常內(nèi)容時(shí),神經(jīng)元的激活模式確實(shí)存在差異。團(tuán)隊(duì)通過(guò)比較海量樣本,在AI大腦中定位出了“危險(xiǎn)感知區(qū)”。



具體操作分兩步走:

這就好比教孩子不是簡(jiǎn)單背誦“不能碰電源”,而是讓他理解觸電的后果。經(jīng)過(guò)這種深度訓(xùn)練的AI,看到危險(xiǎn)圖片時(shí)是真的“心里一激靈”,而不是機(jī)械地說(shuō)“我不能幫忙”。

DAVSP在實(shí)戰(zhàn)中的表現(xiàn)堪稱(chēng)驚艷。在MultiGuard、FigStep等多個(gè)權(quán)威測(cè)試中,其惡意攻擊識(shí)別率比現(xiàn)有最好技術(shù)高出26個(gè)百分點(diǎn)。

更難得的是,它對(duì)正常任務(wù)的影響微乎其微,在圖像描述、視覺(jué)問(wèn)答等測(cè)試中,性能波動(dòng)控制在1%以內(nèi)。

最讓人驚喜的是它的泛化能力。一個(gè)在LLaVA模型上訓(xùn)練的安全邊框,直接移植到InstruCTBLIP模型上,仍然保持85%以上的防護(hù)效果。

這意味著未來(lái)可能開(kāi)發(fā)出通用安全模塊,像手機(jī)殺毒軟件一樣方便安裝。

當(dāng)然,技術(shù)還有進(jìn)化空間。比如在復(fù)雜圖像遮擋情況下的穩(wěn)定性,以及對(duì)新型攻擊手法的適應(yīng)性等,團(tuán)隊(duì)已經(jīng)在GitHub開(kāi)源代碼,邀請(qǐng)全球開(kāi)發(fā)者共同完善。



DAVSP技術(shù)的突破,給整個(gè)AI安全領(lǐng)域帶來(lái)了新思路。它證明了安全與性能不是非此即彼的選擇題。

就像汽車(chē)安全裝置不是簡(jiǎn)單限速,而是通過(guò)安全帶、氣囊等智能防護(hù),在保障安全的同時(shí)不影響駕駛體驗(yàn)。

隨著AI融入醫(yī)療、駕駛、金融等關(guān)鍵領(lǐng)域,這種“深度安全”理念顯得尤為重要。試想,如果醫(yī)療AI因?yàn)榘踩雷o(hù)而看錯(cuò)CT片子,或者自動(dòng)駕駛AI因過(guò)度防護(hù)而反應(yīng)遲鈍,后果都將不堪設(shè)想。

AI安全進(jìn)化史,就是從“打補(bǔ)丁”到“建免疫系統(tǒng)”的升級(jí)。清華DAVSP技術(shù)的價(jià)值,不僅在于解決了當(dāng)前的多模態(tài)安全難題,更開(kāi)創(chuàng)了“深度對(duì)齊”的安全新范式。



當(dāng)AI不僅能識(shí)別危險(xiǎn),更能理解危險(xiǎn)背后的邏輯,我們才能真正信任這些智能助手。

未來(lái),如果這項(xiàng)技術(shù)推廣到語(yǔ)音、視頻等更多場(chǎng)景,或許能從根本上構(gòu)建AI的安全防線。畢竟,讓機(jī)器真正懂得善惡底線,比單純追求更聰明更重要。



這項(xiàng)研究就像給AI世界裝上了“智慧大腦”,讓技術(shù)在快速發(fā)展的同時(shí),始終走在安全的軌道上。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中國(guó)攔截成功!外媒:顛覆美軍事霸權(quán),導(dǎo)彈還沒(méi)飛近,中國(guó)已攔截

中國(guó)攔截成功!外媒:顛覆美軍事霸權(quán),導(dǎo)彈還沒(méi)飛近,中國(guó)已攔截

趣生活
2026-02-19 21:45:45
報(bào)復(fù)來(lái)了!伊朗超級(jí)導(dǎo)彈登場(chǎng),教以色列做人,鐵穹成了笑話

報(bào)復(fù)來(lái)了!伊朗超級(jí)導(dǎo)彈登場(chǎng),教以色列做人,鐵穹成了笑話

劉森森
2026-03-02 12:46:31
在訪華前結(jié)束戰(zhàn)爭(zhēng)?特朗普表態(tài):行動(dòng)或持續(xù)4周,可能死更多美軍

在訪華前結(jié)束戰(zhàn)爭(zhēng)?特朗普表態(tài):行動(dòng)或持續(xù)4周,可能死更多美軍

李健政觀察
2026-03-02 21:42:41
街頭,伊朗人悲傷地跳了起來(lái)?

街頭,伊朗人悲傷地跳了起來(lái)?

關(guān)爾東
2026-03-01 23:02:58
巴方總統(tǒng)警告中國(guó)!只要中國(guó)敢出手反制,巴拿馬就動(dòng)手,后果自負(fù)

巴方總統(tǒng)警告中國(guó)!只要中國(guó)敢出手反制,巴拿馬就動(dòng)手,后果自負(fù)

混沌錄
2026-03-02 21:30:12
表姑向我借了85000,17年沒(méi)還,我去銀行注銷(xiāo)舊卡時(shí),柜員看了眼卡說(shuō):女士,最后一筆轉(zhuǎn)賬留言您要看嗎?

表姑向我借了85000,17年沒(méi)還,我去銀行注銷(xiāo)舊卡時(shí),柜員看了眼卡說(shuō):女士,最后一筆轉(zhuǎn)賬留言您要看嗎?

LULU生活家
2026-03-02 18:50:24
畜生父親虞天華被執(zhí)行死刑,押赴刑場(chǎng)前高喊:這輩子值了!

畜生父親虞天華被執(zhí)行死刑,押赴刑場(chǎng)前高喊:這輩子值了!

紙鳶奇譚
2024-12-04 21:37:57
巴鐵:多虧了中國(guó)制造!一天報(bào)銷(xiāo)115輛坦克!塔利班舉白旗求饒

巴鐵:多虧了中國(guó)制造!一天報(bào)銷(xiāo)115輛坦克!塔利班舉白旗求饒

他是她的島熊
2026-03-01 11:56:55
2026,買(mǎi)了老小區(qū)的業(yè)主要發(fā)財(cái)了,房齡滿28年以上的老房子有新規(guī)

2026,買(mǎi)了老小區(qū)的業(yè)主要發(fā)財(cái)了,房齡滿28年以上的老房子有新規(guī)

室內(nèi)設(shè)計(jì)師有料兒
2026-03-02 16:35:55
不想打了!護(hù)衛(wèi)艦被擊沉,美軍確認(rèn)傷亡,特朗普:伊朗主動(dòng)找我談

不想打了!護(hù)衛(wèi)艦被擊沉,美軍確認(rèn)傷亡,特朗普:伊朗主動(dòng)找我談

可樂(lè)愛(ài)微笑
2026-03-02 05:57:33
英超太難了!世界冠軍掉隊(duì),歐洲冠軍保級(jí),阿森納只剩一個(gè)豪門(mén)

英超太難了!世界冠軍掉隊(duì),歐洲冠軍保級(jí),阿森納只剩一個(gè)豪門(mén)

嗨皮看球
2026-03-02 15:13:07
中美沖突升級(jí)的下一步,一定是軍事較量,我們要做好全面準(zhǔn)備

中美沖突升級(jí)的下一步,一定是軍事較量,我們要做好全面準(zhǔn)備

曾經(jīng)年少
2025-04-14 16:03:33
外媒放言B-21可自由進(jìn)出中國(guó)隨意轟炸,中國(guó)真能攔住嗎

外媒放言B-21可自由進(jìn)出中國(guó)隨意轟炸,中國(guó)真能攔住嗎

隨夢(mèng)而飛起
2026-02-28 06:02:23
人的基因有多強(qiáng)大?網(wǎng)友:今年剪了個(gè)短發(fā),我爸一看就害怕!

人的基因有多強(qiáng)大?網(wǎng)友:今年剪了個(gè)短發(fā),我爸一看就害怕!

另子維愛(ài)讀史
2026-02-27 21:05:30
美軍承認(rèn),用了新裝備

美軍承認(rèn),用了新裝備

環(huán)球時(shí)報(bào)國(guó)際
2026-03-02 00:08:27
挪動(dòng)一米就鎖死?國(guó)產(chǎn)五軸破局“電子手銬”,讓美日高傲變成廢鐵

挪動(dòng)一米就鎖死?國(guó)產(chǎn)五軸破局“電子手銬”,讓美日高傲變成廢鐵

通鑒史智
2026-02-02 16:14:26
WTT大滿貫落幕!誕生6大贏家和3個(gè)輸家,林詩(shī)棟在其中

WTT大滿貫落幕!誕生6大贏家和3個(gè)輸家,林詩(shī)棟在其中

林子說(shuō)事
2026-03-02 01:31:13
太瘋狂!37+5+3搶斷,喬丹87年3000分神跡40年第一

太瘋狂!37+5+3搶斷,喬丹87年3000分神跡40年第一

布斯基
2026-02-22 00:26:41
受美伊以沖突影響 中國(guó)男籃8月賽程撲朔迷離

受美伊以沖突影響 中國(guó)男籃8月賽程撲朔迷離

體壇周報(bào)
2026-03-02 13:57:38
爆料!助手披露內(nèi)賈德遇襲細(xì)節(jié)

爆料!助手披露內(nèi)賈德遇襲細(xì)節(jié)

環(huán)球時(shí)報(bào)國(guó)際
2026-03-02 19:10:00
2026-03-02 22:28:49
春序娛樂(lè)
春序娛樂(lè)
感恩歷史里的人與事。
4576文章數(shù) 738關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

伊朗公布最新戰(zhàn)況 通報(bào)還披露內(nèi)塔尼亞胡行蹤

頭條要聞

伊朗公布最新戰(zhàn)況 通報(bào)還披露內(nèi)塔尼亞胡行蹤

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂(lè)要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車(chē)要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

家居
健康
房產(chǎn)
藝術(shù)
公開(kāi)課

家居要聞

萬(wàn)物互聯(lián) 享科技福祉

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車(chē)上班嗎?

房產(chǎn)要聞

方案突然曝光!??诒睅煷蟾叫?,又有書(shū)包大盤(pán)殺出!

藝術(shù)要聞

簡(jiǎn)約的風(fēng)景畫(huà),美國(guó)畫(huà)家Ben Bauer作品

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版