国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

筑牢人工智能安全屏障:以創(chuàng)新實(shí)踐賦能大模型健康發(fā)展

0
分享至

近期,開(kāi)源AI智能體OpenClaw引發(fā)的“養(yǎng)龍蝦”熱潮在社交平臺(tái)上迅速傳播,在展示出人工智能潛力的同時(shí),也引發(fā)了業(yè)界對(duì)于大模型安全問(wèn)題的廣泛關(guān)注。隨著大模型能力持續(xù)增強(qiáng),其在復(fù)雜交互中的安全邊界問(wèn)題逐漸顯現(xiàn)。在此背景下,以深知對(duì)話風(fēng)控模型(以下簡(jiǎn)稱“對(duì)話風(fēng)控模型”)為代表的一批創(chuàng)新成果,正以更貼近實(shí)際應(yīng)用的方式回應(yīng)這些挑戰(zhàn)。

大模型浪潮下的安全挑戰(zhàn)

伴隨大模型技術(shù)的快速普及與應(yīng)用,越來(lái)越多的企事業(yè)單位積極投身于大模型私有化部署,以期在智能化浪潮中搶占先機(jī),提升核心競(jìng)爭(zhēng)力。然而,技術(shù)躍遷的背后,由大模型技術(shù)引發(fā)的安全風(fēng)險(xiǎn)問(wèn)題亦日益凸顯。

面對(duì)大模型及相關(guān)應(yīng)用帶來(lái)的新型安全挑戰(zhàn),相關(guān)風(fēng)險(xiǎn)問(wèn)題已在業(yè)內(nèi)引發(fā)廣泛關(guān)注。多方公開(kāi)信息顯示,部分開(kāi)源AI智能體在默認(rèn)或不當(dāng)配置情況下存在較高安全風(fēng)險(xiǎn),容易遭受網(wǎng)絡(luò)攻擊并導(dǎo)致敏感信息泄露。同時(shí),在私有化部署場(chǎng)景中,一些服務(wù)器長(zhǎng)期暴露在公網(wǎng)環(huán)境中,模型本身也可能存在被攻擊的隱患,整體安全狀況仍有待進(jìn)一步完善。從實(shí)際應(yīng)用情況來(lái)看,大模型安全問(wèn)題已不再局限于傳統(tǒng)系統(tǒng)層面的漏洞,而是進(jìn)一步延伸至大模型自身以及大模型應(yīng)用層面的安全,包括提示詞注入、惡意誘導(dǎo)、隱蔽表達(dá)、敏感信息套取等,對(duì)現(xiàn)有安全機(jī)制提出了新的要求。

一種面向?qū)嶋H應(yīng)用的安全實(shí)踐

彩智科技創(chuàng)始人、中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)杰出會(huì)員徐劍軍帶領(lǐng)團(tuán)隊(duì)提出“對(duì)話風(fēng)控模型”,以解決大模型在嚴(yán)肅場(chǎng)景中的“幻覺(jué)”問(wèn)題。他說(shuō):“幻覺(jué)是一個(gè)表面現(xiàn)象,根本原因就是知識(shí)工程和大模型都有各自的邊界?!?/p>


徐劍軍介紹可信知識(shí)模型

據(jù)悉,“對(duì)話風(fēng)控模型”采用組件化插入模式,可與原有基座大模型深度協(xié)同配合,相當(dāng)于在基座大模型、應(yīng)用智能體等大模型應(yīng)用前端,增設(shè)了一道專業(yè)的安全“防火墻”。用戶所有訴求均先經(jīng)過(guò)對(duì)話風(fēng)控模型,由該模型基于自然語(yǔ)言上下文理解,對(duì)潛在風(fēng)險(xiǎn)進(jìn)行快速識(shí)別,并可識(shí)別變體拼寫(xiě)、諧音代稱等隱蔽表達(dá)形式,同時(shí)可針對(duì)風(fēng)險(xiǎn)問(wèn)題提供安全代答服務(wù)。


對(duì)話風(fēng)控模型工作流程示意圖

該對(duì)話風(fēng)控模型主要由風(fēng)險(xiǎn)研判模型和安全代答模型構(gòu)成。其中,風(fēng)險(xiǎn)研判模型負(fù)責(zé)完成對(duì)輸入的風(fēng)險(xiǎn)識(shí)別與分類,實(shí)現(xiàn)風(fēng)險(xiǎn)的主動(dòng)發(fā)現(xiàn)、實(shí)時(shí)預(yù)警。安全代答模型則負(fù)責(zé)對(duì)識(shí)別出的重點(diǎn)關(guān)注類和隱藏條件預(yù)警類問(wèn)題進(jìn)行回應(yīng),按照“事實(shí)澄清-政策引用-正向引導(dǎo)”的三段式原則進(jìn)行回應(yīng),兼顧風(fēng)險(xiǎn)防控與服務(wù)體驗(yàn)。對(duì)于部分存在安全風(fēng)險(xiǎn)的提問(wèn),模型并非簡(jiǎn)單拒答,而是根據(jù)風(fēng)險(xiǎn)研判結(jié)果,靈活觸發(fā)安全代答模式或攔截機(jī)制。當(dāng)啟動(dòng)安全代答模式時(shí),模型將依托權(quán)威文件構(gòu)建的動(dòng)態(tài)更新知識(shí)庫(kù)提供回應(yīng),回復(fù)內(nèi)容均可溯源至官方權(quán)威文件。

共筑AI安全防線,推動(dòng)人工智能行穩(wěn)致遠(yuǎn)

構(gòu)建面向人工智能時(shí)代的安全防護(hù)能力,是當(dāng)前大模型應(yīng)用過(guò)程中需要持續(xù)關(guān)注的重要問(wèn)題之一。

從行業(yè)發(fā)展來(lái)看,對(duì)話風(fēng)控模型所體現(xiàn)的,是一種外部化、低耦合的安全防護(hù)思路。通過(guò)技術(shù)解耦和API服務(wù)方式,研發(fā)團(tuán)隊(duì)可以將更多精力放在模型性能提升和核心業(yè)務(wù)打磨上,減少安全模塊與業(yè)務(wù)邏輯相互牽制帶來(lái)的開(kāi)發(fā)壓力。這種路徑有助于降低大模型研發(fā)與應(yīng)用的綜合成本,也為專用領(lǐng)域大模型的安全落地提供了新的實(shí)踐參考。(作者:徐妍迪)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
快檢查自家陽(yáng)臺(tái)!有人家里已大量出現(xiàn),官方提醒:千萬(wàn)別摸

快檢查自家陽(yáng)臺(tái)!有人家里已大量出現(xiàn),官方提醒:千萬(wàn)別摸

環(huán)球網(wǎng)資訊
2026-04-18 16:23:18
拒爆冷!趙心童四連鞭完勝海菲爾德,衛(wèi)冕冠軍率先闖進(jìn)世錦賽16強(qiáng)

拒爆冷!趙心童四連鞭完勝海菲爾德,衛(wèi)冕冠軍率先闖進(jìn)世錦賽16強(qiáng)

世界體壇觀察家
2026-04-19 05:24:48
庫(kù)里無(wú)緣季后賽遭多方嘲諷!美媒曬無(wú)KD生涯扎心:只是個(gè)投手而已

庫(kù)里無(wú)緣季后賽遭多方嘲諷!美媒曬無(wú)KD生涯扎心:只是個(gè)投手而已

顏小白的籃球夢(mèng)
2026-04-19 06:04:30
跑路,欠下4億貨款,被資本熱捧的“女版劉強(qiáng)東”,怎么徹底涼了

跑路,欠下4億貨款,被資本熱捧的“女版劉強(qiáng)東”,怎么徹底涼了

毒sir財(cái)經(jīng)
2026-04-18 22:18:23
5月1日起全國(guó)嚴(yán)查!開(kāi)車上班、做生意,這些小事別再碰,輕則罰款

5月1日起全國(guó)嚴(yán)查!開(kāi)車上班、做生意,這些小事別再碰,輕則罰款

荷蘭豆愛(ài)健康
2026-04-19 03:44:44
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
成本5億積壓7年,院線都沒(méi)上直接免費(fèi)網(wǎng)播,這電影就是個(gè)笑話!

成本5億積壓7年,院線都沒(méi)上直接免費(fèi)網(wǎng)播,這電影就是個(gè)笑話!

觀察鑒娛
2026-04-18 11:57:49
轟25+13+11又刷四紀(jì)錄!約基奇擊潰森林狼雙塔 美記:無(wú)人能擋

轟25+13+11又刷四紀(jì)錄!約基奇擊潰森林狼雙塔 美記:無(wú)人能擋

顏小白的籃球夢(mèng)
2026-04-19 06:35:35
滾出中國(guó)!云南潑水節(jié)炸出一群“男流氓”,潑女性“臟水”太齷齪

滾出中國(guó)!云南潑水節(jié)炸出一群“男流氓”,潑女性“臟水”太齷齪

奇思妙想草葉君
2026-04-18 02:30:58
在氣質(zhì)面前,年輕真的不值一提。

在氣質(zhì)面前,年輕真的不值一提。

小椰的奶奶
2026-04-19 01:52:39
打不得!日本戰(zhàn)艦闖入臺(tái)海峽,我軍為什么不直接擊沉它?

打不得!日本戰(zhàn)艦闖入臺(tái)海峽,我軍為什么不直接擊沉它?

趣文說(shuō)娛
2026-04-18 19:34:03
曾被譽(yù)為“中國(guó)奇跡”的AI軟件如今為何奄奄一息?現(xiàn)實(shí)無(wú)比尷尬

曾被譽(yù)為“中國(guó)奇跡”的AI軟件如今為何奄奄一息?現(xiàn)實(shí)無(wú)比尷尬

史政先鋒
2026-04-18 13:32:47
“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

胖胖說(shuō)他不胖
2026-04-18 09:00:31
足壇一夜動(dòng)態(tài):切爾西輸曼聯(lián),馬競(jìng)5-6爆冷丟冠,那不勒斯爆大冷

足壇一夜動(dòng)態(tài):切爾西輸曼聯(lián),馬競(jìng)5-6爆冷丟冠,那不勒斯爆大冷

足球狗說(shuō)
2026-04-19 06:10:14
這和土匪有啥區(qū)別!虎跳峽1.9米限高桿火了,自駕交錢才能過(guò)

這和土匪有啥區(qū)別!虎跳峽1.9米限高桿火了,自駕交錢才能過(guò)

哄動(dòng)一時(shí)啊
2026-04-18 19:26:59
“不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

“不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

新華社
2026-04-16 20:38:52
湖南一小車在高速公路跑100碼,突然接到陌生人電話直接嚇哭:你車輪沒(méi)了!

湖南一小車在高速公路跑100碼,突然接到陌生人電話直接嚇哭:你車輪沒(méi)了!

瀟湘晨報(bào)
2026-04-18 17:05:22
徐州姆巴佩?18歲國(guó)青紅星率隊(duì)暴揍蘇超冠軍 替補(bǔ)雙響+炸裂一條龍

徐州姆巴佩?18歲國(guó)青紅星率隊(duì)暴揍蘇超冠軍 替補(bǔ)雙響+炸裂一條龍

我愛(ài)英超
2026-04-18 22:38:17
大數(shù)據(jù)分析,在中國(guó),找個(gè)身高1米7年入20萬(wàn)的老公,到底有多難?

大數(shù)據(jù)分析,在中國(guó),找個(gè)身高1米7年入20萬(wàn)的老公,到底有多難?

深度報(bào)
2026-04-18 23:37:27
教育巨變已擋不???2026屆初中生,難道是僅靠中高考的最后一批?

教育巨變已擋不???2026屆初中生,難道是僅靠中高考的最后一批?

老特有話說(shuō)
2026-04-18 01:00:03
2026-04-19 07:23:00
東方財(cái)經(jīng) incentive-icons
東方財(cái)經(jīng)
眼界決定境界
1338文章數(shù) 3596關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時(shí)隔25年重返英超!沒(méi)有人再嘲笑他了

娛樂(lè)要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

家居
健康
游戲
藝術(shù)
軍事航空

家居要聞

法式線條 時(shí)光靜淌

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

讓老粥批直呼“計(jì)劃有變”的歲獸代理人,到底是什么東西?

藝術(shù)要聞

夜色下的歐洲

軍事要聞

解放軍護(hù)衛(wèi)艦與外艦纏斗20小時(shí) 細(xì)節(jié)披露

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版