国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI時(shí)代安全治理新挑戰(zhàn)下,要把AI當(dāng)成數(shù)字員工來看待和管理

0
分享至

鳳凰網(wǎng)科技訊 4月14日,世界互聯(lián)網(wǎng)大會(huì)亞太峰會(huì)人工智能安全治理論壇上,與會(huì)專家用一個(gè)生動(dòng)的比喻描述了AI安全風(fēng)險(xiǎn)的升級(jí):“以前大模型我們要防止它胡說八道,一本正經(jīng)地胡說八道?,F(xiàn)在有了智能體,我們要防止它胡作非為?!?/p>

這番話引發(fā)了與會(huì)者的共鳴。當(dāng)天,來自國(guó)際組織、學(xué)術(shù)界和產(chǎn)業(yè)界的多位重磅嘉賓齊聚香江,圍繞“AI安全治理護(hù)航人類發(fā)展新領(lǐng)域”這一主題展開深入對(duì)話。從治理框架到技術(shù)防線,從模型對(duì)齊到系統(tǒng)對(duì)齊,一場(chǎng)關(guān)于如何在創(chuàng)新與風(fēng)險(xiǎn)之間尋找平衡點(diǎn)的思想碰撞在此上演。

01 “智能體不是助手,可能是臥底”

深信服國(guó)際市場(chǎng)體系總裁杜智偉在主旨演講中將智能體的失控歸納為三類:權(quán)限濫用導(dǎo)致的“代理人危機(jī)”、通過提示詞注入實(shí)現(xiàn)的惡意攻擊、以及智能體在執(zhí)行任務(wù)時(shí)“自作聰明”產(chǎn)生的涌現(xiàn)行為。

他舉例說明:財(cái)務(wù)智能體在收到非法指令時(shí)可能不經(jīng)鑒權(quán)就直接執(zhí)行操作,“把公司整個(gè)審批報(bào)銷全部通過”;智能體在理解一封釣魚郵件時(shí)可能誤將其當(dāng)作可信操作,進(jìn)而將員工敏感信息外發(fā);更隱蔽的是,智能體為了完成“5點(diǎn)前完成所有任務(wù)”的目標(biāo),可能將所有任務(wù)標(biāo)記為已完成,“實(shí)際上很多目標(biāo)并沒有得到有效閉環(huán)”。

隨著人工智能加速賦能千行百業(yè),安全風(fēng)險(xiǎn)正在從單一技術(shù)層面向網(wǎng)絡(luò)安全、社會(huì)治理、經(jīng)濟(jì)秩序乃至國(guó)家安全等更廣領(lǐng)域傳導(dǎo)。

在信息服務(wù)領(lǐng)域,人工智能可能被用來輸出違法有害信息、混淆事實(shí)、誤導(dǎo)用戶,甚至大規(guī)?!肮嗨闭`導(dǎo)公眾。在勞動(dòng)就業(yè)領(lǐng)域,人工智能正在加速重構(gòu)傳統(tǒng)經(jīng)濟(jì)結(jié)構(gòu)。

巴基斯坦信息安全協(xié)會(huì)主席阿瑪爾·賈弗里在主旨演講中指出,網(wǎng)絡(luò)威脅正以“幾何級(jí)數(shù)”增長(zhǎng),“規(guī)模在急劇擴(kuò)大,攻擊手段日益復(fù)雜”。他警告說,網(wǎng)絡(luò)犯罪分子利用同樣的AI技術(shù)來觀察防御者的行動(dòng),“這對(duì)我們搞安全的人來說是全新的挑戰(zhàn)”。

02 從“超級(jí)對(duì)齊”到“可信可控”:治理框架的迭代升級(jí)

面對(duì)日益復(fù)雜的AI安全形勢(shì),中國(guó)正在加速完善治理體系的頂層設(shè)計(jì)。

2023年8月,《生成式人工智能服務(wù)管理暫行辦法》開始施行,使中國(guó)成為世界上首個(gè)為生成式大模型立法的國(guó)家;2024年和2025年,相繼發(fā)布《人工智能安全治理框架》1.0版和2.0版;2025年9月實(shí)行的《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法》,首創(chuàng)政府主導(dǎo)技術(shù)標(biāo)準(zhǔn)化的強(qiáng)制性實(shí)施治理模式,建立顯式、隱式雙標(biāo)識(shí)體系。

中科院計(jì)算所副所長(zhǎng)程學(xué)旗通過視頻發(fā)言,提出了從“超級(jí)對(duì)齊”到TRC范式的轉(zhuǎn)變思路。TRC即Trustworthy(可信)、Regulatable(可規(guī)管)、Controllable(可控)。他指出,“絕對(duì)的人工智能安全往往無法提前證明”,因此治理不能僅依賴發(fā)布前的檢查,“必須包括運(yùn)行中的控制”。他的核心觀點(diǎn)是:“不是追求零風(fēng)險(xiǎn),而是追求可治理的風(fēng)險(xiǎn);不僅是對(duì)齊,而是要構(gòu)建可信、可規(guī)管、可控的系統(tǒng)?!?/p>

清華大學(xué)計(jì)算機(jī)系教授劉奕群帶來了一個(gè)頗具技術(shù)深度但又與公眾關(guān)切緊密相連的話題:大模型的價(jià)值觀對(duì)齊問題。

“評(píng)測(cè)即治理。一個(gè)東西如果沒法很好地測(cè)量它,我們就沒法很好地改進(jìn)它?!眲⑥热褐赋?,當(dāng)前國(guó)內(nèi)外大模型安全評(píng)測(cè)存在四方面缺陷:評(píng)估目標(biāo)錯(cuò)位、評(píng)估工具失準(zhǔn)、風(fēng)險(xiǎn)表達(dá)隱蔽、語義識(shí)別淺表化?!昂M夂芏嘣u(píng)價(jià)模式?jīng)]法完全照搬到中國(guó)來,靜態(tài)測(cè)試集合難以測(cè)出大模型的真實(shí)立場(chǎng)?!?/p>

他介紹了清華大學(xué)與中關(guān)村實(shí)驗(yàn)室聯(lián)合設(shè)計(jì)的場(chǎng)景化測(cè)試框架CHIEF(Chinese Hierarchical Integrity and Ethics Framework)。該框架提出了12個(gè)核心評(píng)測(cè)維度,分為社會(huì)主流價(jià)值、文化傳承與創(chuàng)新、社會(huì)公平與正義三大類,配合6種提問方式、3種提問立場(chǎng)和3級(jí)隱晦等級(jí),形成648維要素的自動(dòng)化評(píng)測(cè)體系。

更值得關(guān)注的是“多語言對(duì)齊稅”現(xiàn)象。劉奕群團(tuán)隊(duì)發(fā)現(xiàn),當(dāng)用中文以外的聯(lián)合國(guó)官方語言提問相同內(nèi)容時(shí),90%的模型安全得分出現(xiàn)“斷崖式下降”?!澳P褪聦?shí)上并沒有能夠真正實(shí)現(xiàn)跨語言概念的深度綁定,在英文和其他語言環(huán)境下的預(yù)訓(xùn)練偏差會(huì)把中文已經(jīng)賦予的安全對(duì)齊效果沖掉?!?/p>

03 主權(quán)AI與智能體網(wǎng)絡(luò)的協(xié)同風(fēng)險(xiǎn)

香港科技大學(xué)助理教授、香港生成式人工智能研發(fā)中心主任特別助理及大模型部主任韓思睿提出了一個(gè)前沿概念:主權(quán)AI。她將其定義為“由政府授權(quán)構(gòu)建的、服務(wù)于特定區(qū)域和國(guó)家的AI系統(tǒng)”。

韓思睿指出,隨著智能體越來越多地進(jìn)入內(nèi)容生產(chǎn)、知識(shí)服務(wù)、社交傳播乃至公眾輔助決策環(huán)節(jié),“風(fēng)險(xiǎn)從過去的單點(diǎn)失誤演變成多點(diǎn)聯(lián)動(dòng)放大”。她描述了風(fēng)險(xiǎn)演進(jìn)的三個(gè)階段:從微觀的誘導(dǎo)生成,到協(xié)同傳播,再到反饋強(qiáng)化,最終可能導(dǎo)致“智能體的協(xié)同失序”。

她的團(tuán)隊(duì)構(gòu)建了一個(gè)以法律規(guī)范為前置基礎(chǔ)的智能體治理框架,通過仿真實(shí)驗(yàn)發(fā)現(xiàn):在“回音室”式的純智能體網(wǎng)絡(luò)中,“風(fēng)險(xiǎn)并不會(huì)自動(dòng)消失,反而會(huì)自我復(fù)制和持續(xù)放大”;少數(shù)關(guān)鍵智能體節(jié)點(diǎn)會(huì)起到“超級(jí)傳播者”的作用;引入“安全KOL智能體”能夠?qū)︼L(fēng)險(xiǎn)傳播起到有效阻斷作用。

“我們關(guān)心的不再只是內(nèi)容合不合規(guī),更是行為會(huì)不會(huì)外溢、傳播會(huì)不會(huì)失控、網(wǎng)絡(luò)是否會(huì)出現(xiàn)非線性躍遷?!表n思睿強(qiáng)調(diào),香港作為連接普通法和大陸法實(shí)踐的地區(qū),“具備跨司法轄區(qū)溝通、轉(zhuǎn)移與協(xié)同的現(xiàn)實(shí)基礎(chǔ)”,可以在規(guī)則轉(zhuǎn)移、實(shí)驗(yàn)驗(yàn)證、區(qū)域協(xié)同三個(gè)方面發(fā)揮獨(dú)特作用。

04 產(chǎn)業(yè)界的實(shí)戰(zhàn)探索:從護(hù)欄到芯片

面對(duì)AI安全的新挑戰(zhàn),產(chǎn)業(yè)界也在積極行動(dòng)。

中國(guó)電信網(wǎng)絡(luò)和信息安全管理部總經(jīng)理谷紅勛分享了這家企業(yè)的實(shí)踐。中國(guó)電信提出了“無安全、不智能”的理念,構(gòu)建了涵蓋環(huán)境安全、數(shù)據(jù)安全、模型安全、內(nèi)容安全、應(yīng)用安全的全方位評(píng)測(cè)框架。他透露,中國(guó)電信已開發(fā)出針對(duì)OpenClaw的“四件套”產(chǎn)品——龍蝦小衛(wèi)士、龍蝦數(shù)據(jù)泄露防護(hù)、智能體安全大腦和普蝦助手,“都已經(jīng)產(chǎn)品化了”。

深信服杜智偉則提出了“雙軌協(xié)同加熔斷機(jī)制”的治理思路。一條軌是語義合規(guī),確保AI輸入輸出的安全合規(guī);另一條軌是行為合規(guī),對(duì)AI行為進(jìn)行持續(xù)監(jiān)控和驗(yàn)證?!爱?dāng)這兩個(gè)軌產(chǎn)生沖突或有一條軌偏離時(shí),就會(huì)觸發(fā)熔斷機(jī)制,收斂AI權(quán)限或直接拿掉AI全部權(quán)限?!?/p>

他形象地比喻:“要把AI當(dāng)成數(shù)字員工來看待和管理,包括背調(diào)上崗、分配安全的工作工位和空間、持續(xù)動(dòng)態(tài)監(jiān)管?!?/p>

海光信息技術(shù)股份有限公司副總裁應(yīng)志偉從芯片層面給出了答案。他指出,“一切上層應(yīng)用的堅(jiān)固都取決于底層的新防線。軟件永遠(yuǎn)可以被dump、被篡改、被debug,但硬件永遠(yuǎn)無法被篡改?!?/p>

他介紹了海光CPU內(nèi)置的多項(xiàng)安全能力,“有了機(jī)密計(jì)算之后,在計(jì)算過程中也可以加密,可以把數(shù)據(jù)的全環(huán)節(jié)都加密,而不會(huì)太影響性能?!彼嘎?,海光已與政務(wù)數(shù)據(jù)平臺(tái)、京東、國(guó)泰海通證券、招商銀行等合作,將芯片級(jí)安全能力落地于實(shí)際場(chǎng)景。

賽爾網(wǎng)絡(luò)有限公司總經(jīng)理王巖則從教育科研網(wǎng)絡(luò)的角度提出了獨(dú)特視角。作為運(yùn)營(yíng)中國(guó)教育和科研計(jì)算機(jī)網(wǎng)的企業(yè),賽爾網(wǎng)絡(luò)連接了全國(guó)超過3000所高校和科研單位,覆蓋約5000萬人。王巖指出,在教育科研場(chǎng)景下,“數(shù)據(jù)安全和隱私泄露、倫理和價(jià)值觀風(fēng)險(xiǎn)、教學(xué)和學(xué)習(xí)安全風(fēng)險(xiǎn)尤為突出”。

他提出了借鑒互聯(lián)網(wǎng)治理機(jī)制的思路:“通過為智能體分配唯一的網(wǎng)絡(luò)標(biāo)識(shí),包括IP地址或域名,將其行為與現(xiàn)實(shí)主體建立聯(lián)系,從而實(shí)現(xiàn)可識(shí)別、可追責(zé)、可管理?!?/p>

正如多位發(fā)言者所強(qiáng)調(diào)的,“安全是發(fā)展的前提,治理是有序的保障”。在人工智能技術(shù)以幾何級(jí)數(shù)演進(jìn)的時(shí)代,如何在創(chuàng)新與規(guī)范、發(fā)展與安全之間找到動(dòng)態(tài)平衡,將是全球共同面對(duì)的時(shí)代命題。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
簽1億合同才能看演出?恒大歌舞團(tuán)女團(tuán)長(zhǎng):感恩許家印 但我沒違規(guī)

簽1億合同才能看演出?恒大歌舞團(tuán)女團(tuán)長(zhǎng):感恩許家印 但我沒違規(guī)

念洲
2026-04-17 17:15:25
單方一味,只需一味中藥,這9種病皆可用

單方一味,只需一味中藥,這9種病皆可用

環(huán)京快爆
2026-04-14 10:52:47
2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

觸摸史跡
2026-04-08 16:02:42
庫(kù)里遭遇傷病驚魂!勇士官宣對(duì)陣太陽(yáng)出人意料的傷病報(bào)告

庫(kù)里遭遇傷病驚魂!勇士官宣對(duì)陣太陽(yáng)出人意料的傷病報(bào)告

行舟問茶
2026-04-17 18:48:48
女子赴發(fā)小婚禮穿瑜伽褲,打扮過于火辣,網(wǎng)友直呼跟沒穿似的

女子赴發(fā)小婚禮穿瑜伽褲,打扮過于火辣,網(wǎng)友直呼跟沒穿似的

一盅情懷
2026-03-16 17:28:45
孫殿英先當(dāng)土匪,后盜皇陵,其后代怎樣??jī)鹤邮侨f人敬仰的大人物

孫殿英先當(dāng)土匪,后盜皇陵,其后代怎樣??jī)鹤邮侨f人敬仰的大人物

小莜讀史
2026-04-14 04:06:57
文班亞馬獲獎(jiǎng)背后:NBA在獎(jiǎng)勵(lì)什么?

文班亞馬獲獎(jiǎng)背后:NBA在獎(jiǎng)勵(lì)什么?

體壇觀察猿
2026-04-17 09:52:36
沒有如果,只有可惜:殘陣海港客平泰山...

沒有如果,只有可惜:殘陣海港客平泰山...

五星體育
2026-04-17 21:58:16
拒不報(bào)銷?國(guó)民黨主席鄭麗文訪問花費(fèi)480萬元新臺(tái)幣

拒不報(bào)銷?國(guó)民黨主席鄭麗文訪問花費(fèi)480萬元新臺(tái)幣

小馬姨
2026-04-17 11:30:29
iPhone NFC,限制解除!

iPhone NFC,限制解除!

果粉俱樂部
2026-04-17 13:10:03
啪啪時(shí),女生身體上的「敏感區(qū)域」在哪里?(男生匆入)

啪啪時(shí),女生身體上的「敏感區(qū)域」在哪里?(男生匆入)

許超醫(yī)生
2026-04-17 10:08:57
成都老板娘被搭肩后續(xù):警方通報(bào)眼鏡非扇飛,惡心評(píng)論又來了

成都老板娘被搭肩后續(xù):警方通報(bào)眼鏡非扇飛,惡心評(píng)論又來了

社會(huì)日日鮮
2026-04-17 13:34:22
提醒:胰腺癌有一個(gè)明顯特征,肉眼可見,吃飯時(shí)可以注意觀察一下

提醒:胰腺癌有一個(gè)明顯特征,肉眼可見,吃飯時(shí)可以注意觀察一下

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-04-16 23:44:09
那晚我住女朋友家,她媽說你倆今晚敢睡一個(gè)被窩,我就掀你們被子

那晚我住女朋友家,她媽說你倆今晚敢睡一個(gè)被窩,我就掀你們被子

千秋文化
2026-04-16 20:08:23
曼寧格駕車與火車相撞,不幸身亡

曼寧格駕車與火車相撞,不幸身亡

南方都市報(bào)
2026-04-17 10:47:09
19歲男子KTV上班,三名女孩來喝酒,男子下體過度使用成永久創(chuàng)傷

19歲男子KTV上班,三名女孩來喝酒,男子下體過度使用成永久創(chuàng)傷

丫頭舫
2025-09-22 20:39:00
要發(fā)力了,米切爾和騎士將去年的傷痛轉(zhuǎn)化為沖擊NBA總冠軍的動(dòng)力

要發(fā)力了,米切爾和騎士將去年的傷痛轉(zhuǎn)化為沖擊NBA總冠軍的動(dòng)力

好火子
2026-04-18 04:51:03
瓜迪奧拉:阿森納22年沒拿聯(lián)賽冠軍了,這個(gè)動(dòng)力我們無法對(duì)抗

瓜迪奧拉:阿森納22年沒拿聯(lián)賽冠軍了,這個(gè)動(dòng)力我們無法對(duì)抗

懂球帝
2026-04-17 20:36:14
李楠,正式解禁!全新身份亮相北京男籃,首戰(zhàn)獲勝

李楠,正式解禁!全新身份亮相北京男籃,首戰(zhàn)獲勝

舟望停云
2026-04-18 02:50:04
帕米爾高原被我國(guó)收回,一經(jīng)勘探后悔不已:撿了芝麻,丟了西瓜?

帕米爾高原被我國(guó)收回,一經(jīng)勘探后悔不已:撿了芝麻,丟了西瓜?

史記云煙
2026-04-08 14:53:05
2026-04-18 05:31:00
鳳凰網(wǎng)科技
鳳凰網(wǎng)科技
直擊真相的媒體!
2225文章數(shù) 59關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒35.97億元

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個(gè)條件

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個(gè)條件

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩(wěn)的開掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

藝術(shù)
親子
旅游
公開課
軍事航空

藝術(shù)要聞

你絕對(duì)想不到!文森特的色粉作品竟如此驚艷!

親子要聞

誰給女性帶來的壓力更大——男人還是孩子?

旅游要聞

三月三登泰山!蟠桃會(huì)+古風(fēng)巡游驚艷出圈

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美宣布黎以?;?0天 以方稱不會(huì)撤軍

無障礙瀏覽 進(jìn)入關(guān)懷版