新質(zhì)策源導刊丨薛瀾：從“動口”到“動手”：如何為AI智能體劃好安全紅線？

2026-02-26 14:47:12　來源: 中國經(jīng)濟時報

北京舉報

分享至

人類如何與AI智能體共處

編者按

新質(zhì)策源導刊的第二期，我們聚焦AI智能體（AI Agent），不僅僅因為它當下的熱度，更因為我們看到了它對未來的影響。我們深度訪談行業(yè)頂級專家、資深研究人員、國內(nèi)外知名企業(yè)，盡力描繪當下AI時代的真實圖景，展望未來的各種可能性，在不確定性中尋找確定性。

這個領域創(chuàng)新不斷，猶如科幻即將照入現(xiàn)實。我們想知道的不只是近在咫尺的明天會怎樣，更想知道今天我們做的一切，會對不遠的未來產(chǎn)生什么樣的影響，誠邀您和我們一起，探索新AI時代。敬請關(guān)注本期策劃——“人類如何與AI智能體共處”。

——訪清華大學文科資深教授、蘇世民書院院長薛瀾

■中國經(jīng)濟時報記者張一鳴■見習記者姚俊臣

歲末年初，國內(nèi)外多款AI智能體（AI Agent）產(chǎn)品紛紛亮相。從主打內(nèi)容生成的大語言模型，到具備自主決策與執(zhí)行能力的智能體系統(tǒng)，人工智能正加速從虛擬世界走向現(xiàn)實場景，安全發(fā)展的需求隨之迫切。圍繞技術(shù)發(fā)展、風險結(jié)構(gòu)和治理路徑，中國經(jīng)濟時報記者日前專訪了清華大學文科資深教授、蘇世民書院院長薛瀾。

從“動口”到“動手”：AI智能體加速融入現(xiàn)實場景

中國經(jīng)濟時報：近期，國內(nèi)外涌現(xiàn)出很多AI智能體產(chǎn)品，例如OpenClaw，并且迅速爆火，還出現(xiàn)了所謂的“人工智能社區(qū)”。您如何看待這一現(xiàn)象？

薛瀾：過去我們常說，人工智能賦能千行百業(yè)，但真正的“賦能”，必須嵌入現(xiàn)實運行系統(tǒng)。自ChatGPT問世以來，大語言模型的核心能力主要停留在文本與圖像生成，本質(zhì)上仍是對“下一個詞”的概率預測。但近期興起的AI智能體則明顯不同，它不僅能夠生成內(nèi)容，還能夠圍繞目標進行決策和執(zhí)行。從某種意義上說，AI智能體正在從“動口”走向“動手”，不光能夠理解語言符號，還能理解環(huán)境變化，并據(jù)此展開行動。

至于爆火的OpenClaw，雖然有人指出這個所謂的“人工智能社區(qū)”背后完全是真人在操縱，但從目前人工智能的技術(shù)水平和發(fā)展規(guī)律來看，出現(xiàn)AI智能體之間相互討論、辯論甚至協(xié)作的情況，是完全可以預期的。這恰恰反映出人工智能發(fā)展到一定程度后能力的顯著提升和自主性的不斷增強。而這種自主性，也是我們在設計AI智能體的時候就期望它具備的特征。我認為，這是技術(shù)迭代的必然結(jié)果，也是一種讓人喜憂參半的趨勢——我們希望AI智能體“善解人意”，但也害怕AI智能體“自作主張”。

因此，人工智能技術(shù)從虛擬空間走向現(xiàn)實場景，從“動口”轉(zhuǎn)向“動手”，就需要我們更加小心，防止產(chǎn)生新的風險。

從認知偏差到物理傷害：AI智能體更需設置安全護欄

中國經(jīng)濟時報：您提到這個階段需要更加小心，相比于大語言模型，AI智能體在提供方便的同時產(chǎn)生的風險有什么不同？

薛瀾：在大語言模型階段，我們主要需要考慮文本層面的風險，例如算法偏見、AI幻覺等。但是，融入現(xiàn)實場景的AI智能體會造成物理性的傷害，比如醫(yī)療機器人可能操作不慎帶來醫(yī)療事故，家政機器人操作不當引發(fā)火災，等等，這就要求我們在安全機制設計上更加謹慎。

當AI智能體的自主性不斷增強時，我們也要考慮未來的某一天它是不是會出現(xiàn)“不聽話”的情況，甚至反過來指揮人類？已經(jīng)有一些研究發(fā)現(xiàn)，有的人工智能系統(tǒng)具有“自我保護意識”，當面臨被斷電、修改數(shù)據(jù)或替換的時候，會采取策略性回應，甚至以泄露隱私相要挾。雖然這種發(fā)現(xiàn)還停留在實驗室階段，但它表明了一種可能性，那就是高度自主的人工智能系統(tǒng)有可能會在與人類目標不一致時選擇與人類博弈。

中國經(jīng)濟時報：具體而言，您認為當前我們需要關(guān)注哪些風險？

薛瀾：目前主要有三類風險需要關(guān)注。第一類是技術(shù)系統(tǒng)自身的風險，包括系統(tǒng)失控、AI幻覺等問題。例如，在醫(yī)療等高風險場景中，對系統(tǒng)穩(wěn)定性和準確性的要求極高；第二類是技術(shù)惡用和濫用風險，必須防范人工智能被用來干壞事，如被用于制造生物威脅、進行網(wǎng)絡攻擊等；第三類是更為長遠的社會系統(tǒng)風險，AI智能體大規(guī)模融入現(xiàn)實生活，可能對就業(yè)結(jié)構(gòu)、收入分配和社會認知產(chǎn)生深遠影響，需要警惕可能引發(fā)的社會矛盾。

中國經(jīng)濟時報：面對這些風險，我們該如何應對？

薛瀾：任何一項新技術(shù)要在社會中廣泛應用，就必須有一整套社會技術(shù)系統(tǒng)予以保障，包括硬的基礎設施和軟的制度體系。不妨回顧一下汽車的發(fā)展歷史。汽車剛被發(fā)明時，速度不快，影響范圍比較小。隨著技術(shù)不斷改進，汽車的速度提升，對更好的道路產(chǎn)生需求，要求政府投資修建更好的高速公路；行駛距離延長又產(chǎn)生了汽車加油的需求，據(jù)此政府和市場合作逐步建立起加油站網(wǎng)絡；但如果開車的人都是“馬路殺手”，事故頻出也是很危險的。于是，交通法規(guī)、行車駕照考核等制度體系相繼出現(xiàn)。

AI智能體在社會廣泛推廣應用也是如此，我們既要關(guān)注像道路、加油站網(wǎng)絡這樣“硬設施”的建設，也要關(guān)注技術(shù)標準、管理機制這樣“軟設施”的推進，只有當這些配套體系逐步成熟，技術(shù)才能走上安全的發(fā)展道路。

圖片來源/新華社

劃好安全紅線：在“共同無知”中推進敏捷治理

中國經(jīng)濟時報：您一直倡導“敏捷治理”，這一理念對于當前的AI智能體是否具有現(xiàn)實意義？

薛瀾：人工智能技術(shù)發(fā)展具有高度非線性特征，很難通過線性思維推測其未來形態(tài)。我們在企業(yè)調(diào)研時發(fā)現(xiàn)，對于人工智能未來是什么形態(tài)、會出現(xiàn)哪些風險，企業(yè)本身不是很清楚，政府同樣也不清楚。我把這種狀態(tài)稱作“共同無知”。

過去我們談監(jiān)管，常將政府比作貓，違反監(jiān)管的企業(yè)比作老鼠，貓的任務是找老鼠、抓老鼠，而老鼠總想著鉆空子。大家互相防范，產(chǎn)生高度的信息不對稱，很容易陷入更大的風險。而且，雖然我們的治理體系會盡可能在事前有所預判，但預先把技術(shù)應用的所有潛在風險都考慮周全，是非常困難的。

在這種情況下，政府與企業(yè)之間的關(guān)系可能需要發(fā)生變化。這就需要政府和企業(yè)更有效地合作，使我們的治理機制具備一定的動態(tài)適應能力：在技術(shù)應用中發(fā)現(xiàn)問題，在問題出現(xiàn)后迅速響應，通過規(guī)則修訂、標準完善和技術(shù)優(yōu)化加以解決。這種在發(fā)展中不斷優(yōu)化、不斷治理的過程就是“敏捷治理”。

中國經(jīng)濟時報：AI智能體的發(fā)展日新月異，對“敏捷治理”有沒有更高要求？

薛瀾：從宏觀層面看，AI智能體的治理邏輯與大語言模型沒有本質(zhì)差異。但不同之處在于，AI智能體進入現(xiàn)實場景，風險類型更加多元，也對制度配套提出更高要求。好的一點是，我們并不是從零開始，很多領域已經(jīng)逐步建立起完善的法律法規(guī)體系?，F(xiàn)在要解決的問題是，原來的規(guī)制有哪些是合理的可以照用，有哪些不合理的需要調(diào)整。這就要求我們的監(jiān)管部門提前開展研判評估，對現(xiàn)行法律法規(guī)進行系統(tǒng)梳理和動態(tài)調(diào)整。

中國經(jīng)濟時報：對AI智能體，我們是否仍然要堅持“邊發(fā)展邊治理”的思路？

薛瀾：我認為，在現(xiàn)實條件下，這是比較可行的路徑。首先必須劃好不可逾越的紅線——凡是涉及國家安全、生命安全和重大公共利益的領域，監(jiān)管的底線必須清晰。但在基本的紅線確定后，還是要給予技術(shù)充分的探索空間。因為人工智能技術(shù)始終處于不斷發(fā)展、不斷變化的過程中，我們只能是在發(fā)展的過程中，不斷捕捉新問題、解決新問題。“敏捷治理”也是希望盡可能縮短從出現(xiàn)問題到治理響應的時間差。因為技術(shù)發(fā)展的速度一定是比制度變革的速度要快的，在人工智能領域更是這樣。

總監(jiān) 制丨王列軍車海剛

監(jiān) 制丨陳波王彧楊玉洋

主編丨毛晶慧編輯丨蔣帥

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機 / 數(shù)碼

房產(chǎn) / 家居

新質(zhì)策源導刊丨薛瀾：從“動口”到“動手”：如何為AI智能體劃好安全紅線？