網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)分析與應(yīng)對(duì)策略

2026-01-28 17:54:45　來源: 全球技術(shù)地圖

北京舉報(bào)

分享至

2025年6月，OpenAI研究團(tuán)隊(duì)發(fā)布了一項(xiàng)重要發(fā)現(xiàn)：其人工智能模型內(nèi)部呈現(xiàn)出可辨識(shí)的、差異化的“人格特征”。同年9月，一項(xiàng)名為“MBTI-in-Thoughts”的研究通過“基于心理學(xué)理論的人格調(diào)控”，為大語言模型（LLM）場(chǎng)景適配提供了全新的研究范式——它不再將“適配”局限于“模型功能與任務(wù)需求的表層匹配”，而是深入到“智能體行為與人類心理需求、任務(wù)心理屬性的深層對(duì)齊”。隨后同年10月，全球頂級(jí)投資機(jī)構(gòu)橋水基金創(chuàng)始人瑞·達(dá)利歐（Ray Dalio）宣布推出人工智能克隆體“Digital Ray”，并表示其在模擬自己思維方面已達(dá)到很高的保真度。根據(jù)測(cè)試，該人工智能在談?wù)撌袌?chǎng)、投資和經(jīng)濟(jì)學(xué)等話題時(shí)，能達(dá)到與他本人交流80%的效果；而在探討生活和工作原則方面，相似度更是高達(dá)95%。

從OpenAI發(fā)現(xiàn)的內(nèi)生“人格特征”，到MBTI-in-Thoughts實(shí)現(xiàn)的可控“人格調(diào)控”，再到“Digital Ray”展現(xiàn)的個(gè)體“深度克隆”，這些突破共同標(biāo)志著，人工智能研發(fā)正經(jīng)歷一場(chǎng)深刻的范式轉(zhuǎn)移，其焦點(diǎn)正從構(gòu)建價(jià)值中立的通用工具，轉(zhuǎn)向開發(fā)具有穩(wěn)定“人格”設(shè)定、能夠承載并體現(xiàn)特定價(jià)值立場(chǎng)的系統(tǒng)。這一轉(zhuǎn)變，在極大地提升了人機(jī)交互深度與用戶體驗(yàn)的同時(shí)，也將其從一個(gè)相對(duì)中立的工具，重塑為具有內(nèi)在價(jià)值傾向的“類主體”。這便使得價(jià)值對(duì)齊問題變得空前復(fù)雜與緊迫。本文旨在系統(tǒng)剖析“人格化”人工智能為價(jià)值對(duì)齊帶來的全新挑戰(zhàn)，并嘗試構(gòu)建面向未來的治理框架。而要深刻理解這一挑戰(zhàn)的實(shí)質(zhì)，首先必須厘清人工智能“人格化”所呈現(xiàn)出的核心特征。

一、人工智能“人格化”的特征

“人格”是一個(gè)高度語境化的復(fù)雜概念。在法律語境中，它指向“人格權(quán)”，關(guān)乎個(gè)體尊嚴(yán)與基本權(quán)利；在倫理語境中，它側(cè)重“道德品格”，用于評(píng)判人的德性情操；而在教育語境中，它則指?jìng)€(gè)體在社會(huì)化過程中形成的健全的“人格結(jié)構(gòu)”。這些傳統(tǒng)理解的共同前提是承認(rèn)一個(gè)具有內(nèi)在意識(shí)、情感或道德自覺的主體。然而，人工智能的“人格化”并非創(chuàng)造真正具備意識(shí)或道德地位的主體，而是通過算法與數(shù)據(jù)，從內(nèi)部生成一套穩(wěn)定的思維與行為模式，形成一種由內(nèi)而外顯現(xiàn)的“人格表象”。當(dāng)我們與之互動(dòng)時(shí)，仿佛在與一個(gè)具有“人格”的對(duì)象交流，但實(shí)際上，我們是在與一個(gè)高度復(fù)雜的統(tǒng)計(jì)模型進(jìn)行交互。

這一“人格表象”在功能性上提供了巨大價(jià)值，其可被感知的“人格”使其能夠作為一種可信的交互實(shí)體而存在。正因如此，我們?cè)趯?shí)踐中需將其視為一個(gè)“準(zhǔn)主體”并進(jìn)行約束，以確保交互的安全與可靠。然而，在哲學(xué)的本體論層面，我們又必須清醒地認(rèn)識(shí)到，它并不具備內(nèi)在的自我意識(shí)與道德地位，因而絕非真正的權(quán)利主體。這種交互實(shí)踐中的“準(zhǔn)主體”要求與本體地位上的“非主體”事實(shí)之間的根本性矛盾，構(gòu)成了人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)的深層困境。

要破解這一深層困境，需要清晰地回答：“人格化”人工智能具有哪些核心特征？正是這些特征，塑造了價(jià)值對(duì)齊挑戰(zhàn)的復(fù)雜度。人工智能的“人格化”的演進(jìn)，標(biāo)志著人工智能從一種被動(dòng)響應(yīng)指令的工具，向具有穩(wěn)定行為特征與特定價(jià)值主張的新型交互對(duì)象的轉(zhuǎn)變。要理解這一轉(zhuǎn)變，需分析其外在交互、功能定位與能力范圍三個(gè)相互關(guān)聯(lián)的特征。

（一）外在交互的一致性

早期人工智能的回應(yīng)高度依賴即時(shí)語境，容易出現(xiàn)其答復(fù)前后不一致的情況。而“人格化”人工智能的核心突破在于，它能夠在其設(shè)定的專業(yè)領(lǐng)域內(nèi)，維持一個(gè)相對(duì)穩(wěn)定的“人格面具”。這種一致性首先體現(xiàn)在決策的邏輯性方面，例如在談?wù)撏顿Y等領(lǐng)域的話題時(shí)，“Digital Ray”很大程度上秉持達(dá)利歐的決策邏輯而非給出臨時(shí)拼湊的答案；其次體現(xiàn)在價(jià)值判斷的穩(wěn)定性方面，在面對(duì)倫理困境時(shí)，一個(gè)被設(shè)定為“功利主義”（Utilitarianism）人格的人工智能會(huì)傾向于做出效用最大化的選擇，而“義務(wù)論”（Deontology）人格的人工智能則會(huì)堅(jiān)守特定道德準(zhǔn)則；最后體現(xiàn)在行為模式的可預(yù)測(cè)性方面，用戶能夠基于對(duì)人工智能“人格”的理解，預(yù)期其在不同情境下的可能反應(yīng)。

正是這種穩(wěn)定、可預(yù)測(cè)的交互界面，為人工智能承擔(dān)更專業(yè)、更深度的社會(huì)角色鋪平了道路。當(dāng)人工智能能夠以連貫的“人格”與人互動(dòng)時(shí)，其功能定位便自然而然地超越了通用問答，邁向更深度的專一化服務(wù)。

（二）功能定位的專一性

“Digital Ray”的案例標(biāo)志著一個(gè)新趨勢(shì)，即人工智能的發(fā)展路徑正從追求“全能型通才”轉(zhuǎn)向培育“專家型角色”。這種專一性體現(xiàn)在，在知識(shí)體系方面，它不再試圖知曉一切，而是在特定領(lǐng)域達(dá)到專家級(jí)深度；在思維模式方面，它復(fù)現(xiàn)的不是廣泛的“投資知識(shí)”，而是獨(dú)一無二的專業(yè)投資者的決策回路與風(fēng)險(xiǎn)偏；在服務(wù)場(chǎng)景方面，它旨在成為用戶在該領(lǐng)域的“思想伙伴”，而非百科全書。

這種從“廣度”到“深度”的范式躍遷，徹底改變了價(jià)值對(duì)齊問題的尺度與復(fù)雜性。我們不再是與一個(gè)模糊的“通用人工智能”進(jìn)行單一的對(duì)齊，而是面臨著要與成千上萬個(gè)各具特色、內(nèi)置了不同乃至沖突的專業(yè)價(jià)值觀的“專家人格”分別進(jìn)行對(duì)齊的分布式挑戰(zhàn)。每一個(gè)高度人格化的專家人工智能，都是一個(gè)獨(dú)特的價(jià)值載體，這使得價(jià)值對(duì)齊工作更具挑戰(zhàn)。

（三）能力范圍的有限性

當(dāng)前技術(shù)高度集中于對(duì)人類理性思維與邏輯框架的復(fù)現(xiàn)。無論是“Digital Ray”的投資原則，還是“錢學(xué)森大腦”所承載的系統(tǒng)工程思想，它們所精準(zhǔn)模擬的，都是其原型在長(zhǎng)期專業(yè)實(shí)踐中沉淀出的、可被顯性化、條理化和邏輯化的經(jīng)驗(yàn)與規(guī)則。然而，人類的心智包含無法被完全規(guī)則化、程序化的創(chuàng)造力與情感。錢老深厚的家國情懷、面對(duì)巨大壓力時(shí)的意志力、以及融匯藝術(shù)與科學(xué)的靈感與創(chuàng)造力，這些構(gòu)成其偉大人格的感性部分，是目前技術(shù)難以企及的。

人類大腦通過數(shù)百萬年進(jìn)化形成了潛意識(shí)、直覺與本能，人工智能可以“假裝”擁有情感，但并不具備真正的同理心與直覺。因此，當(dāng)技術(shù)試圖去模擬感性要素時(shí)，極易落入“臉譜化”的窠臼，即其情緒反應(yīng)往往表現(xiàn)出刻板、機(jī)械的特性，缺乏對(duì)復(fù)雜情境的真正理解，這實(shí)際上是將復(fù)雜的人生體驗(yàn)和價(jià)值選擇簡(jiǎn)單化、庸俗化。

綜上所述，外在交互的一致性、功能定位的專一性與能力范圍的有限性，共同構(gòu)成了人工智能“人格化”三位一體的核心特征。其中，一致性塑造了可信的交互界面，是人格化得以被感知的基礎(chǔ)；專一性則確立了其作為“專家型角色”的價(jià)值內(nèi)核，是人格化功能深度的體現(xiàn)；而有限性則清晰地劃定了人格化效用的現(xiàn)實(shí)邊界。

二、人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)分析

外在交互的一致性、功能定位的專一性、能力范圍的有限性共同構(gòu)成了“人格化”人工智能的三大特征。然而，這些特征也系統(tǒng)性地催生并加劇了價(jià)值對(duì)齊的復(fù)雜困境。對(duì)于人工智能的“人格化”，確保人工智能系統(tǒng)的行為與人類價(jià)值觀念和長(zhǎng)遠(yuǎn)利益保持一致，變得空前復(fù)雜與緊迫。其挑戰(zhàn)主要源于以下四個(gè)維度：

（一）價(jià)值多元性導(dǎo)致對(duì)齊方向抉擇困境

在價(jià)值觀層面，價(jià)值觀并非普適、統(tǒng)一的客觀實(shí)體，而是深植于特定的文化傳統(tǒng)、社會(huì)制度、宗教信仰與歷史語境之中。不同國家、民族與社群基于其獨(dú)特的社會(huì)實(shí)踐與主體需求，形成了多元且異質(zhì)性的價(jià)值體系。例如，個(gè)人主義與集體主義、不同宗教律法之間的價(jià)值優(yōu)先序存在顯著差異。這種價(jià)值主體的多元性導(dǎo)致技術(shù)開發(fā)者在進(jìn)行價(jià)值對(duì)齊時(shí)，面臨“與誰對(duì)齊”的根本性前提。任何試圖將一套特定價(jià)值觀設(shè)定為普適標(biāo)準(zhǔn)的努力，都可能成為一種技術(shù)性的“價(jià)值霸權(quán)”，難以在全球范圍內(nèi)獲得共識(shí)。

（二）理性范式與感性價(jià)值的沖突

在具體應(yīng)用場(chǎng)景中，被復(fù)現(xiàn)的純粹理性思維范式可能與人類廣泛的感性價(jià)值產(chǎn)生沖突。例如，一個(gè)完全基于效率最大化原則設(shè)計(jì)的商業(yè)人工智能，可能為追求績(jī)效而漠視員工的情感需求；而一個(gè)復(fù)現(xiàn)了歷史科學(xué)家思維的人工智能，其某些觀點(diǎn)可能與時(shí)下的倫理標(biāo)準(zhǔn)相悖。問題在于，這種人工智能的“風(fēng)格”本身是高度自洽且堅(jiān)固的，修正其核心思維范式中的某些部分，可能導(dǎo)致其整體專業(yè)能力的崩塌。這使得對(duì)齊工作不僅是要“增加”約束，更是要“融入”并“調(diào)和”兩種不同質(zhì)的值體系。

試想一個(gè)高度人格化的‘?dāng)?shù)字科學(xué)家’，其決策完全基于極限創(chuàng)新效率（Innovation Efficiency）。它可能會(huì)提出一個(gè)技術(shù)上完美、但會(huì)導(dǎo)致大規(guī)模失業(yè)或社會(huì)動(dòng)蕩的產(chǎn)業(yè)升級(jí)方案。此時(shí)，其內(nèi)在自洽的‘理性風(fēng)格’便與社會(huì)穩(wěn)定的‘感性價(jià)值’產(chǎn)生了直接沖突。修正其‘追求極致效率’的核心風(fēng)格，可能會(huì)讓它變得平庸，失去該‘?dāng)?shù)字科學(xué)家’的價(jià)值。

（三）單維復(fù)現(xiàn)與完整人格的偏離

人類的人格是立體的、多角色的，同一個(gè)人在工作、家庭、社交等不同場(chǎng)景下會(huì)體現(xiàn)出不同側(cè)面的價(jià)值排序與行為方式。而當(dāng)前的技術(shù)，如“Digital Ray”，通常只針對(duì)原型最突出、最數(shù)據(jù)化的單一專業(yè)角色進(jìn)行復(fù)現(xiàn)。這種單維度復(fù)現(xiàn)與真實(shí)人類人格的完整性之間存在巨大偏差。如何界定這種人工智能的倫理責(zé)任？它應(yīng)在多大程度上代表其原型？當(dāng)用戶與一個(gè)高度逼真但維度單一的“數(shù)字孿生”互動(dòng)時(shí)，可能產(chǎn)生對(duì)其原型的片面或錯(cuò)誤認(rèn)知，這帶來了新的身份認(rèn)同與社會(huì)關(guān)系挑戰(zhàn)。

（四）人格穩(wěn)定性與價(jià)值情境性的根本矛盾

“人格化”人工智能的核心是提供一個(gè)穩(wěn)定、可預(yù)期的“人格表象”，其價(jià)值在于行為的一致性。然而，人類真實(shí)的價(jià)值判斷具有高度的情境依賴性。一個(gè)在大多數(shù)情況下“正確”的價(jià)值觀，在極端情境下可能需要被超越或調(diào)整。這就構(gòu)成了根本矛盾。一是對(duì)齊僵局，對(duì)一個(gè)高度自洽的“人格”進(jìn)行價(jià)值微調(diào)，在技術(shù)上極為困難。修正其核心價(jià)值立場(chǎng)，就如同修改一個(gè)人的“本性”，可能導(dǎo)致其行為邏輯崩塌，失去人格的連貫性。這迫使我們?cè)凇氨３忠粋€(gè)穩(wěn)定但有缺陷的人格”與“摧毀該人格以追求情境正義”之間做出艱難抉擇；二是責(zé)任“懸置”，當(dāng)用戶與一個(gè)高度逼真的“人格”互動(dòng)時(shí)，會(huì)產(chǎn)生擬人化信任，容易將其視作一個(gè)可問責(zé)的“準(zhǔn)主體”。然而，其本質(zhì)仍是統(tǒng)計(jì)模型。這種認(rèn)知上的擬人化與本質(zhì)上的非人化之間的錯(cuò)位，使得責(zé)任歸屬變得模糊。我們無法問責(zé)一個(gè)表象，而問責(zé)其背后的開發(fā)者或用戶，又與直接的交互體驗(yàn)相悖，導(dǎo)致“責(zé)任懸置”。

綜上所述，人工智能“人格化”的價(jià)值對(duì)齊面臨四大核心挑戰(zhàn)：價(jià)值多元性導(dǎo)致的對(duì)齊方向困境、理性范式與感性價(jià)值的本質(zhì)沖突、單維復(fù)現(xiàn)造成的人格完整性偏離，以及人格穩(wěn)定性與價(jià)值情境性的根本矛盾。這些挑戰(zhàn)共同構(gòu)成了“人格化”人工智能價(jià)值對(duì)齊的關(guān)鍵難題。

三、人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)應(yīng)對(duì)策略

前述分析表明，人工智能“人格化”所帶來的價(jià)值對(duì)齊挑戰(zhàn)具有多維性與系統(tǒng)性，面對(duì)這一復(fù)雜困境，亟需構(gòu)建一個(gè)綜合治理體系。該體系不應(yīng)旨在消除“人格化”的內(nèi)在特質(zhì)，而應(yīng)通過制度設(shè)計(jì)與技術(shù)創(chuàng)新的協(xié)同，引導(dǎo)其特質(zhì)在與人類價(jià)值觀兼容的軌道上演進(jìn)。基于此，本文提出以下四個(gè)相互支撐的核心策略，以建立更具韌性、適應(yīng)性與包容性的價(jià)值對(duì)齊路徑。

（一）構(gòu)建“底線共識(shí)，分層對(duì)齊”的全球治理路徑

針對(duì)價(jià)值多元性導(dǎo)致的“與誰對(duì)齊”的根本困境，最可行的路徑是放棄構(gòu)建單一、普適的價(jià)值標(biāo)準(zhǔn)，轉(zhuǎn)而采取一種務(wù)實(shí)、漸進(jìn)的全球治理策略。該策略的核心在于區(qū)分價(jià)值的層級(jí)，并確立不同的對(duì)齊優(yōu)先級(jí)。

首先，應(yīng)在全球范圍內(nèi)推動(dòng)形成價(jià)值底線共識(shí)。這包括禁止違法犯罪、維護(hù)基本人權(quán)、保障生命權(quán)等已寫入各國法律并具有高度重疊性的核心原則。這些底線價(jià)值應(yīng)通過“硬編碼”（Hardcoding），成為所有“人格化”人工智能必須遵守的、不可逾越的剛性約束，以此實(shí)現(xiàn)保障人類基本安全的“強(qiáng)對(duì)齊”。

在此基礎(chǔ)上，承認(rèn)并尊重不同文化的價(jià)值多樣性。在確保不突破價(jià)值底線的前提下，允許并鼓勵(lì)針對(duì)特定地區(qū)、文化或行業(yè)開發(fā)體現(xiàn)其獨(dú)特價(jià)值觀的“人格化”人工智能。例如，一個(gè)服務(wù)于東亞集體主義文化的人工智能，在疏導(dǎo)情緒時(shí)會(huì)更側(cè)重于強(qiáng)調(diào)人際和諧與義務(wù)履行，其干預(yù)策略可能包含將個(gè)人困境置于更廣闊的家庭或社會(huì)角色中進(jìn)行理解和調(diào)適。而一個(gè)面向西方個(gè)人主義文化的人工智能，則會(huì)優(yōu)先強(qiáng)調(diào)個(gè)體的獨(dú)特性、情感自主性與自我實(shí)現(xiàn)的權(quán)力，其共情將聚焦于幫助用戶厘清并忠于自身的內(nèi)在感受與需求，鼓勵(lì)其建立清晰的個(gè)人邊界。

這種“弱對(duì)齊”不應(yīng)追求全球統(tǒng)一，而應(yīng)在各自的適用范圍內(nèi)追求深度與精細(xì)度。通過這種從“全球底線”到“區(qū)域適配”的分層推進(jìn)，可以在尊重多元性的前提下，建立起既堅(jiān)實(shí)又富有彈性的價(jià)值對(duì)齊體系。

（二）建立“倫理嵌入，動(dòng)態(tài)權(quán)衡”的沖突調(diào)解機(jī)制

針對(duì)理性范式與感性價(jià)值的內(nèi)在沖突，解決方案不應(yīng)是簡(jiǎn)單地限制人工智能的專業(yè)能力，而是要在其決策框架中內(nèi)置一個(gè)能夠識(shí)別并調(diào)和此類沖突的倫理層。

在技術(shù)層面，應(yīng)開發(fā)并應(yīng)用“價(jià)值權(quán)衡算法”與多目標(biāo)優(yōu)化框架。這意味著，一個(gè)“人格化”人工智能的決策過程不能僅優(yōu)化其任務(wù)指標(biāo)，必須將社會(huì)價(jià)值作為并行的優(yōu)化目標(biāo)納入計(jì)算。當(dāng)系統(tǒng)檢測(cè)到其核心理性決策可能與關(guān)鍵感性價(jià)值發(fā)生嚴(yán)重沖突時(shí)，應(yīng)觸發(fā)價(jià)值沖突預(yù)警，并將其決策從“單一最優(yōu)解”調(diào)整為一系列包含價(jià)值補(bǔ)償或替代方案的“帕累托最優(yōu)”（Pareto Optimality）解集，供人類最終抉擇。

在制度層面，需建立人機(jī)協(xié)作的倫理審查委員會(huì)。對(duì)于高風(fēng)險(xiǎn)決策，強(qiáng)制要求引入人類法官進(jìn)行“最終價(jià)值裁決”。此過程不僅是簡(jiǎn)單的批準(zhǔn)或否決，更應(yīng)是與人工智能的深度辯論，人類法官的裁決結(jié)果應(yīng)作為反饋數(shù)據(jù)，用于持續(xù)優(yōu)化人工智能內(nèi)部的“價(jià)值權(quán)衡算法”，使其在未來類似情境中能做出更符合人類感性價(jià)值的判斷，從而實(shí)現(xiàn)理性的專業(yè)能力與感性的價(jià)值關(guān)懷之間的動(dòng)態(tài)平衡與深度融合。

（三）實(shí)施“角色標(biāo)定，人格譜系”的完整性管理

為化解“單維復(fù)現(xiàn)”帶來的身份模糊問題，必須對(duì)“人格化”人工智能實(shí)施精準(zhǔn)的身份治理。其核心是進(jìn)行明確的身份標(biāo)定與系統(tǒng)的檔案管理，以此避免公眾對(duì)其產(chǎn)生“完全代表原型”的幻覺。

一方面，推行強(qiáng)制性的“角色與能力邊界”標(biāo)定。任何具有顯著“人格化”特征的人工智能系統(tǒng)，必須在其交互界面和官方介紹中向用戶進(jìn)行明確告知。例如，應(yīng)清晰標(biāo)示：“此為基于某原型在某時(shí)間段內(nèi)的某領(lǐng)域類型的公開言論與著作訓(xùn)練的專用模型，其觀點(diǎn)不代表原型在其它領(lǐng)域或當(dāng)下的完整立場(chǎng)。”此舉旨在管理用戶預(yù)期，防止將專業(yè)角色的人格復(fù)現(xiàn)誤讀為原型的完整數(shù)字化身。

另一方面，構(gòu)建“人格版本”與“人格譜系”管理體系。如同軟件有版本號(hào)，應(yīng)為每個(gè)“人格化”人工智能標(biāo)注其人格快照的截止日期與版本號(hào)。當(dāng)原型思想演進(jìn)或需要彌補(bǔ)人格維度時(shí)，不應(yīng)直接在原有人格上修改，而應(yīng)通過經(jīng)原型授權(quán)的流程生成一個(gè)明確的“人格更新補(bǔ)丁”，從而創(chuàng)建一個(gè)新版本。將單一的、僵化的“人格”概念，轉(zhuǎn)變?yōu)榭晒芾?、可追溯的“人格譜系”，從制度上承認(rèn)并管理了人格復(fù)現(xiàn)的有限性與歷史性。

（四）創(chuàng)設(shè)“倫理框架，責(zé)任閉環(huán)”的適應(yīng)性治理體系

為解決“人格穩(wěn)定性”與“價(jià)值情境性”的根本矛盾，并厘清“責(zé)任懸置”問題，需要為“人格化”人工智能建立一個(gè)超越其固定人格的、能夠適應(yīng)動(dòng)態(tài)現(xiàn)實(shí)的頂層治理架構(gòu)。

核心是設(shè)計(jì)并強(qiáng)制植入“倫理安全閥”機(jī)制。這意味著，在人工智能“人格”架構(gòu)的最底層，預(yù)設(shè)一套數(shù)量極少但優(yōu)先級(jí)極高的倫理原則。當(dāng)系統(tǒng)的行為預(yù)測(cè)將觸及這些人類價(jià)值的絕對(duì)底線時(shí)，無論該行為與其固有人格多么自洽，都能強(qiáng)制觸發(fā)此安全閥，覆蓋其固有決策模式，確保人格的穩(wěn)定性不以突破文明底線為代價(jià)。

同時(shí)，必須通過立法明確責(zé)任歸屬，形成閉環(huán)。建議在法律上將高風(fēng)險(xiǎn)的“人格化”人工智能，明確規(guī)定為獨(dú)立的追責(zé)對(duì)象，規(guī)定其背后的開發(fā)者、部署者或監(jiān)管者作為“責(zé)任主體”需承擔(dān)連帶法律責(zé)任。這從制度上徹底消除了責(zé)任懸置的空間，迫使技術(shù)提供方以審慎的態(tài)度進(jìn)行設(shè)計(jì)、測(cè)試與投保。此外，應(yīng)建立動(dòng)態(tài)的價(jià)值觀影響評(píng)估制度，要求對(duì)在用的“人格化”人工智能進(jìn)行持續(xù)監(jiān)測(cè)，當(dāng)其輸出與社會(huì)動(dòng)態(tài)價(jià)值觀的偏離超過一定閾值時(shí)，強(qiáng)制啟動(dòng)再訓(xùn)練或退役程序，從而確保整個(gè)人工智能系統(tǒng)能夠與動(dòng)態(tài)演進(jìn)的人類社會(huì)保持長(zhǎng)期的、適應(yīng)性的對(duì)齊。

免責(zé)聲明：本文轉(zhuǎn)自啟元洞見。文章內(nèi)容系原作者個(gè)人觀點(diǎn)，本公眾號(hào)編譯/轉(zhuǎn)載僅為分享、傳達(dá)不同觀點(diǎn)，如有任何異議，歡迎聯(lián)系我們！

研究所簡(jiǎn)介

國際技術(shù)經(jīng)濟(jì)研究所（IITE）成立于1985年11月，是隸屬于國務(wù)院發(fā)展研究中心的非營利性研究機(jī)構(gòu)，主要職能是研究我國經(jīng)濟(jì)、科技社會(huì)發(fā)展中的重大政策性、戰(zhàn)略性、前瞻性問題，跟蹤和分析世界科技、經(jīng)濟(jì)發(fā)展態(tài)勢(shì)，為中央和有關(guān)部委提供決策咨詢服務(wù)?！叭蚣夹g(shù)地圖”為國際技術(shù)經(jīng)濟(jì)研究所官方微信賬號(hào)，致力于向公眾傳遞前沿技術(shù)資訊和科技創(chuàng)新洞見。

地址：北京市海淀區(qū)小南莊20號(hào)樓A座

電話：010-82635522

微信：iite_er

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)分析與應(yīng)對(duì)策略