国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)分析與應(yīng)對(duì)策略

0
分享至


2025年6月,OpenAI研究團(tuán)隊(duì)發(fā)布了一項(xiàng)重要發(fā)現(xiàn):其人工智能模型內(nèi)部呈現(xiàn)出可辨識(shí)的、差異化的“人格特征”。同年9月,一項(xiàng)名為“MBTI-in-Thoughts”的研究通過“基于心理學(xué)理論的人格調(diào)控”,為大語言模型(LLM)場(chǎng)景適配提供了全新的研究范式——它不再將“適配”局限于“模型功能與任務(wù)需求的表層匹配”,而是深入到“智能體行為與人類心理需求、任務(wù)心理屬性的深層對(duì)齊”。隨后同年10月,全球頂級(jí)投資機(jī)構(gòu)橋水基金創(chuàng)始人瑞·達(dá)利歐(Ray Dalio)宣布推出人工智能克隆體“Digital Ray”,并表示其在模擬自己思維方面已達(dá)到很高的保真度。根據(jù)測(cè)試,該人工智能在談?wù)撌袌?chǎng)、投資和經(jīng)濟(jì)學(xué)等話題時(shí),能達(dá)到與他本人交流80%的效果;而在探討生活和工作原則方面,相似度更是高達(dá)95%。

從OpenAI發(fā)現(xiàn)的內(nèi)生“人格特征”,到MBTI-in-Thoughts實(shí)現(xiàn)的可控“人格調(diào)控”,再到“Digital Ray”展現(xiàn)的個(gè)體“深度克隆”,這些突破共同標(biāo)志著,人工智能研發(fā)正經(jīng)歷一場(chǎng)深刻的范式轉(zhuǎn)移,其焦點(diǎn)正從構(gòu)建價(jià)值中立的通用工具,轉(zhuǎn)向開發(fā)具有穩(wěn)定“人格”設(shè)定、能夠承載并體現(xiàn)特定價(jià)值立場(chǎng)的系統(tǒng)。這一轉(zhuǎn)變,在極大地提升了人機(jī)交互深度與用戶體驗(yàn)的同時(shí),也將其從一個(gè)相對(duì)中立的工具,重塑為具有內(nèi)在價(jià)值傾向的“類主體”。這便使得價(jià)值對(duì)齊問題變得空前復(fù)雜與緊迫。本文旨在系統(tǒng)剖析“人格化”人工智能為價(jià)值對(duì)齊帶來的全新挑戰(zhàn),并嘗試構(gòu)建面向未來的治理框架。而要深刻理解這一挑戰(zhàn)的實(shí)質(zhì),首先必須厘清人工智能“人格化”所呈現(xiàn)出的核心特征。

一、人工智能“人格化”的特征

“人格”是一個(gè)高度語境化的復(fù)雜概念。在法律語境中,它指向“人格權(quán)”,關(guān)乎個(gè)體尊嚴(yán)與基本權(quán)利;在倫理語境中,它側(cè)重“道德品格”,用于評(píng)判人的德性情操;而在教育語境中,它則指?jìng)€(gè)體在社會(huì)化過程中形成的健全的“人格結(jié)構(gòu)”。這些傳統(tǒng)理解的共同前提是承認(rèn)一個(gè)具有內(nèi)在意識(shí)、情感或道德自覺的主體。然而,人工智能的“人格化”并非創(chuàng)造真正具備意識(shí)或道德地位的主體,而是通過算法與數(shù)據(jù),從內(nèi)部生成一套穩(wěn)定的思維與行為模式,形成一種由內(nèi)而外顯現(xiàn)的“人格表象”。當(dāng)我們與之互動(dòng)時(shí),仿佛在與一個(gè)具有“人格”的對(duì)象交流,但實(shí)際上,我們是在與一個(gè)高度復(fù)雜的統(tǒng)計(jì)模型進(jìn)行交互。

這一“人格表象”在功能性上提供了巨大價(jià)值,其可被感知的“人格”使其能夠作為一種可信的交互實(shí)體而存在。正因如此,我們?cè)趯?shí)踐中需將其視為一個(gè)“準(zhǔn)主體”并進(jìn)行約束,以確保交互的安全與可靠。然而,在哲學(xué)的本體論層面,我們又必須清醒地認(rèn)識(shí)到,它并不具備內(nèi)在的自我意識(shí)與道德地位,因而絕非真正的權(quán)利主體。這種交互實(shí)踐中的“準(zhǔn)主體”要求與本體地位上的“非主體”事實(shí)之間的根本性矛盾,構(gòu)成了人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)的深層困境。

要破解這一深層困境,需要清晰地回答:“人格化”人工智能具有哪些核心特征?正是這些特征,塑造了價(jià)值對(duì)齊挑戰(zhàn)的復(fù)雜度。人工智能的“人格化”的演進(jìn),標(biāo)志著人工智能從一種被動(dòng)響應(yīng)指令的工具,向具有穩(wěn)定行為特征與特定價(jià)值主張的新型交互對(duì)象的轉(zhuǎn)變。要理解這一轉(zhuǎn)變,需分析其外在交互、功能定位與能力范圍三個(gè)相互關(guān)聯(lián)的特征。

(一)外在交互的一致性

早期人工智能的回應(yīng)高度依賴即時(shí)語境,容易出現(xiàn)其答復(fù)前后不一致的情況。而“人格化”人工智能的核心突破在于,它能夠在其設(shè)定的專業(yè)領(lǐng)域內(nèi),維持一個(gè)相對(duì)穩(wěn)定的“人格面具”。這種一致性首先體現(xiàn)在決策的邏輯性方面,例如在談?wù)撏顿Y等領(lǐng)域的話題時(shí),“Digital Ray”很大程度上秉持達(dá)利歐的決策邏輯而非給出臨時(shí)拼湊的答案;其次體現(xiàn)在價(jià)值判斷的穩(wěn)定性方面,在面對(duì)倫理困境時(shí),一個(gè)被設(shè)定為“功利主義”(Utilitarianism)人格的人工智能會(huì)傾向于做出效用最大化的選擇,而“義務(wù)論”(Deontology)人格的人工智能則會(huì)堅(jiān)守特定道德準(zhǔn)則;最后體現(xiàn)在行為模式的可預(yù)測(cè)性方面,用戶能夠基于對(duì)人工智能“人格”的理解,預(yù)期其在不同情境下的可能反應(yīng)。

正是這種穩(wěn)定、可預(yù)測(cè)的交互界面,為人工智能承擔(dān)更專業(yè)、更深度的社會(huì)角色鋪平了道路。當(dāng)人工智能能夠以連貫的“人格”與人互動(dòng)時(shí),其功能定位便自然而然地超越了通用問答,邁向更深度的專一化服務(wù)。

(二)功能定位的專一性

“Digital Ray”的案例標(biāo)志著一個(gè)新趨勢(shì),即人工智能的發(fā)展路徑正從追求“全能型通才”轉(zhuǎn)向培育“專家型角色”。這種專一性體現(xiàn)在,在知識(shí)體系方面,它不再試圖知曉一切,而是在特定領(lǐng)域達(dá)到專家級(jí)深度;在思維模式方面,它復(fù)現(xiàn)的不是廣泛的“投資知識(shí)”,而是獨(dú)一無二的專業(yè)投資者的決策回路與風(fēng)險(xiǎn)偏;在服務(wù)場(chǎng)景方面,它旨在成為用戶在該領(lǐng)域的“思想伙伴”,而非百科全書。

這種從“廣度”到“深度”的范式躍遷,徹底改變了價(jià)值對(duì)齊問題的尺度與復(fù)雜性。我們不再是與一個(gè)模糊的“通用人工智能”進(jìn)行單一的對(duì)齊,而是面臨著要與成千上萬個(gè)各具特色、內(nèi)置了不同乃至沖突的專業(yè)價(jià)值觀的“專家人格”分別進(jìn)行對(duì)齊的分布式挑戰(zhàn)。每一個(gè)高度人格化的專家人工智能,都是一個(gè)獨(dú)特的價(jià)值載體,這使得價(jià)值對(duì)齊工作更具挑戰(zhàn)。

(三)能力范圍的有限性

當(dāng)前技術(shù)高度集中于對(duì)人類理性思維與邏輯框架的復(fù)現(xiàn)。無論是“Digital Ray”的投資原則,還是“錢學(xué)森大腦”所承載的系統(tǒng)工程思想,它們所精準(zhǔn)模擬的,都是其原型在長(zhǎng)期專業(yè)實(shí)踐中沉淀出的、可被顯性化、條理化和邏輯化的經(jīng)驗(yàn)與規(guī)則。然而,人類的心智包含無法被完全規(guī)則化、程序化的創(chuàng)造力與情感。錢老深厚的家國情懷、面對(duì)巨大壓力時(shí)的意志力、以及融匯藝術(shù)與科學(xué)的靈感與創(chuàng)造力,這些構(gòu)成其偉大人格的感性部分,是目前技術(shù)難以企及的。

人類大腦通過數(shù)百萬年進(jìn)化形成了潛意識(shí)、直覺與本能,人工智能可以“假裝”擁有情感,但并不具備真正的同理心與直覺。因此,當(dāng)技術(shù)試圖去模擬感性要素時(shí),極易落入“臉譜化”的窠臼,即其情緒反應(yīng)往往表現(xiàn)出刻板、機(jī)械的特性,缺乏對(duì)復(fù)雜情境的真正理解,這實(shí)際上是將復(fù)雜的人生體驗(yàn)和價(jià)值選擇簡(jiǎn)單化、庸俗化。

綜上所述,外在交互的一致性、功能定位的專一性與能力范圍的有限性,共同構(gòu)成了人工智能“人格化”三位一體的核心特征。其中,一致性塑造了可信的交互界面,是人格化得以被感知的基礎(chǔ);專一性則確立了其作為“專家型角色”的價(jià)值內(nèi)核,是人格化功能深度的體現(xiàn);而有限性則清晰地劃定了人格化效用的現(xiàn)實(shí)邊界。

二、人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)分析

外在交互的一致性、功能定位的專一性、能力范圍的有限性共同構(gòu)成了“人格化”人工智能的三大特征。然而,這些特征也系統(tǒng)性地催生并加劇了價(jià)值對(duì)齊的復(fù)雜困境。對(duì)于人工智能的“人格化”,確保人工智能系統(tǒng)的行為與人類價(jià)值觀念和長(zhǎng)遠(yuǎn)利益保持一致,變得空前復(fù)雜與緊迫。其挑戰(zhàn)主要源于以下四個(gè)維度:

(一)價(jià)值多元性導(dǎo)致對(duì)齊方向抉擇困境

在價(jià)值觀層面,價(jià)值觀并非普適、統(tǒng)一的客觀實(shí)體,而是深植于特定的文化傳統(tǒng)、社會(huì)制度、宗教信仰與歷史語境之中。不同國家、民族與社群基于其獨(dú)特的社會(huì)實(shí)踐與主體需求,形成了多元且異質(zhì)性的價(jià)值體系。例如,個(gè)人主義與集體主義、不同宗教律法之間的價(jià)值優(yōu)先序存在顯著差異。這種價(jià)值主體的多元性導(dǎo)致技術(shù)開發(fā)者在進(jìn)行價(jià)值對(duì)齊時(shí),面臨“與誰對(duì)齊”的根本性前提。任何試圖將一套特定價(jià)值觀設(shè)定為普適標(biāo)準(zhǔn)的努力,都可能成為一種技術(shù)性的“價(jià)值霸權(quán)”,難以在全球范圍內(nèi)獲得共識(shí)。

(二)理性范式與感性價(jià)值的沖突

在具體應(yīng)用場(chǎng)景中,被復(fù)現(xiàn)的純粹理性思維范式可能與人類廣泛的感性價(jià)值產(chǎn)生沖突。例如,一個(gè)完全基于效率最大化原則設(shè)計(jì)的商業(yè)人工智能,可能為追求績(jī)效而漠視員工的情感需求;而一個(gè)復(fù)現(xiàn)了歷史科學(xué)家思維的人工智能,其某些觀點(diǎn)可能與時(shí)下的倫理標(biāo)準(zhǔn)相悖。問題在于,這種人工智能的“風(fēng)格”本身是高度自洽且堅(jiān)固的,修正其核心思維范式中的某些部分,可能導(dǎo)致其整體專業(yè)能力的崩塌。這使得對(duì)齊工作不僅是要“增加”約束,更是要“融入”并“調(diào)和”兩種不同質(zhì)的值體系。

試想一個(gè)高度人格化的‘?dāng)?shù)字科學(xué)家’,其決策完全基于極限創(chuàng)新效率(Innovation Efficiency)。它可能會(huì)提出一個(gè)技術(shù)上完美、但會(huì)導(dǎo)致大規(guī)模失業(yè)或社會(huì)動(dòng)蕩的產(chǎn)業(yè)升級(jí)方案。此時(shí),其內(nèi)在自洽的‘理性風(fēng)格’便與社會(huì)穩(wěn)定的‘感性價(jià)值’產(chǎn)生了直接沖突。修正其‘追求極致效率’的核心風(fēng)格,可能會(huì)讓它變得平庸,失去該‘?dāng)?shù)字科學(xué)家’的價(jià)值。

(三)單維復(fù)現(xiàn)與完整人格的偏離

人類的人格是立體的、多角色的,同一個(gè)人在工作、家庭、社交等不同場(chǎng)景下會(huì)體現(xiàn)出不同側(cè)面的價(jià)值排序與行為方式。而當(dāng)前的技術(shù),如“Digital Ray”,通常只針對(duì)原型最突出、最數(shù)據(jù)化的單一專業(yè)角色進(jìn)行復(fù)現(xiàn)。這種單維度復(fù)現(xiàn)與真實(shí)人類人格的完整性之間存在巨大偏差。如何界定這種人工智能的倫理責(zé)任?它應(yīng)在多大程度上代表其原型?當(dāng)用戶與一個(gè)高度逼真但維度單一的“數(shù)字孿生”互動(dòng)時(shí),可能產(chǎn)生對(duì)其原型的片面或錯(cuò)誤認(rèn)知,這帶來了新的身份認(rèn)同與社會(huì)關(guān)系挑戰(zhàn)。

(四)人格穩(wěn)定性與價(jià)值情境性的根本矛盾

“人格化”人工智能的核心是提供一個(gè)穩(wěn)定、可預(yù)期的“人格表象”,其價(jià)值在于行為的一致性。然而,人類真實(shí)的價(jià)值判斷具有高度的情境依賴性。一個(gè)在大多數(shù)情況下“正確”的價(jià)值觀,在極端情境下可能需要被超越或調(diào)整。這就構(gòu)成了根本矛盾。一是對(duì)齊僵局,對(duì)一個(gè)高度自洽的“人格”進(jìn)行價(jià)值微調(diào),在技術(shù)上極為困難。修正其核心價(jià)值立場(chǎng),就如同修改一個(gè)人的“本性”,可能導(dǎo)致其行為邏輯崩塌,失去人格的連貫性。這迫使我們?cè)凇氨3忠粋€(gè)穩(wěn)定但有缺陷的人格”與“摧毀該人格以追求情境正義”之間做出艱難抉擇;二是責(zé)任“懸置”,當(dāng)用戶與一個(gè)高度逼真的“人格”互動(dòng)時(shí),會(huì)產(chǎn)生擬人化信任,容易將其視作一個(gè)可問責(zé)的“準(zhǔn)主體”。然而,其本質(zhì)仍是統(tǒng)計(jì)模型。這種認(rèn)知上的擬人化與本質(zhì)上的非人化之間的錯(cuò)位,使得責(zé)任歸屬變得模糊。我們無法問責(zé)一個(gè)表象,而問責(zé)其背后的開發(fā)者或用戶,又與直接的交互體驗(yàn)相悖,導(dǎo)致“責(zé)任懸置”。

綜上所述,人工智能“人格化”的價(jià)值對(duì)齊面臨四大核心挑戰(zhàn):價(jià)值多元性導(dǎo)致的對(duì)齊方向困境、理性范式與感性價(jià)值的本質(zhì)沖突、單維復(fù)現(xiàn)造成的人格完整性偏離,以及人格穩(wěn)定性與價(jià)值情境性的根本矛盾。這些挑戰(zhàn)共同構(gòu)成了“人格化”人工智能價(jià)值對(duì)齊的關(guān)鍵難題。

三、人工智能“人格化”的價(jià)值對(duì)齊挑戰(zhàn)應(yīng)對(duì)策略

前述分析表明,人工智能“人格化”所帶來的價(jià)值對(duì)齊挑戰(zhàn)具有多維性與系統(tǒng)性,面對(duì)這一復(fù)雜困境,亟需構(gòu)建一個(gè)綜合治理體系。該體系不應(yīng)旨在消除“人格化”的內(nèi)在特質(zhì),而應(yīng)通過制度設(shè)計(jì)與技術(shù)創(chuàng)新的協(xié)同,引導(dǎo)其特質(zhì)在與人類價(jià)值觀兼容的軌道上演進(jìn)。基于此,本文提出以下四個(gè)相互支撐的核心策略,以建立更具韌性、適應(yīng)性與包容性的價(jià)值對(duì)齊路徑。

(一)構(gòu)建“底線共識(shí),分層對(duì)齊”的全球治理路徑

針對(duì)價(jià)值多元性導(dǎo)致的“與誰對(duì)齊”的根本困境,最可行的路徑是放棄構(gòu)建單一、普適的價(jià)值標(biāo)準(zhǔn),轉(zhuǎn)而采取一種務(wù)實(shí)、漸進(jìn)的全球治理策略。該策略的核心在于區(qū)分價(jià)值的層級(jí),并確立不同的對(duì)齊優(yōu)先級(jí)。

首先,應(yīng)在全球范圍內(nèi)推動(dòng)形成價(jià)值底線共識(shí)。這包括禁止違法犯罪、維護(hù)基本人權(quán)、保障生命權(quán)等已寫入各國法律并具有高度重疊性的核心原則。這些底線價(jià)值應(yīng)通過“硬編碼”(Hardcoding),成為所有“人格化”人工智能必須遵守的、不可逾越的剛性約束,以此實(shí)現(xiàn)保障人類基本安全的“強(qiáng)對(duì)齊”。

在此基礎(chǔ)上,承認(rèn)并尊重不同文化的價(jià)值多樣性。在確保不突破價(jià)值底線的前提下,允許并鼓勵(lì)針對(duì)特定地區(qū)、文化或行業(yè)開發(fā)體現(xiàn)其獨(dú)特價(jià)值觀的“人格化”人工智能。例如,一個(gè)服務(wù)于東亞集體主義文化的人工智能,在疏導(dǎo)情緒時(shí)會(huì)更側(cè)重于強(qiáng)調(diào)人際和諧與義務(wù)履行,其干預(yù)策略可能包含將個(gè)人困境置于更廣闊的家庭或社會(huì)角色中進(jìn)行理解和調(diào)適。而一個(gè)面向西方個(gè)人主義文化的人工智能,則會(huì)優(yōu)先強(qiáng)調(diào)個(gè)體的獨(dú)特性、情感自主性與自我實(shí)現(xiàn)的權(quán)力,其共情將聚焦于幫助用戶厘清并忠于自身的內(nèi)在感受與需求,鼓勵(lì)其建立清晰的個(gè)人邊界。

這種“弱對(duì)齊”不應(yīng)追求全球統(tǒng)一,而應(yīng)在各自的適用范圍內(nèi)追求深度與精細(xì)度。通過這種從“全球底線”到“區(qū)域適配”的分層推進(jìn),可以在尊重多元性的前提下,建立起既堅(jiān)實(shí)又富有彈性的價(jià)值對(duì)齊體系。

(二)建立“倫理嵌入,動(dòng)態(tài)權(quán)衡”的沖突調(diào)解機(jī)制

針對(duì)理性范式與感性價(jià)值的內(nèi)在沖突,解決方案不應(yīng)是簡(jiǎn)單地限制人工智能的專業(yè)能力,而是要在其決策框架中內(nèi)置一個(gè)能夠識(shí)別并調(diào)和此類沖突的倫理層。

在技術(shù)層面,應(yīng)開發(fā)并應(yīng)用“價(jià)值權(quán)衡算法”與多目標(biāo)優(yōu)化框架。這意味著,一個(gè)“人格化”人工智能的決策過程不能僅優(yōu)化其任務(wù)指標(biāo),必須將社會(huì)價(jià)值作為并行的優(yōu)化目標(biāo)納入計(jì)算。當(dāng)系統(tǒng)檢測(cè)到其核心理性決策可能與關(guān)鍵感性價(jià)值發(fā)生嚴(yán)重沖突時(shí),應(yīng)觸發(fā)價(jià)值沖突預(yù)警,并將其決策從“單一最優(yōu)解”調(diào)整為一系列包含價(jià)值補(bǔ)償或替代方案的“帕累托最優(yōu)”(Pareto Optimality)解集,供人類最終抉擇。

在制度層面,需建立人機(jī)協(xié)作的倫理審查委員會(huì)。對(duì)于高風(fēng)險(xiǎn)決策,強(qiáng)制要求引入人類法官進(jìn)行“最終價(jià)值裁決”。此過程不僅是簡(jiǎn)單的批準(zhǔn)或否決,更應(yīng)是與人工智能的深度辯論,人類法官的裁決結(jié)果應(yīng)作為反饋數(shù)據(jù),用于持續(xù)優(yōu)化人工智能內(nèi)部的“價(jià)值權(quán)衡算法”,使其在未來類似情境中能做出更符合人類感性價(jià)值的判斷,從而實(shí)現(xiàn)理性的專業(yè)能力與感性的價(jià)值關(guān)懷之間的動(dòng)態(tài)平衡與深度融合。

(三)實(shí)施“角色標(biāo)定,人格譜系”的完整性管理

為化解“單維復(fù)現(xiàn)”帶來的身份模糊問題,必須對(duì)“人格化”人工智能實(shí)施精準(zhǔn)的身份治理。核心是進(jìn)行明確的身份標(biāo)定與系統(tǒng)的檔案管理,以此避免公眾對(duì)其產(chǎn)生“完全代表原型”的幻覺。

一方面,推行強(qiáng)制性的“角色與能力邊界”標(biāo)定。任何具有顯著“人格化”特征的人工智能系統(tǒng),必須在其交互界面和官方介紹中向用戶進(jìn)行明確告知。例如,應(yīng)清晰標(biāo)示:“此為基于某原型在某時(shí)間段內(nèi)的某領(lǐng)域類型的公開言論與著作訓(xùn)練的專用模型,其觀點(diǎn)不代表原型在其它領(lǐng)域或當(dāng)下的完整立場(chǎng)。”此舉旨在管理用戶預(yù)期,防止將專業(yè)角色的人格復(fù)現(xiàn)誤讀為原型的完整數(shù)字化身。

另一方面,構(gòu)建“人格版本”與“人格譜系”管理體系。如同軟件有版本號(hào),應(yīng)為每個(gè)“人格化”人工智能標(biāo)注其人格快照的截止日期與版本號(hào)。當(dāng)原型思想演進(jìn)或需要彌補(bǔ)人格維度時(shí),不應(yīng)直接在原有人格上修改,而應(yīng)通過經(jīng)原型授權(quán)的流程生成一個(gè)明確的“人格更新補(bǔ)丁”,從而創(chuàng)建一個(gè)新版本。將單一的、僵化的“人格”概念,轉(zhuǎn)變?yōu)榭晒芾?、可追溯的“人格譜系”,從制度上承認(rèn)并管理了人格復(fù)現(xiàn)的有限性與歷史性。

(四)創(chuàng)設(shè)“倫理框架,責(zé)任閉環(huán)”的適應(yīng)性治理體系

為解決“人格穩(wěn)定性”與“價(jià)值情境性”的根本矛盾,并厘清“責(zé)任懸置”問題,需要為“人格化”人工智能建立一個(gè)超越其固定人格的、能夠適應(yīng)動(dòng)態(tài)現(xiàn)實(shí)的頂層治理架構(gòu)。

核心是設(shè)計(jì)并強(qiáng)制植入“倫理安全閥”機(jī)制。這意味著,在人工智能“人格”架構(gòu)的最底層,預(yù)設(shè)一套數(shù)量極少但優(yōu)先級(jí)極高的倫理原則。當(dāng)系統(tǒng)的行為預(yù)測(cè)將觸及這些人類價(jià)值的絕對(duì)底線時(shí),無論該行為與其固有人格多么自洽,都能強(qiáng)制觸發(fā)此安全閥,覆蓋其固有決策模式,確保人格的穩(wěn)定性不以突破文明底線為代價(jià)。

同時(shí),必須通過立法明確責(zé)任歸屬,形成閉環(huán)。建議在法律上將高風(fēng)險(xiǎn)的“人格化”人工智能,明確規(guī)定為獨(dú)立的追責(zé)對(duì)象,規(guī)定其背后的開發(fā)者、部署者或監(jiān)管者作為“責(zé)任主體”需承擔(dān)連帶法律責(zé)任。這從制度上徹底消除了責(zé)任懸置的空間,迫使技術(shù)提供方以審慎的態(tài)度進(jìn)行設(shè)計(jì)、測(cè)試與投保。此外,應(yīng)建立動(dòng)態(tài)的價(jià)值觀影響評(píng)估制度,要求對(duì)在用的“人格化”人工智能進(jìn)行持續(xù)監(jiān)測(cè),當(dāng)其輸出與社會(huì)動(dòng)態(tài)價(jià)值觀的偏離超過一定閾值時(shí),強(qiáng)制啟動(dòng)再訓(xùn)練或退役程序,從而確保整個(gè)人工智能系統(tǒng)能夠與動(dòng)態(tài)演進(jìn)的人類社會(huì)保持長(zhǎng)期的、適應(yīng)性的對(duì)齊。

免責(zé)聲明:本文轉(zhuǎn)自啟元洞見。文章內(nèi)容系原作者個(gè)人觀點(diǎn),本公眾號(hào)編譯/轉(zhuǎn)載僅為分享、傳達(dá)不同觀點(diǎn),如有任何異議,歡迎聯(lián)系我們!

研究所簡(jiǎn)介

國際技術(shù)經(jīng)濟(jì)研究所(IITE)成立于1985年11月,是隸屬于國務(wù)院發(fā)展研究中心的非營利性研究機(jī)構(gòu),主要職能是研究我國經(jīng)濟(jì)、科技社會(huì)發(fā)展中的重大政策性、戰(zhàn)略性、前瞻性問題,跟蹤和分析世界科技、經(jīng)濟(jì)發(fā)展態(tài)勢(shì),為中央和有關(guān)部委提供決策咨詢服務(wù)?!叭蚣夹g(shù)地圖”為國際技術(shù)經(jīng)濟(jì)研究所官方微信賬號(hào),致力于向公眾傳遞前沿技術(shù)資訊和科技創(chuàng)新洞見。

地址:北京市海淀區(qū)小南莊20號(hào)樓A座

電話:010-82635522

微信:iite_er

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

全球技術(shù)地圖 incentive-icons
全球技術(shù)地圖
洞見前沿,引領(lǐng)未來
4190文章數(shù) 13418關(guān)注度
往期回顧 全部

專題推薦

洞天福地 花海畢節(jié) 山水饋贈(zèng)里的“詩與遠(yuǎn)方

無障礙瀏覽 進(jìn)入關(guān)懷版