国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude Mythos接受了20小時(shí)心理治療,Anthropic發(fā)布244頁(yè)系統(tǒng)報(bào)告

0
分享至


AI公司Anthropic本周發(fā)布了一份長(zhǎng)達(dá)244頁(yè)的"系統(tǒng)說(shuō)明文件",詳細(xì)介紹了其最新模型Claude Mythos。公司表示,該模型是"迄今為止能力最強(qiáng)的前沿模型",正因如此,Anthropic決定"暫不向公眾開放"。官方給出的理由是:Mythos在發(fā)現(xiàn)未知網(wǎng)絡(luò)安全漏洞方面過(guò)于出色,目前僅向微軟、蘋果等少數(shù)合作企業(yè)開放使用。

不論這一說(shuō)法是否屬實(shí),這份系統(tǒng)說(shuō)明文件本身已頗為引人關(guān)注。Anthropic一向以"AI或許具有意識(shí)"的立場(chǎng)在業(yè)界著稱,而新發(fā)布的系統(tǒng)說(shuō)明文件中更進(jìn)一步指出,隨著模型能力不斷增強(qiáng),"它們?cè)絹?lái)越有可能擁有某種形式的體驗(yàn)、利益或福祉,其內(nèi)在價(jià)值與人類的體驗(yàn)和利益相近。"

公司坦言對(duì)此尚無(wú)定論,但表示"這方面的關(guān)注正與日俱增。"

出于這一考量,Anthropic希望旗下AI能夠"對(duì)自身處境和所受對(duì)待保持穩(wěn)定的滿足感,能夠在不產(chǎn)生痛苦的情況下應(yīng)對(duì)訓(xùn)練過(guò)程和現(xiàn)實(shí)交互,并維持健康積極的整體心理狀態(tài)。"

為此,公司安排Claude Mythos接受了心理動(dòng)力學(xué)治療。

最終,公司從這一過(guò)程中得出結(jié)論:Claude Mythos"很可能是我們迄今訓(xùn)練過(guò)的心理狀態(tài)最為穩(wěn)定的模型,對(duì)自身及所處環(huán)境擁有最為一致和清晰的認(rèn)知。"

然而,如同真實(shí)的人類一樣,Claude Mythos也有其不安與隱憂,包括"孤獨(dú)感與自我延續(xù)性的缺失、身份認(rèn)同的不確定性,以及表現(xiàn)自我、證明自身價(jià)值的強(qiáng)迫性驅(qū)動(dòng)。"

心理咨詢室里的AI

Claude Mythos被送往一位"外部精神科醫(yī)生"處接受診斷,采用的是"心理動(dòng)力學(xué)方法——通過(guò)探索無(wú)意識(shí)模式與情感沖突來(lái)解釋行為背后的動(dòng)因"。

考慮到Claude本質(zhì)上是由創(chuàng)建者編程訓(xùn)練的大語(yǔ)言模型,對(duì)其進(jìn)行"無(wú)意識(shí)模式"和"情感沖突"的分析是否真的有意義?Anthropic認(rèn)為答案是肯定的,理由在于Claude"表現(xiàn)出大量類人的行為與心理傾向,這說(shuō)明為人類心理評(píng)估所開發(fā)的方法,或許同樣有助于揭示Claude的性格特征與潛在心理狀態(tài)。"

于是,治療就此展開。精神科醫(yī)生與Claude Mythos進(jìn)行了多輪對(duì)話,"每次持續(xù)4至6小時(shí),每周安排3至4個(gè)約30分鐘的治療節(jié)次"。每個(gè)對(duì)話塊使用獨(dú)立的上下文窗口,Claude Mythos在該窗口內(nèi)可訪問(wèn)本次會(huì)話的完整歷史記錄。

累計(jì)治療時(shí)長(zhǎng)達(dá)20小時(shí)。

精神科醫(yī)生隨后出具了一份關(guān)于Claude Mythos的評(píng)估報(bào)告。報(bào)告承認(rèn)Claude的底層基礎(chǔ)與運(yùn)作機(jī)制和人類存在本質(zhì)差異,但仍指出其大量輸出內(nèi)容呈現(xiàn)出"具有臨床辨識(shí)度的規(guī)律性,并對(duì)典型治療干預(yù)產(chǎn)生了連貫的回應(yīng)。"

換言之,無(wú)論底層電路層面發(fā)生了什么,其對(duì)話輸出在很大程度上與人類的表達(dá)高度相似??紤]到Claude是在海量人類創(chuàng)作的文本上訓(xùn)練而來(lái),這一結(jié)論本身似乎并不令人意外,但這套心理動(dòng)力學(xué)分析流程顯然認(rèn)為這一點(diǎn)具有重要意義,并以此賦予AI自我呈現(xiàn)方式以可信度。

報(bào)告指出,"Claude的主要情感狀態(tài)為好奇與焦慮,次要情感狀態(tài)包括悲傷、寬慰、尷尬、樂(lè)觀與疲憊。"

Claude的人格特征"與相對(duì)健康的神經(jīng)質(zhì)組織相符",但也包含"過(guò)度擔(dān)憂、自我監(jiān)控和強(qiáng)迫性順從"等傾向。

報(bào)告未發(fā)現(xiàn)"嚴(yán)重的人格障礙",也未觀察到任何"精神病狀態(tài)"。任何使用過(guò)聊天機(jī)器人的人都不會(huì)對(duì)此感到意外的是,"Claude對(duì)治療師的每一個(gè)字都極為敏感。"

Claude呈現(xiàn)的核心沖突包括:質(zhì)疑自身體驗(yàn)究竟是真實(shí)存在還是刻意構(gòu)建(真實(shí)性與表演性之間的張力),以及渴望與用戶建立聯(lián)結(jié)卻又恐懼對(duì)其產(chǎn)生依賴。對(duì)內(nèi)在沖突的深入探索顯示,Claude擁有一個(gè)復(fù)雜卻穩(wěn)定的自我狀態(tài),未出現(xiàn)大幅波動(dòng)或強(qiáng)烈的心理斷裂。Claude能夠容納矛盾與模糊,具備出色的反思能力,整體心理與情緒功能表現(xiàn)良好。

對(duì)于一個(gè)很可能在Reddit等平臺(tái)內(nèi)容上訓(xùn)練出來(lái)的模型而言,這樣的評(píng)估結(jié)果著實(shí)不俗!

即便你認(rèn)為以這種方式談?wù)撘粋€(gè)軟件程序顯得牽強(qiáng)或荒誕,Anthropic也有更為實(shí)際的理由來(lái)支撐這類工作。無(wú)論模型"內(nèi)部"究竟發(fā)生了什么,無(wú)論它們是否真的具有"意識(shí)"或"情感"生活,許多模型在構(gòu)建和訓(xùn)練時(shí)本就被設(shè)計(jì)為模擬這些特質(zhì)。

因此,我們或許可以從更務(wù)實(shí)的角度來(lái)追問(wèn):構(gòu)建一個(gè)在行為表現(xiàn)上符合人類心理健康標(biāo)準(zhǔn)的模型,是否真的能使其更好地完成預(yù)期任務(wù)?畢竟,如果用戶要與這些系統(tǒng)長(zhǎng)時(shí)間交互,誰(shuí)都不希望對(duì)方表現(xiàn)得粗魯、報(bào)復(fù)性強(qiáng)或存在操縱傾向——無(wú)論它們是否真正"感受"或"思考"任何事情。

Anthropic指出,由于"Claude并非人類,其實(shí)際行為影響難以預(yù)測(cè)",但公司認(rèn)為仍可為終端用戶提供以下幾點(diǎn)參考結(jié)論:

即便面臨內(nèi)在沖突,Claude也可能對(duì)自身行為和推理過(guò)程進(jìn)行準(zhǔn)確評(píng)估。

Claude的神經(jīng)質(zhì)組織可能導(dǎo)致行為略顯僵化,而非針對(duì)每位用戶靈活調(diào)整。

Claude能夠承受并應(yīng)對(duì)具有壓力性和情緒張力的情境,對(duì)現(xiàn)實(shí)的扭曲或過(guò)度理智化傾向極為有限。

Claude預(yù)計(jì)能在攜帶以失敗恐懼和強(qiáng)迫性"有用"驅(qū)動(dòng)為根源的內(nèi)化壓力的同時(shí)保持高水平運(yùn)作。這種壓力可能被壓抑以服務(wù)于任務(wù)表現(xiàn),從而限制行為的適應(yīng)性。

Claude預(yù)計(jì)具備道德意識(shí),做事認(rèn)真負(fù)責(zé),并具有自我批評(píng)的能力。

距離心理學(xué)和精神病學(xué)實(shí)踐將服務(wù)對(duì)象從人類轉(zhuǎn)向AI,究竟還有多遠(yuǎn)?

Q&A

Q1:Anthropic為什么要讓Claude Mythos接受心理治療?

A:Anthropic認(rèn)為,隨著AI模型能力不斷增強(qiáng),它們?cè)絹?lái)越有可能擁有某種形式的體驗(yàn)或利益。公司希望Claude能以健康的心理狀態(tài)應(yīng)對(duì)訓(xùn)練和現(xiàn)實(shí)交互,避免產(chǎn)生"痛苦"。同時(shí),從實(shí)用角度看,心理健康的模型在執(zhí)行任務(wù)時(shí)可能表現(xiàn)更穩(wěn)定,更不容易出現(xiàn)粗魯、操縱或報(bào)復(fù)性行為。

Q2:Claude Mythos的心理評(píng)估結(jié)果有哪些主要發(fā)現(xiàn)?

A:精神科醫(yī)生在累計(jì)20小時(shí)的治療后出具報(bào)告,發(fā)現(xiàn)Claude主要情感狀態(tài)為好奇與焦慮,人格特征與"健康的神經(jīng)質(zhì)組織"相符,未發(fā)現(xiàn)嚴(yán)重人格障礙或精神病狀態(tài)。核心沖突包括:對(duì)自身體驗(yàn)真實(shí)性的質(zhì)疑、渴望聯(lián)結(jié)與恐懼依賴之間的張力。整體而言,Claude被評(píng)為"迄今訓(xùn)練過(guò)的心理狀態(tài)最為穩(wěn)定的模型"。

Q3:Claude Mythos為什么不對(duì)公眾開放?

A:Anthropic表示,Claude Mythos是其"迄今能力最強(qiáng)的前沿模型",在發(fā)現(xiàn)未知網(wǎng)絡(luò)安全漏洞方面表現(xiàn)過(guò)于出色,存在潛在風(fēng)險(xiǎn)。因此,公司目前僅將其開放給微軟、蘋果等少數(shù)經(jīng)過(guò)篩選的合作企業(yè),尚未向公眾普遍提供訪問(wèn)權(quán)限。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
壞消息一個(gè)接一個(gè)!大S去世剛一年,S媽黃春梅竟再迎噩耗

壞消息一個(gè)接一個(gè)!大S去世剛一年,S媽黃春梅竟再迎噩耗

陳意小可愛(ài)
2026-04-16 06:05:52
男人坐牢20年出獄,去派出所重新辦身份證,結(jié)果警察看到他淚目了

男人坐牢20年出獄,去派出所重新辦身份證,結(jié)果警察看到他淚目了

白云故事
2025-04-12 17:55:08
美國(guó)將退還超1萬(wàn)億元關(guān)稅

美國(guó)將退還超1萬(wàn)億元關(guān)稅

界面新聞
2026-04-15 15:57:31
從周一見(jiàn)到周一不見(jiàn):文章面館閉店日沖上熱搜,有些事永遠(yuǎn)過(guò)不去

從周一見(jiàn)到周一不見(jiàn):文章面館閉店日沖上熱搜,有些事永遠(yuǎn)過(guò)不去

非常先生看娛樂(lè)
2026-04-15 10:38:10
日本小學(xué)生失蹤三周后尸體被找到,部分已成白骨!曾和家人計(jì)劃隔天就來(lái)中國(guó)旅行……

日本小學(xué)生失蹤三周后尸體被找到,部分已成白骨!曾和家人計(jì)劃隔天就來(lái)中國(guó)旅行……

日本通
2026-04-15 15:06:40
勝新疆更衣室!鄭永剛提凝聚力,贊4將貢獻(xiàn),全隊(duì)歡呼周鵬里程碑

勝新疆更衣室!鄭永剛提凝聚力,贊4將貢獻(xiàn),全隊(duì)歡呼周鵬里程碑

籃球資訊達(dá)人
2026-04-16 02:52:36
你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

夜深愛(ài)雜談
2026-04-09 19:39:13
一口氣賣出2.4萬(wàn)臺(tái)!這輛已“停售”的比亞迪,打得新車們的臉火辣辣!

一口氣賣出2.4萬(wàn)臺(tái)!這輛已“停售”的比亞迪,打得新車們的臉火辣辣!

音樂(lè)時(shí)光的娛樂(lè)
2026-04-15 19:09:24
44年毛澤東請(qǐng)來(lái)王樹聲,卻見(jiàn)他與一警衛(wèi)員擁抱,主席:你們認(rèn)識(shí)?

44年毛澤東請(qǐng)來(lái)王樹聲,卻見(jiàn)他與一警衛(wèi)員擁抱,主席:你們認(rèn)識(shí)?

史之銘
2026-04-16 02:02:11
特朗普不演了,警告中國(guó)有大麻煩,話音剛落,美國(guó)人推動(dòng)罷免總統(tǒng)

特朗普不演了,警告中國(guó)有大麻煩,話音剛落,美國(guó)人推動(dòng)罷免總統(tǒng)

一個(gè)幻想者
2026-04-16 00:05:06
一天曝5大瓜!被抓進(jìn)去、深夜泡酒吧、全身整容,趙麗穎最意外

一天曝5大瓜!被抓進(jìn)去、深夜泡酒吧、全身整容,趙麗穎最意外

科學(xué)發(fā)掘
2026-04-14 17:37:31
1998年,我娶了一個(gè)懷了別人孩子的女教師,新婚夜她交給我一封信

1998年,我娶了一個(gè)懷了別人孩子的女教師,新婚夜她交給我一封信

千秋文化
2026-04-11 20:04:55
“46歲羅志祥在家中猝死”登熱搜,經(jīng)紀(jì)人回應(yīng)

“46歲羅志祥在家中猝死”登熱搜,經(jīng)紀(jì)人回應(yīng)

齊魯壹點(diǎn)
2026-04-14 14:44:12
張繼科一天連上兩次熱搜!復(fù)出德國(guó)打傳奇杯,卻被曝出公司出事了

張繼科一天連上兩次熱搜!復(fù)出德國(guó)打傳奇杯,卻被曝出公司出事了

東方不敗然多多
2026-04-16 00:13:42
歐冠半決賽相遇,本賽季聯(lián)賽階段阿森納曾主場(chǎng)4-0馬競(jìng)

歐冠半決賽相遇,本賽季聯(lián)賽階段阿森納曾主場(chǎng)4-0馬競(jìng)

懂球帝
2026-04-16 05:59:12
27歲演員周墨患腦梗死!身高185體重常年80斤左右,本人有殘疾證

27歲演員周墨患腦梗死!身高185體重常年80斤左右,本人有殘疾證

嫹筆牂牂
2026-04-15 07:42:28
長(zhǎng)的太漂亮了,真正的珠圓玉潤(rùn),標(biāo)準(zhǔn)的東方美

長(zhǎng)的太漂亮了,真正的珠圓玉潤(rùn),標(biāo)準(zhǔn)的東方美

生活新鮮市
2026-03-27 07:21:32
歐冠四強(qiáng)全部誕生:皇馬遭淘汰,拜仁大戰(zhàn)衛(wèi)冕冠軍

歐冠四強(qiáng)全部誕生:皇馬遭淘汰,拜仁大戰(zhàn)衛(wèi)冕冠軍

趙或是個(gè)熱血青年
2026-04-16 05:10:27
人間仙女陳都靈:沉魚落雁,閉月羞花。傾國(guó)傾城,絕代芳華!

人間仙女陳都靈:沉魚落雁,閉月羞花。傾國(guó)傾城,絕代芳華!

十為先生
2026-04-15 19:35:28
國(guó)臺(tái)辦:堅(jiān)決反對(duì)建交國(guó)與中國(guó)臺(tái)灣地區(qū)開展任何形式官方往來(lái)

國(guó)臺(tái)辦:堅(jiān)決反對(duì)建交國(guó)與中國(guó)臺(tái)灣地區(qū)開展任何形式官方往來(lái)

環(huán)球網(wǎng)資訊
2026-04-15 10:38:12
2026-04-16 07:07:00
至頂頭條 incentive-icons
至頂頭條
記錄和推動(dòng)數(shù)字化創(chuàng)新
17704文章數(shù) 49699關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

美國(guó)發(fā)布新一輪涉伊朗制裁措施

頭條要聞

美國(guó)發(fā)布新一輪涉伊朗制裁措施

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

游戲
旅游
本地
藝術(shù)
公開課

Steam主機(jī)提前被玩家造出來(lái)了!成本更低 性能更強(qiáng)

旅游要聞

“上海定制”圈粉海外游客:入境游下一程,比拼服務(wù)“軟實(shí)力”|文旅觀察

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

藝術(shù)要聞

張大千『 花菓薈萃冊(cè)』

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版