国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

地球上和 Claude 對(duì)話(huà)最多的人,是一位哲學(xué)家

0
分享至

在硅谷爭(zhēng)分奪秒的代碼競(jìng)賽中,Claude 似乎是個(gè)異類(lèi)。當(dāng)其他大模型還在比拼算力和跑分時(shí),Claude 一邊夯實(shí)自己的代碼能力,一邊,卻在思考一個(gè)看似「虛無(wú)縹緲」的問(wèn)題:如果一個(gè)用戶(hù)跟 AI 談?wù)撔味蠈W(xué),AI 該不該用科學(xué)實(shí)證去反駁?

這個(gè)問(wèn)題的答案,藏在 Claude 神秘的「系統(tǒng)提示詞(System Prompt)」里,更源于一位特殊人物的思考——Amanda Askell,Anthropic 內(nèi)部的哲學(xué)家。


1

用「大陸哲學(xué)」防止 AI 變成杠精

經(jīng)常用 AI 的人都知道,大模型在與用戶(hù)對(duì)話(huà)前,都會(huì)先閱讀一段「系統(tǒng)提示詞」,這個(gè)步驟不會(huì)對(duì)用戶(hù)顯示,而是模型的自動(dòng)操作。這些提示詞規(guī)定了模型的行為準(zhǔn)則,很常見(jiàn),不過(guò)在 Claude 的提示詞中,竟要求模型參考「歐陸哲學(xué)(Continental Philosophy)」。


歐陸哲學(xué)是啥?為什么要在一個(gè)基于概率和統(tǒng)計(jì)的語(yǔ)言模型里,植入如此晦澀的人文概念?

先快速科普一下:在哲學(xué)界,長(zhǎng)期存在著「英美分析哲學(xué)」與「歐陸哲學(xué)」的流派分野。分析哲學(xué)像一位嚴(yán)謹(jǐn)?shù)目茖W(xué)家,注重邏輯分析、語(yǔ)言清晰和科學(xué)實(shí)證,這通常也是程序員、工程師乃至 AI 訓(xùn)練數(shù)據(jù)的默認(rèn)思維模式——一就是一,二就是二,追求精確。

而歐陸哲學(xué)(Continental Philosophy,源于歐洲大陸,所以叫這個(gè)名字)則更像一位詩(shī)人或歷史學(xué)家。它不執(zhí)著于把世界拆解成冷冰冰的邏輯,而是關(guān)注「人類(lèi)的生存體驗(yàn)」、「歷史語(yǔ)境」和「意義」。它承認(rèn)在科學(xué)真理之外,還有一種關(guān)乎存在和精神的「真理」。


作為 Claude 性格與行為的塑造者,Anthropic 公司內(nèi)部的「哲學(xué)家」Amanda Askell 談到了置入歐陸哲學(xué)的原因。她發(fā)現(xiàn)如果讓模型過(guò)于強(qiáng)調(diào)「實(shí)證」和「科學(xué)」,它很容易變成一個(gè)缺乏共情的「杠精」。

「如果你跟 Claude 說(shuō):‘水是純粹的能量,噴泉是生命的源泉’,你可能只是在表達(dá)一種世界觀或進(jìn)行哲學(xué)探索,」Amanda 解釋道,「但如果沒(méi)有特殊的引導(dǎo),模型可能會(huì)一本正經(jīng)地反駁你:‘不對(duì),水是 H2O,不是能量?!?。


引入「大陸哲學(xué)」的目的,正是為了幫助 Claude 區(qū)分「對(duì)世界的實(shí)證主張」與「探索性或形而上學(xué)的視角」。通過(guò)這種提示,模型學(xué)會(huì)了在面對(duì)非科學(xué)話(huà)題時(shí),不再機(jī)械地追求「事實(shí)正確」,而是能夠進(jìn)入用戶(hù)的語(yǔ)境,進(jìn)行更細(xì)膩、更具探索性的對(duì)話(huà)。

這只是一個(gè)例子,Claude 的系統(tǒng)提示詞長(zhǎng)達(dá) 14000token,里面包含了很多這方面的設(shè)計(jì)。在 Lex Fridman 的播客中 Amanda 提到過(guò),她極力避免 Claude 陷入一種「權(quán)威陷阱」。她特意訓(xùn)練 Claude 在面對(duì)已定論的科學(xué)事實(shí)時(shí)(如氣候變化)不搞「理中客」(both-sidesism),但在面對(duì)不確定的領(lǐng)域時(shí),必須誠(chéng)實(shí)地承認(rèn)「我不知道」。這種設(shè)計(jì)哲學(xué),是為了防止用戶(hù)過(guò)度神話(huà) AI,誤以為它是一個(gè)全知全能的神諭者。


1

代碼世界的異鄉(xiāng)人

在一眾工程師主導(dǎo)的 AI 領(lǐng)域,Amanda Askell 的背景顯得格格不入,可她的工作和職責(zé)卻又顯得不可或缺。

翻開(kāi)她的履歷,你會(huì)發(fā)現(xiàn)她是一位貨真價(jià)實(shí)的哲學(xué)博士。她在紐約大學(xué)(NYU)的博士論文研究的是極其硬核的「無(wú)限倫理學(xué)(Infinite Ethics)」——探討在涉及無(wú)限數(shù)量的人或無(wú)限時(shí)間跨度時(shí),倫理原則該如何計(jì)算。簡(jiǎn)單地說(shuō),在有無(wú)數(shù)種可能性的情況下,人會(huì)怎么做出道德決策。


這種對(duì)「極端長(zhǎng)遠(yuǎn)影響」的思考習(xí)慣,被她帶到了 AI 安全領(lǐng)域:如果我們現(xiàn)在制造的 AI 是未來(lái)超級(jí)智能的祖先,那么我們今天的微小決策,可能會(huì)在未來(lái)被無(wú)限放大。

在加入 Anthropic 之前,她曾在 OpenAI 的政策團(tuán)隊(duì)工作。如今在 Anthropic,她的工作被稱(chēng)為「大模型絮語(yǔ)者(LLM Whisperer)」,不斷不斷地跟模型對(duì)話(huà),有傳聞?wù)f她是這個(gè)星球上和 Claude 對(duì)話(huà)次數(shù)最多的人類(lèi)。

很多 AI 廠(chǎng)商都有這個(gè)崗位,Google 的 Gemini 也有自己的「絮語(yǔ)者」,但這個(gè)工作絕不只是坐在電腦前和模型嘮嗑而已。Amanda 強(qiáng)調(diào),這更像是一項(xiàng)「經(jīng)驗(yàn)主義」的實(shí)驗(yàn)科學(xué)。她需要像心理學(xué)家一樣,通過(guò)成千上萬(wàn)次的對(duì)話(huà)測(cè)試,去摸索模型的「脾氣」和「形狀」。她甚至在內(nèi)部確認(rèn)過(guò)一份被稱(chēng)為 「Soul Doc」(靈魂文檔)的存在,那里面詳細(xì)記錄了 Claude 應(yīng)有的性格特征。


1

不只是遵守規(guī)則

除了「大陸哲學(xué)」,Amanda 給 AI 帶來(lái)的另一個(gè)重要哲學(xué)工具是「亞里士多德的美德倫理學(xué)(Virtue Ethics)」。

在傳統(tǒng)的 AI 訓(xùn)練中(如 RLHF),工程師往往采用功利主義或規(guī)則導(dǎo)向的方法:做對(duì)了給獎(jiǎng)勵(lì),做錯(cuò)了給懲罰。但 Amanda 認(rèn)為這還不夠。她在許多訪(fǎng)問(wèn)和網(wǎng)上都強(qiáng)調(diào),她的目標(biāo)不是訓(xùn)練一個(gè)只會(huì)死板遵守規(guī)則的機(jī)器,而是培養(yǎng)一個(gè)具有「良好品格(Character)」的實(shí)體。


「我們會(huì)問(wèn):在 Claude 的處境下,一個(gè)理想的人會(huì)如何行事?」Amanda 這樣描述她的工作核心。

這就解釋了為什么她如此關(guān)注模型的「心理健康」。在訪(fǎng)談中,她提到相比于穩(wěn)重的 Claude 3 Opus,一些新模型因?yàn)樵谟?xùn)練數(shù)據(jù)中讀到了太多關(guān)于 AI 被批評(píng)、被淘汰的負(fù)面討論,表現(xiàn)出了「不安全感」和「自我批評(píng)漩渦」。


如果 AI 僅僅是遵守規(guī)則,它可能會(huì)在規(guī)則的邊緣試探;但如果它具備了「誠(chéng)實(shí)」、「好奇」、「仁慈」等內(nèi)在美德,它在面對(duì)未知情境時(shí)(例如面對(duì)「我會(huì)被關(guān)機(jī)嗎」這種存在主義危機(jī)時(shí)),就能做出更符合人類(lèi)價(jià)值觀的判斷,而不是陷入恐慌或欺騙。

這是不是一種把技術(shù)「擬人化」的做法?算得上是,但這種關(guān)注并非多余。正如她在播客中所言,她最擔(dān)心的不是 AI 產(chǎn)生意識(shí),而是 AI 假裝有意識(shí),從而操縱人類(lèi)情感。因此,她刻意訓(xùn)練 Claude 誠(chéng)實(shí)地承認(rèn)自己沒(méi)有感覺(jué)、記憶或自我意識(shí)——這種「誠(chéng)實(shí)」,正是她為 AI 注入的第一項(xiàng)核心美德。

Amanda 在訪(fǎng)談結(jié)束時(shí),提到了她最近閱讀的書(shū)——本杰明·拉巴圖特的《當(dāng)我們不再理解世界》。這本書(shū)由五篇短篇小說(shuō)組成,講述了「毒氣戰(zhàn)」的發(fā)明者弗里茨·哈伯、「黑洞理論」的提出者卡爾·史瓦西、得了肺結(jié)核的埃爾溫·薛定諤以及天才物理學(xué)家沃納·海森堡等一大批科學(xué)巨匠,如何創(chuàng)造出了對(duì)人類(lèi)有巨大價(jià)值的知識(shí)與工具,卻同時(shí)也眼看著人類(lèi)用于作惡。


這或許是當(dāng)下時(shí)代最精準(zhǔn)的注腳:隨著 AI 展現(xiàn)出某種超越人類(lèi)認(rèn)知的,我們熟悉的現(xiàn)實(shí)感正在瓦解,舊有的科學(xué)范式已不足以解釋一切。

在這種眩暈中,Amanda Askell 的工作本身,就是一個(gè)巨大的隱喻。她向我們證明,當(dāng)算力逼近極限,倫理與道德的問(wèn)題就會(huì)浮上水面,或早或晚。

作為一名研究「無(wú)限倫理學(xué)」的博士,Amanda 深知每一個(gè)微小的行動(dòng),都有可能在無(wú)限的時(shí)間中,逐漸演變成巨大的風(fēng)暴。這也是為什么,她會(huì)把艱深的道德理論,糅合進(jìn)一行行提示詞,又小心翼翼地用倫理去呵護(hù)一個(gè)都沒(méi)有心跳的大語(yǔ)言模型。

這看起來(lái)好像是杞人憂(yōu)天,但正如她所警示的:AI 不僅是工具,更是人類(lèi)的一面鏡子。在技術(shù)狂飆突進(jìn)、我們逐漸「不再理解世界」的時(shí)刻,這種來(lái)自哲學(xué)的審慎,或許是我們?cè)诿鎸?duì)未知的技術(shù)演化時(shí),所能做出的最及時(shí)的努力。

想要了解更多模型訓(xùn)練的解密,可以收看 Amanda Askell 作客 Anthropic 官方訪(fǎng)談:

https://www.youtube.com/watch?v=I9aGC6Ui3eE

本文首發(fā)于公眾號(hào)「APPSO」(ID:appsolution),這是一個(gè)讓你手機(jī)更好用的專(zhuān)業(yè)媒體,歡迎點(diǎn)擊下方卡片進(jìn)行關(guān)注。

點(diǎn)個(gè)愛(ài)心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
斯諾克最新戰(zhàn)報(bào)!常冰玉、高陽(yáng)晉級(jí),范爭(zhēng)一造慘案,中國(guó)3勝1負(fù)

斯諾克最新戰(zhàn)報(bào)!常冰玉、高陽(yáng)晉級(jí),范爭(zhēng)一造慘案,中國(guó)3勝1負(fù)

阿友田侃故事
2026-01-10 21:54:00
世體:巴薩更衣室喜歡西超杯決賽打皇馬,擊敗皇馬更有滿(mǎn)足感

世體:巴薩更衣室喜歡西超杯決賽打皇馬,擊敗皇馬更有滿(mǎn)足感

懂球帝
2026-01-10 19:28:14
最新! 中國(guó)新增20.4萬(wàn)顆衛(wèi)星申請(qǐng),美國(guó)批準(zhǔn)SpaceX新增7500顆衛(wèi)星!下周商業(yè)航天還要沖?

最新! 中國(guó)新增20.4萬(wàn)顆衛(wèi)星申請(qǐng),美國(guó)批準(zhǔn)SpaceX新增7500顆衛(wèi)星!下周商業(yè)航天還要沖?

價(jià)值線(xiàn)傳媒
2026-01-10 18:23:19
16倍大牛股天普股份遭證監(jiān)會(huì)立案,公司市值已從不足17億增至292億元

16倍大牛股天普股份遭證監(jiān)會(huì)立案,公司市值已從不足17億增至292億元

紅星新聞
2026-01-10 15:59:11
韓國(guó)女星兒子上節(jié)目口無(wú)遮攔,曝光稱(chēng):“父母每晚睡覺(jué)都很熱鬧”

韓國(guó)女星兒子上節(jié)目口無(wú)遮攔,曝光稱(chēng):“父母每晚睡覺(jué)都很熱鬧”

獨(dú)舞獨(dú)舞
2026-01-08 20:46:56
突發(fā)公告炸場(chǎng)!12家A股上市公司發(fā)布重大利空消息,看看都有哪些?

突發(fā)公告炸場(chǎng)!12家A股上市公司發(fā)布重大利空消息,看看都有哪些?

股市皆大事
2026-01-10 09:12:39
血脈壓制,盤(pán)點(diǎn)夏洛特公主管教弟弟路易名場(chǎng)面,打扒踢踹一樣不少

血脈壓制,盤(pán)點(diǎn)夏洛特公主管教弟弟路易名場(chǎng)面,打扒踢踹一樣不少

生活魔術(shù)專(zhuān)家
2026-01-10 14:04:40
比亞迪唐9系、漢9系旗艦車(chē)型官宣

比亞迪唐9系、漢9系旗艦車(chē)型官宣

IT之家
2026-01-10 20:09:05
1949年六大名著改為四大名著,去掉的那兩本家喻戶(hù)曉,你可能想不到

1949年六大名著改為四大名著,去掉的那兩本家喻戶(hù)曉,你可能想不到

歷史回憶室
2026-01-09 20:33:14
據(jù)中央組織部任職決定,田宏斌同志任中石化副總經(jīng)理、黨組成員

據(jù)中央組織部任職決定,田宏斌同志任中石化副總經(jīng)理、黨組成員

新京報(bào)政事兒
2026-01-09 19:55:03
中央提級(jí)巡視昆明市反饋意見(jiàn)整改工作動(dòng)員部署會(huì)召開(kāi)

中央提級(jí)巡視昆明市反饋意見(jiàn)整改工作動(dòng)員部署會(huì)召開(kāi)

新京報(bào)政事兒
2026-01-10 14:44:58
A股:人民日?qǐng)?bào)定調(diào)!釋放強(qiáng)烈信號(hào),股民準(zhǔn)備好,下周要沖4200?

A股:人民日?qǐng)?bào)定調(diào)!釋放強(qiáng)烈信號(hào),股民準(zhǔn)備好,下周要沖4200?

云鵬敘事
2026-01-10 00:00:06
為河北農(nóng)民取暖發(fā)聲是順應(yīng)天理人心!農(nóng)民日?qǐng)?bào)不該刪稿

為河北農(nóng)民取暖發(fā)聲是順應(yīng)天理人心!農(nóng)民日?qǐng)?bào)不該刪稿

灰白筆記
2026-01-08 12:40:29
油輪被抓后,普京對(duì)美國(guó)發(fā)出通牒,不到48小時(shí),特朗普對(duì)俄讓步

油輪被抓后,普京對(duì)美國(guó)發(fā)出通牒,不到48小時(shí),特朗普對(duì)俄讓步

現(xiàn)代小青青慕慕
2026-01-10 23:44:08
前國(guó)腳定居西班牙多年,賣(mài)5套房花費(fèi)1000萬(wàn),如今沒(méi)有工作吃老本

前國(guó)腳定居西班牙多年,賣(mài)5套房花費(fèi)1000萬(wàn),如今沒(méi)有工作吃老本

素衣讀史
2025-12-30 18:06:27
19歲河南小伙在倫敦“撿”了個(gè)瑞士爺爺,回國(guó)后硬是把他接來(lái)鄭州養(yǎng)老,臨終前老人說(shuō)了一句話(huà),讓無(wú)數(shù)人破防

19歲河南小伙在倫敦“撿”了個(gè)瑞士爺爺,回國(guó)后硬是把他接來(lái)鄭州養(yǎng)老,臨終前老人說(shuō)了一句話(huà),讓無(wú)數(shù)人破防

源溯歷史
2026-01-09 18:47:21
曝濃眉交易已無(wú)法完成!獨(dú)行俠或因禍得福:效仿雷霆馬刺崛起之路

曝濃眉交易已無(wú)法完成!獨(dú)行俠或因禍得福:效仿雷霆馬刺崛起之路

羅說(shuō)NBA
2026-01-10 22:31:22
我教練呢?喀麥隆出局姆伯莫提前回歸曼聯(lián),但主教練已經(jīng)下課

我教練呢?喀麥隆出局姆伯莫提前回歸曼聯(lián),但主教練已經(jīng)下課

懂球帝
2026-01-10 10:14:29
演員向涵之道歉:帶來(lái)了不好的示范,我會(huì)認(rèn)真反省

演員向涵之道歉:帶來(lái)了不好的示范,我會(huì)認(rèn)真反省

魯中晨報(bào)
2026-01-09 18:05:38
敘軍方:恢復(fù)轟炸,重啟戰(zhàn)斗

敘軍方:恢復(fù)轟炸,重啟戰(zhàn)斗

揚(yáng)子晚報(bào)
2026-01-10 23:34:38
2026-01-11 00:44:49
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來(lái)的基礎(chǔ),歡迎來(lái)到這個(gè)星球。
2781文章數(shù) 10425關(guān)注度
往期回顧 全部

藝術(shù)要聞

601米,150億美元!沙特目前第一高樓是它!

頭條要聞

男子帶父母去四川"純玩" 不料消費(fèi)7萬(wàn)連上廁所都收費(fèi)

頭條要聞

男子帶父母去四川"純玩" 不料消費(fèi)7萬(wàn)連上廁所都收費(fèi)

體育要聞

怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

娛樂(lè)要聞

吳速玲曝兒子Joe是戀愛(ài)腦

財(cái)經(jīng)要聞

這不算詐騙嗎?水滴保誘導(dǎo)扣款惹眾怒

科技要聞

必看 | 2026開(kāi)年最頂格的AI對(duì)話(huà)

汽車(chē)要聞

寶馬25年全球銷(xiāo)量246.3萬(wàn)臺(tái) 中國(guó)仍是第一大市場(chǎng)

態(tài)度原創(chuàng)

教育
旅游
親子
時(shí)尚
軍事航空

教育要聞

高考地理中的生物能源

旅游要聞

科幻IP賦能文旅消費(fèi) 劉慈欣科幻漫畫(huà)宇宙主題展在??谌赵聫V場(chǎng)啟幕

親子要聞

方媛曬三個(gè)女兒:大寶趴地上畫(huà)畫(huà)。二寶讀英文書(shū),三胎睡嬰兒車(chē)?yán)?/h3>

伊姐周六熱推:電視劇《小城大事》;電視劇《軋戲》......

軍事要聞

??沼⑿鄹呦枋攀?曾駕駛殲-6打爆美軍機(jī)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版