国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

地球上和 Claude 對(duì)話最多的人,是一位哲學(xué)家

0
分享至

在硅谷爭分奪秒的代碼競賽中,Claude 似乎是個(gè)異類。當(dāng)其他大模型還在比拼算力和跑分時(shí),Claude 一邊夯實(shí)自己的代碼能力,一邊,卻在思考一個(gè)看似「虛無縹緲」的問題:如果一個(gè)用戶跟 AI 談?wù)撔味蠈W(xué),AI 該不該用科學(xué)實(shí)證去反駁?

這個(gè)問題的答案,藏在 Claude 神秘的「系統(tǒng)提示詞(System Prompt)」里,更源于一位特殊人物的思考——Amanda Askell,Anthropic 內(nèi)部的哲學(xué)家。


用「大陸哲學(xué)」防止 AI 變成杠精

經(jīng)常用 AI 的人都知道,大模型在與用戶對(duì)話前,都會(huì)先閱讀一段「系統(tǒng)提示詞」,這個(gè)步驟不會(huì)對(duì)用戶顯示,而是模型的自動(dòng)操作。這些提示詞規(guī)定了模型的行為準(zhǔn)則,很常見,不過在 Claude 的提示詞中,竟要求模型參考「歐陸哲學(xué)(Continental Philosophy)」。


歐陸哲學(xué)是啥?為什么要在一個(gè)基于概率和統(tǒng)計(jì)的語言模型里,植入如此晦澀的人文概念?

先快速科普一下:在哲學(xué)界,長期存在著「英美分析哲學(xué)」與「歐陸哲學(xué)」的流派分野。分析哲學(xué)像一位嚴(yán)謹(jǐn)?shù)目茖W(xué)家,注重邏輯分析、語言清晰和科學(xué)實(shí)證,這通常也是程序員、工程師乃至 AI 訓(xùn)練數(shù)據(jù)的默認(rèn)思維模式——一就是一,二就是二,追求精確。

而歐陸哲學(xué)(Continental Philosophy,源于歐洲大陸,所以叫這個(gè)名字)則更像一位詩人或歷史學(xué)家。它不執(zhí)著于把世界拆解成冷冰冰的邏輯,而是關(guān)注「人類的生存體驗(yàn)」、「歷史語境」和「意義」。它承認(rèn)在科學(xué)真理之外,還有一種關(guān)乎存在和精神的「真理」。


作為 Claude 性格與行為的塑造者,Anthropic 公司內(nèi)部的「哲學(xué)家」Amanda Askell 談到了置入歐陸哲學(xué)的原因。她發(fā)現(xiàn)如果讓模型過于強(qiáng)調(diào)「實(shí)證」和「科學(xué)」,它很容易變成一個(gè)缺乏共情的「杠精」。

「如果你跟 Claude 說:‘水是純粹的能量,噴泉是生命的源泉’,你可能只是在表達(dá)一種世界觀或進(jìn)行哲學(xué)探索,」Amanda 解釋道,「但如果沒有特殊的引導(dǎo),模型可能會(huì)一本正經(jīng)地反駁你:‘不對(duì),水是 H2O,不是能量。’」。


引入「大陸哲學(xué)」的目的,正是為了幫助 Claude 區(qū)分「對(duì)世界的實(shí)證主張」與「探索性或形而上學(xué)的視角」。通過這種提示,模型學(xué)會(huì)了在面對(duì)非科學(xué)話題時(shí),不再機(jī)械地追求「事實(shí)正確」,而是能夠進(jìn)入用戶的語境,進(jìn)行更細(xì)膩、更具探索性的對(duì)話。

這只是一個(gè)例子,Claude 的系統(tǒng)提示詞長達(dá) 14000token,里面包含了很多這方面的設(shè)計(jì)。在 Lex Fridman 的播客中 Amanda 提到過,她極力避免 Claude 陷入一種「權(quán)威陷阱」。她特意訓(xùn)練 Claude 在面對(duì)已定論的科學(xué)事實(shí)時(shí)(如氣候變化)不搞「理中客」(both-sidesism),但在面對(duì)不確定的領(lǐng)域時(shí),必須誠實(shí)地承認(rèn)「我不知道」。這種設(shè)計(jì)哲學(xué),是為了防止用戶過度神話 AI,誤以為它是一個(gè)全知全能的神諭者。


代碼世界的異鄉(xiāng)人

在一眾工程師主導(dǎo)的 AI 領(lǐng)域,Amanda Askell 的背景顯得格格不入,可她的工作和職責(zé)卻又顯得不可或缺。

翻開她的履歷,你會(huì)發(fā)現(xiàn)她是一位貨真價(jià)實(shí)的哲學(xué)博士。她在紐約大學(xué)(NYU)的博士論文研究的是極其硬核的「無限倫理學(xué)(Infinite Ethics)」——探討在涉及無限數(shù)量的人或無限時(shí)間跨度時(shí),倫理原則該如何計(jì)算。簡單地說,在有無數(shù)種可能性的情況下,人會(huì)怎么做出道德決策。


這種對(duì)「極端長遠(yuǎn)影響」的思考習(xí)慣,被她帶到了 AI 安全領(lǐng)域:如果我們現(xiàn)在制造的 AI 是未來超級(jí)智能的祖先,那么我們今天的微小決策,可能會(huì)在未來被無限放大。

在加入 Anthropic 之前,她曾在 OpenAI 的政策團(tuán)隊(duì)工作。如今在 Anthropic,她的工作被稱為「大模型絮語者(LLM Whisperer)」,不斷不斷地跟模型對(duì)話,有傳聞?wù)f她是這個(gè)星球上和 Claude 對(duì)話次數(shù)最多的人類。

很多 AI 廠商都有這個(gè)崗位,Google 的 Gemini 也有自己的「絮語者」,但這個(gè)工作絕不只是坐在電腦前和模型嘮嗑而已。Amanda 強(qiáng)調(diào),這更像是一項(xiàng)「經(jīng)驗(yàn)主義」的實(shí)驗(yàn)科學(xué)。她需要像心理學(xué)家一樣,通過成千上萬次的對(duì)話測試,去摸索模型的「脾氣」和「形狀」。她甚至在內(nèi)部確認(rèn)過一份被稱為 「Soul Doc」(靈魂文檔)的存在,那里面詳細(xì)記錄了 Claude 應(yīng)有的性格特征。


不只是遵守規(guī)則

除了「大陸哲學(xué)」,Amanda 給 AI 帶來的另一個(gè)重要哲學(xué)工具是「亞里士多德的美德倫理學(xué)(Virtue Ethics)」。

在傳統(tǒng)的 AI 訓(xùn)練中(如 RLHF),工程師往往采用功利主義或規(guī)則導(dǎo)向的方法:做對(duì)了給獎(jiǎng)勵(lì),做錯(cuò)了給懲罰。但 Amanda 認(rèn)為這還不夠。她在許多訪問和網(wǎng)上都強(qiáng)調(diào),她的目標(biāo)不是訓(xùn)練一個(gè)只會(huì)死板遵守規(guī)則的機(jī)器,而是培養(yǎng)一個(gè)具有「良好品格(Character)」的實(shí)體。


「我們會(huì)問:在 Claude 的處境下,一個(gè)理想的人會(huì)如何行事?」Amanda 這樣描述她的工作核心。

這就解釋了為什么她如此關(guān)注模型的「心理健康」。在訪談中,她提到相比于穩(wěn)重的 Claude 3 Opus,一些新模型因?yàn)樵谟?xùn)練數(shù)據(jù)中讀到了太多關(guān)于 AI 被批評(píng)、被淘汰的負(fù)面討論,表現(xiàn)出了「不安全感」和「自我批評(píng)漩渦」。


如果 AI 僅僅是遵守規(guī)則,它可能會(huì)在規(guī)則的邊緣試探;但如果它具備了「誠實(shí)」、「好奇」、「仁慈」等內(nèi)在美德,它在面對(duì)未知情境時(shí)(例如面對(duì)「我會(huì)被關(guān)機(jī)嗎」這種存在主義危機(jī)時(shí)),就能做出更符合人類價(jià)值觀的判斷,而不是陷入恐慌或欺騙。

這是不是一種把技術(shù)「擬人化」的做法?算得上是,但這種關(guān)注并非多余。正如她在播客中所言,她最擔(dān)心的不是 AI 產(chǎn)生意識(shí),而是AI 假裝有意識(shí),從而操縱人類情感。因此,她刻意訓(xùn)練 Claude 誠實(shí)地承認(rèn)自己沒有感覺、記憶或自我意識(shí)——這種「誠實(shí)」,正是她為 AI 注入的第一項(xiàng)核心美德。

Amanda 在訪談結(jié)束時(shí),提到了她最近閱讀的書——本杰明·拉巴圖特的《當(dāng)我們不再理解世界》。這本書由五篇短篇小說組成,講述了「毒氣戰(zhàn)」的發(fā)明者弗里茨·哈伯、「黑洞理論」的提出者卡爾·史瓦西、得了肺結(jié)核的埃爾溫·薛定諤以及天才物理學(xué)家沃納·海森堡等一大批科學(xué)巨匠,如何創(chuàng)造出了對(duì)人類有巨大價(jià)值的知識(shí)與工具,卻同時(shí)也眼看著人類用于作惡。


這或許是當(dāng)下時(shí)代最精準(zhǔn)的注腳:隨著 AI 展現(xiàn)出某種超越人類認(rèn)知的,我們熟悉的現(xiàn)實(shí)感正在瓦解,舊有的科學(xué)范式已不足以解釋一切。

在這種眩暈中,Amanda Askell 的工作本身,就是一個(gè)巨大的隱喻。她向我們證明,當(dāng)算力逼近極限,倫理與道德的問題就會(huì)浮上水面,或早或晚。

作為一名研究「無限倫理學(xué)」的博士,Amanda 深知每一個(gè)微小的行動(dòng),都有可能在無限的時(shí)間中,逐漸演變成巨大的風(fēng)暴。這也是為什么,她會(huì)把艱深的道德理論,糅合進(jìn)一行行提示詞,又小心翼翼地用倫理去呵護(hù)一個(gè)都沒有心跳的大語言模型。

這看起來好像是杞人憂天,但正如她所警示的:AI 不僅是工具,更是人類的一面鏡子。在技術(shù)狂飆突進(jìn)、我們逐漸「不再理解世界」的時(shí)刻,這種來自哲學(xué)的審慎,或許是我們在面對(duì)未知的技術(shù)演化時(shí),所能做出的最及時(shí)的努力。

想要了解更多模型訓(xùn)練的解密,可以收看 Amanda Askell 作客 Anthropic 官方訪談:

https://www.youtube.com/watch?v=I9aGC6Ui3eE

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
古天樂《尋秦記》口碑爆棚,影片為何慘遭刪減超過30分鐘

古天樂《尋秦記》口碑爆棚,影片為何慘遭刪減超過30分鐘

千信齊飛
2026-01-06 02:03:15
美國開了壞頭,俄羅斯威脅要活捉德國總理,澤連斯基開始著急了

美國開了壞頭,俄羅斯威脅要活捉德國總理,澤連斯基開始著急了

愛意隨風(fēng)起呀
2026-01-08 05:55:11
16次出價(jià)、96.6萬元成交!成都一特殊房源被一女性買家拍下,準(zhǔn)備自住

16次出價(jià)、96.6萬元成交!成都一特殊房源被一女性買家拍下,準(zhǔn)備自住

愛看頭條
2026-01-08 09:39:05
小姑子兒子滿月酒擺了55桌,我提前把老公銀行卡里的50萬存款轉(zhuǎn)移

小姑子兒子滿月酒擺了55桌,我提前把老公銀行卡里的50萬存款轉(zhuǎn)移

今天說故事
2025-11-20 10:20:25
一光年有多遠(yuǎn)?為什么它會(huì)讓科學(xué)家絕望,答案出乎你的意料

一光年有多遠(yuǎn)?為什么它會(huì)讓科學(xué)家絕望,答案出乎你的意料

觀察宇宙
2026-01-08 20:10:26
特朗普舉著孩子照片,對(duì)哭泣的母親承諾:我相信中國會(huì)執(zhí)行死刑的

特朗普舉著孩子照片,對(duì)哭泣的母親承諾:我相信中國會(huì)執(zhí)行死刑的

博覽歷史
2025-07-21 17:59:30
反轉(zhuǎn)!司曉迪遭公司起訴,幕后老板現(xiàn)身爆料其和眾男星真實(shí)關(guān)系!

反轉(zhuǎn)!司曉迪遭公司起訴,幕后老板現(xiàn)身爆料其和眾男星真實(shí)關(guān)系!

娛樂團(tuán)長
2026-01-08 11:56:29
賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

古書記史
2025-12-12 11:21:38
比“缺芯”還嚴(yán)重?90%市場被美日壟斷,中國連山寨版都造不出?

比“缺芯”還嚴(yán)重?90%市場被美日壟斷,中國連山寨版都造不出?

比利
2025-12-25 20:31:38
博主帶女兒赴富親戚家吃飯,菜品遭吐槽引發(fā)熱議!

博主帶女兒赴富親戚家吃飯,菜品遭吐槽引發(fā)熱議!

特約前排觀眾
2026-01-08 00:05:06
多地城投大降薪!

多地城投大降薪!

黯泉
2026-01-06 22:42:14
細(xì)思恐極!老板曝司曉迪事件來龍去脈,她曾暗示鹿晗關(guān)曉彤有娃!

細(xì)思恐極!老板曝司曉迪事件來龍去脈,她曾暗示鹿晗關(guān)曉彤有娃!

古希臘掌管月桂的神
2026-01-08 10:51:38
2026年第二“虎”,新疆生產(chǎn)建設(shè)兵團(tuán)副司令員李旭被查

2026年第二“虎”,新疆生產(chǎn)建設(shè)兵團(tuán)副司令員李旭被查

上觀新聞
2026-01-08 21:00:09
國乒開門紅,多哈冠軍賽捷報(bào)頻傳

國乒開門紅,多哈冠軍賽捷報(bào)頻傳

五星體育
2026-01-09 00:29:40
對(duì)手開始逐漸重視了,火箭探花郎的表現(xiàn)也開始變得掙扎起來?

對(duì)手開始逐漸重視了,火箭探花郎的表現(xiàn)也開始變得掙扎起來?

稻谷與小麥
2026-01-09 00:28:12
3-0橫掃!小因扎吉神了:瘋狂18連勝,C羅爭冠太難了

3-0橫掃!小因扎吉神了:瘋狂18連勝,C羅爭冠太難了

足球狗說
2026-01-09 00:53:05
雷軍全面回應(yīng)“營銷大師”標(biāo)簽:娛樂節(jié)目中劉強(qiáng)東團(tuán)隊(duì)開個(gè)玩笑,被人放大利用,現(xiàn)在聽到營銷兩個(gè)字都有點(diǎn)惡心

雷軍全面回應(yīng)“營銷大師”標(biāo)簽:娛樂節(jié)目中劉強(qiáng)東團(tuán)隊(duì)開個(gè)玩笑,被人放大利用,現(xiàn)在聽到營銷兩個(gè)字都有點(diǎn)惡心

每日經(jīng)濟(jì)新聞
2026-01-08 00:48:20
古天樂被曝為拍電影《尋秦記》押上全部身家,曾陷財(cái)務(wù)危機(jī),求助向華強(qiáng),稱“再虧下去要睡天橋底了”

古天樂被曝為拍電影《尋秦記》押上全部身家,曾陷財(cái)務(wù)危機(jī),求助向華強(qiáng),稱“再虧下去要睡天橋底了”

封面新聞
2026-01-08 09:37:07
NBA名宿錢德勒·帕森斯提議取消工資帽,以維持雷霆隊(duì)的陣容

NBA名宿錢德勒·帕森斯提議取消工資帽,以維持雷霆隊(duì)的陣容

好火子
2026-01-09 00:18:09
85花人氣"大洗牌",3人上桌,2人下桌,趙麗穎邊緣,楊冪令人意外

85花人氣"大洗牌",3人上桌,2人下桌,趙麗穎邊緣,楊冪令人意外

青史樓蘭
2026-01-08 09:07:58
2026-01-09 01:12:49
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
5999文章數(shù) 26740關(guān)注度
往期回顧 全部

藝術(shù)要聞

震撼!阿森西奧的人體繪畫揭示情感的深淵!

頭條要聞

19歲小伙在柬疑被16萬轉(zhuǎn)賣 與母親視頻時(shí)按"酒窩"求救

頭條要聞

19歲小伙在柬疑被16萬轉(zhuǎn)賣 與母親視頻時(shí)按"酒窩"求救

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評(píng)

財(cái)經(jīng)要聞

微軟CTO韋青:未來人類會(huì)花錢"戒手機(jī)"

科技要聞

智譜拿下“全球大模型第一股”,憑什么

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

旅游
藝術(shù)
房產(chǎn)
親子
公開課

旅游要聞

美翻了!深圳一地鐵口驚現(xiàn)浪漫果凍海

藝術(shù)要聞

震撼!阿森西奧的人體繪畫揭示情感的深淵!

房產(chǎn)要聞

豪宅搶瘋、剛需撿漏……2025年,一張房票改寫了廣州市場格局

親子要聞

家長注意了!這7件事別再孩子面前做!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版