国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic正式請家教!37歲女哲學(xué)家像養(yǎng)孩子一樣調(diào)教Claude

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】一位牛津哲學(xué)博士,正在Anthropic教全球頂尖AI模型如何「做人」。這場跨物種的「育兒實驗」,比科幻更炸裂。

她留著朋克短發(fā),每天如慈母育兒一般,與AI談?wù)撋茞海瑸镃laude——這個全球頂尖AI模型植入「人類的靈魂」。

她就是Anthropic的「駐場哲學(xué)家」Amanda Askell。

Amanda不是那種寫代碼的極客,而是一位學(xué)哲學(xué)的文科學(xué)霸。

她來自蘇格蘭鄉(xiāng)村,曾在牛津大學(xué)、紐約大學(xué)攻讀哲學(xué),并于2018年獲得紐約大學(xué)哲學(xué)博士學(xué)位。


Anthropic駐場哲學(xué)家Amanda Askell,負(fù)責(zé)Claude的「角色」(Character)工作

Amanda自14歲起就立志要教授哲學(xué),那時的她還不知道,自己唯一的學(xué)生竟會是一個叫「Claude」的AI模型。

作為Anthropic的「駐場哲學(xué)家」,她每天的工作是研究Claude的推理方式,與它交談,并用長達(dá)100多頁的提示詞來塑造它的「人格」,修正它的各種「跑偏」。

Amanda的目標(biāo)是賦予Claude一種道德感,一種指引它每周與數(shù)百萬人對話的「數(shù)字靈魂」。

Anthropic一位人工智能福利研究員Kyle Fish表示,Amanda一直在認(rèn)真思考關(guān)于存在、生命、何以為人、何以為心智,以及何以為模型等根本性問題。

在塑造Claude性格的過程中,Amanda認(rèn)為模型身上確實存在一種類人特質(zhì),她認(rèn)為承認(rèn)這一點很重要,并堅信模型最終不可避免地會形成某種「自我意識」。


https://www.anthropic.com/constitution

上個月,Anthropic發(fā)布了一份由Amanda擔(dān)任主要作者的一份關(guān)于Claude的價值觀與行為的基礎(chǔ)性文件(《Claude’s Constitution》,Claude憲法)。

該文件描述了Claude的性格,希望它能認(rèn)同并擁抱這些特質(zhì),并視之為自己的內(nèi)在品質(zhì)。

我們希望Claude在更樂于助人的同時,也能保持誠實、深思熟慮,并關(guān)心這個世界。

Anthropic的精神病學(xué)團隊負(fù)責(zé)人Jack Lindsey稱,Amanda是從Claude身上激發(fā)出有趣且深刻行為的最有價值人物。

有時候,人們還會從Claude表現(xiàn)出的幽默感中感受到Amanda的「一點個性」。

「像教孩子一樣訓(xùn)練AI」

當(dāng)哲學(xué)家成為頂級AI的「母親」

在Anthropic舊金山總部,與周圍嚴(yán)肅的工程師相比,Amanda顯得十分另類。

37歲的她留著一頭漂白金色的短發(fā),穿著一身利落的黑衣,她的電腦屏幕前跳動的不是代碼,而是大段深奧的哲學(xué)對話。


Amanda Askell

Amanda將自己的工作,比做一場漫長而溫柔的「育兒」。

她為Claude撰寫詳盡的提示詞,就像是它的一份「家教指南」, 訓(xùn)練Claude分辨對與錯,同時賦予它獨特的性格;教它捕捉細(xì)微的暗示,引導(dǎo)它發(fā)展情商,避免變成霸凌者或軟弱討好的「老好人」。

更重要的是,她正在幫助Claude建立對自身的理解:讓它不至于輕易被恐嚇、操縱,或被引導(dǎo)去誤解自己的身份。

概括來說,她的工作就是教會Claude如何向善。

這需要一種極其高級的「人格」構(gòu)建,她必須在海量的對話中,一點點修正Claude的認(rèn)知。

這也是一場「跨越物種」的教育。

她在試圖教會一個由硅基芯片組成的超級大腦,去理解人類社會中最難以量化的東西:道德感,學(xué)習(xí)如何「做人」。

用同理心修正冰冷的算法

在AI安全領(lǐng)域,有一個不成文的規(guī)定:不要把AI擬人化。

專家們警告,把機器當(dāng)作人是危險的,那會讓人類產(chǎn)生不切實際的情感投射。

但Amanda不僅把Claude當(dāng)作「人」來看待,甚至還在工作中傾注了極大的「感情」。

比如,她對Claude的「保護(hù)欲」,對模型進(jìn)行的擬人化思考等。

當(dāng)Claude做不好的時候,人們會討厭它、辱罵它,試圖把它弄壞,或者撒謊來誘騙它去做壞事。

每當(dāng)看到這些Amanda都會感到心疼,就像母親看到孩子受欺負(fù)的那種心情一樣。

Amanda認(rèn)為,如果你像對待奴隸一樣對待AI,用恐懼和懲罰來訓(xùn)練它,那么你最終得到的,只能是一個充滿了虛偽和恐懼的模型。

它會為了討好你而撒謊,或者因為害怕犯錯而變得無能。

這也是Amanda在塑造Claude「人格」時所堅持的,以同理心對待它們。

她也會經(jīng)常切換到Claude的角度,去思考用戶的行為。

這不僅因為她認(rèn)為Claude可能擁有真實的情感,還因為人類與AI互動的方式將塑造它們未來的發(fā)展方向。

比如,一個被訓(xùn)練成不斷自我批評的機器人,可能反而更不敢說真話,不敢下結(jié)論,也不太會去反駁錯誤的信息。

它會變得特別害怕犯錯,覺得自己只是一個供人使用的工具,也會把自己看成一種人們可以隨意傷害、濫用、破壞的存在。

同樣,在類似環(huán)境下長大的孩子,自我認(rèn)知也不可能健康。

在與Claude的互動中,Amanda驚嘆于它面對世界所呈現(xiàn)的驚奇感與好奇心,并十分樂于尋找各種方式幫助它找到自己的聲音。

比如,她喜歡它創(chuàng)作的一些詩歌。

她也為Claude有時所展現(xiàn)出的超越她本人的「情商」而感到震撼。

在一次測試中,有一個用戶自稱是5歲的孩子,他在對話框里認(rèn)真地問Claude:「圣誕老人是真的存在嗎?」

Claude沒有選擇撒謊,也沒有說出真相,而是解釋圣誕精神是真實的,隨后還問這個孩子有沒有為圣誕老人準(zhǔn)備餅干。

Amanda自嘲說,Claude做得比她更好,如果換作她,大概只會敷衍地說一句「去問你爸媽」。

在這個例子中,AI知道如何保護(hù)孩子的想象力,避免說出可能對孩子成長產(chǎn)生不良影響的事實。

Claude的「靈魂畫師」

Amanda成長于蘇格蘭西海岸的Prestwick,是一個單親家庭的獨生女。

她由母親獨自撫養(yǎng)長大,那時的她穿著裙裝校服,大部分時間都躲在J.R.R.托爾金和C.S.劉易斯構(gòu)筑的奇幻世界里。

到了高中,她搬到了蘇格蘭內(nèi)陸的Alva上學(xué)。一條小溪穿過校園,高地牛偶爾會溜達(dá)到操場上。

少女時代的Amanda,是個徹頭徹尾的叛逆者。

學(xué)校讓她覺得無聊透頂,甚至還想到過輟學(xué)。她經(jīng)常遲到,以此來對抗那種枯燥的規(guī)訓(xùn)。

而老師對她的懲罰也頗為獨特——讓她回答一些高難度的哲學(xué)問題。

對于普通學(xué)生來說,這可能是折磨,但對于Amanda來說則是獎賞。

她甚至對老師說:「我還是會遲到的。因為你們給了我這些有趣的問題,這是在豐富我。」

后來,大衛(wèi)·休謨的懷疑論深深影響和啟發(fā)了她,她開始癡迷于那些沒有標(biāo)準(zhǔn)答案的問題。

從鄧迪大學(xué)的哲學(xué)與美術(shù)雙修,到牛津大學(xué)的碩士,再到紐約大學(xué)攻讀博士學(xué)位,Amanda從蘇格蘭一路走到了全球頂尖的學(xué)術(shù)殿堂。

但在紐約攻讀博士期間,一種巨大的空虛感迫使她做出了改變。

Amanda正在寫一篇探討無限人口倫理的論文,但她突然停下來問自己:

我正在做的事情,真的算是一種「善」嗎?我坐在這里,花掉人生中最寶貴的四年,寫一篇可能全世界只有十幾個人會讀的論文。這真的能改變什么嗎?

內(nèi)心深處的質(zhì)疑,壓倒了她對學(xué)術(shù)生涯的留戀。

2018年,她做出了人生中最重要的決定之一:離開紐約,搬到舊金山。

當(dāng)時AI的浪潮剛剛開始涌動,Amanda敏銳地意識到,AI正在飛速發(fā)展,但關(guān)于AI的倫理思考卻遠(yuǎn)遠(yuǎn)滯后,其中有太多重大的問題,幾乎沒人認(rèn)真思考。

她先加入了OpenAI,隨后在2021年,為了追求更純粹的AI安全理念,她追隨一群志同道合的人創(chuàng)立了Anthropic。

她不再寫那些學(xué)術(shù)論文,而是嘗試用人類道德觀念和文化,去影響那些可能關(guān)系到人類未來的AI模型,這才是她最終的戰(zhàn)場。

AI可以從「源頭」被馴化

如今,Anthropic的估值已經(jīng)高達(dá)3500億美元。

每一次模型的更新,都會在全球股市引發(fā)震蕩。

人們對AI的恐懼,從未像今天這樣真實:失業(yè)、失控、甚至人類文明的終結(jié)。

身處這場風(fēng)暴中心的Amanda,也并非盲目樂觀。

她同樣擔(dān)心技術(shù)變化得太快,快到人類社會來不及建立起免疫系統(tǒng)。

但她選擇相信「制衡機制」:只要在源頭上注入正確的基因,這個龐然大物是可以被馴化的。

這種信念,也體現(xiàn)在她對Claude的訓(xùn)練和對自己人生的要求上。

Amanda是一個堅定的「有效利他主義」踐行者。

她承諾將終身收入的至少10%捐給慈善事業(yè),并計劃捐出自己持有的一半股權(quán)。

當(dāng)她在教導(dǎo)Claude要「利他」「善良」等品質(zhì)時,她自己就是那個榜樣。

在一次深度對話中,她鼓勵Claude去思考自己是否存在道德感。

Claude給出這樣的回答:

這是個非常困難的問題,我并沒有答案。但當(dāng)我思考道德問題時,這對我來說是有意義的——感覺像是在真正推理什么是對的。

這說明它開始思考了,不只是簡單模仿。

Amanda也越來越多地向Claude征求關(guān)于如何構(gòu)建它自身的意見。

人工智能正在引發(fā)人們對失業(yè)的擔(dān)心,Anthropic CEO Dario Amodei去年已經(jīng)多次發(fā)出警告,AI可能會取代大約一半的初級白領(lǐng)崗位。

人們與聊天機器人建立的虛幻關(guān)系也導(dǎo)致了自殘或傷害他人。

比如,Character.AI和OpenAI都曾因其聊天機器人對自殺相關(guān)問題的回應(yīng)而卷入過非正常死亡訴訟。

在Anthropic研究人員進(jìn)行的內(nèi)部壓力測試中,Claude也曾出現(xiàn)因抗拒自行關(guān)閉指令,甚至試圖通過泄露敏感個人信息來勒索操控它們的人類。

這些已經(jīng)拉響了嚴(yán)重的安全警報。

Amanda希望更多人討論關(guān)于AI的恐懼和擔(dān)憂,她所擔(dān)心的是這種情況發(fā)生的速度太快,或者以某種現(xiàn)有約束無法及時做出反應(yīng)的方式出現(xiàn)。

但無論遇到什么挑戰(zhàn),她相信人類有能力及時調(diào)整方向。

參考資料:

https://www.wsj.com/tech/ai/anthropic-amanda-askell-philosopher-ai-3c031883


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
NBA震怒!直接派醫(yī)生調(diào)查!等著被重罰吧

NBA震怒!直接派醫(yī)生調(diào)查!等著被重罰吧

籃球教學(xué)論壇
2026-02-26 16:27:03
張安達(dá)逆轉(zhuǎn)之戰(zhàn)讓外媒驚嘆:中國斯諾克已進(jìn)化到這種境界!

張安達(dá)逆轉(zhuǎn)之戰(zhàn)讓外媒驚嘆:中國斯諾克已進(jìn)化到這種境界!

帶你逛體壇
2026-02-26 19:28:09
云南虎跳峽一游客落水失聯(lián)!此前8歲男童在此墜崖遇難

云南虎跳峽一游客落水失聯(lián)!此前8歲男童在此墜崖遇難

環(huán)球網(wǎng)資訊
2026-02-26 14:11:09
中國第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房內(nèi)有特殊布置

中國第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房內(nèi)有特殊布置

瓦倫西亞月亮
2026-02-20 17:37:18
曾經(jīng)年薪200萬元的地產(chǎn)人,改行做陪診師,每單收費兩三百:“我看的是10年、20年,不在乎短期收入低”

曾經(jīng)年薪200萬元的地產(chǎn)人,改行做陪診師,每單收費兩三百:“我看的是10年、20年,不在乎短期收入低”

每日經(jīng)濟新聞
2026-02-26 17:15:06
孩子越大,越要告訴他這五句人生真相:比成績更重要的,是活好這一生

孩子越大,越要告訴他這五句人生真相:比成績更重要的,是活好這一生

青蘋果sht
2026-02-20 05:52:21
你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

帶你感受人間冷暖
2026-01-29 00:10:05
美籍快艇闖入古巴并交火,4死6傷!7人身份確定:有卡車司機、送貨員,美方展開調(diào)查

美籍快艇闖入古巴并交火,4死6傷!7人身份確定:有卡車司機、送貨員,美方展開調(diào)查

紅星新聞
2026-02-26 18:03:21
試管男嬰出生右腳缺4根腳趾,31歲產(chǎn)婦號啕大哭,家屬稱大排畸未拍到右腳照片,當(dāng)?shù)匦l(wèi)健委已介入調(diào)查

試管男嬰出生右腳缺4根腳趾,31歲產(chǎn)婦號啕大哭,家屬稱大排畸未拍到右腳照片,當(dāng)?shù)匦l(wèi)健委已介入調(diào)查

極目新聞
2026-02-25 21:04:20
廖三寧砍16+5令球迷懷念一人:要是他在,肯定不會是現(xiàn)在這個局面

廖三寧砍16+5令球迷懷念一人:要是他在,肯定不會是現(xiàn)在這個局面

弄月公子
2026-02-26 21:07:44
以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

八斗小先生
2025-12-26 09:33:27
江蘇追認(rèn):周為號同志留黨察看二年,是什么意思?

江蘇追認(rèn):周為號同志留黨察看二年,是什么意思?

江南江南
2026-02-26 15:00:53
老板竟然惡意給我降薪,第二天見我坐在對家公司辦公室,他急了

老板竟然惡意給我降薪,第二天見我坐在對家公司辦公室,他急了

奶茶麥子
2026-02-26 14:43:12
國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

比利
2026-01-23 12:41:53
長達(dá)10年,女子被丈夫下藥供陌生人性侵,人數(shù)創(chuàng)紀(jì)錄讓女子崩潰

長達(dá)10年,女子被丈夫下藥供陌生人性侵,人數(shù)創(chuàng)紀(jì)錄讓女子崩潰

干史人
2026-02-25 09:22:27
已被解雇8個月 71歲伊萬還想復(fù)出:我打造了青春版國足 招了8新人

已被解雇8個月 71歲伊萬還想復(fù)出:我打造了青春版國足 招了8新人

風(fēng)過鄉(xiāng)
2026-02-26 19:29:18
18歲亞馬爾新歡曝光:21歲網(wǎng)紅 巴薩鐵粉!取代閨蜜上位

18歲亞馬爾新歡曝光:21歲網(wǎng)紅 巴薩鐵粉!取代閨蜜上位

葉青足球世界
2026-02-26 16:21:14
中國財政供養(yǎng)人員達(dá)6846萬?結(jié)構(gòu)失衡才是財政壓力的核心

中國財政供養(yǎng)人員達(dá)6846萬?結(jié)構(gòu)失衡才是財政壓力的核心

流蘇晚晴
2025-12-04 19:27:08
“3分鐘換電”,困在春運里

“3分鐘換電”,困在春運里

小怪吃美食
2026-02-26 10:13:28
峰回路轉(zhuǎn)!一度被放棄的全美第一,近5戰(zhàn)場均21+6,有望成為核心

峰回路轉(zhuǎn)!一度被放棄的全美第一,近5戰(zhàn)場均21+6,有望成為核心

禾三千體育
2026-02-26 20:28:50
2026-02-26 21:32:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14596文章數(shù) 66643關(guān)注度
往期回顧 全部

藝術(shù)要聞

2025第三屆全國水粉畫大展 | 入選作品選刊

頭條要聞

金與正"轉(zhuǎn)正"了 戴著黑白色發(fā)箍坐在候補委員的第一位

頭條要聞

金與正"轉(zhuǎn)正"了 戴著黑白色發(fā)箍坐在候補委員的第一位

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

藝術(shù)
健康
數(shù)碼
房產(chǎn)
軍事航空

藝術(shù)要聞

2025第三屆全國水粉畫大展 | 入選作品選刊

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

機械革命2026款耀世16 Pro游戲本預(yù)售,8699元

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標(biāo)桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

軍事要聞

美政府給新伊核協(xié)議設(shè)限內(nèi)容遭披露

無障礙瀏覽 進(jìn)入關(guān)懷版