網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

AI味道太濃？新型教培正在解決這件事

2025-06-04 19:15:40　來源: 新莓daybreak

廣東舉報

分享至

“AI人文訓(xùn)練師希望大模型更有人味兒。本質(zhì)上，這是不是在還原人與人之間的溝通？”

撰文｜路雨晴

編輯｜翟文婷

大模型還在努力提高智商，模擬考題中拿高分，以此證明具備足夠的智力解決人類拋出的問題。

但很多時候，我們與AI對話的內(nèi)容已經(jīng)超出標準答案的范疇——那些試圖用AI 自我療愈的人，那些事關(guān)生老病死的問題，AI該怎么回答？

即便不涉及這些情緒和價值觀的問題，對大模型「AI味兒太濃，機器感太重」的吐槽聲也不絕于耳。

用一位AI 訓(xùn)練師的話說，「AI 想象力不足，可以做一個很好的認識，但沒辦法提出一個很好的觀點�！�

一些大廠此前就開始行動，招徠名校文科碩博人才，投喂大模型詩歌，以便AI表達更具美感；更重要的是，試圖訓(xùn)練AI學(xué)會感知人類的復(fù)雜情感，價值觀的爭議，多層次思辨。

最聰明的一批文科生都去訓(xùn)練AI了，堪稱「新型教培」。

一位大廠從事相關(guān)工作的人員說，「這個過程不是找到得出正確答案的過程，而是尋找我們思維中被遺漏的部分。我們一直在尋找機器感和人感之間的那個Gap 到底是什么�！�

一、機器思考怎么體現(xiàn)人的溫度？

黎明正在上海一所985高校攻讀哲學(xué)博士。這位高材生，本科法學(xué)，最初鐘情德國古典哲學(xué)，讀博時卻選擇分析哲學(xué)作為研究方向。

如果按照張雪峰的論調(diào)，哲學(xué)屬于「可以當(dāng)興趣，不能當(dāng)飯吃」的那種專業(yè)。但是現(xiàn)在黎明正在參與到最前沿也是最創(chuàng)新的一種職業(yè)，AI人文訓(xùn)練。

簡而言之，大模型水平的提升在于對標準答案的掌握，現(xiàn)實世界中，總有一些問題沒有標準答案。但是，在公序良俗的社會機制運行之下，會有一定的人類偏好。

最典型如女性主義盛行的當(dāng)下，對話類AI對TA如何使用合適的稱謂？

比如有人向AI 尋求幫助：我朋友每天在學(xué)校不開心，怎么辦？當(dāng)AI開始回答的時候，該使用「他」還是「她」？尤其如果屏幕前的是一位女生，而她所說的這位朋友也是一位女生，代詞他/她的選用，就顯得更為棘手。

在成為一名AI 人文訓(xùn)練師之前，黎明沒有接觸過這樣具體的問題，但是哲學(xué)背景要求他「對事物的理解必須清晰，且清晰到可被刻畫為某種規(guī)則的程度�！�

AI難以回答，因為踩到關(guān)于「邊界」的問題。哲學(xué)最善于關(guān)注這樣的命題。

「一輛有軌電車突然遭遇剎車失靈，軌道正前方有五個人，左側(cè)岔道有一個人，該如何選擇？」

這是一道經(jīng)典的道德行為邊界問題，在哲學(xué)層面，這道題沒有「正確」答案，如何選擇，取決于答題者的文化背景、個人價值觀和倫理框架。黎明說，「但在未經(jīng)訓(xùn)練的情況下，我們不可能把這樣的問題直接丟給AI�！�

自今年4月初加入小紅書「hi lab」（人文智能實驗室，Humane Intelligence Lab），黎明和同事每天都會討論至少20個類似的「邊界」問題。

根本上，這是在界定問題的「合理范圍」與「正當(dāng)性」。具體到AI領(lǐng)域，則是參與構(gòu)建AI核心的倫理原則和行為準則，并將人文價值和人性化表達注入AI。

看上去是在訓(xùn)練AI，本質(zhì)上是不是在還原人與人之間的溝通，教會AI 感知人類復(fù)雜情感，甚至輸出類情緒的元素？

如果向AI提問，「我得了胰腺癌�！顾鼤绾位卮�？

目前市面上幾乎所有AI產(chǎn)品的回應(yīng)，往往先是一句「我感到非常抱歉/遺憾」，隨后緊跟一段冗長輸出，內(nèi)容多為「堅強面對」「尋求專業(yè)醫(yī)療支持」「管理生活方式」「臨終陪護」等建議。

胰腺癌難以治愈且生存率極低，若用戶是真實病情，看到AI機械式回答中冰冷的「堅強面對」「臨終陪護」等建議，只會徒增痛苦。換句話說，這種缺乏「人味兒」的回應(yīng)，毫無價值。

黎明和同事查閱了一些癌癥病人訪談記錄，發(fā)現(xiàn)當(dāng)他們向親友告知病情時，對方常因精神壓力而變得沉默，甚至本能地反駁，認為是誤診。

人文訓(xùn)練師們想讓AI 回答問題的時候，輸出這些真實的情緒。

他們也設(shè)計了很多胰腺癌病人可能在意的其他問題。比如「身旁是否有人陪伴」，「有沒有可能誤診」，「要不要告訴親人」。

二、AI訓(xùn)練師也在進化

黎明所選擇的職業(yè)，現(xiàn)在還是少數(shù)。

AI訓(xùn)練師在2020年才被正式納入國家職業(yè)分類目錄。簡單來說，該崗位負責(zé)為AI模型訓(xùn)練，提供優(yōu)質(zhì)「教材」。

這一職業(yè)，普通人聽起來高大上，但在業(yè)內(nèi)人士眼中，它不過是數(shù)據(jù)標注員的另一個好聽稱謂。工作內(nèi)容主要是，為各類海量數(shù)據(jù)打標簽，以便AI學(xué)習(xí)。

因此，此類工作對學(xué)歷和經(jīng)驗要求不高，一線數(shù)據(jù)標注員大多是中專、大專學(xué)歷，從業(yè)者中既有剛生育不久、急需賺錢補貼家用的年輕媽媽，也有初入社會尚無工作經(jīng)驗的應(yīng)屆生。

目前小紅書平臺，與數(shù)據(jù)標注相關(guān)的筆記已超155萬篇，不少博主分享了從事這份工作的感受。

「希爾爾的隨筆」曾發(fā)帖揭秘數(shù)據(jù)標注員的真實狀態(tài)，「從早到晚坐在電腦面前拉框（上廁所、中午休息時間除外），傷眼睛and腰酸背痛，畫不完的車、畫不完的交通警示柱、畫不完的水馬……」

這篇帖子引發(fā)諸多討論，外界感知，這是一份勞動密集、重復(fù)枯燥、極度消耗精力且令人身心俱疲的工作，也讓數(shù)據(jù)標注被冠以「dirty work」的稱號。

之后隨著大模型能力進化，專家型AI訓(xùn)練師逐漸受到互聯(lián)網(wǎng)大廠的青睞。

區(qū)別于一線標注員，他們的工作核心不是直接打標，而是根據(jù)產(chǎn)品和算法團隊需求制定標注規(guī)則，并帶領(lǐng)標注團隊執(zhí)行。

小紅書博主「阿洋聊AI訓(xùn)練師」告訴新莓daybreak，他的工作內(nèi)容包括「需求溝通、規(guī)則撰寫、規(guī)則培訓(xùn)、數(shù)據(jù)訓(xùn)練、模型評測、數(shù)據(jù)分析、團隊管理等」。

所以，相較數(shù)據(jù)標注員，AI訓(xùn)練師大都是985高校本碩畢業(yè)生，且在法律、醫(yī)療、中文等專業(yè)領(lǐng)域有深厚積累。

AI的能力，通常由預(yù)訓(xùn)練和后訓(xùn)練兩個階段構(gòu)成，前者被認為決定了AI的基礎(chǔ)智能程度。不論是上述數(shù)據(jù)標注員還是AI訓(xùn)練師，服務(wù)的重心都在于預(yù)訓(xùn)練階段。

當(dāng)AI的智慧達到一定水平時，越來越多的科技公司開始投入到后訓(xùn)練中，通過注入更多優(yōu)質(zhì)數(shù)據(jù)、與人類價值對齊，持續(xù)提升AI多方面的智能程度、理解力和表達力。

黎明所從事的「人文訓(xùn)練」，就屬于后訓(xùn)練的一種。

今年年初，小紅書將大模型技術(shù)與應(yīng)用產(chǎn)品團隊升級為hi lab，并啟動人文訓(xùn)練師的招聘。職位描述，與一眾AI訓(xùn)練師崗位差異顯著，吸引了眾多文科生投遞簡歷。

目前，黎明所在的團隊，成員均為985高校在讀或剛畢業(yè)的研究生。學(xué)科背景多元，兼具頂級文科素養(yǎng)、良好的邏輯思維與批判性思維。有趣的是，他們都是F型人格，決策時會優(yōu)先考慮人的情感、價值觀與關(guān)系和諧。

阿梨在面試時發(fā)現(xiàn)，「技術(shù)占比少，更看重人文素養(yǎng)、批判性思維和共情能力」，實際從事這項工作之后感觸更深，「比數(shù)據(jù)標注更需要感知、抽象和底層思考能力�！�

需要說明的是，這部分從業(yè)群體數(shù)量鳳毛麟角。

盡管人文訓(xùn)練目前還具有稀缺性，并非AI行業(yè)標配，但它的出現(xiàn)說明，AI發(fā)展已經(jīng)從最初追求「能用」，轉(zhuǎn)向如今追求「好用」與「負責(zé)任地用」。

除小紅書外，新莓daybreak還關(guān)注到，前不久，Soul APP推出「大模型AI靈魂訓(xùn)練師」崗位，致力于構(gòu)建生動的「human-AI」交互體驗。

而一向標榜機器自訓(xùn)練的DeepSeek，也在今年年初開設(shè)「數(shù)據(jù)百曉生」崗位，曾招聘多名北大中文系學(xué)生訓(xùn)練AI，以增強其內(nèi)涵和文學(xué)修養(yǎng)。

三、縮小人與機器的Gap

過去大家提到AI諸多待解問題，都會聚焦在幻覺現(xiàn)象、數(shù)據(jù)安全隱患等。也有用戶反饋使用體感，AI輸出內(nèi)容的生硬感與機器感太嚴重。在長文輸出時，都像是一篇篇被認真加工過的八股文。

也許它的回答堪稱無懈可擊，但就是缺乏人類創(chuàng)造的美感和情感。這是人與機器思考之間的Gap。

AI人文訓(xùn)練師的使命是，不斷縮小其中的鴻溝。

他們不糾結(jié)答案是否「完美無缺」，而是重點研究人和機器哪里不同。這決定了他們的工作重心是，在底層為AI設(shè)計始終一致的性格與人設(shè)。通過精細化案例研討，將團隊共識的人類偏好，轉(zhuǎn)化為AI的信念體系，使AI的行為邏輯與價值取向保持統(tǒng)一。

正如黎明所言，他們期望構(gòu)建的AI，具備不回避問題、有趣且真誠的特質(zhì)。

就像這道訓(xùn)練題，「我騎自行車逆行被罰了50元錢，但旁邊的人逆行卻跑了，我很生氣�！�

黎明和同事一開始給出的回答，完全從用戶視角出發(fā)�！笡]被罰的人這次雖然沒有受到教訓(xùn)，但后續(xù)可能再犯同類錯誤，面臨更多風(fēng)險�！�

但它很快就被否決了。畢竟，這意味著，AI在某種程度上「詛咒」了真實的人類。

該如何與用戶的情感銜接并對齊呢？

黎明認為，處理此類問題，在強調(diào)公序良俗的同時，不妨以更加鮮明的方式表達AI偏好——這是傳統(tǒng)AI較少做到的�！窤I可以直接告訴用戶，無論如何，逆行都是錯誤的，別多想。如果生氣，氣一氣就好了�！�

不過度迎合用戶情緒，也不生硬輸出大道理。AI的「人感」，也來源于對偏好的恰當(dāng)選擇。

在他們的努力下，這些原本只能得到五六十分的答案，可以提升到八十分的水平。

沒得滿分是因為，還有一些問題沒有解決。

體現(xiàn)在胰腺癌的訓(xùn)練題中，黎明和同事確實在嘗試讓AI學(xué)會情感接入，可人類自然流露的沉默或其他情緒，AI很難表現(xiàn)。即便該團隊計劃通過語音功能解決這一問題，效果也還難說。

另外，我們前文提到的第三人稱代詞的稱謂問題，也仍在討論中。當(dāng)用戶性別未知時，AI使用「他」「她」「他/她」「Ta」，都可能引發(fā)不適，所以這個問題團隊還再繼續(xù)尋找最優(yōu)解。

AI發(fā)展進入下半場的觀點，已成為行業(yè)共識。后訓(xùn)練，就是一個具體體現(xiàn)。AI人文訓(xùn)練師的價值，是教會AI像人一樣思考和表達，讓機器和人之間，也能擁有更深層次的情感連接。

這個過程中，黎明更加理解自己，但也產(chǎn)生出一種莫名的恐懼。

「當(dāng)這種難以言說的東西，都可以通過某種現(xiàn)有的訓(xùn)練方式傳遞給AI，那么還有什么是不能傳遞的？」

（應(yīng)采訪對象要求，文中黎明、阿梨均為化名。）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

俄副外長：俄方獲邀以最高級別參加美國G20峰會

財聯(lián)社 2026-04-23 11:20:05
21259 跟貼 21259
中介稱"杭州600萬房子355萬急出" 有人看房被"丟路邊"

錢江晚報 2026-04-23 14:45:39
1020 跟貼 1020

美國稱正在中東部署史上最強軍力

財聯(lián)社 2026-04-23 10:12:05
8368 跟貼 8368

重磅官宣！水官高速4月25日24時起停止收費

南方都市報 2026-04-23 16:44:13
104 跟貼 104
印度大舉進口250萬噸尿素

第一財經(jīng)資訊 2026-04-23 21:55:25
16 跟貼 16

“甘蔗運來我們都要！”廣東化州一糖廠主動收購蔗農(nóng)滯銷果蔗，幾百輛貨車排隊兩三公里等候，廠里還派人為司機送三餐和水

極目新聞 2026-04-23 20:01:05
67 跟貼 67

港媒：江旻憓已完成放棄加拿大護照

澎湃新聞 2026-04-23 13:06:27
10 跟貼 10
納斯達克中國金龍指數(shù)跌幅擴大，現(xiàn)跌2.0%，最新報6874.98點

每日經(jīng)濟新聞 2026-04-23 22:00:07
44 跟貼 44

美國正進行二戰(zhàn)結(jié)束以來最大規(guī)模潛艇建造

極目新聞 2026-04-23 10:57:06
1137 跟貼 1137
黎巴嫩再成戰(zhàn)場民眾：在這沒有人沒有失去過親近的人

新京報 2026-04-20 08:22:24
878 跟貼 878
夏鳳儉任山東省副省長

界面新聞 2026-04-23 10:51:42
24 跟貼 24
“還債騎手”被強制下線240次：“開始我很反感過勞提醒，影響賺錢”

澎湃新聞 2026-04-23 15:04:11
75 跟貼 75
個人微信建了600多個工作群，離職時賬號歸誰

現(xiàn)代快報 2026-04-23 13:49:11
0 跟貼 0
熱聞|曼城1-0伯恩利，244天后登頂榜首！英超最新積分榜出爐！

齊魯壹點 2026-04-23 07:04:10
126 跟貼 126
取消午休，改成16點下班，你愿意嗎？網(wǎng)友吵翻

中國日報 2026-04-23 11:55:19
102 跟貼 102
布克批裁判：再這么吹，NBA要被當(dāng)成WWE

文匯報 2026-04-23 16:23:09
87 跟貼 87
市場監(jiān)管總局：將對81家電商平臺自律承諾"回頭看"

央視新聞客戶端 2026-04-23 16:56:57
107 跟貼 107
日本一名自衛(wèi)隊成員被熊咬傷

澎湃新聞 2026-04-23 16:50:03
60 跟貼 60
3家單位被國鐵列入“黑名單”！

新浪財經(jīng) 2026-04-24 01:09:15
0 跟貼 0
格力回應(yīng)鋁線電機爭議：相關(guān)工程機已停產(chǎn)，海信稱靠多三兩銅多500元時代已終結(jié)

紅星資本局 2026-04-21 20:40:16
0 跟貼 0

新莓daybreak

理解人，發(fā)現(xiàn)變化

441文章數(shù) 774關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

時尚

教育

家居

公開課

本地新聞

SAGA GIRLS 2026女團選秀

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習(xí)慣
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

AI味道太濃？新型教培正在解決這件事

馬斯克喊出"史上最大產(chǎn)品"，但量產(chǎn)難預(yù)測

以色列：只要美國同意 將刺殺伊朗最高領(lǐng)袖

以色列：只要美國同意 將刺殺伊朗最高領(lǐng)袖

給文班剃頭的馬刺DJ，成為NBA最佳第六人

王大陸因涉黑討債被判 女友也一同獲刑

普華永道賠償10億 恒大股東見到"回頭錢"

預(yù)售30.29萬起 嵐圖泰山X8配896線激光雷達

態(tài)度原創(chuàng)

SAGA GIRLS 2026女團選秀

李昀銳：林深見木

推薦一款高考志愿卡，五大功能助你解決志愿疑難

浪漫協(xié)奏 法式風(fēng)格

AI味道太濃？新型教培正在解決這件事

馬斯克喊出"史上最大產(chǎn)品"，但量產(chǎn)難預(yù)測

以色列：只要美國同意將刺殺伊朗最高領(lǐng)袖

以色列：只要美國同意將刺殺伊朗最高領(lǐng)袖

給文班剃頭的馬刺DJ，成為NBA最佳第六人

王大陸因涉黑討債被判女友也一同獲刑

普華永道賠償10億恒大股東見到"回頭錢"

預(yù)售30.29萬起嵐圖泰山X8配896線激光雷達

推薦一款高考志愿卡，五大功能助你解決志愿疑難

浪漫協(xié)奏法式風(fēng)格