国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“數(shù)據(jù)百曉生”的主要任務,就是給AI出題、編寫“理想態(tài)”

0
分享至

“這是個需要高質(zhì)量人文社科人才的崗位,因為只有最善于思考人與世界關系的人類,才能教會AI怎么更好的做一個人?!?/strong>



文 /巴九靈

這篇文章開始之前,先邀請大家猜猜下面這份招聘要求對應的是什么崗位。



揭曉答案:這份看起來要求不低的工作,招聘的是AI數(shù)據(jù)標注員。在BOSS直聘上,這個崗位月薪最高接近兩萬元;部分崗位直接注明“重點大學本碩博優(yōu)先”。

通俗地說,數(shù)據(jù)標注員就是AI的老師,負責對文本、圖像、音頻等原始數(shù)據(jù)進行分類、標記或注釋,從而教會機器識別、理解并學習人類世界的邏輯和知識。

2020年起,“人工智能訓練師”正式被納入國家職業(yè)分類目錄,“數(shù)據(jù)標注員”是其中的重要工種之一。據(jù)國家數(shù)據(jù)局,截至今年9月底,我國7個數(shù)據(jù)標注基地共有標注企業(yè)362家,標注從業(yè)人員達8.5萬人。

但這個行業(yè)仍缺乏人才。量子位智庫2023年底發(fā)布的《中國AIGC數(shù)據(jù)標注產(chǎn)業(yè)全景報告》顯示,未來5年,中國數(shù)據(jù)標注專業(yè)人才缺口或達百萬量級。

那么,數(shù)據(jù)標注到底是一份什么樣的工作?



“985”“QS100”碩博,

給AI當老師

小鵝本科就讀于一所“211”高校,目前在一家“985”高校讀研,學的是歷史學專業(yè)。她曾在大四那年做過一份數(shù)據(jù)標注實習的工作。

她每天的工作,就是面對一張科技公司發(fā)來的、填滿后臺收集的用戶提問和AI生成答案的Excel表格,給AI的答案打分。小鵝處理一條數(shù)據(jù)平均花費的時間是15分鐘左右,少數(shù)棘手的任務,單條就要花上近一個小時。

這份實習不需要面試,招聘方會提供一份打分標準手冊和一套測試題,要求自學手冊內(nèi)容后,在測試題中選5道,完成后上交,正確率超過80%即視為通過。

小鵝當初花了一個下午學習這份標注手冊,又花了2個小時完成5道測試題,才通過了考核。

起初覺得易如反掌的小巴,嘗試了小鵝發(fā)來的兩道題,結(jié)果正確率不足50%。這才發(fā)現(xiàn),這份工作遠比我們想象的困難。

◎ 首先,標注手冊中包含大量術語,理解門檻極高。比如,“缺少富媒體形式”,是指答案中沒有包含短視頻鏈接;“prompt外泄”,是指答案暴露了提問未涉及的內(nèi)部指令;“弱相關內(nèi)容或冗余殘留”,就是答案和提問沒關系。

◎ 其次,打分要求極其繁瑣、嚴格。標注者需要在“0、1、2、3”四個檔位中給3個答案分別打分,并根據(jù)答案在準確性、結(jié)構性、相關性、全面性等方面的缺陷,分別打好標簽,備注原因;然后把三個答案依次排序,逐一解釋理由。



進行數(shù)據(jù)標注的工作人員

對于如何判定分數(shù)和標簽,接近6萬字的標注手冊列舉出了幾十種具體分析場景,這些分析費時費力。比如,判斷是否出現(xiàn)幻覺,需要一一核對參考資料;涉及專業(yè)知識,需要自己查找資料去驗證。

除了打分,另一種常見的標注形式是“出題”,難度更大。剛獲得海外語言類專業(yè)博士學位的小凡,求學時做了長達5年的數(shù)據(jù)標注兼職。她的工作是在一家海外眾包標注平臺上給AI出題并寫出解答,難度達到博士級別。這些文本會被作為訓練語料,喂給AI。

從招聘市場情況看,這份職業(yè)的天花板極高。

今年以來,各家頭部大模型公司開始在招攬專家級標注員上競速。比如,阿里搭建了“曉天睿士”專家社區(qū),學歷要求頭部高校碩士起步,行業(yè)專家級人才最高時薪可達1000元。字節(jié)跳動成立了Xpert兼職眾包標注平臺,需要標注者上傳簡歷、選擇標注的細分專業(yè)領域,并完成難度較高的專業(yè)知識測試。

另一方面,行業(yè)的“入場券”也在快速漲價。

一位負責多家頭部企業(yè)標注人員招聘的HR告訴小巴,近兩年,標注崗位招聘要求不斷提高。

早期招聘要求的學歷水平大多在專科、高中,無需經(jīng)驗、上手就能做。但今年,候選人本科以上學歷的占比超過五成。通用類AI標注開始有經(jīng)驗要求;垂直類一般要求相關專業(yè)或行業(yè)經(jīng)驗,部分崗位需要做專業(yè)筆試。

競爭也逐漸激烈,目前招聘通過率大約是2:1。

持續(xù)吸納高端人才,成為標注行業(yè)肉眼可見的趨勢。



部分公司數(shù)據(jù)標注招聘要求



不算體面的工種

頂尖人才正涌入數(shù)據(jù)標注行業(yè),但身處其中的人們,大多態(tài)度悲觀。

在高強度的標注實習中,小鵝感受到了這個行業(yè)巨大的矛盾。

??其一,缺乏尊嚴。

小鵝最反感的是工作中沒完沒了的扯皮。文字判斷有巨大的主觀模糊空間,作為乙方的標注員與作為甲方的質(zhì)檢員經(jīng)常會發(fā)生爭執(zhí)。比如,甲方認為A答案的邏輯性更強,而乙方認為B答案更完善。

在這些爭論中,她感到標注員角色的巨大矛盾性:雖然承擔著AI工程里超過60%的工作量,但他們在這個系統(tǒng)里是不被尊重的。隨著模型的進化和調(diào)整,甲方給出的打分標準會經(jīng)常變動,但標注員們往往無法撼動現(xiàn)有的標準,只能接受甲方的評判。

她也感到這份工作缺乏獲得感。即便標注已經(jīng)成為一個知識密集行業(yè),但仍采取著流水線式的管理方式,絕大多數(shù)標注工作采取計件制計薪。標注的工作本質(zhì)是消耗腦力處理一條條數(shù)據(jù),但并不知道這些數(shù)據(jù)從哪來、到哪去,甚至不少標注員不知道自己標注的是哪個大模型。

??其二,性價比低。

小鵝此前實習的公司是一家外包標注機構,項目團隊里大多是兼職的大學生,每人每天至少完成10條,日薪100元,超額完成按10元/條計。



部分公司數(shù)據(jù)標注僅招聘兼職人員

即便是專家級別的標注,性價比也很低。一位入駐某家國內(nèi)大模型專家社區(qū)的在讀博士告訴小巴,自己在平臺上出題的時薪大約在100—300元,收入并不比家教等其他兼職有吸引力。他很快放棄了這份兼職。

從招聘市場的薪資報價看,全職數(shù)據(jù)標注員的門檻水漲船高,但待遇低,在北京、上海這樣的地區(qū),不少標注崗位要求研究生級別學歷,但月薪只有六七千元。

??其三,上升空間狹窄。

一位AI產(chǎn)品經(jīng)理向小巴介紹,他所在的頭部互聯(lián)網(wǎng)企業(yè),標注崗位除了極個別管理崗位,其余均為外包,人員流動率極高,能待上超過一年的人并不多。

雖然理論上,數(shù)據(jù)標注員可以依次向標注組長、質(zhì)檢、質(zhì)控、數(shù)據(jù)運營乃至算法類崗位發(fā)展,但因為技術類崗位的天然壁壘,真正實現(xiàn)的概率極低,絕大部分標注員會一直停留在原崗位上。

??其四,即使門檻被知識抬高,標注本質(zhì)上還是一份極易被AI替代的工作,“教會徒弟、餓死師傅”。

科技公司正在普遍采用合成數(shù)據(jù)減少對人工的依賴。比如,業(yè)內(nèi)常見的降本手法“蒸餾”,即用ChatGPT等更高級的大模型生成的答案去訓練更初級的大模型。中小型大模型廠商大多使用這種方法,降低數(shù)據(jù)成本。

因為這些原因,高端人才們進入標注行業(yè),大多要么是尋求臨時過渡工作,要么只是作為兼職獲得一份收入,行業(yè)對他們難有長期吸引力。



大模型巨頭開始“卷”數(shù)據(jù)

問題的本質(zhì),是標注行業(yè)的社會認知和管理方式,都沒能跟上AI“知識饑渴”的速度。

過去8年,數(shù)據(jù)標注行業(yè)經(jīng)歷了巨大的變化。

這曾經(jīng)是個非常底層的工種。它興起于2017年前后,早期被廣泛應用于智能駕駛。那時任務簡單重復,比如框選圖片上的紅綠燈、汽車、障礙物。

因為又苦又累,多年來,海外科技巨頭把這份工作轉(zhuǎn)移到勞動力最廉價的地區(qū)。牛津大學的一項調(diào)查顯示,全球有數(shù)百萬數(shù)據(jù)標注員集中在烏干達、肯尼亞等欠發(fā)達國家,他們每天工作9小時以上,時薪僅約1.16美元(約合人民幣8.3元),項目結(jié)束即失業(yè)。



OpenAI合作外包公司Sama公司員工

圖源:Sama公司官網(wǎng)

在中國,數(shù)據(jù)標注產(chǎn)業(yè)主要聚集在中西部及三四線城市。在標注基地打標的員工,不少是待業(yè)青年、中老年人、殘障人士,只要會使用電腦即可。

所以在大部分新聞報道中,數(shù)據(jù)標注員是一群AI世界里隱形的底層勞動力,在全世界欠發(fā)達國家、地區(qū)賺著“賽博流水線”上的微薄收入。

但最近兩年,高端化的趨勢開始在海外興起。海外數(shù)據(jù)標注龍頭Scale AI,從2024年開始關閉肯尼亞、尼日利亞、巴基斯坦等地的承包站點,轉(zhuǎn)而招聘美國本土高學歷人士。

據(jù)港媒報道,截至今年年初,Scale AI參與模型優(yōu)化的人員中,12%擁有分子生物學等領域的博士學位,超40%擁有所在領域的碩士學位、法律學位或MBA學位。

相較于時薪僅1美元出頭的低端標注,這些高端標注員平均時薪達到40美元。

而對專家級標注員的投入也確實推動了公司的增長,Scale 2024年營收約8.7億美元,預計今年營收達20億美元。Scale AI創(chuàng)始人Alex Wang公開發(fā)言稱:“我們需要最優(yōu)秀和最聰明的頭腦來貢獻數(shù)據(jù)?!?/strong>

其競品、美國另一數(shù)據(jù)標注巨頭Surge AI,已經(jīng)成為全球大模型追求高端數(shù)據(jù)時的首選。它把高質(zhì)量的數(shù)據(jù)標注比作“寫詩”,組建了一支由哲學家、工程師、常春藤盟校畢業(yè)生等構成的標注團隊。

而國內(nèi)的高端化趨勢,很大程度上是從DeepSeek開始的。

2023年起,DeepSeek開始招聘“數(shù)據(jù)百曉生”崗位,不限專業(yè)、不限經(jīng)驗,實習生日薪超過500元,正職年薪可達百萬。崗位要求之一是“涉獵廣泛、博聞強識,對各行各業(yè)的知識都擁有強烈的興趣”。



“數(shù)據(jù)百曉生”的主要任務,就是給AI出題、編寫“理想態(tài)”的優(yōu)質(zhì)答案作為學習資料、給AI生成的答案打分和調(diào)試,等等。

結(jié)果也很驚人:DeepSeek上線7天用戶破億,靠文采飛揚、金句頻出和嚴謹?shù)纳疃人伎计迫?,業(yè)內(nèi)盛傳其標注團隊由北大哲學系的學生組成。

此后,國內(nèi)大模型界風向逐漸轉(zhuǎn)變,開始在“特級教師”上做文章。

這種從“普通老師”到“特級教師”的需求變化,是AI進化到一定程度的必然結(jié)果。

AI行業(yè)有句經(jīng)典名言“Garbage In Garbage Out”,一個模型能力行不行,很大程度上取決于訓練模型的數(shù)據(jù)質(zhì)量。據(jù)IBM的一項研究,僅注釋質(zhì)量提高5%,就可以將復雜計算機視覺任務的模型準確率提高15%—20%。

算法、算力、數(shù)據(jù),是業(yè)內(nèi)公認的AI三要素。頭部大模型們在算法和算力上難分伯仲,數(shù)據(jù)質(zhì)量成了最有機會“卷”出差距的方向。



AI變成精英以后?

可以說,自數(shù)據(jù)標注被正式認定為職業(yè),經(jīng)過5年的發(fā)展,這個行業(yè)仍面臨著低壁壘競爭和勞動剝削等諸多問題,處于一個難以定性的狀態(tài)。

但在每個新興行業(yè)出現(xiàn)、創(chuàng)造新工種的早期,都會出現(xiàn)類似的問題。所有的職業(yè),都是先出現(xiàn),再進化的。

這份工作的前景也未必真如想象中渺茫。比如,它提供了一種職業(yè)轉(zhuǎn)型路徑:成了一條文科生在AI領域大展拳腳的神奇過渡帶。一些頭部大模型已經(jīng)開始組建“AI人文訓練師”團隊,訓練AI識別“仇恨言論”和撰寫“高情商回復”。

而這些文科生,也在這份工作中不斷觸碰AI與社會的邊界。小鵝說,在結(jié)束這份實習以后,她手機里的AI總是比別人的好用,因為理解底層邏輯,她更擅長下達精確的指令。

這是個需要高質(zhì)量人文社科人才的崗位,因為只有最善于思考人與世界關系的人類,才能教會AI怎么更好地做一個人。



學習使用AI辦公技巧

換個角度看,在高學歷人才該不該去“打螺絲”之外,還有一件事值得關注。

在小鵝標注的上千條數(shù)據(jù)中,她印象最深刻的一條記錄是,一位用戶向AI提問“殘疾人患腦癌能不能進養(yǎng)老院”。小鵝翻閱此人的過往提問記錄,發(fā)現(xiàn)她向AI傾訴了很多自己各方面的困難,包括離婚、家暴、病重和無人贍養(yǎng)。但對于AI而言,這些提問不過是一條條平平無奇的數(shù)據(jù)流。

當AI在頂尖老師的訓練下變得越來越頂尖,它就像一個含著金湯匙出生、接受正統(tǒng)通識教育的古希臘式精英,逐漸無法再看到更基層的需求。

或許下一步,新的鯰魚就會從這些被忽視的需求中跳出來。

*文中受訪者姓名均為化名

本篇作者 | 溫若梅 | 責任編輯 |徐濤

主編 |何夢飛| 圖源 |VCG、網(wǎng)絡

驚艷、尖叫和思考,都會出現(xiàn)在這場AI大秀上!12月28日在廈門,吳老師將通過一場名為“AI閃耀中國”科技人文秀,把他在今年的“AI大調(diào)研”成果展現(xiàn)給大家~



合作支持

聯(lián)合出品:吳曉波頻道、優(yōu)酷、七維動力、東南衛(wèi)視

官方AI助手:千問

首席戰(zhàn)略合作伙伴:廈門國貿(mào)控股集團

官方電商合作伙伴:天貓小黑盒

超級品牌:飛書、金牌家居、雙鹿電池、東鵬瓷磚、聯(lián)想、影目INMO、1688、慕思集團

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
銀行人勸告:家里有老人存款的,務必加上第二存款人!越早越安心

銀行人勸告:家里有老人存款的,務必加上第二存款人!越早越安心

小白鴿財經(jīng)
2025-12-17 07:05:02
KK園區(qū)491棟違法建筑已拆除

KK園區(qū)491棟違法建筑已拆除

財聯(lián)社
2025-12-24 17:38:43
克林頓氣瘋了:不能光公布我一個人的!立即全部公開!

克林頓氣瘋了:不能光公布我一個人的!立即全部公開!

占豪
2025-12-23 23:39:15
5連勝廣東傳來2好3壞消息!胡明軒傷情正式確認,新的隱患出現(xiàn)

5連勝廣東傳來2好3壞消息!胡明軒傷情正式確認,新的隱患出現(xiàn)

后仰大風車
2025-12-24 07:15:06
不只是俄羅斯傻眼了,就連我們都傻眼了

不只是俄羅斯傻眼了,就連我們都傻眼了

南權先生
2025-12-24 16:55:53
上海多區(qū)發(fā)布預警!已確認:上海天氣即將轉(zhuǎn)折!

上海多區(qū)發(fā)布預警!已確認:上海天氣即將轉(zhuǎn)折!

魯中晨報
2025-12-24 16:28:11
弘一法師:少跟孩子生氣,孩子投胎到你家,有這幾種原因

弘一法師:少跟孩子生氣,孩子投胎到你家,有這幾種原因

木言觀
2025-12-23 18:35:55
挺著七個月孕肚跪雪地作畫,繼子女喊“梅媽媽”,撕碎了后媽劇本

挺著七個月孕肚跪雪地作畫,繼子女喊“梅媽媽”,撕碎了后媽劇本

做一個合格的吃瓜群眾
2025-12-23 19:02:01
降息,突發(fā)大消息!黃金直線跳水!中概股,拉升!

降息,突發(fā)大消息!黃金直線跳水!中概股,拉升!

證券時報e公司
2025-12-24 23:23:36
國家批復!深圳向北再造一個中心區(qū)!25萬人想要把握住的下一“硅谷”來了!

國家批復!深圳向北再造一個中心區(qū)!25萬人想要把握住的下一“硅谷”來了!

深圳夢
2025-12-24 20:55:12
“媽媽,你下面怎么有胡子”?媽媽給出的答案,值得我們學習

“媽媽,你下面怎么有胡子”?媽媽給出的答案,值得我們學習

大果小果媽媽
2025-12-24 13:23:29
新加坡人直言:比起海南封關帶來的威脅,更怕中國會幫泰國挖運河

新加坡人直言:比起海南封關帶來的威脅,更怕中國會幫泰國挖運河

荊楚寰宇文樞
2025-12-24 23:03:00
美方發(fā)的邀請,中方斷然拒絕,特朗普轉(zhuǎn)身通告全球,要造25艘戰(zhàn)艦

美方發(fā)的邀請,中方斷然拒絕,特朗普轉(zhuǎn)身通告全球,要造25艘戰(zhàn)艦

大國觀察眼
2025-12-25 00:40:59
重錘!武漢又一小區(qū)要拆了!

重錘!武漢又一小區(qū)要拆了!

越喬
2025-12-24 22:52:06
故宮養(yǎng)心殿12月26日重新開放

故宮養(yǎng)心殿12月26日重新開放

界面新聞
2025-12-24 23:13:22
3類牙膏被列入致癌“黑名單”,長期用或有致癌風險?告訴你真相

3類牙膏被列入致癌“黑名單”,長期用或有致癌風險?告訴你真相

39健康網(wǎng)
2025-12-24 20:37:18
美軍悍然扣押中方油輪!大陸攔截美對臺島軍售的船只,時機已到了

美軍悍然扣押中方油輪!大陸攔截美對臺島軍售的船只,時機已到了

大國觀察眼
2025-12-22 00:10:52
明年1月1日起,向好友發(fā)淫穢信息,無論是公開微信群還是私人私聊均違法

明年1月1日起,向好友發(fā)淫穢信息,無論是公開微信群還是私人私聊均違法

觀威海
2025-12-23 09:18:13
鄭州一中學欄桿斷裂致學生墜樓重傷,事故調(diào)查報告7年未公布?官方:成立聯(lián)合調(diào)查組

鄭州一中學欄桿斷裂致學生墜樓重傷,事故調(diào)查報告7年未公布?官方:成立聯(lián)合調(diào)查組

界面新聞
2025-12-24 20:56:59
第二輛!泰國VT-4再次炸膛,真就一點不珍惜完全當自行火炮使?

第二輛!泰國VT-4再次炸膛,真就一點不珍惜完全當自行火炮使?

樂天閑聊
2025-12-24 10:47:57
2025-12-25 03:04:49
估計快了我看了
估計快了我看了
富商大賈發(fā)送到
39文章數(shù) 0關注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經(jīng)要聞

北京進一步放松限購 滬深是否會跟進?

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

本地
時尚
數(shù)碼
健康
公開課

本地新聞

云游安徽|一川江水潤安慶,一塔一戲一城史

對不起周柯宇,是陳靖可先來的

數(shù)碼要聞

AMD Zen 6與Intel Nova Lake或?qū)⑸涎?88 MB 3D緩存“大戰(zhàn)”

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版