国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

糟糕!最強(qiáng)智能體搶走了1.2%人類(lèi)遠(yuǎn)程工作報(bào)酬

0
分享至

人類(lèi)為AI到底會(huì)不會(huì)搶走工作操碎了心。被AI取代,與投入巨資卻無(wú)法提升生產(chǎn)力同樣糟糕。各類(lèi)大模型與智能體的評(píng)估,正從紙面上的智商競(jìng)賽,轉(zhuǎn)向?qū)Φ闹苯訙y(cè)驗(yàn)。這有助于人類(lèi)面對(duì)“生存還是毀滅”時(shí),盡可能地端正自己的位置。

從數(shù)據(jù)標(biāo)注巨頭 Scale AI 的最新報(bào)告來(lái)看,那些可以居家完成、端到端交付的遠(yuǎn)程任務(wù),即便由當(dāng)下最強(qiáng)大的智能體執(zhí)行,也只有2.5%能達(dá)到客戶(hù)可接受的標(biāo)準(zhǔn);它們的經(jīng)濟(jì)價(jià)值更低,智能體從中獲得的報(bào)酬至多占1.2%。但是,按照智庫(kù)METR的“”,到了明年底,也許最強(qiáng)智能體就有望完成一半的遠(yuǎn)程工作了。

AI被人為地賦予了提升生產(chǎn)力的使命。但“AI能干什么”,并不完整對(duì)應(yīng)著“AI能被市場(chǎng)承認(rèn)的勞動(dòng)”。Scale AI想研究的正是,客戶(hù)究竟愿不愿意為智能體的勞動(dòng)付費(fèi)。

該研究提出了智能體(或具備智能體能力的大模型)遠(yuǎn)程工作指數(shù)(RLI)的評(píng)估標(biāo)準(zhǔn)。所謂遠(yuǎn)程工作,往往是某些可以獨(dú)立完成的任務(wù),可以委托、交付、驗(yàn)證的知識(shí)勞動(dòng)單元,而不是抽象的工作崗位職責(zé)。這對(duì)于圍繞業(yè)務(wù)的真實(shí)指標(biāo)(準(zhǔn)確率、延遲、幻覺(jué)率、客戶(hù)滿(mǎn)意度等)展開(kāi)具備現(xiàn)實(shí)意義。

盡管如此,這些遠(yuǎn)程工作本身,也可以是從人類(lèi)員工或團(tuán)隊(duì)的完整工作流程中拆分出來(lái)的——這又為智能體持續(xù)地嵌入生產(chǎn)系統(tǒng)和反饋循環(huán)創(chuàng)造了條件——這時(shí)候?yàn)榇恕百I(mǎi)單”的就是智能體的人類(lèi)合作伙伴了。

智能體的遠(yuǎn)程工作指數(shù),核心就在于它的“自動(dòng)化率”(automation rate)。它指的是,智能體提交的任務(wù),最終被客戶(hù)認(rèn)可付費(fèi)的任務(wù)數(shù)量,在所有選定任務(wù)中的占比。這些智能體完成的任務(wù),可以是超越對(duì)照組的人類(lèi)員工提交的結(jié)果,也可以是符合客戶(hù)心理預(yù)期的結(jié)果。滿(mǎn)足上述任意一項(xiàng),即可視為完成任務(wù)。

Scale AI選定的任務(wù),來(lái)自全球最大遠(yuǎn)程自由職業(yè)平臺(tái)Upwork。研究團(tuán)隊(duì)從64個(gè)二級(jí)分類(lèi)(subcategories) 中篩選出23個(gè)“可端到端獨(dú)立完成”類(lèi)別,涵蓋了設(shè)計(jì)、運(yùn)營(yíng)、營(yíng)銷(xiāo)、行政、數(shù)據(jù)/商業(yè)智能、音頻/視頻制作以及其他類(lèi)別,共240個(gè)項(xiàng)目。

這些項(xiàng)目還附有人工交付成果的“黃金標(biāo)準(zhǔn)”,以及人類(lèi)完成上述任務(wù)花費(fèi)的時(shí)間與獲得的報(bào)酬。人類(lèi)完成所有這些任務(wù),需要約6000個(gè)小時(shí),獲得14.4萬(wàn)美元的報(bào)酬;其中,單個(gè)任務(wù)中位勞動(dòng)時(shí)間11個(gè)小時(shí),中位勞動(dòng)報(bào)酬200美元。

結(jié)果,在所有這些任務(wù)中,即使最領(lǐng)先的智能體,能夠讓客戶(hù)心甘情愿付費(fèi)的,也就其中的2.5%。它就是今年出盡風(fēng)頭的“通用智能體”Manus。其他前沿模型GPT-5、Sonnet 4.5與Grok 4還沒(méi)它能打。


失敗的任務(wù),各有各的難處。約45%是因?yàn)椤百|(zhì)量差”,還有35%是因?yàn)椤安煌暾保约?5%因?yàn)椤安灰恢隆薄6切┏晒Φ娜蝿?wù),往往集中在更為“寬松”的創(chuàng)意類(lèi)項(xiàng)目,尤其是音頻(例如為復(fù)古游戲創(chuàng)建音效、分離人聲和伴奏、為旁白添加背景音樂(lè))和圖像(例如廣告和Logo設(shè)計(jì))相關(guān)的工作,以及寫(xiě)作和數(shù)據(jù)檢索/網(wǎng)絡(luò)抓取。

如果用“經(jīng)濟(jì)價(jià)值”來(lái)衡量,智能體的表現(xiàn)就更差了。最強(qiáng)的Manus,完成這2.5%的任務(wù),總共獲得了1720美元的報(bào)酬,占所有潛在總報(bào)酬的1.2%;剩下的幾個(gè)模型或智能體,甚至都離1%都還遠(yuǎn)著。

這倒側(cè)面證明了最新披露的一組token數(shù)據(jù)。

這家每月消耗1300萬(wàn)億token的硅谷巨頭,自有模型Gemini通過(guò)API每分鐘消耗約70億個(gè)token,折合每月約300億,相當(dāng)于企業(yè)調(diào)用僅占不到25%,絕大多數(shù)token都被谷歌自身龐大的搜索、視頻與廣告等業(yè)務(wù)消耗了。目前能高效、規(guī)模兌現(xiàn)token價(jià)值的,仍然是硅谷巨頭主導(dǎo)的消費(fèi)者市場(chǎng)。

目前,全年消耗萬(wàn)億token的“需求大戶(hù)”,也僅150家,差不多每家每年在token上花費(fèi)百萬(wàn)美元左右。這意味著“企業(yè)AI”為谷歌云貢獻(xiàn)了0.3%的收入。它們也許已經(jīng)通過(guò)了技術(shù)驗(yàn)證,正在不斷嘗試與大模型與智能體磨合,驗(yàn)證工作流程與商業(yè)模式。


可見(jiàn),AI應(yīng)用在企業(yè)服務(wù)領(lǐng)域的爆發(fā),尚需時(shí)日。盡管OpenAI最早分析了人類(lèi)工作的GPT暴露風(fēng)險(xiǎn),今年又發(fā)布了經(jīng)濟(jì)價(jià)值評(píng)估框架GDPval;Anthropic多次更新了自己的經(jīng)濟(jì)指數(shù)(AEI)。但從這兩家AI巨頭最近的用戶(hù)使用報(bào)告來(lái)看,企業(yè)AI滲透率的擴(kuò)展,確實(shí)仍然存在“鴻溝”。

OpenAI發(fā)現(xiàn),ChatGPT用戶(hù)超過(guò)70%的對(duì)話(huà)與工作無(wú)關(guān)。而在與工作有關(guān)的活動(dòng)中,獲取信息(19.3%)、解釋信息含義(13.1%)、記錄信息(12.8%)占比最高,其次是提供咨詢(xún)與建議(9.2%)、創(chuàng)造性思考(9.1%)和決策解決問(wèn)題(8.5%)。

就連更擅長(zhǎng)企業(yè)服務(wù)的Anthropic也遇到了問(wèn)題。它發(fā)現(xiàn),旗下Claude API任務(wù)的使用分布(usage distribution),呈現(xiàn)了非常明顯的“冪律分布”。即,將近50%的API使用量,映射到了計(jì)算機(jī)和數(shù)學(xué)任務(wù),而靠后80%的任務(wù),只占了10%的使用量。

也就是說(shuō),在面對(duì)現(xiàn)實(shí)工作任務(wù)時(shí),AI與智能體還不夠“通用”。OpenAI和Anthropic,采用的工作分類(lèi)都是傳統(tǒng)的O*NET分類(lèi)(美國(guó)勞工部的職業(yè)數(shù)據(jù)庫(kù)),這也意味著它們所謂的“使用”,往往并不意味著讓智能體端到端地替代人類(lèi)員工。

它當(dāng)然仍然有用,但無(wú)法真實(shí)反映生產(chǎn)力層面的提升。事實(shí)上,美國(guó)METR研究所分析開(kāi)發(fā)者的實(shí)際工作產(chǎn)出時(shí),發(fā)現(xiàn)使用AI的開(kāi)發(fā)者完成任務(wù)的速度,竟比不使用AI時(shí)慢了20%。

Claude Sonnet 4.5剛出來(lái)的時(shí)候,Anthropic就宣稱(chēng)它能連續(xù)專(zhuān)注工作超30小時(shí)。但是,很快就被智庫(kù)METR打了臉。該機(jī)構(gòu)測(cè)評(píng)發(fā)現(xiàn),它實(shí)際能以50%成功率完成的任務(wù),相當(dāng)于1小時(shí)53分鐘的人類(lèi)任務(wù)的水平,不及今年8月發(fā)布的GPT-5的2小時(shí)15分鐘。


這也解釋了為什么在Scale AI的遠(yuǎn)程任務(wù)指數(shù)中,大模型的表現(xiàn)往往不佳;因?yàn)橛薪?jīng)濟(jì)價(jià)值的獨(dú)立任務(wù),即使中位時(shí)間也達(dá)到了11個(gè)小時(shí)。

不過(guò),按每7個(gè)月翻一番的“智能體摩爾定律”,那一天不會(huì)太久。理論上,差不多16個(gè)月后,也就是明年底,最強(qiáng)大的智能體,就可以搶走一半不需要互動(dòng)與協(xié)作的人類(lèi)遠(yuǎn)程工作了。

參考:

https://scale.com/research/rli

https://www.anthropic.com/economic-index

https://openai.com/index/how-people-are-using-chatgpt/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
不戰(zhàn)而勝!對(duì)手門(mén)希克因傷退賽,德約生涯第65次躋身大滿(mǎn)貫八強(qiáng)

不戰(zhàn)而勝!對(duì)手門(mén)??艘騻速?,德約生涯第65次躋身大滿(mǎn)貫八強(qiáng)

全景體育V
2026-01-25 17:37:59
“美國(guó)斬殺線(xiàn)”事件詳細(xì)梳理:最新爆料美女留學(xué)生當(dāng)“狗”太辣眼

“美國(guó)斬殺線(xiàn)”事件詳細(xì)梳理:最新爆料美女留學(xué)生當(dāng)“狗”太辣眼

聽(tīng)風(fēng)聽(tīng)你
2026-01-24 20:54:06
替補(bǔ)出場(chǎng)2分鐘染黃!拜合拉木賽后手指著裁判說(shuō)話(huà) 39度高燒仍拼命

替補(bǔ)出場(chǎng)2分鐘染黃!拜合拉木賽后手指著裁判說(shuō)話(huà) 39度高燒仍拼命

風(fēng)過(guò)鄉(xiāng)
2026-01-25 10:59:52
國(guó)家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

國(guó)家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

霹靂炮
2026-01-19 22:24:13
雷軍無(wú)奈宣布:全部下架!

雷軍無(wú)奈宣布:全部下架!

電動(dòng)知家
2026-01-25 15:31:25
記者:徐彬與中國(guó)U23在吉達(dá)告別,已正式啟程前往英國(guó)迎接新挑戰(zhàn)

記者:徐彬與中國(guó)U23在吉達(dá)告別,已正式啟程前往英國(guó)迎接新挑戰(zhàn)

懂球帝
2026-01-25 16:26:22
58歲那英改走顏值路線(xiàn)?過(guò)度醫(yī)美變化大到認(rèn)不出,這是要鬧哪出?

58歲那英改走顏值路線(xiàn)?過(guò)度醫(yī)美變化大到認(rèn)不出,這是要鬧哪出?

鋒哥與八卦哥
2026-01-25 13:26:51
出大事了!中國(guó)收到“戰(zhàn)書(shū)”,這次不是美國(guó),中方已經(jīng)做好準(zhǔn)備

出大事了!中國(guó)收到“戰(zhàn)書(shū)”,這次不是美國(guó),中方已經(jīng)做好準(zhǔn)備

愛(ài)吃醋的貓咪
2026-01-23 20:27:00
武漢理工畢業(yè)做保安!男子被學(xué)校約談后,稱(chēng)保安比送外賣(mài)掙得多…

武漢理工畢業(yè)做保安!男子被學(xué)校約談后,稱(chēng)保安比送外賣(mài)掙得多…

火山詩(shī)話(huà)
2026-01-25 09:02:44
一語(yǔ)道破女留學(xué)生的牢A,親眼目睹陪讀媽媽的悲哀,到底真還是假

一語(yǔ)道破女留學(xué)生的牢A,親眼目睹陪讀媽媽的悲哀,到底真還是假

每日一見(jiàn)
2026-01-23 15:07:50
云南毒紅薯升級(jí)!調(diào)查組介入,網(wǎng)友扒出黑幕,難怪商戶(hù)敢主動(dòng)投毒

云南毒紅薯升級(jí)!調(diào)查組介入,網(wǎng)友扒出黑幕,難怪商戶(hù)敢主動(dòng)投毒

云舟史策
2026-01-24 16:14:54
李亞鵬曝光捐贈(zèng)名單,向太發(fā)聲:我捐了幾百萬(wàn),王菲默默支持了幾千萬(wàn),也是不夠的……

李亞鵬曝光捐贈(zèng)名單,向太發(fā)聲:我捐了幾百萬(wàn),王菲默默支持了幾千萬(wàn),也是不夠的……

都市快報(bào)橙柿互動(dòng)
2026-01-24 19:48:42
首映僅150萬(wàn),《舒克貝塔》票房撲街,鄭淵潔父子虧到懷疑人生

首映僅150萬(wàn),《舒克貝塔》票房撲街,鄭淵潔父子虧到懷疑人生

電影票房預(yù)告片
2026-01-25 00:00:56
個(gè)稅降了,2026年1月15日起執(zhí)行

個(gè)稅降了,2026年1月15日起執(zhí)行

會(huì)計(jì)人
2026-01-25 12:03:57
女友懷孕收15萬(wàn)元彩禮,被退婚后控告男友強(qiáng)奸,男方起訴退還全部彩禮,法院判了

女友懷孕收15萬(wàn)元彩禮,被退婚后控告男友強(qiáng)奸,男方起訴退還全部彩禮,法院判了

南國(guó)今報(bào)
2026-01-25 17:09:35
安東尼奧即將成為國(guó)奧主帥,兩年后將挑戰(zhàn)40年魔咒

安東尼奧即將成為國(guó)奧主帥,兩年后將挑戰(zhàn)40年魔咒

澎湃新聞
2026-01-25 14:07:05
好消息!鐵路新規(guī):60歲以上老人乘坐高鐵火車(chē),可享受5大福利

好消息!鐵路新規(guī):60歲以上老人乘坐高鐵火車(chē),可享受5大福利

巢客HOME
2026-01-25 06:50:03
青島回應(yīng)“學(xué)生械斗”:系A(chǔ)I生成的不實(shí)信息

青島回應(yīng)“學(xué)生械斗”:系A(chǔ)I生成的不實(shí)信息

極目新聞
2026-01-24 23:30:18
株洲殺豬宴失控!央視新華社接連怒批,句句戳心窩,這下麻煩大了

株洲殺豬宴失控!央視新華社接連怒批,句句戳心窩,這下麻煩大了

以茶帶書(shū)
2026-01-24 23:18:39
1550億美元身家的黃仁勛現(xiàn)身上海一菜場(chǎng),商戶(hù):他在我的栗子店消費(fèi)65元,還給我簽名紅包

1550億美元身家的黃仁勛現(xiàn)身上海一菜場(chǎng),商戶(hù):他在我的栗子店消費(fèi)65元,還給我簽名紅包

極目新聞
2026-01-25 15:58:12
2026-01-25 19:08:49
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
292文章數(shù) 61關(guān)注度
往期回顧 全部

科技要聞

黃仁勛在上海逛菜市場(chǎng),可能惦記著三件事

頭條要聞

游客自稱(chēng)爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬(wàn)元

頭條要聞

游客自稱(chēng)爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬(wàn)元

體育要聞

中國(guó)足球不會(huì)一夜變強(qiáng),但他們已經(jīng)創(chuàng)造歷史

娛樂(lè)要聞

王玉雯方嚴(yán)正聲明 劇方回應(yīng):涉事人員已被開(kāi)除

財(cái)經(jīng)要聞

隋廣義等80人被公訴 千億騙局進(jìn)入末路

汽車(chē)要聞

別克至境E7內(nèi)飾圖曝光 新車(chē)將于一季度正式發(fā)布

態(tài)度原創(chuàng)

藝術(shù)
游戲
數(shù)碼
旅游
軍事航空

藝術(shù)要聞

當(dāng)代唯一能稱(chēng)為“大師”的人,他的字普通人看不懂,啟功跟他比,就像小學(xué)生!

《怪獵物語(yǔ)3》藝術(shù)插畫(huà)公開(kāi)!火龍騎士御風(fēng)飛翔

數(shù)碼要聞

AMD核顯規(guī)劃分化,中端APU將沿用RDNA3.5舊架構(gòu)直至2029年

旅游要聞

一秒入仙境!金佛山冬雪、日出、云海絕美同框

軍事要聞

俄美烏三方首輪會(huì)談細(xì)節(jié)披露

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版