国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

頭部AI公司陸續(xù)推出自動(dòng)化Agent,這些“AI員工”的表現(xiàn)如何?

0
分享至

就在昨天,OpenAI 和 Anthropic 像約好了一樣,同時(shí)甩出了自家的重磅更新:Claude Opus 4.6和GPT-5.3-Codex。AI公司陸續(xù)推出自動(dòng)化Agent,這些“AI員工”的表現(xiàn)如何?它們將帶來(lái)哪些新機(jī)會(huì)?

硅谷這次不是在更新一個(gè)工具,而是在給整個(gè)人類職場(chǎng)改規(guī)則。

AI公司扎堆推出自動(dòng)化 Agent,本質(zhì)上就是把過(guò)去躲在聊天框里的模型,拉出來(lái)丟進(jìn)真實(shí)電腦、真實(shí)代碼庫(kù)、真實(shí)業(yè)務(wù)流程里,讓它們當(dāng)一回你手下的員工。

這些新一代 AI 員工,已經(jīng)不是玩具級(jí)別的實(shí)習(xí)生,而是可以真正扛活的熟練工。

但它們不是萬(wàn)能的超級(jí)英雄,而是需要你學(xué)會(huì)管理、學(xué)會(huì)分工、學(xué)會(huì)設(shè)邊界的一支數(shù)字外包團(tuán)隊(duì)。

誰(shuí)能先學(xué)會(huì)用 AI 帶團(tuán)隊(duì),誰(shuí)就能在這波變革里抄近道。

OpenAI 這一波,是在行動(dòng)力上踩死油門(mén)。



GPT-5.3-Codex最恐怖的一點(diǎn),是官方直接承認(rèn):它在自己的誕生過(guò)程中發(fā)揮了關(guān)鍵作用。

換一種說(shuō)法,就是模型已經(jīng)能幫工程師寫(xiě)訓(xùn)練代碼、改工具鏈、找Bug,甚至參與下一代模型的迭代。

這意味著什么?

意味著你以前得拉一整個(gè)工程小組干的活,現(xiàn)在一臺(tái)云上的AI員工就能跑通七成。

再看它的成績(jī)單。

在模擬人類操控電腦的 OSWorld 場(chǎng)景里,新模型從前代可憐的38.2%準(zhǔn)確率,一躍到64.7%。

人類平均水平是72%。

也就是說(shuō),它已經(jīng)不是瞎點(diǎn)亂點(diǎn)的腳本小子,而是能像普通白領(lǐng)一樣,會(huì)切屏、會(huì)開(kāi)軟件、會(huì)在各種窗口間來(lái)回倒騰任務(wù)。

在命令行的 Terminal-Bench 2.0 測(cè)試中,它直接干到77.3%,把GPT-5.2甩開(kāi)一大截。



對(duì)于一個(gè)要在服務(wù)器、容器、Linux環(huán)境下跑任務(wù)的AI員工來(lái)說(shuō),這個(gè)分?jǐn)?shù)的意義只有一句話:你可以放心把真正的工程環(huán)境交給他打理了。

編碼能力更不用說(shuō),在SWE-Bench Pro這種用真實(shí)開(kāi)源項(xiàng)目、四種語(yǔ)言、還專門(mén)防套路、防刷分的硬核榜單里,它做到當(dāng)前一流水平,而且用更少Token搞定問(wèn)題。

這就是純粹的工程生產(chǎn)力。

另一邊,Anthropic的Claude Opus 4.6走的是完全不同的路子。

OpenAI在拼誰(shuí)跑得快,Anthropic在拼誰(shuí)看得遠(yuǎn)、記得住、想得深。

大模型這兩年一個(gè)老大難問(wèn)題,就是所謂上下文腐蝕。

理論上說(shuō)支持幾十萬(wàn)上下文,實(shí)際一塞幾百頁(yè)文檔,就開(kāi)始前后矛盾、顧頭不顧尾。

Opus 4.6直接把桌子掀了。

在MRCR v2這種專門(mén)干它的長(zhǎng)版本大海撈針測(cè)試?yán)?,新版本的召回率干?6%,上一代只有18.5%。

從機(jī)械硬背到真正記住,這就是量變到質(zhì)變的拐點(diǎn)。

更狠的是,那1M的上下文窗口。



這已經(jīng)不是讀一篇報(bào)告,而是把整個(gè)知識(shí)庫(kù)吞下去。

幾百頁(yè)財(cái)報(bào)、幾十萬(wàn)字代碼、成堆協(xié)議文檔一起扔進(jìn)去,讓它去幫你找第xxx頁(yè)腳注里那個(gè)小數(shù)點(diǎn)錯(cuò)沒(méi)錯(cuò),這在之前幾乎是科幻。

再加上最高128k的輸出。

你不是讓它寫(xiě)一篇文章,而是可以讓它寫(xiě)完一整份行業(yè)白皮書(shū)、一個(gè)復(fù)雜系統(tǒng)的完整代碼架構(gòu),甚至一家公司級(jí)別的流程重構(gòu)方案。

這才是真正意義上的知識(shí)型AI員工:讀得進(jìn)、接得住、吐得出。

那么,這些自動(dòng)化Agent現(xiàn)在到底能干什么?



先別幻想什么科幻電影里的鋼鐵俠管家,腳踏實(shí)地一點(diǎn),你會(huì)發(fā)現(xiàn)它們已經(jīng)可以在幾個(gè)方向上穩(wěn)定創(chuàng)造價(jià)值。

在工程團(tuán)隊(duì)里,GPT-5.3-Codex這種Agent可以從一個(gè)需求文檔出發(fā),自己拆分任務(wù),寫(xiě)代碼,跑測(cè)試,修Bug,打包部署,小問(wèn)題還會(huì)自己查日志排查原因。

人類工程師的角色,正在從寫(xiě)代碼,變成給目標(biāo)、做Review、定規(guī)范。

在知識(shí)密集行業(yè),比如投研、咨詢、法律合規(guī),Claude Opus 4.6那1M上下文,幾乎就是天生為這類工作設(shè)計(jì)的。

它可以一次性吞掉一家公司的歷年年報(bào)、公告、新聞、研報(bào),再結(jié)合你給的提綱,幫你產(chǎn)出一份邏輯完整、數(shù)據(jù)鏈條干凈的分析。

最重要的是,它在細(xì)節(jié)上不容易丟針,這在嚴(yán)肅場(chǎng)景里是決定生死的能力。

在運(yùn)營(yíng)和業(yè)務(wù)側(cè),Agent可以代替人工去跑各種重復(fù)但瑣碎的操作。



登錄后臺(tái)、導(dǎo)出報(bào)表、清洗數(shù)據(jù)、生成日?qǐng)?bào)周報(bào);在瀏覽器里批量查價(jià)格、看競(jìng)品、截圖歸檔;甚至在你的CRM、工單系統(tǒng)里來(lái)回切換,幫你整理客戶跟進(jìn)記錄。

這些一線員工最煩的機(jī)械活,AI員工的精力是無(wú)限的。

那它們表現(xiàn)到底算不算合格?

如果把幾十年前的自動(dòng)化當(dāng)作給工廠裝了電機(jī),那這波AI Agent,更像是給辦公室裝了一條看不見(jiàn)的傳送帶。

速度和準(zhǔn)確率,已經(jīng)超過(guò)大多數(shù)人類在疲憊狀態(tài)下的表現(xiàn)。

但他們還做不到的是:自己定義目標(biāo)、自己做關(guān)鍵價(jià)值判斷。

也就是說(shuō),它們已經(jīng)是很強(qiáng)的執(zhí)行層,但還不是獨(dú)當(dāng)一面的決策層。

真正的機(jī)會(huì),在于誰(shuí)能最先把這批AI員工,嵌進(jìn)自己的業(yè)務(wù)閉環(huán)里。

對(duì)個(gè)體來(lái)說(shuō),你可以把它當(dāng)成:



一支不下班的代碼外包團(tuán)隊(duì)。

一個(gè)永遠(yuǎn)在幫你讀文檔、記筆記、提煉要點(diǎn)的私人研究助理。

一群愿意24小時(shí)陪你試錯(cuò)、做方案、跑模型的影子同事。

對(duì)公司來(lái)說(shuō),機(jī)會(huì)更直接:

可以用更少的人,撐起更大的業(yè)務(wù)規(guī)模。

可以用更便宜的重復(fù)性人力,轉(zhuǎn)化出更多高附加值的創(chuàng)意崗位。

可以在原本不敢碰的復(fù)雜方向上試水,因?yàn)橛蠥I員工幫忙兜底細(xì)節(jié)。

那我們可以怎么用?



先從一個(gè)具體崗位下手,而不是從全公司大躍進(jìn)開(kāi)始。

比如給開(kāi)發(fā)組配一個(gè)代碼Agent,明確它負(fù)責(zé)的范圍是:?jiǎn)螠y(cè)、重構(gòu)建議、基礎(chǔ)Bug修復(fù)。

比如給投研團(tuán)隊(duì)配一個(gè)長(zhǎng)文檔Agent,讓它只負(fù)責(zé)資料匯總與初稿,最終結(jié)論必須由人拍板。

人的職責(zé)也要升級(jí)。

你不再只是執(zhí)行任務(wù)者,而是 AI 團(tuán)隊(duì)的組長(zhǎng)。

要學(xué)會(huì)寫(xiě)清目標(biāo),而不是手把手教步驟。

要學(xué)會(huì)設(shè)計(jì)檢查點(diǎn),而不是盲目信任結(jié)果。

要學(xué)會(huì)跨工具協(xié)同,而不是只盯著一個(gè)聊天窗口。

至于那些喜歡端著架子、守著舊經(jīng)驗(yàn)不肯變的人,真正的危機(jī)在這里。

不是被AI干掉,而是被會(huì)用AI的人輕松超車。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
戴腳鐐走完長(zhǎng)征的戰(zhàn)士,開(kāi)國(guó)大典前毛主席見(jiàn)他:你不怕我把你忘嘍

戴腳鐐走完長(zhǎng)征的戰(zhàn)士,開(kāi)國(guó)大典前毛主席見(jiàn)他:你不怕我把你忘嘍

大運(yùn)河時(shí)空
2026-02-27 12:25:03
2026第一波大裁員來(lái)了,注意這5個(gè)危險(xiǎn)行業(yè)

2026第一波大裁員來(lái)了,注意這5個(gè)危險(xiǎn)行業(yè)

愛(ài)看劇的阿峰
2026-02-25 04:59:54
小學(xué)黨委書(shū)記教育部發(fā)布會(huì)做分享:畢業(yè)班孩子平均比11年前長(zhǎng)高5.52厘米

小學(xué)黨委書(shū)記教育部發(fā)布會(huì)做分享:畢業(yè)班孩子平均比11年前長(zhǎng)高5.52厘米

紅星新聞
2026-02-27 17:25:29
春天,少吃蘋(píng)果多吃它,一次買(mǎi)20斤,曬干囤起來(lái),從春天吃到夏天

春天,少吃蘋(píng)果多吃它,一次買(mǎi)20斤,曬干囤起來(lái),從春天吃到夏天

阿龍美食記
2026-02-26 19:13:38
這位好萊塢女星對(duì)奧斯卡獎(jiǎng)根本不抱希望……

這位好萊塢女星對(duì)奧斯卡獎(jiǎng)根本不抱希望……

電影分享會(huì)
2026-02-27 11:08:03
杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場(chǎng)卻被伴娘攔下

杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場(chǎng)卻被伴娘攔下

蘭姐說(shuō)故事
2025-06-09 10:00:07
唯一無(wú)歐冠四分之一區(qū),阿森納抽中勒沃庫(kù)森、博德閃耀、葡體

唯一無(wú)歐冠四分之一區(qū),阿森納抽中勒沃庫(kù)森、博德閃耀、葡體

懂球帝
2026-02-27 19:50:07
黃一鳴帶小孩給爺爺奶奶拜年,嘴巴很甜,被懷疑是變相要紅包

黃一鳴帶小孩給爺爺奶奶拜年,嘴巴很甜,被懷疑是變相要紅包

新游戲大妹子
2026-02-18 09:18:57
蒯曼不敵早田希娜,林詩(shī)棟和黃友政擊敗法國(guó)組合,都有把握

蒯曼不敵早田希娜,林詩(shī)棟和黃友政擊敗法國(guó)組合,都有把握

子水體娛
2026-02-27 13:29:32
昔日申花主力門(mén)將如今處境不佳,當(dāng)打之年卻淪落中乙,引發(fā)熱議

昔日申花主力門(mén)將如今處境不佳,當(dāng)打之年卻淪落中乙,引發(fā)熱議

懂個(gè)球
2026-02-27 17:09:33
DeepSeek發(fā)布下一代技術(shù)!北大實(shí)習(xí)生立功

DeepSeek發(fā)布下一代技術(shù)!北大實(shí)習(xí)生立功

智東西
2026-02-27 12:59:15
四川臥龍現(xiàn)“全網(wǎng)最黑”大熊貓

四川臥龍現(xiàn)“全網(wǎng)最黑”大熊貓

揚(yáng)子晚報(bào)
2026-02-27 07:37:29
單賽季投進(jìn)300個(gè)三分有多難?NBA至今僅5人達(dá)成,庫(kù)里6次上榜碾壓

單賽季投進(jìn)300個(gè)三分有多難?NBA至今僅5人達(dá)成,庫(kù)里6次上榜碾壓

禾三千體育
2026-02-27 20:41:32
記者:梅倫多出席海港出征儀式,蔣光太、張琳芃因傷未出席

記者:梅倫多出席海港出征儀式,蔣光太、張琳芃因傷未出席

懂球帝
2026-02-27 17:48:20
最新!干 部 任 免

最新!干 部 任 免

新浪財(cái)經(jīng)
2026-02-26 18:22:57
兩個(gè)事實(shí)證明,我國(guó)實(shí)際已經(jīng)控制了面積80平方公里的南沙五方礁

兩個(gè)事實(shí)證明,我國(guó)實(shí)際已經(jīng)控制了面積80平方公里的南沙五方礁

瓦倫西亞月亮
2026-02-27 08:21:11
我國(guó)每年近千萬(wàn)人做腸鏡!醫(yī)生直言:做一次腸鏡,或管10年無(wú)礙?

我國(guó)每年近千萬(wàn)人做腸鏡!醫(yī)生直言:做一次腸鏡,或管10年無(wú)礙?

鬼菜生活
2026-02-10 20:14:46
不被任何人拿捏的頂級(jí)思維:不要回答別人的問(wèn)題,要回答別人的目的

不被任何人拿捏的頂級(jí)思維:不要回答別人的問(wèn)題,要回答別人的目的

古代經(jīng)典
2026-02-25 15:40:12
羨慕!上海彩民守號(hào)一年中大樂(lè)透3764萬(wàn)獎(jiǎng)金,中獎(jiǎng)號(hào)碼源自機(jī)選!

羨慕!上海彩民守號(hào)一年中大樂(lè)透3764萬(wàn)獎(jiǎng)金,中獎(jiǎng)號(hào)碼源自機(jī)選!

小李子體育
2026-02-27 15:38:52
連爆大冷世界第4與第5趙心童2-4憾負(fù),8強(qiáng)對(duì)陣及賽程出爐中國(guó)德比

連爆大冷世界第4與第5趙心童2-4憾負(fù),8強(qiáng)對(duì)陣及賽程出爐中國(guó)德比

求球不落諦
2026-02-27 06:32:28
2026-02-27 21:04:49
之乎者也小魚(yú)兒
之乎者也小魚(yú)兒
激揚(yáng)文字,直擊心靈
854文章數(shù) 98關(guān)注度
往期回顧 全部

科技要聞

單張不到五毛!谷歌深夜發(fā)布Nano Banana 2

頭條要聞

夜間氣溫達(dá)零下30℃ 烏總統(tǒng):烏面臨幾十年來(lái)最難冬天

頭條要聞

夜間氣溫達(dá)零下30℃ 烏總統(tǒng):烏面臨幾十年來(lái)最難冬天

體育要聞

一場(chǎng)必須要贏的比賽,男籃何止擊敗了裁判

娛樂(lè)要聞

繼網(wǎng)暴谷愛(ài)凌后 美國(guó)欲沒(méi)收其全部收入

財(cái)經(jīng)要聞

沈明高提共富建議 百姓持科技股國(guó)家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

房產(chǎn)
旅游
手機(jī)
家居
公開(kāi)課

房產(chǎn)要聞

重磅!海南“十五五”規(guī)劃出爐!未來(lái)五年,方向定了!

旅游要聞

賞花燈、玩非遺、逛市集崇明特色元宵活動(dòng)邀您來(lái)打卡

手機(jī)要聞

榮耀Magic V6:本季度最大電池大折疊手機(jī)來(lái)襲!

家居要聞

素色肌理 品意式格調(diào)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版