国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

我們正在嚴(yán)重低估AI的進(jìn)展!AlphaGo締造者罕見(jiàn)發(fā)聲:2026年AI自主上崗8小時(shí)

0
分享至

  

  來(lái)源:新智元

  【導(dǎo)讀】當(dāng)我們還在調(diào)侃「AI寫錯(cuò)代碼」時(shí),實(shí)驗(yàn)室里的科學(xué)家卻看到它能獨(dú)立完成幾個(gè)小時(shí)的復(fù)雜任務(wù)。AlphaGo作者Julian罕見(jiàn)發(fā)聲:公眾對(duì)AI的認(rèn)知,至少落后一個(gè)世代。最新數(shù)據(jù)更顯示,AI正以指數(shù)速度逼近專家水準(zhǔn),2026或許就是臨界點(diǎn)。我們,是在見(jiàn)證未來(lái),還是在自欺欺人?

  AlphaGo、AlphaZero的核心作者——Julian拋出了一個(gè)尖銳的比喻:人們今天對(duì)AI的態(tài)度,很像當(dāng)初面對(duì)新冠疫情早期的反應(yīng)。

  Julian的意思很直接:我們正在嚴(yán)重低估AI的進(jìn)展。

  

  很多人還在笑它寫錯(cuò)代碼,抱怨它沒(méi)法替代人類;但在實(shí)驗(yàn)室里,研究者早已看到另一幅景象——AI已經(jīng)能獨(dú)立完成幾個(gè)小時(shí)的復(fù)雜任務(wù),并且還在按指數(shù)速度進(jìn)化。

  這就是他決定站出來(lái)發(fā)聲的原因:公眾的認(rèn)知,和前沿的現(xiàn)實(shí),之間至少隔著一個(gè)世代的落差。

  

  科學(xué)家不忍再沉默:AI為何被大眾低估?

  Julian Schrittwieser的名字,或許不像馬斯克、奧特曼那樣家喻戶曉,但在AI圈,他是響當(dāng)當(dāng)?shù)拇嬖凇?/p>

  

  作為AlphaGo、AlphaZero、MuZero的核心作者之一,他親歷了AI從「圍棋科幻」到「現(xiàn)實(shí)碾壓」的全過(guò)程。

  也正因如此,當(dāng)他在個(gè)人博客寫下那段話時(shí),格外刺耳:

  人們注意到AI還會(huì)犯錯(cuò),就急著下結(jié)論:它永遠(yuǎn)不可能達(dá)到人類水準(zhǔn),或者影響有限。可別忘了——就在幾年前,讓AI寫程序、設(shè)計(jì)網(wǎng)站還完全是科幻!

  在他看來(lái),今天的輿論氛圍有點(diǎn)荒謬。

  大眾盯著模型出錯(cuò)的細(xì)節(jié),就斷言「AI不過(guò)如此」;記者拿兩代模型的閑聊對(duì)比,覺(jué)得「沒(méi)啥變化」,就認(rèn)定「進(jìn)步停滯」;政策討論里,AI被當(dāng)成遙遠(yuǎn)的、虛浮的「泡沫」。

  

  然而,實(shí)驗(yàn)室里的研究者看到的,卻是另一幅畫面:AI的能力曲線正在以指數(shù)型躍升。

  Julian bluntly指出,公眾與前沿之間的認(rèn)知差距,至少滯后了一個(gè)世代。

  他之所以站出來(lái)發(fā)聲,不是為了渲染危機(jī),而是為了提醒:如果連科學(xué)家眼前清晰可見(jiàn)的趨勢(shì)都被忽視,真正的臨界點(diǎn)到來(lái)時(shí),我們幾乎沒(méi)有準(zhǔn)備。

  指數(shù)曲線下的震撼

  AI「獨(dú)立上班」的時(shí)間在翻倍

  Julian提出的第一個(gè)關(guān)鍵證據(jù),來(lái)自一家專門研究模型能力的機(jī)構(gòu)——METR (Model Evaluation and Threat Research)

  他們的思路很直白:不再只看模型答題對(duì)錯(cuò),而是衡量它們能自主完成多長(zhǎng)時(shí)間的真實(shí)任務(wù)。

  在今年早些時(shí)候的研究里,METR給出的答案是:Claude 3.7 Sonnet能在約1小時(shí)長(zhǎng)度的軟件工程任務(wù)中保持50%的成功率。

  

  這意味著,它已經(jīng)具備獨(dú)立撐起一段「實(shí)打?qū)嵉墓ぷ鲿r(shí)長(zhǎng)」的能力。

  Julian指出,更令人震驚的是——這條曲線呈現(xiàn)出指數(shù)增長(zhǎng)趨勢(shì),每7個(gè)月翻一倍。

  Sonnet 3.7已經(jīng)是7個(gè)月前的模型,正好對(duì)應(yīng)METR統(tǒng)計(jì)出的翻倍周期。

  他隨即給出最新的對(duì)照:在METR官網(wǎng)更新的圖表里,可以看到Grok 4、Claude Opus 4.1、GPT-5已經(jīng)排在右上角。

  

  Julian博文引用的METR數(shù)據(jù),橫軸為時(shí)間,縱軸為可完成任務(wù)的時(shí)長(zhǎng)。可以看到GPT-5、Opus 4.1已經(jīng)突破兩小時(shí)大關(guān)。

  它們不再是「1小時(shí)工作」,而是能夠支撐超過(guò)2小時(shí)的任務(wù)。指數(shù)并沒(méi)有放緩,反而略超預(yù)期。

  這條線的含義不止是「2小時(shí)」,而是它所暗示的外推未來(lái)

  如果趨勢(shì)不變,2026年年中,模型將能連續(xù)完成8小時(shí)工作;再往后,2027年,模型可能在不少?gòu)?fù)雜任務(wù)上超越人類專家。

  Julian的意思很明確:你也許不必喜歡這種預(yù)測(cè),但忽視它的代價(jià)極高。

  跨行業(yè)評(píng)測(cè):AI已逼近人類專家

  如果說(shuō)METR的研究證明了AI在軟件工程任務(wù)上的「時(shí)間地平線」不斷拉長(zhǎng),那么另一項(xiàng)研究——OpenAI的GDPval則把這個(gè)趨勢(shì)帶進(jìn)了現(xiàn)實(shí)經(jīng)濟(jì)。

  GDPval的設(shè)計(jì)非常直接:找來(lái)44個(gè)職業(yè)、9大行業(yè)的任務(wù),每個(gè)職業(yè)挑選30個(gè)真實(shí)工作樣本,總共1320項(xiàng)任務(wù)。

  

  GDPval任務(wù)覆蓋9大行業(yè),44個(gè)職業(yè),模型表現(xiàn)已與人類差距極小。Claude Opus 4.1在多個(gè)維度甚至領(lǐng)先GPT-5。

  這些任務(wù)由平均14年經(jīng)驗(yàn)的行業(yè)專家設(shè)計(jì),再交給模型去完成,最后由盲評(píng)打分:只看結(jié)果,不看作者是誰(shuí)。

  Julian在博文里寫道:

  最新的結(jié)果顯示,GPT-5在許多職業(yè)任務(wù)上已經(jīng)接近人類水準(zhǔn)。更令人意外的是,Claude Opus 4.1(發(fā)布時(shí)間甚至早于 GPT-5),在GDPval上的表現(xiàn)顯著優(yōu)于GPT-5,幾乎追平了行業(yè)專家。

  這不是某個(gè)孤立benchmark的「漂亮成績(jī)」,而是在跨越法律、金融、工程、醫(yī)療、創(chuàng)意等行業(yè)的真實(shí)檢驗(yàn)中,AI開(kāi)始逼近人類平均水平。

  

  OpenAI GDPval評(píng)測(cè)結(jié)果(2024–2025)?v軸為模型在真實(shí)職業(yè)任務(wù)中的勝率(對(duì)比有多年經(jīng)驗(yàn)的行業(yè)專家),深色為純勝率,淺色為勝或平局?梢钥吹紾PT-5已逼近「行業(yè)專家水平線」。

  更值得注意的是:OpenAI在這份報(bào)告中,并沒(méi)有刻意凸顯自家模型,反而坦誠(chéng)承認(rèn)友商Claude的表現(xiàn)更好。

  

  Julian特別稱贊這一點(diǎn),認(rèn)為這是行業(yè)少見(jiàn)的「科研誠(chéng)信」:

  在追求安全和有益結(jié)果時(shí),比拼輸贏反而不是最重要的。

  當(dāng)然,GDPval的設(shè)計(jì)也并非完美。

  Julian也提醒,許多任務(wù)依然相對(duì)「整潔」(messy程度不高),沒(méi)有模擬長(zhǎng)周期、多輪反饋的復(fù)雜工作環(huán)境。

  但即便如此,趨勢(shì)已經(jīng)足夠說(shuō)明問(wèn)題——AI不只是能寫點(diǎn)小程序,而是在真實(shí)的職業(yè)場(chǎng)景里,正一步步靠近甚至超越人類。

  質(zhì)疑聲出現(xiàn):趨勢(shì)真的可靠嗎?

  在Julian的博文下,不少讀者認(rèn)同「AI沒(méi)有泡沫」,但也有人提出尖銳的質(zhì)疑。

  其中,Atharva Raykar的評(píng)論獲得了高贊。他指出:

  把AI的進(jìn)展直接類比成指數(shù)曲線,其實(shí)很危險(xiǎn)。疫情的指數(shù)傳播有明確機(jī)制支撐,而AI的提升并不是必然的。

  

  他的觀點(diǎn)是:AI的進(jìn)步更像是摩爾定律,靠整個(gè)行業(yè)不斷疊加創(chuàng)新與工程突破。

  如果沒(méi)有推理模型等關(guān)鍵節(jié)點(diǎn)的突破,能力曲線可能早就「撞墻」。所以,單純外推曲線,未必能保證未來(lái)必然繼續(xù)加速。

  Atharva還提到另一個(gè)問(wèn)題:評(píng)測(cè)任務(wù)不夠「messy」。

  METR的任務(wù)平均「復(fù)雜度得分」只有3/16,相當(dāng)于結(jié)構(gòu)清晰的小型工程任務(wù);而現(xiàn)實(shí)世界中的軟件項(xiàng)目、科研探索,往往在7–16的區(qū)間,遠(yuǎn)比benchmark混亂。

  也就是說(shuō),現(xiàn)在的評(píng)測(cè)結(jié)果可能高估了AI在真實(shí)世界中的適用性。

  Julian在后續(xù)回復(fù)中承認(rèn)了這些提醒的合理性,但也強(qiáng)調(diào):

  我類比的重點(diǎn)并不是AI一定會(huì)像病毒傳播那樣加速,而是公眾和決策層正在忽視已經(jīng)發(fā)生的增長(zhǎng)。

  短期(1–2 年)的趨勢(shì)依然很清晰——在這種尺度上,外推往往比專家預(yù)測(cè)更靠譜。

  在他看來(lái),問(wèn)題的關(guān)鍵不是曲線未來(lái)是否會(huì)「拐彎],而是:如果趨勢(shì)真的繼續(xù),而社會(huì)卻沒(méi)有準(zhǔn)備,那代價(jià)將會(huì)極其沉重。

  未來(lái)是替代,還是百倍增幅的協(xié)作?

  Julian 在文章的最后給出了他最具沖擊力的預(yù)測(cè):

  2026年中,至少有一款頂級(jí)模型能連續(xù)自主完成8小時(shí)的工作任務(wù)——這意味著它不再只是一個(gè)「對(duì)話工具」,而是能真正以「全職員工」的形式參與工作流。

  2026年底,在多個(gè)行業(yè)任務(wù)中,會(huì)有模型的表現(xiàn)正式達(dá)到人類專家的平均水平。

  2027年之后,在不少垂直任務(wù)里,AI的表現(xiàn)將頻繁超越專家,并逐步成為生產(chǎn)力的主力。

  這不是科幻,而是從當(dāng)前曲線直接外推出的「保守版本」。

  

  Julian直言,忽視這種趨勢(shì),比過(guò)度擔(dān)憂更危險(xiǎn)。

  但他同時(shí)也強(qiáng)調(diào),AI的未來(lái)不一定意味著「替代」。在他設(shè)想的畫面里,更有可能出現(xiàn)的是這樣一種場(chǎng)景:

  人類依舊是指揮者,但身邊會(huì)有幾十個(gè)、上百個(gè)超強(qiáng)助手。人機(jī)協(xié)作下的效率提升,不是1倍,而是10倍、100倍。

  這種模式不僅能避免大規(guī)模失業(yè)的恐慌,還可能釋放前所未有的創(chuàng)造力。

  科研、設(shè)計(jì)、醫(yī)療、法律、金融……幾乎所有行業(yè)都會(huì)因此重組。

  Julian把這種可能性稱為「更安全、更有益的道路」:讓AI成為超強(qiáng)工具,而不是對(duì)手。

  這幅未來(lái)圖景令人震撼:或許在不遠(yuǎn)的2026或2027,你不是被AI取代,而是帶著一支「AI 團(tuán)隊(duì)」去上班。

  Julian的提醒,其實(shí)很簡(jiǎn)單:我們正在低估AI。

  不是說(shuō)它完美無(wú)缺,而是它的曲線比多數(shù)人想象的更快、更陡。

  按照當(dāng)前的趨勢(shì),2026或許就是關(guān)鍵轉(zhuǎn)折點(diǎn)——AI可能不再是「實(shí)驗(yàn)室的奇觀」,而是走進(jìn)每一個(gè)普通行業(yè),真正改寫經(jīng)濟(jì)的底層邏輯。

  這不是危言聳聽(tīng),而是一個(gè)事實(shí):未來(lái)兩三年內(nèi),我們都將直面一個(gè)被低估的臨界點(diǎn)。

  而當(dāng)那一刻到來(lái)時(shí),每個(gè)人都要回答同一個(gè)問(wèn)題:你會(huì)抵抗、觀望,還是率先和你的AI團(tuán)隊(duì)并肩上崗?

  參考資料:

  https://x.com/polynoamial/status/1972167347088904371

  https://www.julian.ac/blog/2025/09/27/failing-to-understand-the-exponential-again/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
比恒大還慘!中國(guó)第二大民企轟然倒塌,負(fù)債7500億,創(chuàng)始人被帶走

比恒大還慘!中國(guó)第二大民企轟然倒塌,負(fù)債7500億,創(chuàng)始人被帶走

古事尋蹤記
2025-12-27 07:16:35
社保嚴(yán)查全面收緊!無(wú)數(shù)中小企業(yè),正在為十年前的小聰明買單

社保嚴(yán)查全面收緊!無(wú)數(shù)中小企業(yè),正在為十年前的小聰明買單

芳姐侃社會(huì)
2026-04-25 18:32:12
40球,巴黎創(chuàng)隊(duì)史單賽季歐冠進(jìn)球數(shù)新高

40球,巴黎創(chuàng)隊(duì)史單賽季歐冠進(jìn)球數(shù)新高

懂球帝
2026-04-29 03:41:16
凱恩歐冠淘汰賽已打入16球,成該階段進(jìn)球最多的英格蘭球員

凱恩歐冠淘汰賽已打入16球,成該階段進(jìn)球最多的英格蘭球員

懂球帝
2026-04-29 03:41:16
13球7助,KK加盟巴黎后歐冠參與進(jìn)球?yàn)橥谒星騿T最多

13球7助,KK加盟巴黎后歐冠參與進(jìn)球?yàn)橥谒星騿T最多

懂球帝
2026-04-29 04:34:06
40歲32天,諾伊爾成出戰(zhàn)歐冠半決賽第三年長(zhǎng)球員

40歲32天,諾伊爾成出戰(zhàn)歐冠半決賽第三年長(zhǎng)球員

懂球帝
2026-04-29 03:41:16
即將升入英冠,林肯城球員&球迷齊聲高歌:下賽季踢熱刺咯!

即將升入英冠,林肯城球員&球迷齊聲高歌:下賽季踢熱刺咯!

懂球帝
2026-04-28 13:14:06
地鐵搶座互毆后續(xù):警方立案,老太先動(dòng)手反占優(yōu),女子結(jié)局更慘

地鐵搶座互毆后續(xù):警方立案,老太先動(dòng)手反占優(yōu),女子結(jié)局更慘

阿鳧愛(ài)吐槽
2026-04-28 01:01:23
全面取消“寬帶5G融合套餐”,或是運(yùn)營(yíng)商未來(lái)扭轉(zhuǎn)局面的最佳出路!

全面取消“寬帶5G融合套餐”,或是運(yùn)營(yíng)商未來(lái)扭轉(zhuǎn)局面的最佳出路!

通信老柳
2026-04-24 08:21:36
哭窮了!一線男1號(hào)片酬跌至巔峰期3折,網(wǎng)友:待遇比醫(yī)生差才合理

哭窮了!一線男1號(hào)片酬跌至巔峰期3折,網(wǎng)友:待遇比醫(yī)生差才合理

火山詩(shī)話
2026-04-28 07:27:33
“窮人炫富,難掩心酸!”男大學(xué)生炫耀坐高鐵一等座,因長(zhǎng)相被嘲

“窮人炫富,難掩心酸!”男大學(xué)生炫耀坐高鐵一等座,因長(zhǎng)相被嘲

妍妍教育日記
2026-04-24 09:05:03
第二個(gè)加納喬!曼聯(lián) 7100 萬(wàn)水貨徹底迷失,卡里克該棄用了

第二個(gè)加納喬!曼聯(lián) 7100 萬(wàn)水貨徹底迷失,卡里克該棄用了

瀾歸序
2026-04-29 01:24:33
7年敗光2億!鄒市明冉瑩穎共同發(fā)文:二人最終還是邁出了這一步!

7年敗光2億!鄒市明冉瑩穎共同發(fā)文:二人最終還是邁出了這一步!

拳擊時(shí)空
2026-04-16 06:04:48
76年他準(zhǔn)備好了“接班人演講稿”,毛主席突然讓華國(guó)鋒擔(dān)任代總理

76年他準(zhǔn)備好了“接班人演講稿”,毛主席突然讓華國(guó)鋒擔(dān)任代總理

銅臭的歷史味
2026-04-29 00:58:47
打起來(lái)了,以軍不宣而戰(zhàn);內(nèi)塔尼亞胡迎來(lái)勁敵,或被關(guān)進(jìn)大牢!

打起來(lái)了,以軍不宣而戰(zhàn);內(nèi)塔尼亞胡迎來(lái)勁敵,或被關(guān)進(jìn)大牢!

說(shuō)歷史的老牢
2026-04-27 23:23:31
帶30萬(wàn)大軍敗退臺(tái)灣,蔣介石親自到碼頭接,為何到臺(tái)灣只活了3年

帶30萬(wàn)大軍敗退臺(tái)灣,蔣介石親自到碼頭接,為何到臺(tái)灣只活了3年

夏目歷史君
2026-04-20 10:33:19
“談”還是“打”?臺(tái)灣最新民調(diào)給出驚人答案,大陸這步棋走對(duì)了

“談”還是“打”?臺(tái)灣最新民調(diào)給出驚人答案,大陸這步棋走對(duì)了

新浪財(cái)經(jīng)
2026-04-28 00:57:34
繼迪馬利亞后,登貝萊成第二位歐冠半決賽傳射的巴黎球員

繼迪馬利亞后,登貝萊成第二位歐冠半決賽傳射的巴黎球員

懂球帝
2026-04-29 04:23:07
北京這一夜,林芳兵變了,朱琳老了,沈丹萍腫了,唯她看著年輕了

北京這一夜,林芳兵變了,朱琳老了,沈丹萍腫了,唯她看著年輕了

以茶帶書
2026-04-28 19:32:51
最新 | 我市通報(bào)5起違反中央八項(xiàng)規(guī)定精神典型問(wèn)題

最新 | 我市通報(bào)5起違反中央八項(xiàng)規(guī)定精神典型問(wèn)題

天津廣播
2026-04-28 16:20:16
2026-04-29 04:55:00
互聯(lián)網(wǎng)思想 incentive-icons
互聯(lián)網(wǎng)思想
AI時(shí)代,互聯(lián)網(wǎng)思想觀察
2434文章數(shù) 16907關(guān)注度
往期回顧 全部

科技要聞

10億周活目標(biāo)落空!傳OpenAI爆發(fā)內(nèi)部分歧

頭條要聞

19歲中國(guó)女孩被困緬甸 交20萬(wàn)贖金園區(qū)仍未放人

頭條要聞

19歲中國(guó)女孩被困緬甸 交20萬(wàn)贖金園區(qū)仍未放人

體育要聞

魔術(shù)黑八活塞,一步之遙?!

娛樂(lè)要聞

蔡卓妍官宣結(jié)婚,老公比她小10歲

財(cái)經(jīng)要聞

中央政治局會(huì)議定調(diào),八大看點(diǎn)速覽!

汽車要聞

拒絕瘋狂套娃!現(xiàn)代艾尼氪金星長(zhǎng)在未來(lái)審美點(diǎn)上

態(tài)度原創(chuàng)

健康
教育
游戲
時(shí)尚
本地

干細(xì)胞治療燒燙傷三大優(yōu)勢(shì)!

教育要聞

教育部通知,今年9月份開(kāi)始,上學(xué)的規(guī)則全變了

這不爽翻了?曝PS6或能穩(wěn)穩(wěn)運(yùn)行60幀+光追的游戲畫面

普通女性春天穿什么好看?這些穿搭值得借鑒,自然舒適

本地新聞

用青花瓷的方式,打開(kāi)西溪濕地

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版