国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

《紐約客》丨為什么人工智能在2025年并未改變我們的生活

0
分享至

Why A.I. Didn’t Transform Our Lives in 2025

今年本應(yīng)是自主智能體接管日常任務(wù)的一年。但是科技行業(yè)承諾過(guò)多,實(shí)際交付卻令人失望。

作者:卡爾·紐波特(Cal Newport)

2025年12月27日


插圖:Shira Inbar

一年前,OpenAI首席執(zhí)行官薩姆·阿爾特曼(Sam Altman)曾做出一個(gè)大膽預(yù)測(cè):“我們相信,在2025年,我們可能會(huì)看到首批人工智能智能體‘加入勞動(dòng)力隊(duì)伍’,并實(shí)質(zhì)性地改變企業(yè)的產(chǎn)出?!睅字芎?,該公司首席產(chǎn)品官凱文·韋爾(Kevin Weil)在1月達(dá)沃斯世界經(jīng)濟(jì)論壇上表示:“我認(rèn)為2025年將是ChatGPT從一個(gè)超級(jí)聰明的東西……轉(zhuǎn)變?yōu)槟茉诂F(xiàn)實(shí)世界中為你做事的一年。”他舉例說(shuō),人工智能可以填寫(xiě)在線表格、預(yù)訂餐廳等,并隨后承諾:“我們肯定能做到這一點(diǎn),毫無(wú)疑問(wèn)?!?/p>

這絕非小題大做。聊天機(jī)器人能直接回應(yīng)基于文本的指令——比如回答問(wèn)題或草擬一封電子郵件。但理論上,智能體(agent)能夠獨(dú)立在數(shù)字世界中導(dǎo)航,完成需要多個(gè)步驟并調(diào)用其他軟件(如網(wǎng)頁(yè)瀏覽器)的任務(wù)。以預(yù)訂酒店為例:你需要決定入住日期、根據(jù)個(gè)人偏好篩選選項(xiàng)、閱讀評(píng)論、在多個(gè)網(wǎng)站間比價(jià)和比較設(shè)施。智能體理論上可以自動(dòng)化所有這些活動(dòng)。這項(xiàng)技術(shù)的影響將是巨大的:聊天機(jī)器人對(duì)人類員工而言只是便利工具;而真正高效的人工智能智能體則可能完全取代這些員工。Salesforce首席執(zhí)行官馬克·貝尼奧夫(Marc Benioff)聲稱其公司一半的工作已由人工智能完成,并預(yù)測(cè)智能體將引發(fā)一場(chǎng)價(jià)值數(shù)萬(wàn)億美元的“數(shù)字勞動(dòng)力革命”。

2025年之所以被稱作“人工智能智能體之年”,部分原因在于到2024年底,這類工具在計(jì)算機(jī)編程方面已展現(xiàn)出不容置疑的熟練度。今年5月,OpenAI展示了一段Codex智能體的演示視頻:用戶要求該工具修改他的個(gè)人網(wǎng)站?!霸凇顿Y/工具’旁邊再加一個(gè)叫‘我喜歡的食物’的標(biāo)簽頁(yè)。在文檔里寫(xiě)上——塔可餅?!庇脩魧?xiě)道。聊天機(jī)器人迅速執(zhí)行了一系列相互關(guān)聯(lián)的操作:它先查看網(wǎng)站目錄中的文件,檢查一個(gè)有希望的文件內(nèi)容,然后使用搜索命令找到插入新代碼行的正確位置。在理解網(wǎng)站結(jié)構(gòu)后,它成功添加了一個(gè)展示塔可餅的新頁(yè)面。作為一名計(jì)算機(jī)科學(xué)家,我不得不承認(rèn),Codex處理任務(wù)的方式與我本人幾乎一致。硅谷因此堅(jiān)信,其他復(fù)雜任務(wù)也將很快被攻克。

然而,隨著2025年接近尾聲,通用型人工智能智能體的時(shí)代卻并未到來(lái)。今年秋天,OpenAI聯(lián)合創(chuàng)始人安德烈·卡帕西(Andrej Karpathy)——他已離開(kāi)公司并啟動(dòng)了一個(gè)人工智能教育項(xiàng)目——形容智能體“認(rèn)知能力不足”,并直言:“就是行不通。”長(zhǎng)期批評(píng)科技行業(yè)炒作的加里·馬庫(kù)斯(Gary Marcus)最近也在他的Substack上寫(xiě)道:“到目前為止,人工智能智能體基本上是個(gè)啞炮?!边@種預(yù)測(cè)與現(xiàn)實(shí)之間的落差至關(guān)重要。流暢的聊天機(jī)器人和逼真的視頻生成器固然令人印象深刻,但它們本身無(wú)法帶來(lái)一個(gè)機(jī)器接管我們大量日?;顒?dòng)的世界。如果主要人工智能公司無(wú)法交付真正廣泛可用的智能體,那么它們關(guān)于人工智能驅(qū)動(dòng)未來(lái)的承諾也可能落空。

“人工智能智能體”一詞讓人聯(lián)想到《黑客帝國(guó)》或《碟中諜:最終清算》中那種超強(qiáng)的新技術(shù)。但實(shí)際上,智能體并非某種定制化的數(shù)字大腦,而是由與聊天機(jī)器人相同的大型語(yǔ)言模型(LLM)驅(qū)動(dòng)。當(dāng)你要求智能體完成一項(xiàng)任務(wù)時(shí),一個(gè)控制程序(即協(xié)調(diào)智能體行為的普通應(yīng)用程序)會(huì)將你的請(qǐng)求轉(zhuǎn)化為對(duì)LLM的提示:“我想完成這件事,這是可用的工具,我第一步該做什么?”控制程序隨后嘗試LLM建議的操作,向它反饋結(jié)果,并繼續(xù)問(wèn):“接下來(lái)該做什么?”這個(gè)循環(huán)一直持續(xù),直到LLM認(rèn)為任務(wù)已完成。

事實(shí)證明,這種架構(gòu)在自動(dòng)化軟件開(kāi)發(fā)方面表現(xiàn)優(yōu)異。創(chuàng)建或修改計(jì)算機(jī)程序所需的大多數(shù)操作,都可以通過(guò)在基于文本的終端中輸入有限的一組命令來(lái)實(shí)現(xiàn)。這些命令指示計(jì)算機(jī)瀏覽文件系統(tǒng)、在源文件中添加或更新文本,必要時(shí)還將人類可讀的代碼編譯為機(jī)器可讀的二進(jìn)制代碼。這對(duì)大型語(yǔ)言模型來(lái)說(shuō)是理想環(huán)境。“終端界面是基于文本的,而這正是語(yǔ)言模型擅長(zhǎng)的領(lǐng)域,”Terminal-Bench(一種用于評(píng)估編程智能體的流行工具)的聯(lián)合開(kāi)發(fā)者亞歷克斯·肖(Alex Shaw)告訴我。

然而,像阿爾特曼所設(shè)想的那種更通用的助手,則要求智能體走出終端的舒適區(qū)。由于大多數(shù)人通過(guò)點(diǎn)擊鼠標(biāo)完成電腦任務(wù),一個(gè)能“加入勞動(dòng)力隊(duì)伍”的人工智能很可能需要學(xué)會(huì)使用鼠標(biāo)——這出人意料地困難?!都~約時(shí)報(bào)》最近報(bào)道,一批新創(chuàng)公司正在構(gòu)建“影子網(wǎng)站”——復(fù)制聯(lián)合航空、Gmail等熱門(mén)網(wǎng)頁(yè)的副本,供人工智能分析人類如何使用光標(biāo)。今年7月,OpenAI發(fā)布了ChatGPT Agent,這是一個(gè)早期版本的、能使用網(wǎng)頁(yè)瀏覽器完成任務(wù)的機(jī)器人,但一篇評(píng)測(cè)指出,“即便是點(diǎn)擊、選擇元素和搜索等簡(jiǎn)單操作,智能體也可能耗費(fèi)數(shù)秒甚至數(shù)分鐘?!庇幸淮?,該工具在房地產(chǎn)網(wǎng)站的下拉菜單中選擇價(jià)格時(shí),竟卡了將近15分鐘。

提升智能體能力還有另一種路徑:讓現(xiàn)有工具更容易被人工智能掌握。一個(gè)開(kāi)源項(xiàng)目正致力于開(kāi)發(fā)所謂的“模型上下文協(xié)議”(Model Context Protocol),這是一種標(biāo)準(zhǔn)化接口,允許智能體通過(guò)基于文本的請(qǐng)求訪問(wèn)軟件。另一個(gè)是谷歌今年春天推出的Agent2Agent協(xié)議,它設(shè)想一個(gè)智能體之間可以直接交互的世界。例如,我的個(gè)人人工智能無(wú)需親自操作酒店預(yù)訂網(wǎng)站,只需向一個(gè)由酒店公司專門(mén)訓(xùn)練的專用人工智能發(fā)出請(qǐng)求,由后者代為操作即可。當(dāng)然,要圍繞機(jī)器人重新構(gòu)建整個(gè)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施仍需時(shí)間。(多年來(lái),開(kāi)發(fā)者一直在努力阻止機(jī)器人干擾網(wǎng)站。)即便技術(shù)人員能完成這項(xiàng)工程,或成功掌握鼠標(biāo)操作,他們?nèi)詫⒚媾R另一項(xiàng)挑戰(zhàn):支撐智能體決策的大型語(yǔ)言模型本身的缺陷。

在宣布ChatGPT Agent上線的視頻中,阿爾特曼與OpenAI工程師團(tuán)隊(duì)展示了多項(xiàng)功能。其中一段演示生成了一張地圖,據(jù)稱顯示了遍訪北美全部30座美國(guó)職業(yè)棒球大聯(lián)盟球場(chǎng)的行程。奇怪的是,地圖上竟包含墨西哥灣中部的一個(gè)??奎c(diǎn)。有人或許會(huì)把這種錯(cuò)誤當(dāng)作偶然,但在硅谷批評(píng)者馬庫(kù)斯看來(lái),這類失誤揭示了一個(gè)更根本的問(wèn)題。他告訴我,大型語(yǔ)言模型缺乏對(duì)“現(xiàn)實(shí)世界運(yùn)行機(jī)制”的足夠理解,難以可靠地處理開(kāi)放式任務(wù)。即使在規(guī)劃旅行這樣看似簡(jiǎn)單的場(chǎng)景中,“你仍然需要對(duì)時(shí)間和地點(diǎn)進(jìn)行推理”——而這些基本的人類能力恰恰是語(yǔ)言模型所欠缺的?!八麄兪窃诒孔镜墓ぞ咧嫌侄哑隽烁啾孔镜墓ぞ?,”他說(shuō)。

其他評(píng)論人士則警告,智能體會(huì)放大錯(cuò)誤。聊天機(jī)器人用戶很快就會(huì)發(fā)現(xiàn),大型語(yǔ)言模型有“胡編亂造”的傾向;一項(xiàng)廣受引用的基準(zhǔn)測(cè)試顯示,OpenAI最新模型GPT-5的不同版本幻覺(jué)率約為10%。對(duì)于執(zhí)行多步驟任務(wù)的智能體而言,這種偶發(fā)性失誤可能是災(zāi)難性的:只要一步出錯(cuò),整個(gè)任務(wù)就可能徹底偏離軌道?!皠e對(duì)人工智能智能體太興奮,”《商業(yè)內(nèi)幕》今年春天的一篇頭條警告道,“它們會(huì)犯很多錯(cuò)誤?!?/p>

為了更清楚地理解大型語(yǔ)言模型的大腦如何出錯(cuò),我請(qǐng)ChatGPT模擬一個(gè)酒店預(yù)訂智能體的行動(dòng)方案。它列出了18個(gè)步驟和子步驟:選擇預(yù)訂網(wǎng)站、對(duì)搜索結(jié)果應(yīng)用篩選條件、輸入信用卡信息、向我發(fā)送預(yù)訂摘要等等。我對(duì)模型分解任務(wù)的細(xì)致程度印象深刻。(若不一一列出,人們很容易低估完成如此常見(jiàn)任務(wù)所需的小動(dòng)作數(shù)量。)但我也能看出,這個(gè)假想的智能體可能在哪些環(huán)節(jié)脫軌。

例如,子步驟4.4要求智能體使用公式對(duì)房間進(jìn)行排序:α×(位置得分)+β×(評(píng)分得分)-γ×(價(jià)格懲罰)+δ×(忠誠(chéng)度獎(jiǎng)勵(lì))。這種做法方向正確,但模型對(duì)細(xì)節(jié)的描述令人擔(dān)憂地模糊:它如何計(jì)算這些懲罰值和獎(jiǎng)勵(lì)值?又如何選擇希臘字母代表的權(quán)重來(lái)平衡各項(xiàng)因素?人類通常會(huì)通過(guò)試錯(cuò)和常識(shí)手動(dòng)調(diào)整這些細(xì)節(jié),但誰(shuí)也不知道大型語(yǔ)言模型獨(dú)自會(huì)怎么做。而微小的錯(cuò)誤也會(huì)產(chǎn)生重大影響:如果過(guò)度強(qiáng)調(diào)價(jià)格,你可能會(huì)被安排到城里最破舊的酒店之一。

幾周前,阿爾特曼在一份內(nèi)部備忘錄中宣布,人工智能智能體的開(kāi)發(fā)是OpenAI將弱化推進(jìn)的項(xiàng)目之一,因?yàn)楣鞠M芯Ω倪M(jìn)其核心聊天機(jī)器人產(chǎn)品。就在去年此時(shí),阿爾特曼等領(lǐng)導(dǎo)者還在渲染我們已沖過(guò)技術(shù)懸崖,正混亂地墜入一個(gè)自動(dòng)化的勞動(dòng)力未來(lái)。如今看來(lái),這種亢奮顯得過(guò)于草率。最近,為了調(diào)整自己對(duì)人工智能的預(yù)期,我一直在回想今年10月卡帕西接受播客主持人德瓦克什·帕特爾(Dwarkesh Patel)采訪時(shí)的一番話。帕特爾問(wèn)他,為何“智能體之年”未能成真??ㄅ廖骰卮穑骸拔矣X(jué)得這個(gè)行業(yè)存在一些過(guò)度預(yù)測(cè)。在我看來(lái),這更準(zhǔn)確地說(shuō)應(yīng)該是‘智能體的十年’。” ?

作者:卡爾·紐波特是《紐約客》的特約撰稿人,也是喬治城大學(xué)的計(jì)算機(jī)科學(xué)教授。

說(shuō)明:本號(hào)刊發(fā)來(lái)自各方的文章,是為了獲得更全面的信息,不代表本號(hào)支持文章中的觀點(diǎn)。由于微信公眾號(hào)每天只能推送一次,本站目前在騰訊新聞發(fā)布最新的文章,每天24小時(shí)不間斷更新,請(qǐng)?jiān)隍v訊新聞中搜索“邸鈔”,或在瀏覽器中點(diǎn)擊:

https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
成龍4000萬(wàn)尋回小龍女,房祖名暗中相助,吳卓林語(yǔ)驚全網(wǎng)

成龍4000萬(wàn)尋回小龍女,房祖名暗中相助,吳卓林語(yǔ)驚全網(wǎng)

凜若秋霜
2026-01-11 16:03:47
考官問(wèn)“什么門(mén)永遠(yuǎn)關(guān)不上”在場(chǎng)考生答錯(cuò),7歲小朋友出正確答案

考官問(wèn)“什么門(mén)永遠(yuǎn)關(guān)不上”在場(chǎng)考生答錯(cuò),7歲小朋友出正確答案

蘭姐說(shuō)故事
2026-01-09 20:05:03
到底什么叫洗錢(qián)?網(wǎng)友"完美閉環(huán)"式回答,感覺(jué)錯(cuò)過(guò)了一個(gè)億

到底什么叫洗錢(qián)?網(wǎng)友"完美閉環(huán)"式回答,感覺(jué)錯(cuò)過(guò)了一個(gè)億

另子維愛(ài)讀史
2026-01-09 22:18:04
死傷不明!美軍再次不宣而戰(zhàn),20架戰(zhàn)機(jī)投下近百炸彈

死傷不明!美軍再次不宣而戰(zhàn),20架戰(zhàn)機(jī)投下近百炸彈

大國(guó)之翼
2026-01-11 07:00:21
超級(jí)外援公開(kāi)求職卻沒(méi)人要!上賽季場(chǎng)均砍30+10+9,恐就此告別CBA

超級(jí)外援公開(kāi)求職卻沒(méi)人要!上賽季場(chǎng)均砍30+10+9,恐就此告別CBA

老葉評(píng)球
2026-01-11 20:55:35
2輪搶4分,歷史性一夜!中國(guó)隊(duì)揚(yáng)眉吐氣,U23亞洲杯排名最新如下

2輪搶4分,歷史性一夜!中國(guó)隊(duì)揚(yáng)眉吐氣,U23亞洲杯排名最新如下

侃球熊弟
2026-01-11 21:42:56
WTT冠軍賽:男單世界第6被淘汰!2:4不敵日本張本智和,無(wú)緣冠軍

WTT冠軍賽:男單世界第6被淘汰!2:4不敵日本張本智和,無(wú)緣冠軍

國(guó)乒二三事
2026-01-11 11:02:50
杭州舞廳高端化:老板賠本進(jìn)場(chǎng),男客被迫買(mǎi)單,三毛場(chǎng)能火多久

杭州舞廳高端化:老板賠本進(jìn)場(chǎng),男客被迫買(mǎi)單,三毛場(chǎng)能火多久

成都人的故事
2026-01-11 11:40:08
甘比這碗飯,不是誰(shuí)都吃得了!

甘比這碗飯,不是誰(shuí)都吃得了!

BenSir本色說(shuō)
2025-12-14 22:10:55
平時(shí)熬的夜,周末竟能補(bǔ)回來(lái)!多項(xiàng)研究發(fā)現(xiàn),周末補(bǔ)覺(jué),顯著降低心臟病、糖尿病、抑郁癥風(fēng)險(xiǎn)

平時(shí)熬的夜,周末竟能補(bǔ)回來(lái)!多項(xiàng)研究發(fā)現(xiàn),周末補(bǔ)覺(jué),顯著降低心臟病、糖尿病、抑郁癥風(fēng)險(xiǎn)

醫(yī)諾維
2026-01-10 11:21:16
反擊來(lái)了!當(dāng)大貨車(chē)變成流動(dòng)全國(guó)的水果店的那一刻,年年漲價(jià)的水果店慌了?。。?>
    </a>
        <h3>
      <a href=張曉磊
2026-01-11 12:13:43
林昀儒4-3絕殺張本智和,多哈賽男單對(duì)陣出爐,國(guó)乒無(wú)緣

林昀儒4-3絕殺張本智和,多哈賽男單對(duì)陣出爐,國(guó)乒無(wú)緣

劉剮說(shuō)體壇
2026-01-11 21:34:36
一頓亂扔!11投0中,全場(chǎng)0分0板1助,媒體人:需苦練,球迷:一根筋

一頓亂扔!11投0中,全場(chǎng)0分0板1助,媒體人:需苦練,球迷:一根筋

金山話體育
2026-01-11 07:12:00
雷軍放話:SU7已擊敗Model 3,YU7一直沒(méi)大力推廣,準(zhǔn)備發(fā)力……

雷軍放話:SU7已擊敗Model 3,YU7一直沒(méi)大力推廣,準(zhǔn)備發(fā)力……

柴狗夫斯基
2026-01-10 21:49:03
電影《尋秦記》票房突破六千萬(wàn),雙結(jié)局設(shè)定給觀眾一場(chǎng)美夢(mèng)

電影《尋秦記》票房突破六千萬(wàn),雙結(jié)局設(shè)定給觀眾一場(chǎng)美夢(mèng)

TVB劇評(píng)社
2026-01-11 15:52:55
一個(gè)月內(nèi)兩度請(qǐng)辭!“80后”劉鵬辭任中順潔柔董事長(zhǎng)、總裁,年薪514萬(wàn)

一個(gè)月內(nèi)兩度請(qǐng)辭!“80后”劉鵬辭任中順潔柔董事長(zhǎng)、總裁,年薪514萬(wàn)

紅星新聞
2026-01-11 16:10:47
-8℃!雨夾雪又又又要來(lái)南京!

-8℃!雨夾雪又又又要來(lái)南京!

南京擇校
2026-01-11 15:11:57
越戰(zhàn)的始作俑者黎筍,死后越南人如何評(píng)價(jià)他?昔日路線被全面拋棄

越戰(zhàn)的始作俑者黎筍,死后越南人如何評(píng)價(jià)他?昔日路線被全面拋棄

浩渺青史
2026-01-10 12:40:24
熱議U23男足勝澳洲:李昊無(wú)可挑剔;亞洲類似比賽早該這么踢

熱議U23男足勝澳洲:李昊無(wú)可挑剔;亞洲類似比賽早該這么踢

懂球帝
2026-01-11 22:00:28
廣東大勝遼籃25分!奎因狂砍25分,徐杰胡明軒均0分,看傻楊鳴

廣東大勝遼籃25分!奎因狂砍25分,徐杰胡明軒均0分,看傻楊鳴

多特體育說(shuō)
2026-01-11 20:31:05
2026-01-11 22:31:00
邸報(bào)
邸報(bào)
每天分享有意思的文章。
419文章數(shù) 99關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

10人違規(guī)吃喝1人飲酒后死亡 組織者曾找商人借錢(qián)補(bǔ)償

頭條要聞

10人違規(guī)吃喝1人飲酒后死亡 組織者曾找商人借錢(qián)補(bǔ)償

體育要聞

詹皇曬照不滿打手沒(méi)哨 裁判報(bào)告最后兩分鐘無(wú)誤判

娛樂(lè)要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣(mài)平臺(tái)"燒錢(qián)搶存量市場(chǎng)"迎來(lái)終局?

汽車(chē)要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

游戲
數(shù)碼
時(shí)尚
藝術(shù)
教育

《GTA6》真能實(shí)現(xiàn)沙灘全是人嗎?玩家懷疑“預(yù)告騙”

數(shù)碼要聞

ECS精英推出Liva Z系列迷你主機(jī),多CPU可選

當(dāng)一個(gè)57歲的女人,決定從零開(kāi)始

藝術(shù)要聞

砸18億!游戲巨頭落子廣州!詩(shī)悅網(wǎng)絡(luò)總部大樓新進(jìn)展

教育要聞

孩子沉迷手機(jī)沉迷游戲怎么辦?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版