国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI 深夜發(fā)布 ChatGPT Agent:對標Manus、硬剛 Grok 4

0
分享至

作者 | 岑祎揚

責編 | 王啟隆

出品 | AI 科技大本營(ID:rgznai100)

投稿或?qū)で髨蟮?| zhanghy@csdn.net

在馬斯克發(fā)布 Grok 4 模型之后,OpenAI 帶著新產(chǎn)品來了。

這次發(fā)布會沒有網(wǎng)傳的 GPT-5 或者 Open-Weight 的模型,但首發(fā)了 Manus 同款的 ChatGPT Agent。

ChatGPT Agent的核心亮點在于它整合了“Operator” 網(wǎng)絡搜索智能體與“Deep Research”深度研究智能體。OpenAI表示,這解決了上一代產(chǎn)品的功能局限?!癘perator”雖然擅長網(wǎng)絡信息檢索,卻無法進行深度分析和撰寫專業(yè)報告;而“Deep Research”雖具備研究能力,但無法實時利用網(wǎng)站信息或訪問需用戶驗證的內(nèi)容來優(yōu)化報告。

工具方面,OpenAI為 ChatGPT 配備了圖形化瀏覽器、文本瀏覽器、命令行終端及API調(diào)用等多種工具,使其能通過文本與視覺畫面全面理解網(wǎng)絡信息。ChatGPT 甚至可以接入用戶的郵件和 GitHub 賬戶,從而在回答中融入個性化內(nèi)容。對于需要用戶認證的網(wǎng)站,用戶可在智能體內(nèi)置的瀏覽器中完成登錄,授權智能體執(zhí)行更深入的研究與任務。這種多路徑的信息獲取與交互方式,讓ChatGPT 能自主選擇最高效的方案來完成任務。

在運行機制上,ChatGPT Agent 可以調(diào)用虛擬計算機來運行代碼或搜索信息。用戶可以隨時終止或接管正在執(zhí)行的任務,并獲取已經(jīng)生成的結(jié)果,保證了用戶的主導權。在補充信息或提供新的指令后,ChatGPT 能夠無縫繼續(xù)之前的工作,并在必要時向用戶請求進一步的澄清,實現(xiàn)了高效的人機協(xié)同。

然而,ChatGPT Agent 所展示的許多核心功能,都與此前的 Manus 高度相似。在首發(fā)演示中,Manus 就已展示了調(diào)用其虛擬計算機來解壓并閱讀用戶簡歷的能力,并可以在任務執(zhí)行過程中隨時中斷、添加新的簡歷或要求生成新的數(shù)據(jù)表格。

在與網(wǎng)絡環(huán)境的交互方面,Manus 也能夠像真人一樣瀏覽網(wǎng)站,根據(jù)用戶設定的具體要求(如租金、位置、學區(qū))篩選并記錄房屋信息。值得注意的是,在處理銀行卡號等敏感信息的環(huán)節(jié),Manus 也支持用戶隨時接管操作界面,從而保障個人隱私安全。從可中斷的工作流到安全的私密信息處理,再到定時執(zhí)行任務的能力。

在性能方面,ChatGPT Agent 展現(xiàn)了其前沿水平。在測試專家級知識的 HLE(Humanity's Last Exam)基準測試中,ChatGPT 的最高得分達到44.4%,與Grok 4持平。而在 FrontierMath 數(shù)學測試中,ChatGPT Agent 更是以顯著優(yōu)勢登頂,成績高出 o4 mini 8%,比 Grok 4 高出15%。

在處理數(shù)據(jù)任務的 DSBench 測試中,ChatGPT Agent 大幅領先人類專家,數(shù)據(jù)分析和數(shù)據(jù)建模的優(yōu)勢分別達到了25%和20%。然而,OpenAI 首次引用的電子表格(Spreadsheet)測試卻暴露了當前AI的短板。即便能夠調(diào)用 Excel 工具,ChatGPT Agent 的正確率也僅為45%,遠低于人類71%的水平。這似乎在暗示,即使AI的浪潮沖擊著各行各業(yè),需要復雜邏輯的會計等崗位短期內(nèi)仍難以被完全取代。

正如 Anthropic 在 Claude Research 文章中所陳述的觀點,目前的智能體更適合應用于金融等高回報、高價值的任務場景。在內(nèi)部的投行建模測試中,ChatGPT Agent 成功完成了71.3%的入門級任務(例如,為一家財富500強公司建立標準的三報表財務模型),表現(xiàn)明顯優(yōu)于 o3 和DeepResearch。巧合的是,Anthropic 也在同日宣布了其金融智能體的計劃,這預示著金融投資領域正迅速成為頂級 AI 公司競逐的下一個焦點。

從亞馬遜發(fā)布 Kiro 智能體編程軟件,到馬斯克為 Grok 增加“同伴模式”以深化人機交流,再到 Manus 在日常任務自動化上的探索,智能體的應用市場已初顯擁擠。在此背景下,OpenAI 與 Anthropic 不約而同地將目光投向金融行業(yè),揭示了智能體競賽的下一個方向。

AI 產(chǎn)品爆發(fā),但你的痛點解決了嗎?

2025 全球產(chǎn)品經(jīng)理大會

8 月 15–16 日

北京·威斯汀酒店

互聯(lián)網(wǎng)大廠、AI 創(chuàng)業(yè)公司、ToB/ToC 實戰(zhàn)一線的產(chǎn)品人

12 大專題分享,洞察趨勢、拆解路徑、對話未來。

立即掃碼領取大會PPT

搶占 AI 產(chǎn)品下一波紅利

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
郭士強承認了!日本媒體稱中國男籃勝之不武,或向國際籃聯(lián)上訴

郭士強承認了!日本媒體稱中國男籃勝之不武,或向國際籃聯(lián)上訴

十點街球體育
2026-03-07 20:32:44
有趣!郭士強回應搶斷日本隊的球,引起了現(xiàn)場哈哈大笑

有趣!郭士強回應搶斷日本隊的球,引起了現(xiàn)場哈哈大笑

體育哲人
2026-03-07 20:06:17
針對“不敢休、不讓休”怪圈,國家出手了!

針對“不敢休、不讓休”怪圈,國家出手了!

國是直通車
2026-03-07 09:12:15
宗教習俗不能擾民:誰給你凌晨敲梆子喚醒的權力?

宗教習俗不能擾民:誰給你凌晨敲梆子喚醒的權力?

西域都護
2026-03-05 22:49:54
民政部部長:一半以上鄉(xiāng)鎮(zhèn)(街道)建成區(qū)域養(yǎng)老服務中心

民政部部長:一半以上鄉(xiāng)鎮(zhèn)(街道)建成區(qū)域養(yǎng)老服務中心

中國青年報
2026-03-07 10:52:04
事實的真相:一個從不焦慮的人,往往生活在極度的淺薄中。

事實的真相:一個從不焦慮的人,往往生活在極度的淺薄中。

松果正念袁老師
2026-02-25 19:45:39
要升溫了!江蘇最新預測!需要注意的是……

要升溫了!江蘇最新預測!需要注意的是……

江南晚報
2026-03-08 03:34:47
氫彈威力上不封頂,但核武器有個不成文的規(guī)定:扔不到對方頭上去

氫彈威力上不封頂,但核武器有個不成文的規(guī)定:扔不到對方頭上去

沒有偏旁的常慶
2026-03-01 07:00:11
中國早已布局完畢,美專家警告美國,別打伊朗,中國一定笑到最后

中國早已布局完畢,美專家警告美國,別打伊朗,中國一定笑到最后

伴君終老
2026-03-07 20:19:11
謝賢前女友再曝猛料!相識第一天拒絕了兩次謝賢,當時行情非常好

謝賢前女友再曝猛料!相識第一天拒絕了兩次謝賢,當時行情非常好

念得小柔
2026-02-13 02:19:33
社保繳滿15年在家坐等退休行不行?評論區(qū)網(wǎng)友徹底淪陷,炸鍋了

社保繳滿15年在家坐等退休行不行?評論區(qū)網(wǎng)友徹底淪陷,炸鍋了

深度報
2026-03-07 22:05:36
丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養(yǎng)了,兒子也能養(yǎng)

丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養(yǎng)了,兒子也能養(yǎng)

惟來
2026-03-06 23:38:32
一舞封神后,被東莞首富收入囊中,如今她已是7歲孩子媽媽

一舞封神后,被東莞首富收入囊中,如今她已是7歲孩子媽媽

白面書誏
2026-03-06 16:34:31
MWC26巴塞羅那GLOMO獲獎名單公布,華為斬獲八項殊榮

MWC26巴塞羅那GLOMO獲獎名單公布,華為斬獲八項殊榮

藍鯨新聞
2026-03-06 12:28:23
當傳教士為川普“跌倒”而興奮:左派的信仰偽裝與國家迷失

當傳教士為川普“跌倒”而興奮:左派的信仰偽裝與國家迷失

斌聞天下
2026-02-23 06:55:03
多接觸女性的隱秘好處:第2個,90%的男人一輩子都沒意識到

多接觸女性的隱秘好處:第2個,90%的男人一輩子都沒意識到

三農(nóng)老歷
2026-03-08 04:25:13
醫(yī)生勸告:心梗最危險信號,不是胸痛,而是頻繁出現(xiàn)這3個癥狀

醫(yī)生勸告:心梗最危險信號,不是胸痛,而是頻繁出現(xiàn)這3個癥狀

蜉蝣說
2026-03-07 17:51:37
跟腱斷裂后的復出首戰(zhàn):為什么塔圖姆只用298天,而克萊等了941天

跟腱斷裂后的復出首戰(zhàn):為什么塔圖姆只用298天,而克萊等了941天

扣籃達人
2026-03-07 18:26:11
文旅部部長:7名外國游客到上海旅游,買了40箱中國貨;“成為中國人”成了網(wǎng)絡熱詞,老外愛上喝開水吃火鍋等中式生活

文旅部部長:7名外國游客到上海旅游,買了40箱中國貨;“成為中國人”成了網(wǎng)絡熱詞,老外愛上喝開水吃火鍋等中式生活

新民晚報
2026-03-07 15:00:52
72歲大爺斑塊消失,他把血管變干凈的三個方法,連醫(yī)生也贊嘆

72歲大爺斑塊消失,他把血管變干凈的三個方法,連醫(yī)生也贊嘆

荊醫(yī)生科普
2026-03-03 16:40:19
2026-03-08 08:15:00
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術的創(chuàng)造者和使用者
2639文章數(shù) 7660關注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

中國貨船通過霍爾木茲海峽后 美國宣布200億美元計劃

頭條要聞

中國貨船通過霍爾木茲海峽后 美國宣布200億美元計劃

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

汪小菲曝親媽猛料,張?zhí)m公開財產(chǎn)分配

財經(jīng)要聞

針對"不敢休、不讓休"怪圈 國家出手了

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

數(shù)碼
藝術
旅游
游戲
家居

數(shù)碼要聞

蘋果MacBook Neo跑分出爐:A18 Pro少了一個核心 GPU被反殺

藝術要聞

吳冠中:筆墨等于零

旅游要聞

不看這條推文,你真的要錯過大理的春天~

外媒:Xbox新主機恐成微軟絕唱!失敗即退出硬件市場

家居要聞

暖棕撞色 輕法奶油風

無障礙瀏覽 進入關懷版