国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.4來了:不是更聰明,是真的能替你干活了

0
分享至

OpenAI這次是真的急了。

3月3日,GPT-5.3 Instant上線;3月5日,GPT-5.4緊跟著就來了。



兩天之內(nèi),兩個(gè)重磅模型,一個(gè)管日常聊天,一個(gè)管專業(yè)干活。這節(jié)奏,連AI自己都快跟不上了。

但這次,GPT-5.4不只是"更快更強(qiáng)"那么簡單。

它帶來了幾個(gè)真正改變游戲規(guī)則的東西:原生電腦操控、Tool Search機(jī)制

以及一個(gè)讓所有打工人都該認(rèn)真想想的數(shù)據(jù)——83%的專業(yè)任務(wù),AI已經(jīng)能做到跟人類專家一樣好,甚至更好。

一、GPT-5.4:不是更聰明,是真的能替你干活了

GPT-5.4這次有三個(gè)版本:

GPT-5.4 標(biāo)準(zhǔn)版:面向API和Codex

GPT-5.4 Thinking:帶深度推理,ChatGPT Plus用戶可用

GPT-5.4 Pro:性能拉滿,僅限Pro(200美元/月)和企業(yè)版



OpenAI自己的定義是:"面向?qū)I(yè)工作最強(qiáng)大、最高效的前沿模型。"

它把之前GPT-5.3-Codex的頂級編碼能力,整合進(jìn)了主線推理模型。以前想要最好的代碼能力和推理能力,得切換不同模型。

現(xiàn)在GPT-5.4一個(gè)模型全包了。

二、原生電腦操控:AI操作電腦,第一次超過了人類

這是GPT-5.4最大的突破。

它是OpenAI第一個(gè)支持"原生計(jì)算機(jī)使用"的模型——不是通過插件,不是通過第三方工具,而是模型本身就能操作你的電腦。

它能寫代碼來控制電腦,也能直接發(fā)出鍵盤和鼠標(biāo)指令。

在OSWorld桌面操控測試中,GPT-5.4得分75.0%,人類平均72.4%。而上一代GPT-5.2只有47.3%。



從47.3%直接跳到75.0%,不是小改進(jìn),是代際飛躍。這意味著什么?

以后讓AI幫你填表格、訂機(jī)票、在不同軟件之間搬運(yùn)數(shù)據(jù),不再是演示視頻里的未來,而是正在落地的現(xiàn)實(shí)。看到屏幕截圖,它就知道該點(diǎn)哪里、該輸入什么。

比如:GPT-5.4 可以識別瀏覽器界面的截圖,并通過基于坐標(biāo)的點(diǎn)擊與界面元素交互,以發(fā)送郵件和安排日歷事件。

也可以給它一份記錄列表,它就能使用類似 Playwright 的自動化技術(shù)處理并提交它們到網(wǎng)頁表單。

而且,這里面的操作視頻都沒有經(jīng)過加速處理,就是GPT 5.4正常的運(yùn)行速度!

三、Tool Search:省了47%的token

以前你讓AI調(diào)用工具,得明確告訴它用哪個(gè)API、怎么調(diào)。更頭疼的是工具越多,消耗的token越多,越慢越貴。

現(xiàn)在GPT-5.4能自己去"搜索"最合適的工具和API,自動選擇、自動調(diào)用。

給模型一本工具目錄,讓它自己判斷需要什么,用到才加載,用不到根本不占空間。



實(shí)測效果:250個(gè)任務(wù)場景下,減少47%的token消耗,準(zhǔn)確率完全不變。

差不多省了一半的錢和一半的時(shí)間。對做AI Agent開發(fā)的同學(xué)來說,這是基礎(chǔ)設(shè)施級別的改進(jìn)。

四、Thinking模式升級:思考過程,你可以實(shí)時(shí)打斷

GPT-5.4 Thinking有個(gè)很有意思的新交互方式:

當(dāng)你問一個(gè)復(fù)雜問題時(shí),模型會先給你展示一個(gè)思考大綱,告訴你它打算分幾步處理。

關(guān)鍵是——你可以在它思考的過程中隨時(shí)插嘴、調(diào)整方向。

以前是發(fā)問題→等結(jié)果→發(fā)現(xiàn)方向不對→刪掉重來,浪費(fèi)大量token和時(shí)間。

現(xiàn)在是實(shí)時(shí)協(xié)作,就像和同事討論方案一樣。這個(gè)功能目前在ChatGPT網(wǎng)頁版和Android端已上線,iOS端即將支持。

五、100萬token上下文 + 83%超越人類專家

GPT-5.4的上下文窗口達(dá)到了100萬token。什么概念?

一本40萬字的小說,它能一次性讀完并理解。一個(gè)完整的代碼庫,它能整體分析。

更重要的是,它在超長上下文中的"回憶能力"幾乎完美——那種"你在第3頁說的話到了第300頁就忘了"的問題,在GPT-5.4上大幅改善。

OpenAI用一套叫GDPval的測試來評估GPT-5.4,覆蓋了9個(gè)行業(yè)、44個(gè)職業(yè)。這些不是隨便選的——它們都是美國GDP貢獻(xiàn)超過5%的行業(yè)中,工資最高、最知識密集的崗位。

金融分析師、投資顧問、合規(guī)官員、采購經(jīng)理、機(jī)械工程師、房地產(chǎn)經(jīng)紀(jì)人……

測試結(jié)果:GPT-5.4在83%的任務(wù)中,表現(xiàn)達(dá)到或超過了人類專家水平。



也就是說,AI在法律分析、財(cái)務(wù)建模、做PPT等知識工作中,有83%的概率能做得跟人類專家一樣好甚至更好。





你沒看錯(cuò),AI操作電腦比人類平均水平還好了。

這意味著什么?不是說這些職業(yè)馬上就消失。但它說明:在這些知識型崗位中,AI已經(jīng)可以承擔(dān)大部分"標(biāo)準(zhǔn)化工作"。

六、GPT-5.3 Instant:不追求最強(qiáng),追求"不油膩"

這次OpenAI其實(shí)一周內(nèi)發(fā)了兩個(gè)模型,容易搞混。簡單理解:

GPT-5.3 Instant= 你的日常聊天助手

GPT-5.4 Thinking= 你的專業(yè)工作搭檔

GPT-5.3 Instant(3月3日上線)主打三個(gè)改進(jìn):

→ 幻覺減少26.8%(這個(gè)提升非常顯著)

→ 說話不再"油膩"了(OpenAI官方原話是"anti-cringe",終于知道大家嫌它啰嗦了)

→ 40萬token上下文窗口

簡單說,以前ChatGPT回答你一個(gè)問題,經(jīng)常加一堆"作為AI語言模型,我很高興為你回答……"這種廢話。現(xiàn)在5.3 Instant終于學(xué)會了正常說話。

兩個(gè)模型的分工很明確:日常對話用5.3 Instant,快速高效不廢話;遇到復(fù)雜任務(wù)、專業(yè)分析、寫代碼,切換到5.4 Thinking,深度推理精準(zhǔn)輸出。

寫在最后

兩天連發(fā)兩個(gè)模型,背后是OpenAI面對Claude Opus 4.6和DeepSeek V4的焦慮。

目前AI模型的第一梯隊(duì)是三足鼎立:OpenAI的GPT-5.4、Anthropic的Claude Opus 4.6、Google的Gemini 3.1 Pro。

跟Claude Opus 4.6比:

在操作電腦這件事上,GPT-5.4(75.0%)剛剛超過了Claude Opus 4.6(72.7%)。

但Reddit上的用戶反饋很有意思——即使GPT-5.4在跑分上領(lǐng)先,很多人表示不打算從Claude切換過來,因?yàn)镃laude"感覺更聰明",寫代碼的體驗(yàn)更流暢。

跑分是一回事,手感是另一回事。

價(jià)格對比(API):

→ GPT-5.4 Pro:$21/$168(每百萬token輸入/輸出)

→ Claude Opus 4.6:$5/$25

GPT-5.4真正值得關(guān)注的,不是跑分更高了,而是AI正在從"回答問題"變成"執(zhí)行任務(wù)"。

原生電腦操控 + Tool Search + 可中斷的思考模式,這三件事加在一起,意味著AI真的可以像一個(gè)員工一樣幫你干活了。

剛好,今天下午openclaw官方也宣布開始支持接入GPT-5.4了!



一個(gè)新的時(shí)代,正在加速到來。

以上,感謝看到這里,如果覺得不錯(cuò)的話,隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧!我們,下期再見。

我建了個(gè)免費(fèi)AI交流群,感興趣的朋友可以+我Lorjia0319,備注“進(jìn)群”加入,同時(shí)圍觀朋友圈日常AI干貨思考

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
2026年清明節(jié)不一般,掃墓要推遲?提醒大家4件事早做準(zhǔn)備!

2026年清明節(jié)不一般,掃墓要推遲?提醒大家4件事早做準(zhǔn)備!

有范又有料
2026-03-07 14:14:16
史無前例!河北一村鼓勵(lì)高考生,考上985、211獎(jiǎng)5000,其他獎(jiǎng)3000

史無前例!河北一村鼓勵(lì)高考生,考上985、211獎(jiǎng)5000,其他獎(jiǎng)3000

火山詩話
2026-03-10 10:30:40
到東北喝了頓酒,才知道為啥東北白酒走不出東三省,不是價(jià)格問題

到東北喝了頓酒,才知道為啥東北白酒走不出東三省,不是價(jià)格問題

濤哥美食匯
2026-03-10 09:16:10
特朗普改口,原油高點(diǎn)大跌30%, 美股直線拉升

特朗普改口,原油高點(diǎn)大跌30%, 美股直線拉升

每日經(jīng)濟(jì)新聞
2026-03-10 08:53:07
美國打不過伊朗?你的問題,就是報(bào)道看得太多了

美國打不過伊朗?你的問題,就是報(bào)道看得太多了

走讀新生
2026-03-09 22:30:33
3月10日人民幣對美元中間價(jià)調(diào)升176個(gè)基點(diǎn)

3月10日人民幣對美元中間價(jià)調(diào)升176個(gè)基點(diǎn)

證券時(shí)報(bào)
2026-03-10 09:43:08
德黑蘭市民興奮地喊道:卡爾恰克革命衛(wèi)隊(duì)挨揍了!感謝美國以色列

德黑蘭市民興奮地喊道:卡爾恰克革命衛(wèi)隊(duì)挨揍了!感謝美國以色列

老馬拉車莫少裝
2026-03-08 10:49:49
深圳一幼兒園學(xué)費(fèi)217360元!網(wǎng)友:都說經(jīng)濟(jì)下滑,只是我窮而已

深圳一幼兒園學(xué)費(fèi)217360元!網(wǎng)友:都說經(jīng)濟(jì)下滑,只是我窮而已

火山詩話
2026-03-10 13:22:20
香菇再次被關(guān)注!醫(yī)生發(fā)現(xiàn):癌癥患者吃香菇,不用多久或有5改善

香菇再次被關(guān)注!醫(yī)生發(fā)現(xiàn):癌癥患者吃香菇,不用多久或有5改善

讀懂世界歷史
2026-02-12 21:48:53
賭球+假球+出賣球隊(duì)!被NBA終身禁賽后,他用一場三雙宣告回歸

賭球+假球+出賣球隊(duì)!被NBA終身禁賽后,他用一場三雙宣告回歸

球童無忌
2026-03-10 20:13:59
布倫特原油期貨大跌10%

布倫特原油期貨大跌10%

每日經(jīng)濟(jì)新聞
2026-03-10 08:51:04
油價(jià)已逼近傷害經(jīng)濟(jì)的水平

油價(jià)已逼近傷害經(jīng)濟(jì)的水平

新浪財(cái)經(jīng)
2026-03-10 00:53:10
大爆冷!王曼昱0-3不敵日本選手,與馬琳全程無交流,快哭出來了

大爆冷!王曼昱0-3不敵日本選手,與馬琳全程無交流,快哭出來了

翰飛觀事
2026-03-10 17:16:53
房價(jià)大局已定?未來近90%中國家庭,或許要經(jīng)歷這4大難關(guān)

房價(jià)大局已定?未來近90%中國家庭,或許要經(jīng)歷這4大難關(guān)

慧眼看世界哈哈
2026-03-10 14:44:07
“第一軟飯男”去世,伺候美國老婦13年,繼承268億,死后錢給誰

“第一軟飯男”去世,伺候美國老婦13年,繼承268億,死后錢給誰

來科點(diǎn)譜
2026-02-23 07:04:53
震驚!網(wǎng)傳廣東一車一日8次占應(yīng)急車道被扣48分,橫跨贛鄂湘三省

震驚!網(wǎng)傳廣東一車一日8次占應(yīng)急車道被扣48分,橫跨贛鄂湘三省

火山詩話
2026-03-10 17:06:29
大腳擊中海鷗的門將:當(dāng)時(shí)感覺糟透了,但救活它讓我們很欣慰

大腳擊中海鷗的門將:當(dāng)時(shí)感覺糟透了,但救活它讓我們很欣慰

懂球帝
2026-03-10 17:34:28
0-3爆冷!王曼昱輸球原因揭曉,前國手一針見血,國乒女單敲警鐘

0-3爆冷!王曼昱輸球原因揭曉,前國手一針見血,國乒女單敲警鐘

大秦壁虎白話體育
2026-03-10 15:10:05
官宣:沙特簽署購買中國翼龍-3生產(chǎn)線協(xié)議,價(jià)值50億美元

官宣:沙特簽署購買中國翼龍-3生產(chǎn)線協(xié)議,價(jià)值50億美元

世家寶
2026-03-10 11:44:04
馬云:未來三年到五年內(nèi),全世界的經(jīng)濟(jì),中國的經(jīng)濟(jì)都不好

馬云:未來三年到五年內(nèi),全世界的經(jīng)濟(jì),中國的經(jīng)濟(jì)都不好

南權(quán)先生
2026-03-10 15:25:39
2026-03-10 21:32:49
珞珈AI實(shí)戰(zhàn)筆記
珞珈AI實(shí)戰(zhàn)筆記
AI科技博主 | 一人企業(yè) 探索「AI超級個(gè)體」復(fù)利商業(yè)化 分享AI工具、實(shí)用教程與副業(yè)賺錢方法
1文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

頭條要聞

特朗普開始找接班人 當(dāng)眾問捐款人怎么看萬斯和魯比奧

頭條要聞

特朗普開始找接班人 當(dāng)眾問捐款人怎么看萬斯和魯比奧

體育要聞

加蘭沒那么差,但鱸魚會用嗎?

娛樂要聞

肖戰(zhàn)首奪SMG視帝,孫儷四封視后創(chuàng)歷史

財(cái)經(jīng)要聞

“龍蝦補(bǔ)貼”密集出爐 最高1000萬!

汽車要聞

MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

態(tài)度原創(chuàng)

健康
數(shù)碼
親子
公開課
軍事航空

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

史上最大電池折疊屏旗艦!榮耀Magic V6圖賞

親子要聞

當(dāng)萌娃被問:嬰兒為什么總是睡覺?她的回答太逗了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

剛說完戰(zhàn)爭很快結(jié)束 特朗普改口

無障礙瀏覽 進(jìn)入關(guān)懷版