国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.4「原生操控電腦」實測封神!OpenClaw天選模型來了

0
分享至


新智元報道

編輯:定慧

【新智元導讀】OpenAI深夜發(fā)布GPT-5.4,首次實現(xiàn)原生電腦操控能力,實測驚艷,幾乎可以操作電腦上所有應用!

凌晨兩點,OpenAI毫無預兆地丟出了GPT-5.4。

這個模型,即將改變2026年整個AIAgent格局!

這一次,最核心的能力終于呼之欲出:原生操控電腦。

Agent能力是2026年AI進化的主線任務,在實測后,一個深刻的感受:

GPT-5.4可能是2026年目前為止,最適合跑OpenClaw的模型。

或許沒有之一。


一手實測GPT-5.4

打工人真的懸了

目前GPT-5.4已經(jīng)在網(wǎng)頁版和Codex中上線,在實測多種場景后,真的只有一個感受:打工人真的懸了。

這個模型幾乎可以操作電腦上的一切:文件、程序、檔案、終端等等,只要是打工人能做,它都可以做。


以Macbook為例,讓GPT-5.4操作日歷來定制提醒。

GPT-5.4直接調(diào)起對應應用,并要求系統(tǒng)給予對應的權(quán)限。


然后日歷中就出現(xiàn)了對應的提醒。


你還可以用GPT-5.4來操作電腦打開APP,比如要求打開小宇宙 APP。

GPT-5.4不僅可以找到APP,還能播放對應的節(jié)目。


你甚至可以要求GPT-5.4直接操作計算器APP,而且是在計算器 APP內(nèi)部來計算。


幾乎你電腦上任何APP,都可以被GPT-5.4所調(diào)用,比如打開微信讀書。

這是真正的「原生電腦操控能力」。


你可以要求GPT-5.4更換電腦壁紙。


甚至,你可以要求GPT-5.4操作終端來打開claude code。



我們都知道OpenClaw這只「龍蝦」能夠爆火,核心就是其Agent能力太過強大。

一個部署在Macmini上的OpenClaw幾乎擁有和人類一樣的操作能力和操作權(quán)限。

而這一次,GPT-5.4直接在模型層面實現(xiàn)「原生操控電腦」能力。


OpenClaw之父Peter評價GPT-5.4在編程能力提升不小外,在其他能力方面更加統(tǒng)一、更加智能。


HyperWriteAI、OthersideAI首席執(zhí)行官Matt Shumer認為GPT-5.4是目前世界上最好的模型,遠超其他。

他對GPT-5.4的評價是:不可思議、超乎想象。

即便是標準模式下,GPT-5.4 的表現(xiàn)也超越了以往專業(yè)版的模型……這簡直不可思議!

編程能力更是驚人……近乎完美無瑕。

在Codex內(nèi)部,它的可靠性達到了極致。

編程問題基本上已被攻克。關于這點無需多言,它的優(yōu)秀程度就是如此超乎想象。


OpenAI的杰出科學家Sebastien Bubeck用一幅梗圖來形容GPT-5.4編程能力提升。


Mercor AI首席執(zhí)行官Brenda則認為GPT-5.4即將超越頂尖咨詢公司、頂尖投行和頂尖律所的專業(yè)能力。

也就是人類精英金領的所有工作,它都能做,甚至做的更好。


原生電腦操控能力

這是真正的分水嶺

實測后,讓我們來仔細想想,GPT-5.4到底強在哪里?

GPT-5.4是OpenAI發(fā)布的第一個具備「原生電腦使用能力」的通用模型。

它不需要借助外部框架或者專門的適配層,就能直接通過截圖識別屏幕內(nèi)容,發(fā)出鼠標點擊和鍵盤輸入指令,像人類一樣在桌面環(huán)境中操作軟件。

在OSWorld-Verified基準測試中(這個測試衡量AI在真實桌面環(huán)境中的導航能力),GPT-5.4拿到了75.0%的成功率。


作為對比,GPT-5.2只有47.3%,而人類基準線是72.4%。

也就是說,GPT-5.4操控電腦的能力,已經(jīng)超過了普通人類用戶的平均水平。

這是第一次有通用AI模型做到這一點。

AI操控電腦,第一次比人類自己操控得更好。

天作之合:GPT-5.4精準命中OpenClaw每一個痛點

再說回OpenClaw,為什么說GPT-5.4是OpenClaw的天選模型?

終于來到了最讓人興奮的部分。

如果你在今年年初關注過科技圈,你不可能不知道OpenClaw。

這個由PSPDFKit創(chuàng)始人Peter Steinberger開發(fā)的開源個人AI助手項目,在2026年1月以72小時狂攬6萬GitHub Star的速度一夜爆紅,如今Star數(shù)已經(jīng)突破25萬,甚至一度帶動Mac Mini全球賣斷貨、樹莓派股價翻倍。


OpenClaw的核心理念只有一句話:TheAIthat actually does things。

不只是聊天,而是真的幫你干活。

它運行在你自己的電腦上,擁有對Shell、文件系統(tǒng)、瀏覽器的完整訪問權(quán)限。

你通過WhatsApp、Telegram、飛書、釘釘發(fā)一條消息,它就能在后臺幫你執(zhí)行終端命令、編寫腳本、管理郵件、抓取網(wǎng)頁數(shù)據(jù),甚至安裝和調(diào)試軟件。

它有持久記憶,能通過不斷擴展技能變得越來越強大。

但是,OpenClaw有一個公開的秘密:模型就是產(chǎn)品。

OpenClaw創(chuàng)始人Peter Steinberger自己說過,推薦使用最強的最新一代模型。

社區(qū)的結(jié)論也一針見血:模型即產(chǎn)品,框架只是包裝。

社區(qū)里廣泛流傳的經(jīng)驗是,如果你用的模型不夠強,OpenClaw的魔法就會消失。

有開發(fā)者做過詳細測試,用低端模型運行OpenClaw和用Claude Opus 4.5運行,體驗差距可以到40%到95%。

OpenClaw的創(chuàng)始人Peter推薦將OpenClaw的版本升級到5.4之后,再配合GPT-5.4。


模型的推理能力、工具調(diào)用準確度、長程任務的上下文保持能力,直接決定了OpenClaw到底是賽博秘書還是昂貴的自動補全。

而GPT-5.4恰恰在OpenClaw最需要的每一個維度上,都踩中了甜蜜點。

原生電腦操控——完美匹配。

OpenClaw的核心價值就是讓AI操作你的電腦。GPT-5.4是第一個原生具備這一能力的通用模型,OSWorld測試超越人類水平。這意味著接入GPT-5.4的OpenClaw,不再需要通過復雜的適配和Hack來實現(xiàn)桌面自動化,而是像給賽車換上了渦輪發(fā)動機——從底層就是為這個場景而生。

100萬Token上下文——續(xù)航無憂。

OpenClaw是一個持續(xù)運行的Agent,需要維持長對話、記住復雜指令鏈、處理大量文件內(nèi)容。以前用其他模型,跑著跑著就忘了前面的任務。100萬Token的上下文窗口,意味著OpenClaw終于有了足夠大的工作臺來鋪開所有材料。

Tool Search——Agent的效率革命。

OpenClaw的強大之處在于它可以接入數(shù)十種Skills和工具。但工具越多,每次調(diào)用消耗的Token就越多,成本飆升。GPT-5.4的Tool Search機制天然解決了這個問題——不用把所有工具定義都塞進上下文,按需取用,Token消耗直降47%。對于7×24小時運行的OpenClaw來說,這可能意味著每月節(jié)省幾十甚至上百美元的API費用。

推理能力躍升——告別高級自動補全。

之前用低端模型運行OpenClaw,遇到稍微復雜的任務就卡殼。GPT-5.4在專業(yè)工作任務中超過83%的人類專家表現(xiàn),配合其在數(shù)學、編程、文檔處理等領域的全面提升,意味著OpenClaw可以勝任更復雜、更高價值的工作場景。從幫你寫代碼調(diào)Bug,到幫你做財務分析寫投資備忘錄,想象空間瞬間拉滿。

事實上,OpenClaw的官方文檔已經(jīng)提供了GPT-5.4的接入配置方案,OpenAI的Responses API也已全面支持。

社區(qū)里第一批吃螃蟹的人應該已經(jīng)在配置了。

新時代的起點

讓我們把視野拉遠一點。

GPT-5.4的發(fā)布,不僅是模型參數(shù)的又一次刷新,更標志著AI行業(yè)正在經(jīng)歷一次底層邏輯的切換:從對話式AI到智能體AI的跨越

過去幾年,我們一直在討論AI有多聰明、能寫什么、能回答什么。

但從GPT-5.4開始,話題變了——AI能做什么、能完成什么、能替代什么。

當一個模型能獨立操控電腦比普通人更熟練,能在83%的專業(yè)場景中匹敵行業(yè)專家——這不是量變,這是質(zhì)變。

而OpenClaw這樣的開源Agent框架,正是把這種能力轉(zhuǎn)化為實際生產(chǎn)力的橋梁。

GPT-5.4+OpenClaw的組合,讓我們第一次清晰地看到了個人AI員工從概念變?yōu)楝F(xiàn)實的路徑。

對于一些人來說,奇點已經(jīng)到了。

你,準備好了嗎?

參考資料:

https://chatgpt.com/codex

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
卡里烏斯女友:穿著選擇是對觀眾的尊重;我喜歡那種火熱感覺

卡里烏斯女友:穿著選擇是對觀眾的尊重;我喜歡那種火熱感覺

懂球帝
2026-03-07 05:24:28
詹姆斯:媽媽生我時只有16歲 我的動力是給她買個帶儲藏室的房子

詹姆斯:媽媽生我時只有16歲 我的動力是給她買個帶儲藏室的房子

羅說NBA
2026-03-06 07:04:36
國家發(fā)改委:預計今年GDP增量超過6萬億元,相當于一個發(fā)達經(jīng)濟體全年的GDP總量

國家發(fā)改委:預計今年GDP增量超過6萬億元,相當于一個發(fā)達經(jīng)濟體全年的GDP總量

極目新聞
2026-03-06 16:19:45
一個U盤裝走180億,200萬人的血汗錢48小時人間蒸發(fā)

一個U盤裝走180億,200萬人的血汗錢48小時人間蒸發(fā)

流蘇晚晴
2026-03-01 16:54:18
陳小春接 Jasper 放學,校門口抽煙被認出,下一秒直接竄到馬路對面

陳小春接 Jasper 放學,校門口抽煙被認出,下一秒直接竄到馬路對面

草莓解說體育
2026-03-06 09:41:09
失業(yè)游民的戾氣越來越重了

失業(yè)游民的戾氣越來越重了

經(jīng)濟學教授V
2025-11-12 18:49:14
45歲金卡戴珊片場秀身材,肥臀,傲人胸,是真實存在的嗎

45歲金卡戴珊片場秀身材,肥臀,傲人胸,是真實存在的嗎

娛樂領航家
2026-03-06 21:00:03
宗教習俗不能擾民:誰給你凌晨敲梆子喚醒的權(quán)力?

宗教習俗不能擾民:誰給你凌晨敲梆子喚醒的權(quán)力?

西域都護
2026-03-05 22:49:54
詹姆斯談未來退役:有點像失去摯愛舉辦葬禮 但這也是生命的慶典

詹姆斯談未來退役:有點像失去摯愛舉辦葬禮 但這也是生命的慶典

羅說NBA
2026-03-07 06:00:50
你有過什么震驚的經(jīng)歷?淳W(wǎng)友講述,我下巴也震驚的掉了下來

你有過什么震驚的經(jīng)歷?淳W(wǎng)友講述,我下巴也震驚的掉了下來

侃神評故事
2026-02-28 17:35:03
伊朗外長最新表態(tài)

伊朗外長最新表態(tài)

環(huán)球時報國際
2026-03-07 00:15:51
15年前,那個當著全世界喝下核污染水的日本官員,如今還活著嗎

15年前,那個當著全世界喝下核污染水的日本官員,如今還活著嗎

小蜜情感說
2026-03-06 16:52:42
成都天氣:弱冷空氣來襲 降溫降雨在路上

成都天氣:弱冷空氣來襲 降溫降雨在路上

掌上金牛
2026-03-06 17:55:08
一個家庭最大災難,不是窮,而是父母六七十歲還存在以下6種情況

一個家庭最大災難,不是窮,而是父母六七十歲還存在以下6種情況

大熊歡樂坊
2026-03-06 20:10:49
車長破5080mm 上汽奧迪A7L Avant曝光 旅行車市場迎新變量

車長破5080mm 上汽奧迪A7L Avant曝光 旅行車市場迎新變量

西莫的藝術宮殿
2026-03-06 13:30:52
潮汕婚禮丈母娘火了,打扮嬌艷比新娘還搶鏡,網(wǎng)友:感覺有點不對

潮汕婚禮丈母娘火了,打扮嬌艷比新娘還搶鏡,網(wǎng)友:感覺有點不對

梅子的小情緒
2026-02-08 19:59:04
全英賽爆大冷!世界亞軍0-2出局,日本女雙慘敗,陳雨菲戰(zhàn)安洗瑩

全英賽爆大冷!世界亞軍0-2出局,日本女雙慘敗,陳雨菲戰(zhàn)安洗瑩

小徐講八卦
2026-03-07 06:11:12
謝娜禍不單行!被曝走紅后甩掉劉燁,和張杰住在劉燁買的房子里

謝娜禍不單行!被曝走紅后甩掉劉燁,和張杰住在劉燁買的房子里

古希臘掌管月桂的神
2026-03-04 09:26:31
湖南衛(wèi)視元宵晚會直播發(fā)生意外,一名表演嘉賓在完成舞臺動作時意外失誤撞向何炅,何炅:這是要給我拜個晚年嗎

湖南衛(wèi)視元宵晚會直播發(fā)生意外,一名表演嘉賓在完成舞臺動作時意外失誤撞向何炅,何炅:這是要給我拜個晚年嗎

極目新聞
2026-03-04 09:59:45
剛剛,暴漲!直線飆升!

剛剛,暴漲!直線飆升!

新浪財經(jīng)
2026-03-06 20:18:56
2026-03-07 09:04:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領航智能+時代
14656文章數(shù) 66665關注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

中東局勢動蕩 歐盟"女外長"污蔑:中國趁機拿捏歐洲

頭條要聞

中東局勢動蕩 歐盟"女外長"污蔑:中國趁機拿捏歐洲

體育要聞

跑了24年,他終于成為英超“最長的河”

娛樂要聞

周杰倫社交媒體曬昆凌,夫妻感情穩(wěn)定

財經(jīng)要聞

關于經(jīng)濟、股市等,五部門都說了啥?

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

時尚
藝術
手機
家居
數(shù)碼

這些才是適合普通人的穿搭!搭配腰帶、多穿牛仔褲,簡單舒適

藝術要聞

一個電影編劇水平是如何評判的?

手機要聞

7999元起!華為Mate 80 Pro Max官網(wǎng)開放購買:4月15日前發(fā)貨

家居要聞

暖棕撞色 輕法奶油風

數(shù)碼要聞

蘋果MacBook Neo能虛擬機安裝Win11嗎?Parallels回應稱在測試

無障礙瀏覽 進入關懷版