国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

100萬 Token + 接管鼠標(biāo):GPT-5.4 正把 AI 推向“數(shù)字員工”

0
分享至


如果一個 AI 能夠閱讀整套項目文檔,在復(fù)雜問題上進(jìn)行長時間推理,并且自己操作電腦完成任務(wù),它就不再只是一個聊天機(jī)器人。

它更像是一種新的軟件形態(tài)。

隨著 OpenAI 推出 GPT-5.4 Thinking 與 GPT-5.4 Pro,這種變化正在變得具體。100 萬 Token 上下文、推理時計算模式,以及原生計算機(jī)操作能力,第一次在同一代模型中同時出現(xiàn)。

當(dāng)這些能力開始匯合,大模型的角色也在發(fā)生轉(zhuǎn)變——從回答問題,轉(zhuǎn)向直接完成工作。

GPT-5.4:一次圍繞“執(zhí)行能力”的模型升級

2026 年 3 月初,硅谷再次進(jìn)入密集的 AI 發(fā)布周期。

在多輪業(yè)內(nèi)傳聞之后,OpenAI 推出了 GPT-5.4 系列模型。與過去幾次升級主要強(qiáng)化聊天體驗或推理能力不同,這一版本的能力組合明顯指向一個更實際的目標(biāo):讓 AI 更直接地參與真實工作流程。


公開信息顯示,模型的核心能力包括:最高 100 萬 Token 上下文窗口GPT-5.4 Thinking 推理模式、Computer-Use 原生計算機(jī)操作能力,以及 Tool Search 工具檢索機(jī)制。這些能力并非單點突破,而是圍繞“執(zhí)行能力”的系統(tǒng)性升級。

在桌面任務(wù)基準(zhǔn) OSWorld benchmark 的測試中,模型完成任務(wù)的成功率約為 75%,略高于該 benchmark 的人類測試基線約 72%。而在職業(yè)任務(wù)評估 GDPval benchmark 中,模型在 44 種知識型工作任務(wù)中約 83% 的評分進(jìn)入專家區(qū)間。


這些指標(biāo)本身或許仍需要更多實際驗證,但它們指向的趨勢非常明確:AI 正在從信息處理工具變成任務(wù)執(zhí)行系統(tǒng)。

長上下文:模型第一次能“讀完整個項目”

企業(yè)在部署大模型時,一直面臨一個結(jié)構(gòu)性限制——上下文窗口。早期模型只能處理有限的信息量,這迫使企業(yè)構(gòu)建復(fù)雜的 Retrieval-Augmented Generation(RAG)系統(tǒng):文檔被拆分、向量化、索引,再在查詢時重新拼接給模型。

這種架構(gòu)在過去兩年成為 AI 工程的標(biāo)準(zhǔn)方案,但也帶來了新的復(fù)雜度。數(shù)據(jù)被切塊后,上下文關(guān)系容易丟失;檢索系統(tǒng)本身也增加了延遲與維護(hù)成本。

GPT-5.4 將上下文窗口擴(kuò)展到 100 萬 Token。這意味著模型在單次任務(wù)中理論上可以處理完整代碼庫、長期財務(wù)記錄,甚至整個項目文檔集合。

RAG 并不會消失,因為權(quán)限控制、實時數(shù)據(jù)更新以及索引效率仍然是企業(yè)系統(tǒng)不可替代的一部分。但在很多分析型任務(wù)中,超長上下文確實降低了對復(fù)雜檢索架構(gòu)的依賴。

更重要的是,模型開始具備一種過去難以實現(xiàn)的能力:理解完整項目,而不是零散信息片段

Computer-Use:AI 開始直接操作軟件

如果說長上下文改變的是理解能力,那么 Computer-Use 改變的則是執(zhí)行能力。

在這一模式下,模型可以通過視覺理解軟件界面,并模擬鼠標(biāo)點擊、鍵盤輸入以及應(yīng)用導(dǎo)航等操作。這意味著 AI 不再只通過 API 調(diào)用系統(tǒng),而是可以像用戶一樣直接操作軟件界面。

這一變化對企業(yè)自動化領(lǐng)域尤其重要。過去二十年,大量企業(yè)流程自動化依賴 Robotic Process Automation(RPA)系統(tǒng),其核心邏輯是通過腳本執(zhí)行固定步驟,例如錄入數(shù)據(jù)或在系統(tǒng)之間復(fù)制信息。

而具備視覺理解與規(guī)劃能力的 AI,則可能承擔(dān)更復(fù)雜的任務(wù),例如:

  • 跨系統(tǒng)整理數(shù)據(jù)

  • 執(zhí)行多步驟后臺流程

  • 在陌生界面中尋找操作路徑

RPA 并不會立即被取代,但 AI 代理已經(jīng)開始進(jìn)入它們長期占據(jù)的自動化領(lǐng)域。

推理時計算:AI 學(xué)會“慢思考”

GPT-5.4 的另一項關(guān)鍵變化,是 Thinking 模式。這一模式并不是簡單擴(kuò)大模型規(guī)模,而是在推理階段投入更多計算資源,從而提高復(fù)雜任務(wù)的可靠性。

這代表著大模型發(fā)展的一條重要路線:推理時計算(compute-at-inference)。過去十年,模型能力主要依賴訓(xùn)練階段的大規(guī)模數(shù)據(jù)與算力,但隨著預(yù)訓(xùn)練收益逐漸遞減,越來越多公司開始把算力投入到推理階段。

類似趨勢也出現(xiàn)在其他 AI 公司,例如 Anthropic 的深度推理模式,以及 Google 在復(fù)雜任務(wù)中的推理系統(tǒng)。

這種模式的特點很明顯:響應(yīng)時間更長、計算成本更高,但復(fù)雜任務(wù)的成功率明顯提高。在法律分析、財務(wù)建模或復(fù)雜決策任務(wù)中,這類“慢思考 AI”反而更接近真實的專業(yè)工作方式。

Tool Search:被低估的架構(gòu)升級

相比百萬 Token 與 computer-use,Tool Search 可能是這次發(fā)布中最容易被忽視的一項升級。

過去,當(dāng)模型需要調(diào)用工具時,開發(fā)者通常必須把所有工具說明都加載進(jìn)提示詞中。這不僅占用上下文空間,也增加了 Token 成本。


Tool Search 改變了這一機(jī)制:模型可以在需要時檢索工具定義,而不是預(yù)加載全部工具。

在多工具系統(tǒng)中,這種方式可顯著減少工具相關(guān)的 Token 消耗。對于構(gòu)建復(fù)雜 AI 系統(tǒng)的開發(fā)者而言,這類架構(gòu)優(yōu)化往往比單純提升模型能力更重要。

因為真正的大規(guī)模 AI 應(yīng)用,通常由幾十甚至上百個工具共同組成。

AI 競爭的真正焦點正在改變

如果把這些變化放在一起觀察,就會發(fā)現(xiàn) AI 競爭的重心正在發(fā)生變化。

過去幾年,大模型競爭主要集中在規(guī)模、參數(shù)與價格。但現(xiàn)在,競爭正在逐漸轉(zhuǎn)向另一件事情:誰能讓 AI 真正完成任務(wù)。

在這個維度上,不同公司的策略逐漸分化:

  • OpenAI:強(qiáng)調(diào) AI 代理與執(zhí)行能力

  • Anthropic:強(qiáng)調(diào)可靠推理與安全性

  • Google:強(qiáng)調(diào)工具生態(tài)與云基礎(chǔ)設(shè)施

這場競爭的終點,很可能不是更聰明的聊天機(jī)器人,而是一種新的軟件形態(tài)。

一種可以理解任務(wù)、規(guī)劃步驟并執(zhí)行操作的 AI 工作代理。

軟件范式正在變化

從更長的上下文,到更強(qiáng)的推理,再到直接操作軟件界面,大模型正在同時獲得三種能力:理解信息、思考問題、執(zhí)行操作。

當(dāng)這三種能力結(jié)合在一起時,AI 就不再只是軟件的一個接口,而可能逐漸成為新的軟件平臺。

在這種結(jié)構(gòu)下,大模型不僅會改變搜索、寫作或編程工具,還可能重新塑造企業(yè)軟件的基本形態(tài)。

問題已經(jīng)不再是 AI 能否理解工作。而是 AI 何時開始真正接管工作流程(本文首發(fā)鈦媒體App , 作者|硅谷Tech news,編輯|秦聰慧)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
如果熱刺在英超降級卻奪得歐冠冠軍,會發(fā)生什么?

如果熱刺在英超降級卻奪得歐冠冠軍,會發(fā)生什么?

星耀國際足壇
2026-03-06 23:58:30
太危險了! 2025年浙江男子自制1800伏“電貓”,拉70多米抓2只吃

太危險了! 2025年浙江男子自制1800伏“電貓”,拉70多米抓2只吃

萬象硬核本尊
2026-03-06 18:36:27
美軍陣亡士兵遺體繼續(xù)在中東被發(fā)現(xiàn)

美軍陣亡士兵遺體繼續(xù)在中東被發(fā)現(xiàn)

碳基生物關(guān)懷組織
2026-03-03 23:37:09
繼女訂婚,我送一套婚房,婚宴前晚她來電:叔叔,明天你別坐主桌

繼女訂婚,我送一套婚房,婚宴前晚她來電:叔叔,明天你別坐主桌

堇色夜行
2025-12-06 14:47:59
不是打不贏,而是打不起!美國高層直言:拿下伊朗易如反掌,但這會讓中國徹底脫離牽制

不是打不贏,而是打不起!美國高層直言:拿下伊朗易如反掌,但這會讓中國徹底脫離牽制

起喜電影
2026-03-06 03:28:53
五五分流為什么分不下去了?背后的真相

五五分流為什么分不下去了?背后的真相

楓冷慕詩
2026-01-24 13:09:19
極目調(diào)查丨老板瘋狂搶人,一天500元難招技工,廣州“制衣村”工人為何如此緊俏?

極目調(diào)查丨老板瘋狂搶人,一天500元難招技工,廣州“制衣村”工人為何如此緊俏?

極目新聞
2026-03-06 22:41:34
中國女籃72-66雙殺巴西!數(shù)據(jù)一清二楚:不是張子宇 最大功臣是她

中國女籃72-66雙殺巴西!數(shù)據(jù)一清二楚:不是張子宇 最大功臣是她

侃球熊弟
2026-03-06 21:12:18
國家敲定2026年養(yǎng)老金上漲,漲多少?一個沒想到,還有一個好消息

國家敲定2026年養(yǎng)老金上漲,漲多少?一個沒想到,還有一個好消息

鯨探所長
2026-03-06 19:21:04
曾有個很流行的日本謠言:質(zhì)量好的留在日本,等外品的垃圾賣中國

曾有個很流行的日本謠言:質(zhì)量好的留在日本,等外品的垃圾賣中國

章哥說買房
2026-03-05 12:17:42
掛斷王毅電話后,以色列大軍突然向北進(jìn)攻,第二場大戰(zhàn)爆發(fā)

掛斷王毅電話后,以色列大軍突然向北進(jìn)攻,第二場大戰(zhàn)爆發(fā)

Ck的蜜糖
2026-03-04 17:58:13
姑姑春節(jié)給我10萬紅包,只因她生了二胎,想要我包20萬紅包

姑姑春節(jié)給我10萬紅包,只因她生了二胎,想要我包20萬紅包

星羽故事集
2026-02-26 10:52:39
全國人大代表顧祥林:留學(xué)生回國求職規(guī)模大,怎樣避免“僧多粥少”局面?

全國人大代表顧祥林:留學(xué)生回國求職規(guī)模大,怎樣避免“僧多粥少”局面?

上觀新聞
2026-03-06 20:57:06
農(nóng)民養(yǎng)老金問題,今年開始破冰?

農(nóng)民養(yǎng)老金問題,今年開始破冰?

中產(chǎn)先生
2026-03-06 12:16:45
說白了,一開始,全世界都在下注,賭中國會輸。

說白了,一開始,全世界都在下注,賭中國會輸。

忠于法紀(jì)
2025-12-20 10:12:27
伊朗稱向美軍“林肯”號航母發(fā)射導(dǎo)彈

伊朗稱向美軍“林肯”號航母發(fā)射導(dǎo)彈

環(huán)球網(wǎng)資訊
2026-03-07 03:21:50
伊朗網(wǎng)紅吐槽中國網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭的殘酷

伊朗網(wǎng)紅吐槽中國網(wǎng)民,他們都太好戰(zhàn)了,根本不懂戰(zhàn)爭的殘酷

新游戲大妹子
2026-03-05 12:59:52
那些慣于宏大敘事的人,會聆聽重慶女孩和長沙街頭餓暈的人嗎?

那些慣于宏大敘事的人,會聆聽重慶女孩和長沙街頭餓暈的人嗎?

林中木白
2025-10-09 16:35:47
美以伊軍事沖突最大副作用,是斬斷了俄羅斯的“救命稻草”

美以伊軍事沖突最大副作用,是斬斷了俄羅斯的“救命稻草”

廖保平
2026-03-05 12:08:52
360周鴻祎眼睛換上人工晶體:摘掉眼鏡是為了戴AI眼鏡

360周鴻祎眼睛換上人工晶體:摘掉眼鏡是為了戴AI眼鏡

IT之家
2026-03-05 11:02:08
2026-03-07 06:11:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
130329文章數(shù) 861894關(guān)注度
往期回顧 全部

科技要聞

獨家|除夕加班、毫無黑料!林俊旸無奈離場

頭條要聞

伊朗稱向美軍“林肯”號航母發(fā)射導(dǎo)彈

頭條要聞

伊朗稱向美軍“林肯”號航母發(fā)射導(dǎo)彈

體育要聞

跑了24年,他終于成為英超“最長的河”

娛樂要聞

周杰倫社交媒體曬昆凌,夫妻感情穩(wěn)定

財經(jīng)要聞

關(guān)于經(jīng)濟(jì)、股市等,五部門都說了啥?

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

教育
家居
手機(jī)
旅游
公開課

教育要聞

“縣城的最愛學(xué)這種課”,一段女兒當(dāng)街走秀視頻,把人看尷尬了

家居要聞

暖棕撞色 輕法奶油風(fēng)

手機(jī)要聞

榮耀600系列曝光:9000mAh+2億像素+超聲波指紋,這波堆料太狠

旅游要聞

杭州CBD藏了片七彩油菜花海,草莓熊坐鎮(zhèn),成年人的治愈全在這兒

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版