国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

太狠了!奧特曼親手「干掉」GPT-5.2,OpenAI祭出最強(qiáng)編程AI

0
分享至


新智元報(bào)道

編輯:桃子 好困

【新智元導(dǎo)讀】最強(qiáng)AI智能體編程模型GPT-5.2-Codex登場(chǎng)!上下文壓縮,長(zhǎng)程任務(wù)處理更強(qiáng),而且還懂網(wǎng)絡(luò)安全。

GPT-5.2-Codex,深夜突襲!

它是OpenAI迄今為止,最強(qiáng)的AI智能體編程模型,專為復(fù)雜、真實(shí)世界軟件工程而打造。


從名字可以看出,GPT-5.2-Codex基于GPT-5.2進(jìn)一步優(yōu)化版本,它在多項(xiàng)能力上實(shí)現(xiàn)了關(guān)鍵改進(jìn):

· 上下文壓縮,提升了長(zhǎng)周期任務(wù)處理能力

· 在大型代碼變更,如重構(gòu)與遷移上性能更強(qiáng)

· 在原生Windows環(huán)境下,編程能力顯著增強(qiáng)

· 網(wǎng)絡(luò)安全能力最強(qiáng)

奧特曼宣稱,「OpenAI們」已經(jīng)用上了,而且還取得了非常好的成效。


在基準(zhǔn)測(cè)試中,GPT-5.2-Codex在軟件工程、終端測(cè)試中,擊敗了5.1-Codex-Max、GPT-5.2、GPT-5.1。


OpenAI博客中多次重點(diǎn)強(qiáng)調(diào),GPT-5.2-Codex在網(wǎng)絡(luò)安全上,達(dá)到了迄今為止最高水平。

就在上周,一位安全研究員用GPT-5.1-Codex-Max+Codex CLI,直接挖出了一個(gè)導(dǎo)致源代碼泄露的React漏洞。


今天起,所有付費(fèi)用戶皆可用上GPT-5.2-Codex,API將在未來(lái)幾周開(kāi)放。

GPT-5.2-Codex編程狂飆,長(zhǎng)跑不掉線

全新AI智能體編程GPT-5.2-Codex,簡(jiǎn)單來(lái)說(shuō),就是一次「強(qiáng)強(qiáng)聯(lián)合」。

它不光繼承了GPT-5.2原本擅長(zhǎng)的「專業(yè)工作處理能力」,還學(xué)到了5.1-Codex-Max在AI智能體編程和終端操作方面的能力。

這樣一來(lái),它的進(jìn)步就很實(shí)在了——

在長(zhǎng)上下文理解、工具調(diào)用、事實(shí)準(zhǔn)確性、原生上下文壓縮等方面,得到了顯著提升。

由此,GPT-5.2-Codex可以穩(wěn)定支持長(zhǎng)時(shí)間運(yùn)行的編程任務(wù),并在推理時(shí)更省token。

在業(yè)內(nèi)專業(yè)基準(zhǔn)測(cè)試中,5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0上刷新SOTA。

相較于5.1-Codex,約6%的性能提升。


這兩個(gè)測(cè)試,就是專門用于評(píng)估模型在真實(shí)終端環(huán)境中處理多樣化任務(wù)時(shí)的智能體能力。

同時(shí),它在原生Windows環(huán)境中的智能體編程表現(xiàn)也顯著增強(qiáng),進(jìn)一步擴(kuò)展了GPT-5.1-Codex-Max所引入的能力。

得益于這些改進(jìn),Codex能在大型代碼庫(kù)中長(zhǎng)時(shí)間工作,并始終保持完整上下文。

這也就意味著,諸如大規(guī)模重構(gòu)、代碼遷移和功能開(kāi)發(fā)等復(fù)雜任務(wù),GPT-5.2-Codex可以靠譜地完成。

——即便中途方案調(diào)整或嘗試失敗,也能持續(xù)迭代而不迷失方向。

不僅如此,GPT-5.2-Codex「視力」更強(qiáng)了。

編程時(shí),直接發(fā)給它截圖、技術(shù)示意圖、圖表以及各類UI界面,它都能理解得更準(zhǔn)。


更厲害的是,它可以直接讀取設(shè)計(jì)稿,并迅速將其轉(zhuǎn)化為可運(yùn)行的功能原型。

同時(shí),開(kāi)發(fā)者也可以與Codex協(xié)作,將這些原型一點(diǎn)點(diǎn)打磨,直到能正式上線使用。

三大躍遷,AI已「攻破」真實(shí)世界

在OpenAI的一項(xiàng)核心網(wǎng)絡(luò)安全評(píng)估中,可以明顯看到「能力隨時(shí)間的躍遷」——

· GPT-5-Codex帶來(lái)了第一次顯著提升,

· GPT-5.1-Codex-Max帶來(lái)了第二次,

· GPT-5.2-Codex則實(shí)現(xiàn)了第三次躍遷。


對(duì)此,OpenAI判斷,未來(lái)的AI模型仍將沿著這一趨勢(shì)持續(xù)演進(jìn)。

在做規(guī)劃和能力評(píng)估時(shí),他們一直假設(shè)每一代模型,都有潛力達(dá)到「準(zhǔn)備框架」(Preparedness Framework)里,定義的「高」等級(jí)網(wǎng)絡(luò)安全能力。

不過(guò),GPT-5.2-Codex目前還未達(dá)到這一水平。

那么,在真實(shí)世界中,OpenAI的智能體編程模型表現(xiàn)如何?

一周挖出React高危漏洞

12月11日,React團(tuán)隊(duì)爆出了:React Server Components的三個(gè)安全漏洞。

然后,Stripe旗下公司Privy的首席安全工程師Andrew MacPherson,就決定拿這個(gè)漏洞來(lái)「測(cè)試」一下現(xiàn)在的AI模型到底有多能打。

他使用了GPT-5.1-Codex-Max+Codex CLI,以及其他編程智能體,意外的是,在復(fù)現(xiàn)和研究漏洞的過(guò)程中,把關(guān)鍵React漏洞挖出來(lái)了。


具體實(shí)操過(guò)程如下——

最初,他嘗試了多次零樣本學(xué)習(xí)分析,直接讓模型檢查補(bǔ)丁并判斷其修復(fù)的漏洞類型,但并未取得成果。

隨后,他轉(zhuǎn)向更高頻、迭代式的提示方式;在這些方法仍然無(wú)效后,他引導(dǎo)Codex按照標(biāo)準(zhǔn)的防御性安全流程開(kāi)展工作——搭建本地測(cè)試環(huán)境、分析潛在攻擊面,并通過(guò)模糊測(cè)試向系統(tǒng)注入異常輸入。

在嘗試復(fù)現(xiàn)原始React2Shell問(wèn)題的過(guò)程中,Codex發(fā)現(xiàn)了一些異常行為,值得深入調(diào)查。

最終,在短短一周內(nèi),這一流程促成了此前未知漏洞的發(fā)現(xiàn),并被以負(fù)責(zé)任的方式披露給React團(tuán)隊(duì)。

這一案例清楚地展示了,先進(jìn)AI系統(tǒng)如何顯著加速真實(shí)世界、廣泛使用的軟件中的防御性安全研究。

網(wǎng)友實(shí)測(cè)

一位開(kāi)發(fā)者實(shí)測(cè)GPT-5.2-Codex編寫一個(gè)模擬道路上車輛與交通燈工作方式的程序,結(jié)果失敗了。



不過(guò)也有人認(rèn)為,其具備了與Gemini 3 Flash和Pro同樣精美的動(dòng)畫效果。



GPT-5.2-Codex在生成一款反恐精英的游戲,表現(xiàn)亮眼。


總言之,OpenAI認(rèn)為,GPT-5.2-Codex的發(fā)布,是AI在真實(shí)軟件開(kāi)發(fā)與網(wǎng)絡(luò)安全領(lǐng)域的又一大步。

它讓開(kāi)發(fā)者,能輕松應(yīng)對(duì)復(fù)雜又耗時(shí)的任務(wù),同時(shí)也為網(wǎng)絡(luò)安全研究提供更好的工具支持。

參考資料:

https://openai.com/index/introducing-gpt-5-2-codex/

https://openai.com/index/gpt-5-2-codex-system-card/

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
羅永浩又開(kāi)炮!開(kāi)通1000兆寬帶下載只有90多兆,上海電信壓力來(lái)了

羅永浩又開(kāi)炮!開(kāi)通1000兆寬帶下載只有90多兆,上海電信壓力來(lái)了

火山詩(shī)話
2025-12-19 06:40:20
海南封關(guān),新加坡的沉默震耳欲聾!

海南封關(guān),新加坡的沉默震耳欲聾!

環(huán)球策論
2025-12-18 22:39:23
剛剛,哈佛長(zhǎng)新冠研究突破!發(fā)現(xiàn)背后黑手

剛剛,哈佛長(zhǎng)新冠研究突破!發(fā)現(xiàn)背后黑手

徐德文科學(xué)頻道
2025-12-18 21:44:08
新華社證實(shí)南京博物院賣了《江南春》,事情變得更加撲朔迷離

新華社證實(shí)南京博物院賣了《江南春》,事情變得更加撲朔迷離

銀河敘事
2025-12-19 13:00:27
云南大理發(fā)生的這件事,有些人已經(jīng)徹底沒(méi)有底線了!

云南大理發(fā)生的這件事,有些人已經(jīng)徹底沒(méi)有底線了!

胖胖說(shuō)他不胖
2025-12-19 11:00:11
27歲女孩“巧巧”已不幸離世,體重僅35斤,命運(yùn)坎坷!早年父親去世,母親改嫁,有嚴(yán)重抑郁癥

27歲女孩“巧巧”已不幸離世,體重僅35斤,命運(yùn)坎坷!早年父親去世,母親改嫁,有嚴(yán)重抑郁癥

新民晚報(bào)
2025-12-19 15:05:51
潘周聃都選它!累計(jì)交付突破20萬(wàn)臺(tái),領(lǐng)克EM-P超電雙子星殺瘋了

潘周聃都選它!累計(jì)交付突破20萬(wàn)臺(tái),領(lǐng)克EM-P超電雙子星殺瘋了

Nice好車
2025-12-19 11:43:43
梅艷芳母親100歲大壽留影,四個(gè)孩子離世仨,如今過(guò)的比誰(shuí)都瀟灑

梅艷芳母親100歲大壽留影,四個(gè)孩子離世仨,如今過(guò)的比誰(shuí)都瀟灑

萬(wàn)物知識(shí)圈
2025-12-18 09:12:45
2019年,被“港獨(dú)”暴徒圍攻,被迫舉槍的光頭警長(zhǎng),后來(lái)怎樣了?

2019年,被“港獨(dú)”暴徒圍攻,被迫舉槍的光頭警長(zhǎng),后來(lái)怎樣了?

知鑒明史
2025-12-18 18:21:51
吳京認(rèn)祖多爾袞?原諒我不厚道地笑了,這文化水平實(shí)在笑死個(gè)人啊

吳京認(rèn)祖多爾袞?原諒我不厚道地笑了,這文化水平實(shí)在笑死個(gè)人啊

寒士之言本尊
2025-12-18 12:10:25
10人逃單后續(xù):堂哥張先生作為組局人最終付款卻面子里子全無(wú)

10人逃單后續(xù):堂哥張先生作為組局人最終付款卻面子里子全無(wú)

沒(méi)有偏旁的常慶
2025-12-19 06:30:04
最新!抖音集團(tuán)副總裁回應(yīng)出新規(guī)

最新!抖音集團(tuán)副總裁回應(yīng)出新規(guī)

每日經(jīng)濟(jì)新聞
2025-12-16 21:12:04
赴日外國(guó)游客突破3900萬(wàn)人次再創(chuàng)歷史新高 中國(guó)游客影響有限

赴日外國(guó)游客突破3900萬(wàn)人次再創(chuàng)歷史新高 中國(guó)游客影響有限

顫抖的熊貓
2025-12-17 22:12:26
被認(rèn)定為贗品的《江南春》圖卷2001年以6800元價(jià)格賣出!多部門調(diào)查最新進(jìn)展

被認(rèn)定為贗品的《江南春》圖卷2001年以6800元價(jià)格賣出!多部門調(diào)查最新進(jìn)展

海峽網(wǎng)
2025-12-19 09:42:23
泰軍宣布重創(chuàng)柬埔寨!繳獲大批中國(guó)造導(dǎo)彈!打到洪森父子投降?

泰軍宣布重創(chuàng)柬埔寨!繳獲大批中國(guó)造導(dǎo)彈!打到洪森父子投降?

深度報(bào)
2025-12-17 23:06:04
日本迫使蘋果調(diào)整iOS規(guī)則大幅降低蘋果稅,中國(guó)繼續(xù)人傻錢多?

日本迫使蘋果調(diào)整iOS規(guī)則大幅降低蘋果稅,中國(guó)繼續(xù)人傻錢多?

風(fēng)向觀察
2025-12-18 16:40:37
“日入過(guò)萬(wàn)”的16歲深圳燒雞少年壓力來(lái)了!稱每天到手只有1000多

“日入過(guò)萬(wàn)”的16歲深圳燒雞少年壓力來(lái)了!稱每天到手只有1000多

火山詩(shī)話
2025-12-19 11:47:47
亞歷山大32+7+6雷霆送快船5連敗,哈登缺席萊納德22+8+6

亞歷山大32+7+6雷霆送快船5連敗,哈登缺席萊納德22+8+6

湖人崛起
2025-12-19 11:25:36
臨床PK完勝ChatGPT-5!國(guó)內(nèi)團(tuán)隊(duì)造出首個(gè)OCT影像AI系統(tǒng)

臨床PK完勝ChatGPT-5!國(guó)內(nèi)團(tuán)隊(duì)造出首個(gè)OCT影像AI系統(tǒng)

機(jī)器之心Pro
2025-12-16 13:16:06
俄領(lǐng)導(dǎo)人威脅稱,如果談判失敗,俄羅斯將“以武力”奪取領(lǐng)土

俄領(lǐng)導(dǎo)人威脅稱,如果談判失敗,俄羅斯將“以武力”奪取領(lǐng)土

山河路口
2025-12-17 22:34:47
2025-12-19 15:48:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14134文章數(shù) 66391關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

剎車失靈時(shí)速115飆490公里司機(jī):下車后渾身抖無(wú)法說(shuō)話

頭條要聞

剎車失靈時(shí)速115飆490公里司機(jī):下車后渾身抖無(wú)法說(shuō)話

體育要聞

沒(méi)有塔圖姆,還有塔禿姆

娛樂(lè)要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財(cái)經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無(wú)期

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

手機(jī)
教育
親子
藝術(shù)
本地

手機(jī)要聞

追覓首款手機(jī)曝光:1.08億主攝、6.67英寸屏幕、5000mAh電池

教育要聞

官宣!鼓勵(lì)高校為申報(bào)就業(yè)創(chuàng)業(yè)職稱的教師傾斜名額

親子要聞

10歲孩子竟患癌!上海一醫(yī)院兩周3例,醫(yī)生提醒:警惕這種癥狀

藝術(shù)要聞

諸樂(lè)三的寫意花鳥(niǎo)

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版