国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI最強編程模型登場,實測竟又被Gemini 3 Flash按趴下

0
分享至


智東西
編譯 王欣逸
編輯 程茜

智東西12月19日消息,今日凌晨,OpenAI發(fā)布最新編程模型GPT-5.2-Codex,該模型基于GPT-5.2,對智能體編程能力進行了深度優(yōu)化,具體包括:提升了長程任務(wù)執(zhí)行、大規(guī)模代碼變更、兼容Windows環(huán)境以及網(wǎng)絡(luò)安全防御等能力。OpenAI在博客中稱這是他們迄今為止最強的編程模型。


據(jù)OpenAI官方博客,GPT?5.2-Codex不僅繼承了GPT?5.2?的優(yōu)勢,還融合了GPT?5.1-Codex-Max?的前沿智能體編程與終端操作能力,專為復(fù)雜的現(xiàn)實軟件工程和網(wǎng)絡(luò)安全等專業(yè)領(lǐng)域設(shè)計,

OpenAI已率先在Codex CLI、IDE擴展、云端以及代碼審查中發(fā)布了GPT?5.2-Codex,今日起已向所有付費ChatGPT用戶開放,API訪問也即將上線。

值得一提的是,GPT?5.2-Codex發(fā)布之前,谷歌剛宣布推出Gemini 3 Flash模型。有網(wǎng)友讓GPT?5.2-Codex的Gemini 3 Flash共同執(zhí)行任務(wù),結(jié)果,GPT?5.2-Codex敗下陣來,在對50個文件進行漏洞審查的任務(wù)中,Gemini 3 Flash用時1分2秒,發(fā)現(xiàn)了5個問題,而GPT-5.2-Codex用時4分48秒,僅發(fā)現(xiàn)了2個Gemini 3 Flash已找到的問題。


GPT?5.2-Codex的性能可能不及預(yù)期。有網(wǎng)友稱,GPT?5.2-Codex在SWE-Bench Pro上性能提升不到1%,還沒有發(fā)布SWE-Bench Verified結(jié)果,這不免讓人推測GPT?5.2-Codex并未達當前最優(yōu)水平,在一些系統(tǒng)卡基準測試中還出現(xiàn)了性能退步。


據(jù)OpenAI官方博客,從功能上看,GPT?5.2-Codex新增了原生上下文壓縮技術(shù),在長上下文理解、工具調(diào)用、事實準確性以及原生的上下文壓縮上表現(xiàn)提升,推理時Token使用效率提升,還能更精準地理解在編碼過程中共享的截圖、技術(shù)圖表、數(shù)據(jù)圖以及用戶界面。在原生Windows環(huán)境中,GPT?5.2-Codex對GPT?5.1-Codex-Max的能力做了進一步的升級,智能體編程表現(xiàn)更加高效和可靠。

GPT?5.2-Codex在實際軟件工程任務(wù)中的表現(xiàn)有所提升,包括了代碼庫導(dǎo)航、重構(gòu)、Pull Request的創(chuàng)建與審查等方面。

從基準測試來看,GPT?5.2-Codex在評估修復(fù)真實世界代碼問題的SWE-Bench Pro基準測試中得分為56.4%,超越GPT-5.2的55.6%得分以及GPT-5.1的50.8%得分;在衡量編譯和服務(wù)器配置等任務(wù)的Terminal-Bench 2.0基準測試中,GPT?5.2-Codex得分為64.0%,顯著領(lǐng)先前代版本GPT?5.1-Codex-Max的58.1%,展示出了模型在使用命令行和終端解決代理任務(wù)的進步。


據(jù)OpenAI官方博客,在網(wǎng)絡(luò)安全領(lǐng)域,GPT?5.2-Codex在奪旗挑戰(zhàn)(CTF)中創(chuàng)下所有模型的最佳紀錄。從折線軌跡來看,我們也能得出,就網(wǎng)絡(luò)安全評估,OpenAI的模型能力正在持續(xù)提升。OpenAI博客稱,他們正在全面升級網(wǎng)絡(luò)安全防護,還引入可信訪問機制來支持防御工作。


OpenAI首席執(zhí)行官薩姆·阿爾特曼(Sam Altman)稱,上周,一位安全研究人員利用GPT?5.1-Codex-Max發(fā)現(xiàn)并披露了React中的一個漏洞,該漏洞可能導(dǎo)致源代碼泄漏。這反映出了模型能力應(yīng)用于網(wǎng)絡(luò)安全帶來的實際價值。阿爾特曼還提到,這些模型還在不斷改進中,最終會給網(wǎng)絡(luò)安全帶來益處。


結(jié)語:AI編程工具競爭加劇

GPT-5.2-Codex是OpenAI在編程模型上的又一次迭代,通過提升長程任務(wù)處理、大規(guī)模代碼變更和特定環(huán)境表現(xiàn),它為復(fù)雜開發(fā)與安全研究提供了更強大的支持,有望成為發(fā)現(xiàn)和修復(fù)漏洞的有力工具。

在OpenAI本次更新之前,谷歌同日也發(fā)布了低成本的Gemini 3 Flash模型,AI編程賽道競爭持續(xù)激烈。就目前來看,號稱OpenAI最強編程模型的GPT-5.2-Codex在現(xiàn)實場景中的實際效能、與競爭對手產(chǎn)品的比較表現(xiàn)或許不及預(yù)期,該模型的實際應(yīng)用效果和性能檢驗或?qū)⒊蔀榻酉聛淼慕裹c。

來源:OpenAI、X

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國男人,正在美國化

中國男人,正在美國化

茶狐看世界本尊
2025-12-19 23:45:04
接受巡察時唆使下屬說假話報假情,重慶巴南區(qū)公安分局原局長劉倫波被“雙開”

接受巡察時唆使下屬說假話報假情,重慶巴南區(qū)公安分局原局長劉倫波被“雙開”

紅星新聞
2025-12-19 21:19:19
男人如何去刺激女人的荷爾蒙?方法很簡單不信可以試試

男人如何去刺激女人的荷爾蒙?方法很簡單不信可以試試

小小包工頭阿汾
2025-12-20 12:30:39
美航母艦隊進戰(zhàn)位,委電話打到北京,救不救馬杜羅?王毅斬釘截鐵

美航母艦隊進戰(zhàn)位,委電話打到北京,救不救馬杜羅?王毅斬釘截鐵

芊芊子吟
2025-12-19 10:40:13
笑麻了!終于知道為何上岸先斬意中人了,網(wǎng)友:太真實了

笑麻了!終于知道為何上岸先斬意中人了,網(wǎng)友:太真實了

另子維愛讀史
2025-12-19 20:40:45
30年果粉兌換禮品卡后被封號:用了25年的Apple ID被永久停用

30年果粉兌換禮品卡后被封號:用了25年的Apple ID被永久停用

快科技
2025-12-19 14:26:06
海南剛封關(guān),越南就坐不住了?面對無解“陽謀”,連夜抄作業(yè)!

海南剛封關(guān),越南就坐不住了?面對無解“陽謀”,連夜抄作業(yè)!

知鑒明史
2025-12-19 19:21:41
今夜,大漲!降息50個基點

今夜,大漲!降息50個基點

中國基金報
2025-12-20 00:22:33
邢自強:如果房地產(chǎn)不實現(xiàn)止跌回穩(wěn),很難打破消費疲軟等問題

邢自強:如果房地產(chǎn)不實現(xiàn)止跌回穩(wěn),很難打破消費疲軟等問題

新浪財經(jīng)
2025-12-18 15:48:03
華子26+12+制勝三分,亞歷山大空砍35分,森林狼送雷霆賽季第3敗

華子26+12+制勝三分,亞歷山大空砍35分,森林狼送雷霆賽季第3敗

釘釘陌上花開
2025-12-20 13:22:49
1米78的外援級“威懾”!徐杰徹底征服廣州主帥,對其贊不絕口!

1米78的外援級“威懾”!徐杰徹底征服廣州主帥,對其贊不絕口!

田先生籃球
2025-12-20 09:25:48
拿捏新加坡的手段來了,這次真的要給新加坡上強度了。

拿捏新加坡的手段來了,這次真的要給新加坡上強度了。

百態(tài)人間
2025-12-12 16:02:11
沈陽一大爺開機甲玩具車上路,交警:已依法處罰

沈陽一大爺開機甲玩具車上路,交警:已依法處罰

齊魯壹點
2025-12-19 20:37:11
找到勾結(jié)把柄,烏高興壞了,但通敵的不是中國,名單嚇壞澤連斯基

找到勾結(jié)把柄,烏高興壞了,但通敵的不是中國,名單嚇壞澤連斯基

安珈使者啊
2025-12-17 16:32:02
“澳門王”何賢簡介

“澳門王”何賢簡介

方圓文史
2025-12-19 09:04:18
觸目驚心!柬埔寨電詐窩點繳獲物資曝光,別再信海外高薪了!

觸目驚心!柬埔寨電詐窩點繳獲物資曝光,別再信海外高薪了!

老特有話說
2025-12-19 23:20:46
航程猛縮14天!印尼船拒交“買路錢”,新加坡慌了,中國打出王炸

航程猛縮14天!印尼船拒交“買路錢”,新加坡慌了,中國打出王炸

小鬼頭體育
2025-12-19 16:24:50
重要賽事!12月20晚上19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

重要賽事!12月20晚上19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

皮皮觀天下
2025-12-20 10:47:56
Windows 1.0核心開發(fā)團隊時隔40年后重聚,鮑爾默憶往昔!

Windows 1.0核心開發(fā)團隊時隔40年后重聚,鮑爾默憶往昔!

CSDN
2025-12-19 21:42:43
“阿詩瑪”楊麗坤:精神失常后生下兩個兒子,丈夫用一生懷念她

“阿詩瑪”楊麗坤:精神失常后生下兩個兒子,丈夫用一生懷念她

小熊侃史
2025-12-19 11:04:19
2025-12-20 13:48:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
10946文章數(shù) 116929關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

牛彈琴:歐洲最后還是慫了 最打臉的就是馮德萊恩

頭條要聞

牛彈琴:歐洲最后還是慫了 最打臉的就是馮德萊恩

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

戚薇女兒大變樣,10歲就進入“尷尬期”

財經(jīng)要聞

日本加息落地:暴跌沒有,麻煩在后頭

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

時尚
本地
旅游
家居
軍事航空

今年冬天流行的“露襪”穿法,時髦又減齡!

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

旅游要聞

明十三陵景陵將于12月22日對公眾預(yù)約開放

家居要聞

高端私宅 理想隱居圣地

軍事要聞

澤連斯基:前線局勢愈發(fā)艱難

無障礙瀏覽 進入關(guān)懷版