国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,GPT-5.2 正式發(fā)布!讓打工人每周少干 10 小時(shí),成人模式明年見(jiàn)

0
分享至

1106天,OpenAI 從掀桌子的人,變成了被掀桌子的人。

伴隨著 Google Gemini 3的發(fā)布,OpenAI CEO 奧特曼上周罕見(jiàn)拉響了「Code Red」紅色警報(bào),并宣布所有資源回流 ChatGPT 主線,其他業(yè)務(wù)一律靠邊站。

這是 OpenAI 成立以來(lái)第一次進(jìn)入「紅色警報(bào)」?fàn)顟B(tài),也是它第一次如此明確地承認(rèn):競(jìng)爭(zhēng)壓力已經(jīng)大到必須全力應(yīng)對(duì)。


而就在剛剛,OpenAI 發(fā)布了 GPT-5.2模型,打出了 一記力量感十足的重拳。GPT-5.2將向 ChatGPT 付費(fèi)用戶開(kāi)放,并通過(guò) API 提供給開(kāi)發(fā)者,分為三個(gè)版本:

Instant:速度優(yōu)化版,適用于信息查詢、寫(xiě)作和翻譯等常規(guī)任務(wù);

Thinking:擅長(zhǎng)處理復(fù)雜結(jié)構(gòu)化任務(wù),如編程、分析長(zhǎng)文檔、數(shù)學(xué)和規(guī)劃;

Pro:高端版,專注于在高難度任務(wù)中提供極致的準(zhǔn)確性和可靠性。

不聊天,真干活,GPT-5.2闖進(jìn)打工人職場(chǎng)

本以為 OpenAI 會(huì)專注提升 ChatGPT 的個(gè)性化和消費(fèi)者體驗(yàn),結(jié)果 GPT-5.2的發(fā)布方向依舊是走職場(chǎng)實(shí)用主義的路數(shù)。

用 OpenAI 應(yīng)用 CEO Fidji Simo 的話來(lái)說(shuō):「我們?cè)O(shè)計(jì) GPT-5.2是為了給用戶創(chuàng)造更多經(jīng)濟(jì)價(jià)值?!?/strong>

什么叫經(jīng)濟(jì)價(jià)值?

就是讓 AI 真的能干活,做表格、寫(xiě) PPT、敲代碼、看圖、讀長(zhǎng)文、調(diào)用工具、搞定復(fù)雜項(xiàng)目,這些都是 GPT-5.2的拿手好戲。

數(shù)據(jù)也挺唬人。平均每個(gè) ChatGPT 企業(yè)版用戶說(shuō),AI 每天能給他們省40到60分鐘,重度用戶更狠,每周能省10小時(shí)以上。


GPT-5.2 Thinking 是這次發(fā)布的重頭戲。

在評(píng)估44個(gè)職業(yè)知識(shí)型任務(wù)的 GDPval 測(cè)試中,它成為首個(gè)在總體表現(xiàn)上達(dá)到或超過(guò)人類專家水平的模型。具體來(lái)說(shuō),在與行業(yè)專家的對(duì)比中,GPT-5.2 Thinking 在70.9% 的任務(wù)中勝出或持平,由人類專家親自評(píng)判。


這些任務(wù)可不是隨便出的題,涵蓋了美國(guó) GDP 排名前9個(gè)行業(yè),包括銷售演示文稿、會(huì)計(jì)報(bào)表、急診排班計(jì)劃、制造業(yè)圖紙、短視頻制作等等,都是真實(shí)工作場(chǎng)景里的硬活。

編程方面的提升更明顯。

SWE-Bench Pro 是個(gè)相當(dāng)嚴(yán)格的測(cè)試,評(píng)估模型在真實(shí)世界軟件工程中的能力,涉及四種編程語(yǔ)言,比只測(cè) Python 的版本難多了。GPT-5.2 Thinking 在這個(gè)測(cè)試?yán)锬玫搅?5.6% 的成績(jī),創(chuàng)下業(yè)界新高。


更夸張的是在 SWE-bench Verified 里直接干到80%,成為目前最高記錄。這意味著 GPT-5.2 Thinking 能更可靠地調(diào)試生產(chǎn)環(huán)境中的代碼、實(shí)現(xiàn)功能需求、重構(gòu)大型代碼庫(kù),端到端的修復(fù)工作做得更高效,減少人工介入。

前端開(kāi)發(fā)也有明顯提升。

早期測(cè)試者說(shuō),它在處理復(fù)雜或非常規(guī)的前端 UI 任務(wù)時(shí)表現(xiàn)更出色,特別是涉及3D 元素的場(chǎng)景,妥妥的全棧工程師助手。

OpenAI 還放出了幾個(gè)根據(jù)單一提示生成的示例:海浪模擬器、節(jié)日賀卡生成器、打字雨游戲。就一個(gè)提示詞,整個(gè)單頁(yè)應(yīng)用就出來(lái)了,可調(diào)節(jié)的參數(shù)、逼真的動(dòng)畫(huà)效果、平靜的 UI 風(fēng)格,全都有。


幻覺(jué)率降低30%,長(zhǎng)文本能力接近完美

事實(shí)準(zhǔn)確性這塊,GPT-5.2 Thinking 相較于 GPT-5.1 Thinking 的「幻覺(jué)率」更低。

在一組匿名化的 ChatGPT 查詢中,出現(xiàn)錯(cuò)誤的回答減少了約30%。對(duì)于專業(yè)人士來(lái)說(shuō),這意味著在研究、寫(xiě)作、分析與決策支持等任務(wù)中,出錯(cuò)率更低,用起來(lái)更放心。


不過(guò) OpenAI 也提醒,就像所有模型一樣,GPT-5.2并不完美,關(guān)鍵性任務(wù)還是得自己核查。

長(zhǎng)文本推理能力也樹(shù)立了新標(biāo)桿。

在 OpenAI MRCRv2基準(zhǔn)測(cè)試中,GPT-5.2表現(xiàn)領(lǐng)先。這個(gè)測(cè)試評(píng)估的是模型能不能正確整合分布在長(zhǎng)文檔中的信息,對(duì)于深度文檔分析這類涉及數(shù)十萬(wàn) token 的跨文檔信息整合任務(wù)來(lái)說(shuō),GPT-5.2的準(zhǔn)確率遠(yuǎn)超 GPT-5.1。

尤其在 MRCR 的4針測(cè)試(不同于 「大海撈針」,而是要求模型在海量文本里,區(qū)分并找出多個(gè)一模一樣的「針」中的特定一個(gè) )中,最多256k token 的上下文,GPT-5.2是首個(gè)接近100% 準(zhǔn)確率的模型。


這意味著專業(yè)用戶可以用 GPT-5.2高效處理超長(zhǎng)文檔,報(bào)告、合同、學(xué)術(shù)論文、訪談?dòng)涗?、多文件?xiàng)目,它都能在處理上百頁(yè)內(nèi)容時(shí)保持邏輯一致和信息準(zhǔn)確。

視覺(jué)理解方面,GPT-5.2 Thinking 是目前 OpenAI 最強(qiáng)的視覺(jué)模型。在圖表推理和軟件界面理解方面,錯(cuò)誤率下降了約一半。

對(duì)日常專業(yè)使用來(lái)說(shuō),這意味著模型能更準(zhǔn)確地解讀數(shù)據(jù)儀表盤(pán)、產(chǎn)品截圖、技術(shù)圖紙、可視化報(bào)告,適用于金融、運(yùn)營(yíng)、工程、設(shè)計(jì)、客服等以視覺(jué)為核心的工作場(chǎng)景。


空間理解能力和工具調(diào)用能力也有所提升,在 Tau2-bench Telecom 測(cè)試中,GPT-5.2 Thinking 取得了98.7% 的新高成績(jī),展現(xiàn)出在長(zhǎng)、多輪任務(wù)中可靠使用工具的能力。

即使將推理強(qiáng)度設(shè)置為最低檔,GPT-5.2的表現(xiàn)仍顯著優(yōu)于 GPT-5.1和 GPT-4.1。

這代表 GPT-5.2 Thinking 在執(zhí)行端到端工作流方面更強(qiáng),處理客戶服務(wù)案例、從多個(gè)系統(tǒng)中提取數(shù)據(jù)、執(zhí)行分析任務(wù),高效完成全流程輸出,中間環(huán)節(jié)更少出錯(cuò)。

數(shù)學(xué)和科學(xué)能力的提升,可能是這次發(fā)布里最硬核的部分。

在 GPQA Diamond 這種研究生級(jí)別的科學(xué)問(wèn)答測(cè)試?yán)?,覆蓋物理、化學(xué)、生物學(xué)等領(lǐng)域,GPT-5.2表現(xiàn)明顯更強(qiáng)。FrontierMath 那種評(píng)估專家級(jí)數(shù)學(xué)問(wèn)題解決能力的基準(zhǔn)測(cè)試,它也能啃下來(lái)。


更牛的是,在 ARC-AGI-1測(cè)試中,GPT-5.2 Pro 是第一個(gè)突破90% 準(zhǔn)確率的模型,相比去年 o3-preview 的87%,表現(xiàn)更強(qiáng),成本卻降低了約390倍。


ARC-AGI-2版本更難,專注于考察流動(dòng)性推理能力,GPT-5.2 Thinking 得分為52.9%,創(chuàng)下「鏈?zhǔn)剿季S模型」新高,GPT-5.2 Pro 更進(jìn)一步,達(dá)到54.2%。

官方博客中提到一個(gè)令人印象深刻的案例:在統(tǒng)計(jì)學(xué)習(xí)理論的一個(gè)開(kāi)放問(wèn)題上,GPT-5.2 Pro 甚至直接給出了一個(gè)可行的證明方案。

這個(gè)問(wèn)題來(lái)自2019年學(xué)習(xí)理論大會(huì) COLT 上提出的未解難題:如果模型設(shè)定完全正確,數(shù)據(jù)呈標(biāo)準(zhǔn)正態(tài)分布,在這種教科書(shū)式的「干凈」情況下,學(xué)習(xí)曲線是單調(diào)的嗎?


研究人員沒(méi)有先設(shè)計(jì)算法或提供證明思路,也沒(méi)有輸入中間步驟或提示,而是直接請(qǐng)求 GPT-5.2 Pro 給出完整證明。結(jié)果,模型提出了一種可行的解法,并通過(guò)人工驗(yàn)證、外部專家評(píng)審確認(rèn)其正確性。

這說(shuō)明 GPT-5.2 Pro 在一些有明確公理基礎(chǔ)的領(lǐng)域,比如數(shù)學(xué)、理論計(jì)算機(jī)科學(xué),已經(jīng)可以發(fā)揮更實(shí)質(zhì)性的科研輔助作用:探索證明路徑、驗(yàn)證假設(shè)、發(fā)現(xiàn)隱藏的聯(lián)系。


GPT-5.2 API 價(jià)格

性能表現(xiàn)這么猛,代價(jià)自然也不小。

Thinking 和 Deep Research 模式消耗的算力遠(yuǎn)超普通聊天機(jī)器人,因?yàn)樗鼈兊谩杆伎肌沟酶睢S捎?OpenAI 現(xiàn)在用于模型推理的開(kāi)銷,大部分是直接掏真金白銀,而不是用微軟 Azure 的云服務(wù)積分抵扣。

長(zhǎng)期往里砸錢(qián),這種玩法能撐多久,真不好說(shuō)。

總得來(lái)說(shuō),GPT-5.2更像是對(duì)前兩次模型升級(jí)的整合,而不是完全重構(gòu)。

8月的 GPT-5是架構(gòu)重啟,引入了可以在快速響應(yīng)和深度「Thinking」模式之間切換的路由機(jī)制。11月的 GPT-5.1讓系統(tǒng)變得更溫和、更具對(duì)話性,也更適合智能體和編碼任務(wù)。

現(xiàn)在的 GPT-5.2,則是要在這些優(yōu)勢(shì)的基礎(chǔ)上,打造出更可靠的生產(chǎn)級(jí)模型。而且有一個(gè)非常重要的細(xì)節(jié):這次推出的三款 GPT-5.2模型,底層知識(shí)庫(kù)都已經(jīng)完成了更新。


GPT-5.2已經(jīng)開(kāi)始在 ChatGPT 中陸續(xù)上線,優(yōu)先開(kāi)放給付費(fèi)用戶。GPT-5.1還會(huì)在「?jìng)鹘y(tǒng)模型」選項(xiàng)中保留三個(gè)月,之后就正式下線了。

API 那邊也同步開(kāi)放,開(kāi)發(fā)者已經(jīng)可以用上了。價(jià)格比 GPT-5.1貴一些,但 OpenAI 說(shuō)因?yàn)?token 效率更高,實(shí)際總成本反而更低。

一個(gè)壞消息,和一個(gè)好消息

除了模型本身,OpenAI 的商業(yè)化上也有兩個(gè)極具反差感的消息。

雖然這次發(fā)布并沒(méi)有推出新的圖像生成模型,但今天 OpenAI 跟迪士尼達(dá)成了三年授權(quán)協(xié)議。

用戶可以生成包含迪士尼、漫威、皮克斯和星球大戰(zhàn)等200多個(gè)角色的社交視頻,部分生成視頻還能在 Disney+上播放。

作為交換,迪士尼向 OpenAI 投資10億美元,還會(huì)成為重要客戶。內(nèi)容 IP 加 AI 生成,這背后想象空間確實(shí)挺大。


另一個(gè)值得關(guān)注的消息是,ChatGPT 的「成人模式」終于有了明確時(shí)間表。

隨著越來(lái)越多 AI 聊天機(jī)器人涉足成人內(nèi)容,OpenAI 也不打算當(dāng)圣人了。根據(jù)彭博社報(bào)道,Fidji Simo 已經(jīng)明確該功能預(yù)計(jì)2026年第一季度上線。

在此之前,OpenAI 會(huì)繼續(xù)優(yōu)化年齡識(shí)別功能,確保未成年人自動(dòng)啟用內(nèi)容保護(hù)機(jī)制。目前年齡預(yù)測(cè)模型正在部分國(guó)家進(jìn)行早期測(cè)試,以評(píng)估識(shí)別青少年的能力,并確保不會(huì)誤判成年人。

面對(duì) Google Gemini 的步步緊逼,OpenAI 選擇用 GPT-5.2這套組合拳來(lái)回應(yīng)。它更快、更強(qiáng),也更像一個(gè)成熟的商業(yè)產(chǎn)品。

與此同時(shí),一邊擁抱迪士尼的米老鼠,一邊準(zhǔn)備推出成人模式,OpenAI 既要保持技術(shù)領(lǐng)先,又要快速變現(xiàn);既要占領(lǐng)企業(yè)市場(chǎng),又不放過(guò)任何流量入口。

幸運(yùn)的是,迎來(lái)十周年節(jié)點(diǎn)的 OpenAI 最終還是演好了這出反擊大戲。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
震驚!網(wǎng)傳重慶某酒店提及年輕人的性張力,吃完火鍋還有勁折騰…

震驚!網(wǎng)傳重慶某酒店提及年輕人的性張力,吃完火鍋還有勁折騰…

火山詩(shī)話
2026-01-11 08:30:39
高市大概沒(méi)料到,中方拒絕撤回制裁后,又對(duì)日本啟動(dòng)新一輪反制

高市大概沒(méi)料到,中方拒絕撤回制裁后,又對(duì)日本啟動(dòng)新一輪反制

井普椿的獨(dú)白
2026-01-11 19:37:31
4-0橫掃蒯曼進(jìn)決賽!中國(guó)女乒28歲王牌再閃耀:對(duì)決朱雨玲沖冠

4-0橫掃蒯曼進(jìn)決賽!中國(guó)女乒28歲王牌再閃耀:對(duì)決朱雨玲沖冠

李喜林籃球絕殺
2026-01-11 19:18:53
曝李大雙和李琳離婚,現(xiàn)任是外國(guó)美女,已生兒子,丁克23年被拋棄

曝李大雙和李琳離婚,現(xiàn)任是外國(guó)美女,已生兒子,丁克23年被拋棄

天天熱點(diǎn)見(jiàn)聞
2026-01-10 16:30:29
45歲男星曬上海新家!4萬(wàn)電視柜,15萬(wàn)沙發(fā),沒(méi)戲拍日子照樣舒坦

45歲男星曬上海新家!4萬(wàn)電視柜,15萬(wàn)沙發(fā),沒(méi)戲拍日子照樣舒坦

瓜汁橘長(zhǎng)Dr
2026-01-09 17:44:33
西方越想越害怕!俄軍榛樹(shù)高超不用彈頭,170億立方米天然氣泄漏

西方越想越害怕!俄軍榛樹(shù)高超不用彈頭,170億立方米天然氣泄漏

小宸說(shuō)歷史
2026-01-11 08:20:06
最新 | 岳云鵬透露今年不上央視春晚

最新 | 岳云鵬透露今年不上央視春晚

天津廣播
2026-01-11 12:14:15
郭晶晶沒(méi)想到,被國(guó)家隊(duì)開(kāi)除的田亮,如今以這種方式讓人刮目相看

郭晶晶沒(méi)想到,被國(guó)家隊(duì)開(kāi)除的田亮,如今以這種方式讓人刮目相看

無(wú)心小姐姐
2026-01-09 17:46:24
閆學(xué)晶“哭窮”后多平臺(tái)賬號(hào)禁止關(guān)注 其代言調(diào)料品牌老總:將向她索賠 不再請(qǐng)明星代言

閆學(xué)晶“哭窮”后多平臺(tái)賬號(hào)禁止關(guān)注 其代言調(diào)料品牌老總:將向她索賠 不再請(qǐng)明星代言

紅星新聞
2026-01-10 14:19:18
經(jīng)濟(jì)專家魏文烈,舍棄重慶副市長(zhǎng)轉(zhuǎn)投商海,卻給國(guó)家造成巨大損失

經(jīng)濟(jì)專家魏文烈,舍棄重慶副市長(zhǎng)轉(zhuǎn)投商海,卻給國(guó)家造成巨大損失

搜史君
2026-01-11 08:20:11
皇馬將與贊助商續(xù)約:3大金主 每年貢獻(xiàn)3億!高居世界第1

皇馬將與贊助商續(xù)約:3大金主 每年貢獻(xiàn)3億!高居世界第1

葉青足球世界
2026-01-11 16:33:40
男子創(chuàng)業(yè)失敗負(fù)債700萬(wàn),無(wú)家可歸住橋洞,網(wǎng)友:看完我不折騰了

男子創(chuàng)業(yè)失敗負(fù)債700萬(wàn),無(wú)家可歸住橋洞,網(wǎng)友:看完我不折騰了

唐小糖說(shuō)情感
2026-01-05 12:10:38
中國(guó)最高齡產(chǎn)婦盛海琳:丈夫已離世,女兒才15歲,我爭(zhēng)取活到104

中國(guó)最高齡產(chǎn)婦盛海琳:丈夫已離世,女兒才15歲,我爭(zhēng)取活到104

林雁飛
2026-01-10 13:46:21
中方“大反攻”正式開(kāi)始!勒令完全解除武裝,日本美夢(mèng)徹底破碎

中方“大反攻”正式開(kāi)始!勒令完全解除武裝,日本美夢(mèng)徹底破碎

琴音似君語(yǔ)
2026-01-09 20:34:42
紀(jì)實(shí):湖南漂亮18歲女大學(xué)生和父親西藏自駕游,回來(lái)后母親崩潰了

紀(jì)實(shí):湖南漂亮18歲女大學(xué)生和父親西藏自駕游,回來(lái)后母親崩潰了

紅豆講堂
2024-10-09 11:15:47
中方廣發(fā)邀請(qǐng)?zhí)?,多?guó)積極派兵,1國(guó)拒絕派兵,金磚內(nèi)部冒出刺頭

中方廣發(fā)邀請(qǐng)?zhí)?,多?guó)積極派兵,1國(guó)拒絕派兵,金磚內(nèi)部冒出刺頭

時(shí)時(shí)有聊
2026-01-11 19:26:09
留幾手為閆學(xué)晶叫屈?稱抖音用戶都自卑又敏感,評(píng)論區(qū)炸鍋了

留幾手為閆學(xué)晶叫屈?稱抖音用戶都自卑又敏感,評(píng)論區(qū)炸鍋了

小徐講八卦
2026-01-11 16:10:03
“最佳血壓” 數(shù)值多少?醫(yī)生提醒:76 歲以后,血壓控制在這范圍

“最佳血壓” 數(shù)值多少?醫(yī)生提醒:76 歲以后,血壓控制在這范圍

新時(shí)代的兩性情感
2026-01-11 17:01:57
天空體育記者:我感覺(jué)格伊?xí)用税⑸{!槍手將開(kāi)啟多人續(xù)約談判

天空體育記者:我感覺(jué)格伊?xí)用税⑸{!槍手將開(kāi)啟多人續(xù)約談判

足球偵探
2026-01-11 18:06:15
54歲楊鈺瑩近況曝光:定居深圳,每天打理菜園子,生活平淡

54歲楊鈺瑩近況曝光:定居深圳,每天打理菜園子,生活平淡

小徐講八卦
2025-11-17 07:29:28
2026-01-11 20:27:00
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
6005文章數(shù) 26742關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

小學(xué)生留遺書(shū)在家中服藥自殺 母親起訴學(xué)校和英語(yǔ)老師

頭條要聞

小學(xué)生留遺書(shū)在家中服藥自殺 母親起訴學(xué)校和英語(yǔ)老師

體育要聞

詹皇曬照不滿打手沒(méi)哨 裁判報(bào)告最后兩分鐘無(wú)誤判

娛樂(lè)要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣平臺(tái)"燒錢(qián)搶存量市場(chǎng)"迎來(lái)終局?

汽車要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

游戲
親子
教育
時(shí)尚
健康

《GTA6》注定創(chuàng)造歷史 但難復(fù)刻十年前午夜首發(fā)情懷

親子要聞

孩子摔跤不喊停,老師反夸勇敢,家長(zhǎng)卻偷偷拍視頻發(fā)朋友圈

教育要聞

李希貴:下一代學(xué)校應(yīng)該什么樣?

朱珠美上熱搜的老錢(qián)風(fēng)穿搭,太值得借鑒了!

這些新療法,讓化療不再那么痛苦

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版