国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.2 凌晨發(fā)布:這一次,OpenAI 不想做題,只想幫你搞錢!

0
分享至

★ 設(shè)為星標(biāo) | 只講人話,帶你玩轉(zhuǎn)AIGC。

GPT-5.2 終于發(fā)布了!

雖然我已經(jīng)以 Gemini 為主,但 GPT 的每次更新仍然受到極大的關(guān)注(包括我)。


這次到底更新了些啥?

簡單來說,各項指標(biāo)超越 Gemini 3 Pro,讓 OpenAI 居然又重回了王座。


但,并沒有形成那種“外星人降臨”的碾壓優(yōu)勢。

不過,細(xì)節(jié)里全是魔鬼。我們具體來扒一扒。

OpenAI 官方開篇定調(diào)非常高,直接說 GPT-5.2 是迄今為止功能最強(qiáng)大的專業(yè)知識工作模型。

啥叫專業(yè)知識工作模型?

把官方那堆技術(shù)黑話翻譯一下,意思就是:它不再滿足于當(dāng)你的陪聊對象,它現(xiàn)在想做你的“腦力合伙人”。

這一次,OpenAI 顯然是急了,它甚至不屑于跟你談什么“通用智能”的夢想,而是把“搞錢”這三個字寫在了臉上。

它這次的技能點(diǎn),全點(diǎn)在了打工人的痛點(diǎn)上:做表(Excel)、畫餅(PPT)、寫代碼,以及那些讓人頭禿的長文檔。

它就是為了創(chuàng)造“經(jīng)濟(jì)價值”而生的 。

到底有多強(qiáng)?聊聊 GDPval。

為了證明自己“值錢”,OpenAI 甚至拋棄了那些傳統(tǒng)的 MMLU 考試分?jǐn)?shù)。

他們拋出了一個聽起來就充滿金錢味道的新指標(biāo):GDPval。 (這名字一聽就是奔著生產(chǎn)總值GDP去的)

可能很多人沒聽說過這個評測集。 這是 OpenAI 專門為了衡量“真實世界打工能力”搞出來的。

他們在 44 個核心職業(yè)(律師、市場經(jīng)理、工程師等)里,找了一幫平均工齡 14 年的資深專家,出了 1320 道真實的“地獄級工作任務(wù)” 。

注意,不是做選擇題。 是讓你真的去改合同、寫全案 PPT、優(yōu)化生產(chǎn)線圖紙。這些任務(wù),人類專家平均要花 7 個小時才能做完 。

結(jié)果呢?經(jīng)過雙盲測試,GPT-5.2 在 70.9% 的情況下,干得比這些人類專家更好,或者至少打個平手 。


圖:在 GDPval 中,模型嘗試完成涵蓋美國 GDP 貢獻(xiàn)最大的九大行業(yè)中 44 個職業(yè)的特定知識工作

這才是最恐怖的。

它的參照系不是剛畢業(yè)的大學(xué)生,而是行業(yè)專家。 也就是說,在一個有著十幾年經(jīng)驗的采購經(jīng)理面前,GPT-5.2 干出來的活兒,有七成的時候,比他干得還好。

甚至于說,GPT-5.2 Thinking 生成的電子表格和幻燈片在復(fù)雜程度和格式方面都有所提高。


說白了: 以前的 GPT 是個學(xué)霸,現(xiàn)在的 GPT-5.2 是個熟手。

那么,它是怎么做到這一點(diǎn)的?

這背后其實是一場架構(gòu)級的革命。

OpenAI 官方直言不諱:這是自 GPT-5 以來,GPT 系列在智能體編程(Agentic Coding)領(lǐng)域跨度最大的一次飛躍。


圖:在SWE-Bench Pro中(在新窗口中打開)? ? ?,給定一個代碼庫,模型必須生成一個補(bǔ)丁來解決一個實際的軟件工程任務(wù)。

為了證明自己不是自嗨,他們這次直接拉來了 Windsurf 和 Devin 站臺。 這兩位可是現(xiàn)在 AI 編程界的頂流。

官方直接宣布,GPT-5.2 將成為這兩個工具的默認(rèn)核心模型 。

這說明啥?說明這玩意兒已經(jīng)經(jīng)受住了最殘酷的生產(chǎn)環(huán)境考驗。

但真正讓我覺得牛逼的,是背后的技術(shù)邏輯發(fā)生了質(zhì)變。

以前我們?yōu)榱俗?AI 干點(diǎn)復(fù)雜的活,得搭建一套脆弱的“多智能體系統(tǒng)”。

就像拉了一群各懷鬼胎的實習(xí)生在開會,一個負(fù)責(zé)想,一個負(fù)責(zé)寫,一個負(fù)責(zé)改,管理起來極其麻煩,還容易崩 。

而 GPT-5.2 直接解鎖了一種全新的架構(gòu):單一超級智能體(Single Mega-agent)。

這就好比把那一屋子實習(xí)生全裁了,換來了一個精通 20 多種工具的全能大神 。它不僅反應(yīng)更快、腦子更靈光,而且維護(hù)起來簡單了 100 倍。

除了腦子好,它的“手眼”也進(jìn)化了。

為了配得上“超級智能體”這個稱號,OpenAI 這次給 GPT-5.2 裝上了更強(qiáng)的配件:

1. 手更快了

以前的 AI 調(diào)用工具(比如聯(lián)網(wǎng)搜素、畫圖、跑代碼)總有種“卡頓感”。但官方這次特別強(qiáng)調(diào):延遲大幅降低,而且工具調(diào)用能力變得極強(qiáng)。

這意味著什么?

意味著它在多個工具之間切換,絲滑得像是在切菜。

它不再是一個個蹦字的聊天機(jī)器人,而是一個能瞬間調(diào)起計算器、瀏覽器、代碼解釋器的“快手”。嗯?

2. 眼睛更尖了

看一眼官方放出的演示圖: 它能直接看懂復(fù)雜的波浪模擬參數(shù),甚至能精準(zhǔn)識別電路板上的每一個元器件。


圖:GPT 5.2 可以識別出元部件

這說明它的視覺能力已經(jīng)脫離了“認(rèn)貓認(rèn)狗”的初級階段,開始進(jìn)入工業(yè)級的精細(xì)識別了。

配合長上下文能力 ,不管是幾千行的代碼屎山,還是幾十頁的復(fù)雜電路圖,它都能一口吞下,并且過目不忘。

實際上,這使得專業(yè)人士能夠使用 GPT-5.2 處理長篇文檔,例如報告、合同、研究論文、筆錄和多文件項目,同時在數(shù)十萬個詞元中保持一致性和準(zhǔn)確性。


圖:GPT 5.2 的長上下文處理

所以,GPT-5.2 特別適合深度分析、綜合和復(fù)雜的多源工作流程。

但真正的“重頭戲”,是這個:ARC-AGI 2

如果說 GDPval 是測它能不能干活,那 ARC-AGI 2 就是測它到底有沒有腦子。

老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一。

它是由 Keras 之父 Fran?ois Chollet 搞出來的,專門用來反死記硬背的。

比如這種題目:


圖:ARC AGI2 題目


圖:ARC AGI2 題目

以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現(xiàn)原形,得分低得可憐。

大家猜猜上一代的 GPT-5.1 Thinking 拿了多少分?

17.6%。

但這次,GPT-5.2 干到了多少?52.9%。

兄弟們,這是 3 倍的暴漲。這不是“擠牙膏”,這是直接把牙膏管踩爆了。

為了讓大家有個概念,目前市面上最強(qiáng)的競品 Gemini 3 Pro 和 Claude,在這個榜單上的分?jǐn)?shù)大約在 31% - 37% 之間(取決于版本)。


也就是說,OpenAI 這一次在純智商層面,不僅甩開了對手,更是跨越了一個巨大的鴻溝。

這意味著 GPT-5.2 終于突破了那層窗戶紙:它開始具備真正的通用推理能力了。

它遇到?jīng)]見過的新問題,不再是去翻記憶庫里的答案(因為根本沒有),而是像人類一樣,現(xiàn)場觀察規(guī)律、現(xiàn)場推理、現(xiàn)場解決。

順便提一嘴,在另一個數(shù)學(xué)競賽 AIME 2025 里,GPT-5.2 直接拿了 100% 的滿分。

這可是全美高中數(shù)學(xué)聯(lián)賽。 以前我們還在討論 AI 能不能及格,現(xiàn)在它已經(jīng)把卷子做穿了。

相比于它能多寫兩行代碼,我覺得這一點(diǎn),才是這次更新里最硬核、最不容忽視的里程碑。

總結(jié)一下:

GPT-5.2 Instant、思考版和 Pro 版本今日開始推送,首先面向 Plus、Pro、Business 和 Enterprise 套餐用戶。

免費(fèi)版和 Go 用戶將于明天獲得訪問權(quán)限。

GPT-5.2 在我心中,是一個極其合格,甚至有點(diǎn)“過于務(wù)實”的迭代。

它沒有像過去那樣,瘋狂去卷那些虛頭巴腦的考試分?jǐn)?shù),而是把所有的技能點(diǎn),都死磕在了“怎么幫白領(lǐng)干活”這件事上。

它不跟你談星辰大海,只跟你談降本增效;不跟你炫耀參數(shù),只給你看GDPval。

這個點(diǎn),我覺得就很酷,非常的剛需。

雖然從“好玩”或者“科幻感”的角度來說,GPT-5.2 可能沒有 Gemini 3 Pro 原生多模態(tài)帶來的那種絲滑震撼。

(畢竟谷歌同步發(fā)行了 Nano Banana Pro,期待 GPT Image 早日發(fā)布)

但如果你是為了工作,為了搞錢,為了早點(diǎn)下班去陪家人。那 GPT-5.2 可能是目前地表最強(qiáng)、也是最值得你掏錢的生產(chǎn)力工具 。

好了,就扒到這里,如果覺得這篇文章對你有用,別忘點(diǎn)贊,??并轉(zhuǎn)發(fā)給你的朋友哦~

我們下次再見。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
四川一小學(xué)生花50元從學(xué)校跳蚤市場淘回茅臺,爸爸:已聯(lián)系對方家長準(zhǔn)備歸還

四川一小學(xué)生花50元從學(xué)校跳蚤市場淘回茅臺,爸爸:已聯(lián)系對方家長準(zhǔn)備歸還

環(huán)球網(wǎng)資訊
2026-01-09 10:06:33
臺灣加速回歸進(jìn)程,中央決策出奇高明!

臺灣加速回歸進(jìn)程,中央決策出奇高明!

達(dá)文西看世界
2026-01-09 10:40:35
特朗普接受專訪:“我不需要國際法”

特朗普接受專訪:“我不需要國際法”

澎湃新聞
2026-01-09 13:57:08
邀約偷鐵皮遭拒絕,云南一61歲老婦殺害13歲男孩,一審獲死刑

邀約偷鐵皮遭拒絕,云南一61歲老婦殺害13歲男孩,一審獲死刑

紅星新聞
2026-01-09 18:09:30
深夜夫妻駕車過山路,遇小孩求救,丈夫剛要停車,妻子大叫:快走

深夜夫妻駕車過山路,遇小孩求救,丈夫剛要停車,妻子大叫:快走

卡西莫多的故事
2025-11-22 15:13:21
盧卡申科:馬杜羅妻子非常勇敢,拒絕離開馬杜羅身邊

盧卡申科:馬杜羅妻子非常勇敢,拒絕離開馬杜羅身邊

新京報政事兒
2026-01-09 13:33:32
建文帝下落之謎被解開?后世爭議600余年,其實朱棣早就找到答案

建文帝下落之謎被解開?后世爭議600余年,其實朱棣早就找到答案

銘記歷史呀
2026-01-09 08:47:01
四川高縣一村支書暴打殘疾村婦致輕傷二級!法院:免于刑事處罰!

四川高縣一村支書暴打殘疾村婦致輕傷二級!法院:免于刑事處罰!

兵叔評說
2026-01-07 12:13:15
剛剛 | 天津大風(fēng)黃色預(yù)警!10級陣風(fēng)!

剛剛 | 天津大風(fēng)黃色預(yù)警!10級陣風(fēng)!

天津廣播
2026-01-10 09:21:42
癌癥去世的人越來越多!建議:2不喝、3不吃、1堅持,別馬虎了!

癌癥去世的人越來越多!建議:2不喝、3不吃、1堅持,別馬虎了!

鬼菜生活
2026-01-07 09:58:31
為河北農(nóng)民取暖發(fā)聲是順應(yīng)天理人心!農(nóng)民日報不該刪稿

為河北農(nóng)民取暖發(fā)聲是順應(yīng)天理人心!農(nóng)民日報不該刪稿

灰白筆記
2026-01-08 12:40:29
玉淵譚天丨中方加嚴(yán)管制兩用物項,堅決遏制日本軍國主義圖謀

玉淵譚天丨中方加嚴(yán)管制兩用物項,堅決遏制日本軍國主義圖謀

上觀新聞
2026-01-10 07:14:09
“女性偉哥”,來了

“女性偉哥”,來了

中國新聞周刊
2026-01-09 20:47:07
21-16,21-15!王祉怡順利晉級大馬賽決賽,PK世界第一爭冠

21-16,21-15!王祉怡順利晉級大馬賽決賽,PK世界第一爭冠

全景體育V
2026-01-10 11:15:25
“這種兒子,直接用鋼筋揍!”家長曬農(nóng)村兒子現(xiàn)狀,網(wǎng)友忍無可忍

“這種兒子,直接用鋼筋揍!”家長曬農(nóng)村兒子現(xiàn)狀,網(wǎng)友忍無可忍

妍妍教育日記
2026-01-08 20:37:01
美軍再扣中國油輪,真是無法無天了

美軍再扣中國油輪,真是無法無天了

烽火觀天下
2026-01-09 12:42:58
澤連斯基引發(fā)的鏈?zhǔn)椒磻?yīng):敘利亞、哈馬斯、黎巴嫩真主黨、委內(nèi)瑞拉、伊朗

澤連斯基引發(fā)的鏈?zhǔn)椒磻?yīng):敘利亞、哈馬斯、黎巴嫩真主黨、委內(nèi)瑞拉、伊朗

高博新視野
2026-01-08 20:22:29
河南一男孩校內(nèi)死亡后續(xù):官方通報,知情人曝細(xì)節(jié),校方恐擔(dān)責(zé)!

河南一男孩校內(nèi)死亡后續(xù):官方通報,知情人曝細(xì)節(jié),校方恐擔(dān)責(zé)!

有范又有料
2026-01-10 09:31:25
爆大冷!湯普森夢回巔峰,雙狀元空砍47+21+12,一戰(zhàn)認(rèn)清5名球星

爆大冷!湯普森夢回巔峰,雙狀元空砍47+21+12,一戰(zhàn)認(rèn)清5名球星

籃球掃地僧
2026-01-09 20:02:54
不聽趙本山勸告,離婚再娶“女兒閨蜜”,王長貴向同齡岳父母拜年

不聽趙本山勸告,離婚再娶“女兒閨蜜”,王長貴向同齡岳父母拜年

小老頭奇聞
2026-01-09 09:02:03
2026-01-10 13:19:00
AI范兒 incentive-icons
AI范兒
AI范兒是一個專注于人工智能領(lǐng)域的資訊和學(xué)習(xí)平臺,提供最新的人工智能資訊
639文章數(shù) 420關(guān)注度
往期回顧 全部

科技要聞

傳DeepSeek準(zhǔn)備第二次震驚全世界

頭條要聞

媒體:中國若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

頭條要聞

媒體:中國若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

體育要聞

楊瀚森:上場時間要去爭取 而不是要求

娛樂要聞

趙櫻子稱和蔣毅試婚三天:像試面膜

財經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

寶馬25年全球銷量246.3萬臺 中國仍是第一大市場

態(tài)度原創(chuàng)

游戲
本地
教育
公開課
軍事航空

V社罕見這么勤快!新作一年大翻新 節(jié)奏快到停不下來

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

教育要聞

父母別做這3件事

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:已開始從委石油資源中賺錢

無障礙瀏覽 進(jìn)入關(guān)懷版