国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI發(fā)布GPT-5!這是一篇很主觀的解讀...

0
分享至

凌晨1點,OpenAI 終于發(fā)布了萬眾期待的 GPT-5。

距離 GPT-4 發(fā)布,已經(jīng)過去整整兩年半了。我還清晰記得那是2023年的3月14號,距離我從大廠離開還不到一周時間。那個時刻,對AI的興奮和熱情完全掩蓋了面對未知前路的恐懼。

在這兩年多里,OpenAI其實已經(jīng)發(fā)布了十多個不同的模型(包括什么4o、4.1、4.5、o1、o3、o4……模型名字快趕上顯卡廠商了)。

但這次,他們終于喊出了GPT-5的名號。

所以,它到底有什么新變化?值不值得你切換?Claude 4.1 是不是要下崗了?

在展開介紹之前,我們先來看看一個小烏龍:

世界頂級AI公司也能做出這種PPT?

在發(fā)布會的圖表里,OpenAI展示了一個模型評估的對比:

你看這個數(shù)字,52.8 比 69.1 還高,你信嗎?

而且,這個錯誤還不止一次

我服了這個草臺班子的世界。

我合理懷疑,這PPT要是讓GPT-5自己來做,可能反而更靠譜。

GPT-5 三個版本,立刻上線?

OpenAI這次一口氣發(fā)布了三個版本的GPT-5 API:GPT-5、GPT-5 Mini、GPT-5 Nano

官網(wǎng)內(nèi)提供的版本估計也就用這幾個大小不一的模型做些小改造。OpenAI官方說是所有用戶今天都能用上GPT5。

但截至我寫文章時,ChatGPT官網(wǎng)還是老樣子,沒更新。

反倒是我在Cursor里已經(jīng)能用上 GPT-5 了,OpenAI:你是不是舔Cursor舔猛了?

這里插播個有趣的小故事,其實OpenAI是Cursor最早的投資者之一,但是隨著Claude模型能力的增強,Cursor逐漸和Anthropic變得眉來眼去,經(jīng)常有深度交流和聯(lián)合發(fā)布了。
但隨著現(xiàn)在Anthropic出了個和Cursor正面競爭的Claude Code,這三者的關系又迎來了有趣的變數(shù),敵人的敵人,再次成了朋友。
“自適應思考”:抄了Claude的作業(yè)?

這次GPT-5最大的變化之一,是加入了自適應思考能力

也就是說,模型會根據(jù)你的問題,動態(tài)決定要不要深度思考、思考多久。

這聽起來很先進,你不需要糾結選GPT-4o還是o3還是o4-mini之類的模型了,但實際上……

早在 Claude 的 CEO 就提出過類似的理念 —— 讓模型既能快速直覺(系統(tǒng)一),又能深度推理(系統(tǒng)二),而不是二選一。Claude模型從3.7開始也就是這么設計的。

所以OpenAI這波,多少有點跟隨者的味道。

發(fā)布會最大重點:全力壓注編程能力

發(fā)布會超過一半時間都在講「編程能力」和「Agent執(zhí)行」。

  • 請來了 Cursor 的 CEO 現(xiàn)場演示

  • 實測代碼修改、網(wǎng)頁生成、Agent 多步驟推理

你從這個重點方向也能看出:

OpenAI很清楚,現(xiàn)在Anthropic靠 Claude 在API市場上搶走了大量寫代碼的用戶和收入

一組數(shù)據(jù)告訴你,現(xiàn)在OpenAI真有點急

  • OpenAI 總年收入:約 125 億美元

  • Anthropic 總年收入:約 50 億美元(其中API收入已反超OpenAI

而且 Anthropic 的 API 收入中,顯然主要來自寫代碼的用戶(Cursor、Github Copilot等)。

這也是 OpenAI 為什么在 GPT-5 上要主打「編程」,它是真想在API市場和Anthropic剛一剛。

GPT-5 vs Claude 4.1,代碼實測結果來了

我也挑了發(fā)布會里兩個 GPT-5 展示案例,復制了 Prompt,用 Claude 4.1 在 Cursor 中重跑了一遍。

? 案例1:學習法語的卡牌游戲網(wǎng)站

Create a beautiful, highly interactive web app for my partner, an English speaker, to learn French.
Track her daily progress.
Use a highly engaging theme.
Include a variety of activities (e.g., flashcards, quizzes, etc.).
One activity should be a snake-style game in which the snake is replaced by a mouse and the apples are replaced by cheese. Each time the mouse eats a piece of cheese, play a voice-over that introduces a new French word so she can practice pronunciation while playing.
Make it controllable with the arrow keys.
Think before answering. Render everything in canvas.

GPT-5 演示的效果很不錯,多個卡牌、頁面抽卡邏輯也在線。

但我用 Claude 4.1 復現(xiàn)時,發(fā)現(xiàn)頁面結構也基本一致,只是交互有點小bug。

結論:表現(xiàn)接近,GPT-5略強,但不是質(zhì)變。

? 案例2:生成創(chuàng)業(yè)公司財務看板

Please create a finance dashboard for my Series D startup, which makes digital fidget spinners for Al agents.

The target audience is the CFO and c-suite, to check every day and quickly understand how things are going. It should be beautifully and tastefully designed, with some interactivity, and have clear hierarchy for easy focus on what matters. Use fake names for any companies and generate sample data.
Make it colorful!

Use Next.js and tailwind CSS.

GPT-5 的可視化儀表盤做得很精致。

但 Claude 4.1 給出的交互式圖表也幾乎一樣,甚至細節(jié)上更有設計感。

結論:不分上下,我個人更偏愛 Claude 的審美。

那GPT-5到底強在哪?值不值得用?

OpenAI官方當然是放了一堆Benchmark,什么AIME數(shù)學 100%,SWE-Bench 74.9%……

但我想說句實話:

這些Benchmark的價值越來越低了。

高強度數(shù)理邏輯對普通人來說沒意義;從98.4%提升到99%,對真實使用體驗沒多少幫助;用戶更關心的是它是否能幫我寫得更好、寫得更自然。

最后

GPT-5說實話是有點令人失望了,更像是一次 GPT-4.6 式的升級。

或者,也許,我們再也不應該以2022年11月的ChatGPT、2023年3月的GPT-4那種發(fā)布的震撼級別來要求OpenAI了。

OpenAI在那刻時刻就已經(jīng)完成了他們石破天驚的歷史使命,把大語言模型和訓練方法帶給了全世界,F(xiàn)在模型能力的升級已經(jīng)進入了深水區(qū),也許我們后面真的只能一次次看到擠牙膏式的性能提升,或者成本降低。

可惜,AGI還沒來

幸好,AGI還沒來

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
賴清德若赴民意機構做彈劾說明要坐哪? 韓國瑜旁早備“特別席”

賴清德若赴民意機構做彈劾說明要坐哪? 韓國瑜旁早備“特別席”

海峽導報社
2025-12-27 11:44:02
聽聞黃百韜自殺,粟裕一頭栽倒,后來其妻透露:他不敢向主席訴苦

聽聞黃百韜自殺,粟裕一頭栽倒,后來其妻透露:他不敢向主席訴苦

史之銘
2025-12-28 22:41:42
喪心病狂!41國乒奧運冠軍全家遭死亡威脅:有人要殺死你全家

喪心病狂!41國乒奧運冠軍全家遭死亡威脅:有人要殺死你全家

梅亭談
2025-12-28 22:39:12
400萬億什么時候來?等待我們的是什么?

400萬億什么時候來?等待我們的是什么?

混知房產(chǎn)
2025-11-13 20:41:06
七連勝,杜鋒:缺兵少將拿下山西很不容易,希望年輕小將努力成長

七連勝,杜鋒:缺兵少將拿下山西很不容易,希望年輕小將努力成長

懂球帝
2025-12-28 23:50:06
從爭冠核心到軟肋!8000萬歐巨星或淪為替補,斯洛特面臨艱難抉擇

從爭冠核心到軟肋!8000萬歐巨星或淪為替補,斯洛特面臨艱難抉擇

銳評利物浦
2025-12-28 23:42:35
278架無人機襲擊俄羅斯,莫斯科遭30架無人機襲擊,俄羅斯也挨炸

278架無人機襲擊俄羅斯,莫斯科遭30架無人機襲擊,俄羅斯也挨炸

山河路口
2025-12-28 23:26:03
NVIDIA花200億美元收購Grop:補足GPU短板 未來市值看上7.5萬億

NVIDIA花200億美元收購Grop:補足GPU短板 未來市值看上7.5萬億

安兔兔
2025-12-28 22:02:44
烈士王偉的遺孀阮國琴,獲特招入伍,如今已是海軍上校,依舊單身

烈士王偉的遺孀阮國琴,獲特招入伍,如今已是海軍上校,依舊單身

文史達觀
2025-12-28 06:45:07
蒙古國大膽想法:拿400平方公里和中國換通道?想將稀土運往美國

蒙古國大膽想法:拿400平方公里和中國換通道?想將稀土運往美國

游者走天下
2025-12-26 16:20:18
沙利文終于承認,佩洛西竄臺是步臭棋,臺海環(huán)境已發(fā)生不可逆改變

沙利文終于承認,佩洛西竄臺是步臭棋,臺海環(huán)境已發(fā)生不可逆改變

叮當當科技
2025-12-28 22:56:02
樂子大了!越南高鐵項目給中國挖坑,結果掉進去了

樂子大了!越南高鐵項目給中國挖坑,結果掉進去了

超級學爸蛋總
2025-12-28 23:28:22
“苦等9年”的沈夢辰:住2億別墅,請4個保姆,光鮮背后也有淚水

“苦等9年”的沈夢辰:住2億別墅,請4個保姆,光鮮背后也有淚水

老范談史
2025-12-26 14:41:29
黎筍之子黎堅誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

黎筍之子黎堅誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

磊子講史
2025-12-24 11:04:05
乒超大結局:王楚欽衛(wèi)冕男團冠軍 瓜分100萬獎金 孫穎莎也是贏家

乒超大結局:王楚欽衛(wèi)冕男團冠軍 瓜分100萬獎金 孫穎莎也是贏家

侃球熊弟
2025-12-28 20:17:13
烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們造出2.0!

烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們造出2.0!

小莜讀史
2025-12-25 20:46:05
與丈夫相愛10年,還有2個女兒,卻抵不過27歲戲子,她:永不再見

與丈夫相愛10年,還有2個女兒,卻抵不過27歲戲子,她:永不再見

云霄紀史觀
2025-12-28 19:08:07
一分惜!一戰(zhàn)封神!NBA49年,只有他才敢這么玩!

一分惜。∫粦(zhàn)封神!NBA49年,只有他才敢這么玩!

籃球盛世
2025-12-28 20:08:39
宋曉峰豪宅曝光,室內(nèi)有電梯,為直播建豪華工作室,ktv飯店都有

宋曉峰豪宅曝光,室內(nèi)有電梯,為直播建豪華工作室,ktv飯店都有

一娛三分地
2025-12-28 22:55:42
他當縱隊司令優(yōu)柔寡斷,降為副司令打得毫不猶豫,此人是哪位將軍

他當縱隊司令優(yōu)柔寡斷,降為副司令打得毫不猶豫,此人是哪位將軍

云霄紀史觀
2025-12-28 22:40:49
2025-12-29 00:11:00
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發(fā)者
102文章數(shù) 47關注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

澤連斯基:若要烏就領土問題讓步 "和平計劃"應全民公投

頭條要聞

澤連斯基:若要烏就領土問題讓步 "和平計劃"應全民公投

體育要聞

MVP概率達82.5%!約基奇連超大鳥喬丹

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

親子
旅游
游戲
數(shù)碼
軍事航空

親子要聞

博主力薦寶寶輔食鹽,檢測竟是工業(yè)廢料,檢測鉛砷嚴重超標,66 倍溢價收割家長

旅游要聞

12月28日最佳情報|濟南華山湖天鵝出游,打卡濟南地鐵4號線

醉酒兔女郎護送回家!重磅更新可偷看裙底?

數(shù)碼要聞

曝光的AirPods原型機顯示,蘋果曾計劃推出多彩配色方案!

軍事要聞

普京:俄方已無興趣等待烏從其占領區(qū)撤出

無障礙瀏覽 進入關懷版