国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-5.2 翻車內(nèi)幕曝光:技術(shù)團(tuán)隊(duì)沒走「歪路」,但用戶成了大冤種

0
分享至


OpenAI 的十周歲生日,過(guò)得不太體面。

在當(dāng)天發(fā)布的 GPT-5.2 交出了一份完美答卷:它橫掃許多基準(zhǔn)測(cè)試的 SOTA,在數(shù)學(xué)和編程等競(jìng)賽場(chǎng)景中的表現(xiàn)堪稱亮眼,也被官方描述為 AI「超級(jí)大腦」。

可到了社交網(wǎng)絡(luò),迎接它的不是掌聲,而是用戶的集體罵街。


在 X 和 Reddit 上,憤怒與失望幾乎寫在每一條評(píng)論里。人們又一次懷念起那個(gè)曾經(jīng)的「白月光」GPT-4o:有人說(shuō) GPT-5.2 變得平淡、乏味、像被磨平了棱角;也有人譏諷它成了「把成年人當(dāng)幼兒園小孩對(duì)待」的說(shuō)教。

當(dāng)輿論的炮火對(duì)準(zhǔn) OpenAI 及其 CEO Sam Altman(山姆·奧特曼),一個(gè)尖銳的問(wèn)題擺在面前:為什么模型更「聰明」了,用戶反而更不愛了?


更「聰明」的模型,為什么不討喜了

The Information 今天凌晨的最新報(bào)道,扒出了內(nèi)幕。

過(guò)去一年,OpenAI 內(nèi)部曾奉行一條鐵律:每一次模型的代際飛躍,都會(huì)伴隨著用戶量的爆發(fā)式增長(zhǎng),因?yàn)椤缸兟斆鳌箮?lái)的體驗(yàn)升級(jí)是直觀的。但現(xiàn)在,這條鐵律失效了。

當(dāng)然,模型在智能與科研計(jì)算領(lǐng)域的提升依舊顯著。研究團(tuán)隊(duì)耗費(fèi)數(shù)月打磨推理能力,讓它能攻克更復(fù)雜的數(shù)學(xué)與科學(xué)難題,但對(duì)于大多數(shù)普通用戶而言,這種感知微乎其微。


▲ https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset

換句話說(shuō),智能的提升,并不天然等同于體驗(yàn)的提升。

普通用戶很少需要一臺(tái)「競(jìng)賽級(jí)大腦」,他們更多需要一個(gè)「日常好用的助手」。OpenAI 對(duì) 150 萬(wàn)次對(duì)話的大規(guī)模分析佐證了這一判斷,用戶的核心需求極其接地氣:實(shí)用指導(dǎo)(29%)、信息查詢(24%)以及寫作(24%)等,而與編程任務(wù)相關(guān)的對(duì)話只有 4.2%。


于是矛盾就變得非常具體:當(dāng)技術(shù)團(tuán)隊(duì)在實(shí)驗(yàn)室里狂卷數(shù)理化、狂卷基準(zhǔn)測(cè)試時(shí),用戶在聊天框里只想要一句話解決問(wèn)題——?jiǎng)e繞、別教、別拖。

戰(zhàn)線拉得過(guò)長(zhǎng)是一大槽點(diǎn)。

今年大部分時(shí)間里,奧特曼同時(shí)啟動(dòng)了多個(gè)新項(xiàng)目:視頻生成應(yīng)用 Sora、音樂 AI、瀏覽器、AI Agent、硬件設(shè)備、機(jī)器人……攤子越鋪越大,資源也被越分越碎。

這其實(shí)是科技巨頭最常見的經(jīng)典錯(cuò)誤:核心陣地還沒打穩(wěn),就急著開辟第二、第三戰(zhàn)場(chǎng)。短期看是「全面開花」,長(zhǎng)期看,貪多嚼不爛,乃兵家大忌——每一條戰(zhàn)線都缺人、缺算力、缺產(chǎn)品打磨的耐心。


OpenAI 內(nèi)部「研究?jī)?yōu)先」和「產(chǎn)品增長(zhǎng)」之間的拉扯,在圖像生成上體現(xiàn)得尤為明顯:

即便 GPT-4o 的吉卜力風(fēng)格在三月還短暫帶動(dòng)過(guò) ChatGPT 的使用與用戶增長(zhǎng),但 OpenAI 還是一度把圖像模型的開發(fā)優(yōu)先級(jí)往后放,等到 Nano Banana 口碑發(fā)酵后,OpenAI 又緊急回頭補(bǔ)課,內(nèi)部也因此爆發(fā)分歧——

奧特曼認(rèn)定圖像模型是用戶增長(zhǎng)的抓手,研究主管 Mark Chen 則更想把資源押在別的項(xiàng)目上。

另外,伴隨著 Scaling Laws 邊際效益遞減,為了突破大模型的瓶頸,OpenAI 過(guò)去一年里押注了推理模型,超過(guò) 1000 人的研究團(tuán)隊(duì)將資源傾斜于此,導(dǎo)致對(duì) ChatGPT 日常體驗(yàn)的優(yōu)化被邊緣化。


這種做法不僅分散了資源,甚至在年初的內(nèi)測(cè)中出現(xiàn)了性能倒退——為了適配「聊天」場(chǎng)景,反而削弱了推理模型的純粹性。雖然后來(lái)推出了「思考模式」和「深度研究」來(lái)分流、來(lái)補(bǔ)救,但用戶使用率卻很低,真正的日常對(duì)話體驗(yàn)并沒有因此變得更討喜。

除此之外,新舊模型之間也常出現(xiàn)兼容問(wèn)題。

例如在發(fā)布 GPT-5 前,研究人員發(fā)現(xiàn)模型在集成進(jìn) ChatGPT 后在部分編程任務(wù)上表現(xiàn)變差——因?yàn)橄到y(tǒng)根據(jù)用戶職業(yè)等個(gè)性化信息調(diào)整回答,結(jié)果反而干擾了模型理解,導(dǎo)致錯(cuò)誤答案。

誠(chéng)然,推理模型越來(lái)越強(qiáng),但 ChatGPT 體驗(yàn)越來(lái)越拉胯。


當(dāng)技術(shù)進(jìn)步的方向和用戶需求的方向開始分叉,誰(shuí)會(huì)先妥協(xié)?答案顯而易見。

Gemini 3 Pro 的強(qiáng)勢(shì)發(fā)布,最終把 OpenAI 逼到了墻角,于是便有了奧特曼發(fā)布「紅色警報(bào)」的經(jīng)典名場(chǎng)面,要求 OpenAI 員工重新聚焦 ChatGPT,提高產(chǎn)品體驗(yàn)吸引力。

而在同一時(shí)間,OpenAI 應(yīng)用負(fù)責(zé)人 Fidji Simo 也在個(gè)人博客中闡述 ChatGPT 的愿景,那就是從主要以文本為主的對(duì)話系統(tǒng),轉(zhuǎn)向能根據(jù)用戶意圖動(dòng)態(tài)生成界面的全生成式 UI。

只是 Simo 也曾承認(rèn),公司本質(zhì)仍以研究為中心,「產(chǎn)品本身并不是最終目標(biāo)」。


從商業(yè)邏輯看,這句話其實(shí)很危險(xiǎn)。

不同于 Anthropic 更偏向主攻 API 市場(chǎng),OpenAI 的大頭收入來(lái)自個(gè)人訂閱。在消費(fèi)市場(chǎng),沒有人會(huì)為企業(yè)的「終極理想」買單,用戶只愿為當(dāng)下的體驗(yàn)付費(fèi)。這就好比餐廳大廚醉心于研發(fā)米其林料理,而大堂里的食客僅僅想要一碗熱氣騰騰的陽(yáng)春面。

不過(guò),如果你因此就斷言 OpenAI 內(nèi)部已經(jīng)亂了陣腳,那可能低估了這家公司的韌性。

據(jù)彭博社援引 Mark Chen 的說(shuō)法,「紅色警報(bào)」并非新鮮事,而更像是一種戰(zhàn)時(shí)狀態(tài)的常態(tài)化管理工具。每當(dāng) OpenAI 需要集中火力攻克某一單一目標(biāo),或要求團(tuán)隊(duì)放下低優(yōu)先級(jí)任務(wù)時(shí),這種機(jī)制就會(huì)啟動(dòng)。


▲播客地址:https://x.com/Kantrowitz/status/2001790090641645940

奧特曼在最新的播客中,同樣否認(rèn)了拉響紅色警報(bào)帶來(lái)的過(guò)度焦慮。

「首先,所謂的『紅色警報(bào)』,在我們看來(lái)其實(shí)是一種低風(fēng)險(xiǎn)、但非常必要的應(yīng)對(duì)措施。」奧特曼坦言,「在潛在的競(jìng)爭(zhēng)威脅出現(xiàn)時(shí),保持一點(diǎn)『偏執(zhí)』、并迅速做出反應(yīng),是件好事?!?/p>

他甚至提到了今年年初 DeepSeek 的崛起,認(rèn)為那和現(xiàn)在的 Gemini 3 一樣,都是一種良性的外部刺激。

「Gemini 3 到目前為止,還沒帶來(lái)我們?cè)緭?dān)心的那種毀滅性沖擊。雖然它和 DeepSeek 一樣,精準(zhǔn)地刺痛了我們?cè)诋a(chǎn)品策略上的軟肋,但也倒逼我們做出了極其迅速的調(diào)整?!?/p>


在奧特曼看來(lái),這種緊急狀態(tài)通常只會(huì)持續(xù)六到八周?!肝液芨吲d我們有這種快速反應(yīng)機(jī)制,我們不會(huì)在這個(gè)狀態(tài)里待太久?!?/p>

OpenAI 顯然也明白光喊口號(hào)不夠,他們今天也正式發(fā)布了 GPT-5.2-Codex。


作為專為解決復(fù)雜現(xiàn)實(shí)軟件工程問(wèn)題而生的智能體編程模型,GPT-5.2-Codex 在通用智能的基礎(chǔ)上,融合了 GPT-5.1-Codex-Max 的終端操作能力,更擅長(zhǎng)處理代碼重構(gòu)、遷移等長(zhǎng)程任務(wù)。

而同樣是在播客的尾聲,當(dāng)主持人詢問(wèn)「GPT-6 還要等多久?」時(shí),奧特曼敞亮地表示:「我不知道我們什么時(shí)候會(huì)正式把某個(gè)模型命名為 GPT-6,但我預(yù)計(jì)在明年第一季度,會(huì)有比 5.2 有顯著提升的新模型發(fā)布。」

拉響「紅色警報(bào)」,到 GPT-5.2 系列的反擊,再到 GPT-6 的曖昧預(yù)告,OpenAI 試圖用新模型與新節(jié)奏重建信心,但決定長(zhǎng)期勝負(fù)的,仍是分發(fā)入口、生態(tài)協(xié)同與算力成本等硬門檻。

Google 的陽(yáng)謀,與奧特曼的 8300 億「空城計(jì)」

Google 的優(yōu)勢(shì),從來(lái)不只在 Gemini 3 Pro 這一個(gè)模型上,更在于它幾乎無(wú)可匹敵的分發(fā)渠道。

搜索、Chrome、辦公套件。在 AI 賽道,護(hù)城河可能是所有科技產(chǎn)品中最淺的。 用戶的遷移成本幾乎為零,當(dāng) Google 的 AI 產(chǎn)品如空氣般無(wú)處不在,這幾乎成了一場(chǎng)無(wú)解的陽(yáng)謀——你不需要「被說(shuō)服」,你只會(huì)「順手就用」。

更重要的是,在與 Google 的較量中,硬件層面的短板成了 OpenAI 最大的軟肋。

相比于 Google 十二年前就開始布局專用 AI 芯片(TPU)所建立的效率優(yōu)勢(shì),OpenAI 每年仍需花費(fèi)數(shù)十億美元租用算力。即便試圖通過(guò)自建數(shù)據(jù)中心和芯片來(lái)「補(bǔ)課」,但體驗(yàn)在被追平、成本在被碾壓的現(xiàn)狀已是不爭(zhēng)的事實(shí)。


用網(wǎng)友的話來(lái)說(shuō):

OpenAI 現(xiàn)在并不需要一個(gè)更強(qiáng)大的模型,它需要的是 AMD。如果 OpenAI 收購(gòu)了 AMD,這場(chǎng) AI 之戰(zhàn)就將宣告結(jié)束。Google 之所以不怕 OpenAI,是因?yàn)樗鼡碛凶约业?TPU。但它真正該擔(dān)心的,是 OpenAI 擁有 AMD。

OpenAI 總裁 Greg Brockman 在最近的視頻中也坦言,由于算力捉襟見肘,每當(dāng)新功能上線(如年初 GPT-4o 吉卜力風(fēng)格),就必須從研究部門「抽血」,把算力挪給產(chǎn)品部。這是一種飲鴆止渴的循環(huán)——為了維持今天的用戶體驗(yàn),被迫推遲了明日的技術(shù)研發(fā)。

可算力這東西,歸根到底就是兩個(gè)字:燒錢。而且是海量地?zé)X。

為此,據(jù) WSJ 報(bào)道,OpenAI 已計(jì)劃發(fā)起 1000 億美元的巨額融資;若一切順利,這家超級(jí)獨(dú)角獸將在明年 Q1 之前,以 8300 億美元的估值,再次刷新資本市場(chǎng)的想象力。


而在今年早些時(shí)候,軟銀同意向 OpenAI 投資 300 億美元,并于上月出售所持的英偉達(dá)股份價(jià)值 58 億美元,為這筆投資籌資,并預(yù)計(jì)盡快完成剩余 225 億美元的出資。

但錢的問(wèn)題沒那么簡(jiǎn)單。預(yù)計(jì)到 2030 年,OpenAI 的現(xiàn)金消耗將超過(guò) 2000 億美元。相比之下,Google 財(cái)務(wù)穩(wěn)健,甚至能通過(guò) Oracle 等合作伙伴的股價(jià)波動(dòng)間接擠壓 OpenAI 的融資前景。

到處籌錢的 OpenAI,看起來(lái)更像是在和時(shí)間賽跑。于是便誕生了那個(gè)笑話:照奧特曼的融資能力,沒準(zhǔn)哪天連 Google 和英偉達(dá)都能「打包帶走」。


但玩笑歸玩笑,錢能買來(lái)時(shí)間,卻買不來(lái)口碑。

所以在 2025 年這個(gè)冬天,狂奔三年的 OpenAI 選擇先踩一腳剎車,其實(shí)是對(duì)的:收攏戰(zhàn)線、回撤資源,把方向重新對(duì)準(zhǔn) ChatGPT 的日常體驗(yàn)。

這是一次昂貴但必要的糾偏。

技術(shù)領(lǐng)先不等于產(chǎn)品好用,基準(zhǔn)測(cè)試第一不等于用戶滿意。更重要的是,你不能只在用戶懷念舊版本的時(shí)候,才想起來(lái)問(wèn)問(wèn)他們的感受。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普舉著孩子照片,對(duì)哭泣的母親承諾:我相信中國(guó)會(huì)執(zhí)行死刑的

特朗普舉著孩子照片,對(duì)哭泣的母親承諾:我相信中國(guó)會(huì)執(zhí)行死刑的

博覽歷史
2025-07-21 17:59:30
3-1逆轉(zhuǎn)早田希娜!中國(guó)女乒21歲世界冠軍閃耀:進(jìn)化變第三巨頭?

3-1逆轉(zhuǎn)早田希娜!中國(guó)女乒21歲世界冠軍閃耀:進(jìn)化變第三巨頭?

李喜林籃球絕殺
2026-01-09 18:09:24
倒計(jì)時(shí)一個(gè)月,人類即將再次飛向月球

倒計(jì)時(shí)一個(gè)月,人類即將再次飛向月球

NASA航天愛好者
2026-01-09 08:53:57
溥儀在“偽滿”的權(quán)力有多大?別被他裝孫子的一面給騙了

溥儀在“偽滿”的權(quán)力有多大?別被他裝孫子的一面給騙了

掠影后有感
2026-01-09 11:08:09
為什么民國(guó)時(shí)期已經(jīng)有電了,后來(lái)又點(diǎn)了40年煤油燈?

為什么民國(guó)時(shí)期已經(jīng)有電了,后來(lái)又點(diǎn)了40年煤油燈?

浩舞默畫
2026-01-08 09:37:13
王毅外長(zhǎng)發(fā)出統(tǒng)一最強(qiáng)音,向全世界通報(bào)兩件事,中國(guó)再也不避諱了

王毅外長(zhǎng)發(fā)出統(tǒng)一最強(qiáng)音,向全世界通報(bào)兩件事,中國(guó)再也不避諱了

boss外傳
2026-01-08 14:00:03
“女性偉哥”,來(lái)了

“女性偉哥”,來(lái)了

中國(guó)新聞周刊
2026-01-09 20:47:07
退休后一定要去社區(qū)報(bào)到!差別大著呢,搞錯(cuò)準(zhǔn)吃虧

退休后一定要去社區(qū)報(bào)到!差別大著呢,搞錯(cuò)準(zhǔn)吃虧

小小包工頭阿汾
2026-01-09 10:22:28
小學(xué)冬季校服里有“塑料膜”,官方通報(bào):高度重視,已成立聯(lián)合調(diào)查組

小學(xué)冬季校服里有“塑料膜”,官方通報(bào):高度重視,已成立聯(lián)合調(diào)查組

上觀新聞
2026-01-10 10:54:08
崩了崩了!正負(fù)值-65+年薪近4000萬(wàn),就這表現(xiàn),還留著干啥?

崩了崩了!正負(fù)值-65+年薪近4000萬(wàn),就這表現(xiàn),還留著干啥?

球童無(wú)忌
2026-01-09 23:25:10
一口氣搞懂16種酒,吹牛更顯學(xué)問(wèn)

一口氣搞懂16種酒,吹牛更顯學(xué)問(wèn)

混知
2026-01-09 12:27:20
斬首馬杜羅的“支奴干”直升機(jī)中國(guó)也有,為什么至今沒仿制成功?

斬首馬杜羅的“支奴干”直升機(jī)中國(guó)也有,為什么至今沒仿制成功?

軍武次位面
2026-01-08 18:51:19
21分大逆轉(zhuǎn)!衛(wèi)冕冠軍4大首發(fā)缺席仍贏球,兩大奇兵爆砍44分

21分大逆轉(zhuǎn)!衛(wèi)冕冠軍4大首發(fā)缺席仍贏球,兩大奇兵爆砍44分

體壇小李
2026-01-10 11:54:36
李在明送中方5件國(guó)禮,深夜回國(guó)收到噩耗,美駐韓一把手突然撤離

李在明送中方5件國(guó)禮,深夜回國(guó)收到噩耗,美駐韓一把手突然撤離

博覽歷史
2026-01-09 18:08:29
16分大勝籃網(wǎng)!登卡57分11助,又一新星爆發(fā)砍21分,祖巴茨失望了

16分大勝籃網(wǎng)!登卡57分11助,又一新星爆發(fā)砍21分,祖巴茨失望了

一登侃球
2026-01-10 11:52:24
春晚從不對(duì)外售票,那臺(tái)下觀眾都是哪來(lái)的?趙本山的回應(yīng)一針見血

春晚從不對(duì)外售票,那臺(tái)下觀眾都是哪來(lái)的?趙本山的回應(yīng)一針見血

阿廢冷眼觀察所
2026-01-09 07:40:35
中國(guó)再生資源開發(fā)集團(tuán)黨委書記、董事長(zhǎng)、總經(jīng)理邢宏偉接受審查調(diào)查

中國(guó)再生資源開發(fā)集團(tuán)黨委書記、董事長(zhǎng)、總經(jīng)理邢宏偉接受審查調(diào)查

界面新聞
2026-01-10 10:02:29
CBA大沖突!周琦遭羞辱,惱羞成怒,沖向?qū)Ψ狡饹_突 裁判送上兩T

CBA大沖突!周琦遭羞辱,惱羞成怒,沖向?qū)Ψ狡饹_突 裁判送上兩T

體育哲人
2026-01-10 10:47:27
陳慧琳穿三角褲開唱引罵戰(zhàn):舞臺(tái)審美權(quán),到底該誰(shuí)說(shuō)了算?

陳慧琳穿三角褲開唱引罵戰(zhàn):舞臺(tái)審美權(quán),到底該誰(shuí)說(shuō)了算?

韓馳
2026-01-09 12:12:47
1972年,175位將軍復(fù)出沒人要,各大軍區(qū)紛紛甩鍋,周總理這招絕了

1972年,175位將軍復(fù)出沒人要,各大軍區(qū)紛紛甩鍋,周總理這招絕了

寄史言志
2026-01-08 18:02:14
2026-01-10 12:11:00
愛范兒 incentive-icons
愛范兒
消費(fèi)科技第一媒體
38295文章數(shù) 2600568關(guān)注度
往期回顧 全部

科技要聞

傳DeepSeek準(zhǔn)備第二次震驚全世界

頭條要聞

媒體:中國(guó)若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

頭條要聞

媒體:中國(guó)若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

體育要聞

楊瀚森:上場(chǎng)時(shí)間要去爭(zhēng)取 而不是要求

娛樂要聞

趙櫻子稱和蔣毅試婚三天:像試面膜

財(cái)經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

寶馬25年全球銷量246.3萬(wàn)臺(tái) 中國(guó)仍是第一大市場(chǎng)

態(tài)度原創(chuàng)

數(shù)碼
本地
房產(chǎn)
時(shí)尚
公開課

數(shù)碼要聞

核顯玩出獨(dú)顯感:英特爾Panther Lake測(cè)試《戰(zhàn)地6》飆至192 FPS

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

房產(chǎn)要聞

66萬(wàn)方!4755套!三亞巨量房源正瘋狂砸出!

2026春夏八大流行趨勢(shì)

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版