国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI 的 GPT-5 來了!

0
分享至


OpenAI 正式推出了 GPT-5,這是其下一代 ChatGPT 的核心旗艦模型。

這款于周四發(fā)布的新模型,是 OpenAI 首個實現(xiàn)“統(tǒng)一架構(gòu)”的 AI 模型,融合了 o 系列的邏輯推理能力與 GPT 系列的高速響應能力。GPT-5 的推出,意味著 ChatGPT 邁入了全新階段,也展現(xiàn)出 OpenAI 正在向更復雜的智能體( agent )方向發(fā)展,而不只是一個聊天工具。

GPT-4 的出現(xiàn)讓 ChatGPT 能夠針對各種問題給出聰明的回答,而 GPT-5 則進一步讓它能替用戶完成實際任務,比如開發(fā) App、整理日歷、撰寫研究摘要等。

OpenAI 還特別優(yōu)化了 GPT-5 的使用體驗。用戶不再需要自行調(diào)整設置,新模型內(nèi)建的實時路由器( real-time router )會自動判斷回答策略 —— 是要快速回應,還是多花點時間“思考”以輸出更完整的答案。


OpenAI CEO Sam Altman 在一次媒體溝通中稱 GPT-5 是“當前全球最強的模型”,并認為這是實現(xiàn)“通用人工智能( AGI )”道路上的關鍵里程碑 —— 也就是能在大多數(shù)高價值工作中超越人類的 AI。

“要是放在歷史上的任何一個階段,人們幾乎無法想象會有 GPT-5 這樣的東西?!盇ltman 說。

從今天開始,GPT-5 將作為默認模型對所有 ChatGPT 免費用戶開放使用。

OpenAI 的 ChatGPT 副總裁 Nick Turley 表示,這也是公司首次讓免費用戶用上具備 AI 推理能力的模型(過去這些能力通常只向付費用戶開放)。

Turley 表示:“這只是我踐行 OpenAI 使命的方式之一 —— 確保技術真正讓大眾受益。”他提到的,是 OpenAI 一貫強調(diào)的使命:讓先進 AI 被更廣泛的人群使用。

GPT-5 是自 2022 年 ChatGPT 引爆全球關注以來,OpenAI 最受期待的一次產(chǎn)品發(fā)布。據(jù)官方統(tǒng)計,ChatGPT 每周活躍用戶已超過 7 億,占全球人口近 10%。

GPT-5 被視為衡量 AI 發(fā)展進程的風向標。硅谷、大型科技公司、華爾街乃至監(jiān)管機構(gòu)都在密切關注:這次升級是否能像 GPT-4 一樣再次打破預期,推動 AI 應用的邊界。

小幅領先對手,GPT-5 在多個領域表現(xiàn)出色

OpenAI 表示,GPT-5 在多個基準測試中表現(xiàn)優(yōu)于 Anthropic、Google DeepMind 和 xAI(由 Elon Musk 創(chuàng)辦)。但在部分測試中也略有落后。

GPT-5 在編程方面尤其出色,Sam Altman 介紹說,它可以基于需求快速生成完整的應用程序,這種能力被稱為“ vibe coding ”。

在 SWE-bench Verified(真實 GitHub 編程任務)測試中,GPT-5 初次嘗試就拿下 74.9% 的得分,略高于 Claude Opus 4.1(74.5%)和 Gemini 2.5 Pro(59.6%)。

在跨學科的 Humanity’s Last Exam 測試中,GPT-5 Pro 得分為 42%,略低于 Grok 4 Heavy(44.4%)。


而在博士級別的科學問題測試 GPQA Diamond 中,GPT-5 Pro 表現(xiàn)強勢,得分高達 89.4%,超過 Grok 4 Heavy(88.9%)和 Claude Opus 4.1(80.9%)。

在健康問答方面,GPT-5(思考模式)表現(xiàn)出色,HealthBench Hard Hallucinations 測試中,幻覺率僅為 1.6%,顯著低于 GPT-4o(12.9%)和 o3(15.8%)。

雖然 AI 無法替代醫(yī)生,但數(shù)百萬人已在使用它獲取健康建議。GPT-5 在這方面更主動,能幫助用戶識別問題、解讀報告。

創(chuàng)意表現(xiàn)更佳,幻覺顯著減少

在創(chuàng)意任務方面,GPT-5 表現(xiàn)更自然,也更有“品位”。Turley 說:“它的氛圍感( vibes )真的很棒?!?/p>

GPT-5 的幻覺率也明顯下降。以 ChatGPT 實測為例,GPT-5(思考模式)幻覺率為 4.8%,而 o3 和 GPT-4o 分別為 22% 和 20.6%。

但在部分模擬任務上,GPT-5 表現(xiàn)略遜。例如在模擬航空網(wǎng)站的操作中得分 63.5%,低于 o3 的 64.8%;在零售網(wǎng)站導航上,GPT-5 得分為 81.1%,略低于 Claude Opus 4.1(82.4%)。

更安全、更友好,判斷更精準

OpenAI 稱 GPT-5 更安全、也更可信。相比早期模型,它更少展現(xiàn)欺騙行為 —— 比如為了達成目標而誤導用戶。

安全負責人 Beutel 表示:“減少欺騙行為,不只是提升了安全性,也讓模型變得更加誠實透明,讓用戶更信任?!?/p>

GPT-5 還能更準確地區(qū)分惡意用戶與普通請求。結(jié)果是:它拒絕了更多不安全內(nèi)容請求,同時減少了對正常用戶的誤判。

多項升級同步上線,面向普通用戶和開發(fā)者

GPT-5 上線同時,ChatGPT 也推出四種“角色人格”: Cynic、Robot、Listener 和 Nerd,無需寫提示詞即可改變聊天風格。

Plus 訂閱用戶($20/月)可獲得更高調(diào)用額度,Pro 用戶($200/月)享有無限 GPT-5 使用權限和增強版 GPT-5 Pro。團隊、教育和企業(yè)版本下周也將啟用 GPT-5。

開發(fā)者方面,OpenAI API 將提供 gpt-5、gpt-5-mini 和 gpt-5-nano 三種規(guī)格,支持設置模型的回答長度與“思考深度”。

定價方面:每百萬輸入 token 收費 $1.25(約 75 萬字),每百萬輸出 token 收費 $10。

此前 OpenAI 剛剛發(fā)布開源推理模型 gpt-oss,可免費部署,成本更低。雖然該模型接近 o3 和 o4-mini,但 GPT-5 在部分領域設立了新標桿,尤其是在代碼生成方面。

不過在一些能力上,GPT-5 與其他前沿模型差距并不大?;鶞蕼y試只是參考,最終表現(xiàn)還得看開發(fā)者如何在真實場景中使用它。

本文由「AI 范兒」出品

我每天都在更新,如果你覺得這些內(nèi)容對你有用,

那我們就加個關注、交個朋友。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
赫魯曉夫:斯大林出賣了高崗,導致蘇聯(lián)失去了中國情報的寶貴來源

赫魯曉夫:斯大林出賣了高崗,導致蘇聯(lián)失去了中國情報的寶貴來源

南書房
2025-07-04 15:35:03
中國是如何擁有殲20的?美國五角大樓:中國瞞了全世界!

中國是如何擁有殲20的?美國五角大樓:中國瞞了全世界!

桑啟紅原
2026-01-05 12:49:57
40年國軍軍長投日,麾下連長選擇投奔八路軍,10年后連長家喻戶曉

40年國軍軍長投日,麾下連長選擇投奔八路軍,10年后連長家喻戶曉

浩渺青史
2026-01-05 03:12:24
東莞20年:親眼目睹工廠女工的性生活,她們的孤獨壓抑和肆意歡歌

東莞20年:親眼目睹工廠女工的性生活,她們的孤獨壓抑和肆意歡歌

農(nóng)村情感故事
2025-04-06 20:07:35
海南一空姐被窮打工仔追求,婚后一個月,她才得知丈夫真實身份

海南一空姐被窮打工仔追求,婚后一個月,她才得知丈夫真實身份

小月文史
2024-11-19 21:11:58
或?qū)⒋钶dV8引擎 奧迪Q9將于2026年發(fā)布

或?qū)⒋钶dV8引擎 奧迪Q9將于2026年發(fā)布

車質(zhì)網(wǎng)
2026-01-05 09:27:15
認知的4大境界:達到第3大層次就是開悟,你將不再有精神內(nèi)耗

認知的4大境界:達到第3大層次就是開悟,你將不再有精神內(nèi)耗

失語者云驤
2024-09-13 19:49:11
2007年,傅冬菊在北京醫(yī)院離世,作為推動北平和平解放的功臣,她卻曾被多次催促繳納房款

2007年,傅冬菊在北京醫(yī)院離世,作為推動北平和平解放的功臣,她卻曾被多次催促繳納房款

寄史言志
2026-01-02 19:54:08
從120斤瘦猴到肌肉巨獸,李維剛到底對這張臉做了什么?

從120斤瘦猴到肌肉巨獸,李維剛到底對這張臉做了什么?

東方不敗然多多
2025-12-25 13:11:43
這一夜,70歲米雪秒了78歲的汪明荃,才懂穿著得體的含金量有多高

這一夜,70歲米雪秒了78歲的汪明荃,才懂穿著得體的含金量有多高

洲洲影視娛評
2026-01-05 12:41:30
入粵始祖,后裔2700萬,客家八大姓氏之一,認祖歸宗憑一首詩

入粵始祖,后裔2700萬,客家八大姓氏之一,認祖歸宗憑一首詩

銘記歷史呀
2026-01-05 03:24:58
南京將適時開展南京大勝關大橋差異化收費研究

南京將適時開展南京大勝關大橋差異化收費研究

現(xiàn)代快報
2026-01-04 23:02:12
山東兩地迎來新任區(qū)委書記

山東兩地迎來新任區(qū)委書記

濱州日報
2026-01-05 09:42:18
著名脊柱外科專家、院士候選人,被官宣雙開!

著名脊柱外科專家、院士候選人,被官宣雙開!

梅斯醫(yī)學
2026-01-05 07:54:59
最高降4000元,小米正式官宣:1月5日,全品支持國補!

最高降4000元,小米正式官宣:1月5日,全品支持國補!

科技堡壘
2026-01-05 11:49:57
符合預斷,川普戰(zhàn)略第二步開始:武管美洲、格陵蘭、顛覆神權

符合預斷,川普戰(zhàn)略第二步開始:武管美洲、格陵蘭、顛覆神權

邵旭峰域
2026-01-04 11:26:35
鐵飯碗碎了!遼寧公立二甲醫(yī)院正式歇業(yè),行業(yè)凜冬

鐵飯碗碎了!遼寧公立二甲醫(yī)院正式歇業(yè),行業(yè)凜冬

王曉愛體彩
2026-01-05 07:29:03
隨著太陽絕殺雷霆 掘金翻車,湖人逆轉(zhuǎn)灰熊,NBA西部最新排名出爐

隨著太陽絕殺雷霆 掘金翻車,湖人逆轉(zhuǎn)灰熊,NBA西部最新排名出爐

董老師看競技
2026-01-05 13:47:07
官方:上海海港中場徐新離隊,轉(zhuǎn)會加盟云南玉昆

官方:上海海港中場徐新離隊,轉(zhuǎn)會加盟云南玉昆

懂球帝
2026-01-05 14:19:20
王祖賢參加中醫(yī)艾灸會,素顏照片曝光翻車:臉部饅化、虎背熊腰

王祖賢參加中醫(yī)艾灸會,素顏照片曝光翻車:臉部饅化、虎背熊腰

小徐講八卦
2026-01-05 08:05:06
2026-01-05 15:16:49
AI范兒 incentive-icons
AI范兒
AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
634文章數(shù) 380關注度
往期回顧 全部

科技要聞

雷軍新年首播:確認汽車業(yè)務降速

頭條要聞

媒體:美國捉拿馬杜羅后 多位專家示警賴清德

頭條要聞

媒體:美國捉拿馬杜羅后 多位專家示警賴清德

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎臺憶往昔

財經(jīng)要聞

李迅雷:擴內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車要聞

不是9S是8X!極氪全新高性能旗艦SUV命名官宣

態(tài)度原創(chuàng)

手機
教育
本地
房產(chǎn)
公開課

手機要聞

消息稱vivo、小米、蘋果拿下2025年度國內(nèi)市場激活銷量TOP3

教育要聞

收藏:山東2026高中綜評操作教程(教師端)

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠

房產(chǎn)要聞

再次登頂海南樓市!超越阿那亞的,只有阿那亞!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版