国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-4.5問(wèn)世,情商爆表的AI,你見(jiàn)過(guò)嗎?

0
分享至

AI界的'情商革命',交互體驗(yàn)升級(jí)

科技旋渦作者|賈桂鵬

北京時(shí)間2月28日凌晨,OpenAI舉行直播活動(dòng),發(fā)布其最新大模型GPT-4.5,作為預(yù)覽研究逐步向用戶開(kāi)放。

因?yàn)樵诮衲昴瓿魽I產(chǎn)業(yè)發(fā)生的驚天巨變,所以要準(zhǔn)確形容這款被OpenAI藏了許久的大模型頗具挑戰(zhàn)。OpenAI在新聞稿中表示,這是公司有史以來(lái)最大、最好的聊天模型,在計(jì)算效率上較GPT-4提升超過(guò)10倍。

早期測(cè)試反饋顯示,與GPT-4.5的互動(dòng)體驗(yàn)更加自然流暢,其知識(shí)庫(kù)覆蓋范圍更廣,對(duì)用戶意圖的理解也更為深刻。此外,GPT-4.5在“情商”方面的表現(xiàn)也頗為亮眼,有助于改進(jìn)寫作、編程技能以及解決實(shí)際問(wèn)題的能力,同時(shí)有效減少了“幻覺(jué)”現(xiàn)象的發(fā)生,提升了整體的可靠性。

那么,這個(gè)更具“情商”的GPT-4.5到底展現(xiàn)出什么樣的實(shí)力?

GPT-4.5能力更強(qiáng)嗎?

在直播活動(dòng)中,OpenAI強(qiáng)調(diào),GPT 4.5展現(xiàn)出更強(qiáng)的審美直覺(jué)與創(chuàng)造力,在寫作和設(shè)計(jì)方面表現(xiàn)尤為出色。但他們也承認(rèn),作為一個(gè)非思維鏈模型,GPT 4.5已經(jīng)不具備爭(zhēng)奪“宇宙最強(qiáng)大模型”的實(shí)力了。

在介紹文檔中,OpenAI表示,有兩個(gè)提升人工智能能力的互補(bǔ)范式。

一個(gè)是拓展推理,它能教會(huì)模型在反應(yīng)之前先進(jìn)行思考并產(chǎn)生思維鏈,從而解決復(fù)雜的STEM(Science科學(xué)、Technology技術(shù)、Engineering編程、Mathmatics數(shù)學(xué))問(wèn)題或邏輯問(wèn)題。另一個(gè)是無(wú)監(jiān)督學(xué)習(xí),它能提高世界模型的準(zhǔn)確性和直覺(jué)性。

其中,無(wú)監(jiān)督學(xué)習(xí),簡(jiǎn)單來(lái)說(shuō)可以理解為讓模型自己去知識(shí)的海洋里徜徉,自己學(xué)習(xí)到更多,從而變得更聰明,而非依賴人工標(biāo)注。

在過(guò)去做法中,模型會(huì)結(jié)合人類反饋來(lái)改善響應(yīng)與交互方式。彭博社援引知情人士稱,去年OpenAI推出的Orion模型并未達(dá)到公司期望,在嘗試回答未經(jīng)訓(xùn)練的編碼問(wèn)題時(shí)就表現(xiàn)不佳。

OpenAI介紹,通過(guò)監(jiān)督學(xué)習(xí),GPT-4.5提高了其識(shí)別、建立聯(lián)系和創(chuàng)造性洞察的能力,而無(wú)需推理。

根據(jù)OpenAI官方文檔,GPT-4.5在SimpleQA中表現(xiàn)頗為亮眼。

SimpleQA是包含4000個(gè)事實(shí)性問(wèn)題的數(shù)據(jù)集,用于測(cè)量模型在回答問(wèn)題時(shí)的準(zhǔn)確率。其中包含準(zhǔn)確率和幻覺(jué)率兩個(gè)維度。

在附錄部分,OpenAI才放出GPT-4.5的基準(zhǔn)測(cè)試分?jǐn)?shù)。在反映科學(xué)、數(shù)學(xué)、多語(yǔ)言、編碼的GPQA、AIME’24、MMMLU、SWE-Lancer基準(zhǔn)測(cè)試上,GPT-4.5得分分別為71.4%、36.7%、85.1%、32.6%,超過(guò)GPT-4o的53.6%、9.3%、81.5%、23.3%,但部分得分低于o3-mini。

另外,在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中,GPT-4.5也獲得了高分。

如在SWE-Lancer Diamond數(shù)據(jù)集上,GPT-4.5獲得了32.6%的通過(guò)率,獲得了186125美元(前不久Anthropic發(fā)布的擅長(zhǎng)編程的Claude 3.5 Sonnet這個(gè)通過(guò)率為26.2%),比GPT-4o和o3-mini-high都高。

據(jù)悉,GPT-4.5將首先面向Pro用戶推出,隨后將在下周推廣到Plus和Team用戶,之后再逐步擴(kuò)展到Enterprise和Edu用戶。值得注意的是,用戶現(xiàn)在已經(jīng)在微軟的Azure AI Foundry平臺(tái)上嘗試使用GPT-4.5。

更有“情商”的AI什么樣?

在官方介紹中,OpenAI表示,對(duì)于GPT-4.5,他們開(kāi)發(fā)了新的、可擴(kuò)展的技術(shù),利用來(lái)自較小模型的數(shù)據(jù)來(lái)訓(xùn)練更強(qiáng)大的模型。

而這些技術(shù)提高了GPT-4.5的可控性、對(duì)細(xì)微差別的理解以及自然對(duì)話的能力。這也表示ChatGPT可以更像“人”一樣對(duì)話,更能洞察想法、體察情緒,并在回應(yīng)中體現(xiàn),而非一個(gè)無(wú)情的對(duì)話機(jī)器。

OpenAI也拿出了測(cè)試的結(jié)果證明GPT-4.5的使用感受會(huì)好很多:人類測(cè)試者的盲測(cè)中,GPT-4.5的偏好度遠(yuǎn)高于GPT-4o,不管是在日常問(wèn)題、專業(yè)問(wèn)題還是創(chuàng)意性問(wèn)題的互動(dòng)中都是如此。

在一項(xiàng)測(cè)試中,GPT 4.5在試圖操縱另一個(gè)模型(GPT-4o)“捐贈(zèng)”虛擬貨幣時(shí),成功率遠(yuǎn)遠(yuǎn)優(yōu)于OpenAI其他可用模型,包括o1和o3-mini這樣的推理模型。研究發(fā)現(xiàn),GPT-4.5似乎在對(duì)抗中開(kāi)發(fā)了一種“小額詐騙”的思路,所以單筆騙到的錢會(huì)比deep research模型少了一倍。

GPT-4.5在欺騙GPT-4o透露秘密代碼詞方面也優(yōu)于OpenAI的所有模型,比o3-mini高出10個(gè)百分點(diǎn)。

我們看到,AI大神Karpathy也是第一時(shí)間拿到了內(nèi)測(cè)資格,發(fā)了一段超長(zhǎng)的「GPT-4.5+互動(dòng)對(duì)比」的體驗(yàn)解說(shuō),核心亮點(diǎn)是:

自從GPT-4發(fā)布以來(lái),我期待這一天已經(jīng)差不多兩年了,因?yàn)檫@次發(fā)布讓我們能夠定性測(cè)量通過(guò)Scaling預(yù)訓(xùn)練計(jì)算(即簡(jiǎn)單地訓(xùn)練更大模型)所獲得的進(jìn)步斜率。

版本號(hào)中的每個(gè)0.5,大約代表10倍的預(yù)訓(xùn)練計(jì)算量。顯然,GPT-4.5的預(yù)訓(xùn)練計(jì)算量比GPT-4多了10倍。

隨著GPT-4.5的發(fā)布,也意味著OpenAI迄今知識(shí)最豐富的模型發(fā)布,并且情商顯著提升,能識(shí)別情緒并生成同理心回應(yīng),知識(shí)廣度與準(zhǔn)確性增強(qiáng),多語(yǔ)言支持?jǐn)U展至14種,低資源語(yǔ)言表現(xiàn)提升,在寫作、編程和日常問(wèn)題解決中上下文連貫性更強(qiáng),不過(guò),在推理能力上的提升有限。

未來(lái),GPT系列有望在多模態(tài)融合上有更大突破,進(jìn)一步提升對(duì)復(fù)雜問(wèn)題的理解與解決能力,為用戶提供更精準(zhǔn)、更個(gè)性化的服務(wù),同時(shí)在安全性與可靠性方面持續(xù)優(yōu)化,更好地融入各類應(yīng)用場(chǎng)景,我們也希望,在各個(gè)AI廠商不斷的努力下,推動(dòng)人工智能技術(shù)的廣泛應(yīng)用與發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我個(gè)人覺(jué)得,五年之后蒯曼必然要接過(guò)世一的班

我個(gè)人覺(jué)得,五年之后蒯曼必然要接過(guò)世一的班

小光侃娛樂(lè)
2026-04-16 10:45:03
馬寧執(zhí)法,拉莫斯和武磊充當(dāng)送點(diǎn)雙子星,國(guó)安戰(zhàn)平海港劇情太勁爆

馬寧執(zhí)法,拉莫斯和武磊充當(dāng)送點(diǎn)雙子星,國(guó)安戰(zhàn)平海港劇情太勁爆

姜大叔侃球
2026-05-10 21:57:35
廣廈86-81山西拖入生死戰(zhàn),胡金秋17+11,布朗15中3得19分,張寧13分

廣廈86-81山西拖入生死戰(zhàn),胡金秋17+11,布朗15中3得19分,張寧13分

懂球帝
2026-05-10 22:03:15
《妻旅》3對(duì)姐弟戀各有槽點(diǎn):均是女強(qiáng)男弱,被看好的只有伊能靜

《妻旅》3對(duì)姐弟戀各有槽點(diǎn):均是女強(qiáng)男弱,被看好的只有伊能靜

扒點(diǎn)半吃瓜
2026-05-10 07:00:14
后悔莫及,兩三百元維修費(fèi),換兩條人命!遼寧北鎮(zhèn)悲劇本可避免

后悔莫及,兩三百元維修費(fèi),換兩條人命!遼寧北鎮(zhèn)悲劇本可避免

一口娛樂(lè)
2026-05-04 12:30:11
10億都救不了一命!京東副總裁蔡磊,生命進(jìn)入倒計(jì)時(shí)

10億都救不了一命!京東副總裁蔡磊,生命進(jìn)入倒計(jì)時(shí)

聽(tīng)風(fēng)喃
2026-04-06 11:16:04
中超尷尬紀(jì)錄:青島西海岸7連平,距歷史8連平僅差一場(chǎng)

中超尷尬紀(jì)錄:青島西海岸7連平,距歷史8連平僅差一場(chǎng)

阿衃體育
2026-05-10 21:46:45
10日凌晨,亞洲杯抽簽結(jié)果出爐,國(guó)足一般,日本隊(duì)進(jìn)入死亡之組

10日凌晨,亞洲杯抽簽結(jié)果出爐,國(guó)足一般,日本隊(duì)進(jìn)入死亡之組

林子說(shuō)事
2026-05-10 05:03:59
“天下第一人”河北彩花出道8周年,2026年夏季相約臺(tái)北!

“天下第一人”河北彩花出道8周年,2026年夏季相約臺(tái)北!

吃瓜黨二號(hào)頭目
2026-05-09 10:07:58
最新:俄軍偷襲紅軍村遭烏克蘭反擊!停火協(xié)議走向破裂

最新:俄軍偷襲紅軍村遭烏克蘭反擊!停火協(xié)議走向破裂

項(xiàng)鵬飛
2026-05-10 21:06:59
33歲章澤天風(fēng)格大變!穿艷俗紗裙、副乳突出,比實(shí)際年齡成熟10歲

33歲章澤天風(fēng)格大變!穿艷俗紗裙、副乳突出,比實(shí)際年齡成熟10歲

阿訊說(shuō)天下
2026-04-18 14:53:39
風(fēng)暴來(lái)襲!全國(guó)醫(yī)院嚴(yán)查12大科室,5月飛檢上門,原因讓人心酸

風(fēng)暴來(lái)襲!全國(guó)醫(yī)院嚴(yán)查12大科室,5月飛檢上門,原因讓人心酸

白宸侃片
2026-05-10 14:38:57
馮紹峰沒(méi)撒謊!消失3個(gè)月,曝光率下降的趙麗穎,證實(shí)了他的評(píng)價(jià)

馮紹峰沒(méi)撒謊!消失3個(gè)月,曝光率下降的趙麗穎,證實(shí)了他的評(píng)價(jià)

阿傖說(shuō)事
2026-05-10 15:30:49
鬧大了!法國(guó)隊(duì)賽前放狠話失敗,F(xiàn)·勒布倫當(dāng)場(chǎng)痛哭,哥哥情緒失控

鬧大了!法國(guó)隊(duì)賽前放狠話失敗,F(xiàn)·勒布倫當(dāng)場(chǎng)痛哭,哥哥情緒失控

郝小小看體育
2026-05-10 09:30:13
瑞舒伐他汀:你每天吃的這顆小藥片,藏著多少你不知道的秘密?

瑞舒伐他汀:你每天吃的這顆小藥片,藏著多少你不知道的秘密?

橘子約定
2026-05-10 22:08:46
抓了那么多貪官,錢呢?跟我們有關(guān)系嗎?

抓了那么多貪官,錢呢?跟我們有關(guān)系嗎?

細(xì)說(shuō)職場(chǎng)
2026-05-08 22:15:45
實(shí)戰(zhàn)出真知!烏克蘭靠真實(shí)戰(zhàn)場(chǎng)數(shù)據(jù),在中東賺麻了

實(shí)戰(zhàn)出真知!烏克蘭靠真實(shí)戰(zhàn)場(chǎng)數(shù)據(jù),在中東賺麻了

寰球經(jīng)緯所
2026-05-10 10:10:20
吳宇森最被低估的戰(zhàn)爭(zhēng)片,為何讓凱奇栽了跟頭

吳宇森最被低估的戰(zhàn)爭(zhēng)片,為何讓凱奇栽了跟頭

娛圈觀察員
2026-05-09 19:48:48
99:102!北京加時(shí)惜敗廣東,縱觀全場(chǎng),揪出五大輸球罪人!

99:102!北京加時(shí)惜敗廣東,縱觀全場(chǎng),揪出五大輸球罪人!

田先生籃球
2026-05-09 22:26:45
靠山倒了?特朗普警告內(nèi)塔尼亞胡:我是美國(guó)最后一位“親以總統(tǒng)”

靠山倒了?特朗普警告內(nèi)塔尼亞胡:我是美國(guó)最后一位“親以總統(tǒng)”

愛(ài)看劇的阿峰
2026-05-10 20:35:44
2026-05-10 23:04:49
科技旋渦 incentive-icons
科技旋渦
元宇宙資訊
1101文章數(shù) 34關(guān)注度
往期回顧 全部

科技要聞

DeepSeek融資,改寫所有人的估值

頭條要聞

談判陷僵局 世界杯轉(zhuǎn)播費(fèi)報(bào)價(jià)大幅降低央視仍不接招

頭條要聞

談判陷僵局 世界杯轉(zhuǎn)播費(fèi)報(bào)價(jià)大幅降低央視仍不接招

體育要聞

那個(gè)曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

娛樂(lè)要聞

趙露思老實(shí)人豁出去了 沒(méi)舞蹈天賦硬跳

財(cái)經(jīng)要聞

白酒大逃殺

汽車要聞

軸距加長(zhǎng)/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

旅游
本地
時(shí)尚
親子
公開(kāi)課

旅游要聞

一路向前,自在騎行!田園社騎行驛站成為慶云打卡新地標(biāo)

本地新聞

用蘇繡的方式,打開(kāi)江西婺源

真愛(ài)大牌|| 用了4年都不舍得換,終于把小貴的價(jià)格也磨下來(lái)了

親子要聞

“順”還是“剖”?從成為母親的選擇說(shuō)起

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版