国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌、OpenAI同日發(fā)布模型,一個(gè)最快最具性價(jià)比,一個(gè)主打人情味

0
分享至



機(jī)器之心編輯部

深夜,兩大科技巨頭谷歌和 OpenAI 硬剛起來,相繼推出了新版本大模型,分別是 Gemini 3.1 Flash-Lite、GPT?5.3 Instant。

谷歌稱,Gemini 3.1 Flash-Lite 專為大規(guī)模智能設(shè)計(jì),是目前為止最具性價(jià)比的 Gemini 3 系列模型,定價(jià)為輸入 0.25 美元 / 百萬 tokens,輸出 1.50 美元 / 百萬 tokens,而在遠(yuǎn)低于更大模型成本的情況下,仍能提供顯著增強(qiáng)的性能。

Artificial Analysis 的基準(zhǔn)測(cè)試結(jié)果顯示,在保持同等甚至更高質(zhì)量的前提下,與 Gemini 2.5 Flash 相比,3.1 Flash-Lite 的首 token 響應(yīng)時(shí)間(TTFT)要快 2.5 倍,且輸出速度提升了 45%。



GPT?5.3 Instant 則在語氣、相關(guān)性和對(duì)話性方面都有所提升,并且拒絕率更低。與前代產(chǎn)品相比,幻覺減少高達(dá) 26.8%,并且 ChatGPT 和 API 都支持此模型。



有意思的是,在宣布 GPT-5.3 Instant 后,OpenAI 隨即暗示這個(gè)新模型也可能即將退役。OpenAI 在 X 上發(fā)表的一篇文章中表示,GPT-5.4 的到來比你想象的要快。



Gemini 3.1 Flash-Lite:專為大規(guī)模智能而打造

谷歌今日推出的 Gemini 3.1 Flash-Lite,是 Gemini 3 系列中速度最快、成本效率最高的模型。該模型專為大規(guī)模開發(fā)者工作負(fù)載而設(shè)計(jì),在其價(jià)格和模型級(jí)別上提供了出色的性能表現(xiàn)。

官方稱,從今天起,3.1 Flash-Lite 已通過 Gemini API 向開發(fā)者開放預(yù)覽,可在 Google AI Studio 中使用,同時(shí)企業(yè)用戶也可通過 Vertex AI 訪問。

極致性價(jià)比,性能不妥協(xié)

目前,3.1 Flash-Lite 的官方定價(jià)是:輸入為 0.25 美元 / 百萬 tokens;輸出為 1.50 美元 / 百萬 tokens。

在遠(yuǎn)低于更大模型成本的情況下,仍能提供顯著增強(qiáng)的性能。

根據(jù) Artificial Analysis 的基準(zhǔn)測(cè)試,在保持同等甚至更高質(zhì)量的前提下,與 Gemini 2.5 Flash 相比,3.1 Flash-Lite 的首 token 響應(yīng)時(shí)間(TTFT)要快 2.5 倍,且輸出速度提升了 45%。

這種低延遲對(duì)于高頻工作流至關(guān)重要,使其成為開發(fā)者構(gòu)建實(shí)時(shí)響應(yīng)型應(yīng)用體驗(yàn)的理想模型。





Gemini 3.1 Flash-Lite 在速度和質(zhì)量上均超越了 2.5 Flash。

在 Arena.ai 排行榜上,3.1 Flash-Lite 獲得了高達(dá) 1432 的 Elo 評(píng)分。在推理能力和多模態(tài)理解等基準(zhǔn)測(cè)試中,它的表現(xiàn)也要優(yōu)于同級(jí)別的其他模型,包括 GPQA Diamond(86.9%)和 MMMU Pro(76.8%),甚至超過了上一代更大規(guī)模的 Gemini 模型,如 2.5Flash。



面向開發(fā)者的大規(guī)模自適應(yīng)智能

除了性能之外,Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中默認(rèn)支持可調(diào)節(jié)的「思考等級(jí)」(thinking levels)。這意味著,開發(fā)者可以靈活控制模型在任務(wù)中「思考」的深度,從而在成本、速度和推理能力之間取得平衡,而這一點(diǎn)對(duì)于高頻任務(wù)尤為關(guān)鍵。

  • 大規(guī)模任務(wù):3.1 Flash-Lite 可以處理成本敏感的大批量任務(wù),如大規(guī)模翻譯和內(nèi)容審核;
  • 復(fù)雜工作流:3.1 Flash-Lite 也能處理需要深入推理的任務(wù),例如生成用戶界面和儀表盤、創(chuàng)建模擬環(huán)境或遵循復(fù)雜指令。

下面可以來看一下具體的例子。

比如,3.1 Flash-Lite 可以自動(dòng)為一個(gè)電商線框頁面填充數(shù)百個(gè)不同類別的商品:



3.1 Flash-Lite 能夠利用實(shí)時(shí)預(yù)報(bào)和歷史數(shù)據(jù),實(shí)時(shí)生成動(dòng)態(tài)天氣儀表盤:



3.1 Flash-Lite 還可以創(chuàng)建 SaaS 智能體,能夠?yàn)槠髽I(yè)執(zhí)行多種復(fù)雜的、多步驟的任務(wù):



3.1 Flash-Lite 還能夠快速分析并分類海量內(nèi)容,如圖像:



行業(yè)應(yīng)用與開發(fā)者反饋

目前,通過 AI Studio 和 Vertex AI 獲得早期訪問權(quán)限的開發(fā)者,以及 Latitude、Cartwheel 和 Whering 等公司,已經(jīng)開始使用 3.1 Flash-Lite 來解決大規(guī)模復(fù)雜問題。



早期測(cè)試者表示,該模型在效率與推理能力之間取得了良好平衡:能像更大型模型一樣精確處理復(fù)雜輸入,并能穩(wěn)定遵循指令并保持輸出一致性。

GPT?5.3 Instant:提供更順暢、更實(shí)用的日常對(duì)話體驗(yàn)

作為 ChatGPT 最新版本,GPT?5.3 Instant 讓日常對(duì)話更加穩(wěn)定、實(shí)用且流暢。

具體而言,GPT-5.3 Instant 提供了更準(zhǔn)確的回答,在進(jìn)行網(wǎng)頁搜索時(shí)能夠給出更豐富、語境更充分的結(jié)果,同時(shí)減少那些打斷對(duì)話節(jié)奏的無謂死胡同、過多的免責(zé)聲明,以及過于武斷的表述方式。

它不是在拼基準(zhǔn)分?jǐn)?shù),而是優(yōu)化日常使用體驗(yàn),語氣更舒服、內(nèi)容更相關(guān)、對(duì)話更流暢。簡(jiǎn)單說,就是讓 ChatGPT 更像一個(gè)真正順暢的對(duì)話助手,而不是一臺(tái)生硬的問答機(jī)器。

在是否拒絕回答方面判斷更合理,同時(shí)減少不必要的免責(zé)聲明

之前 GPT-5.2 Instant 的回答有時(shí)會(huì)太謹(jǐn)慎,明明可以安全回答的問題,卻選擇拒絕,或者在回答前加很多防御性、說教式的免責(zé)聲明,尤其是在涉及敏感話題時(shí)。

GPT-5.3 Instant 顯著減少了不必要的拒答,同時(shí)弱化了那些在回答問題前顯得過度防御或道德化的開場(chǎng)說明。當(dāng)問題本身適合提供有用答案時(shí),模型現(xiàn)在會(huì)更直接地給出回應(yīng),而不是附加多余的免責(zé)聲明。

在使用聯(lián)網(wǎng)功能時(shí),提供更有用、整合得更好的答案

GPT-5.3 Instant 還提升了在使用網(wǎng)絡(luò)信息時(shí)的回答質(zhì)量。它能更好地將在網(wǎng)上獲取的信息與自身已有的知識(shí)和推理能力之間取得平衡,例如,在解讀最新新聞時(shí),會(huì)結(jié)合自身理解進(jìn)行背景說明,而不是簡(jiǎn)單地羅列或總結(jié)搜索結(jié)果。

更廣泛來說,GPT-5.3 Instant 不再像之前那樣過度依賴網(wǎng)頁結(jié)果,避免出現(xiàn)冗長的鏈接列表或信息拼接松散的問題。它更善于理解問題的潛臺(tái)詞,并優(yōu)先呈現(xiàn)最重要的信息,尤其是在回答開頭部分,使得答案更加相關(guān)、更加易用,同時(shí)不會(huì)犧牲響應(yīng)速度或?qū)υ捳Z氣。

舉例來說:2025-26 賽季美國職業(yè)棒球大聯(lián)盟(MLB)休賽期最大的一筆簽約是哪一筆?它為什么會(huì)對(duì)棒球的長期發(fā)展格局產(chǎn)生影響?





兩者相比,可以看出 GPT-5.3 Instant 的回答顯得更有時(shí)效性,也更貼合用戶的真實(shí)意圖:它準(zhǔn)確識(shí)別出人們正在討論的、來自最近一個(gè)休賽期且具有長期影響的一筆簽約,并將這筆簽約放在聯(lián)盟更宏觀的趨勢(shì)背景下進(jìn)行解讀(例如人才集中化和薪資差距擴(kuò)大的趨勢(shì)),同時(shí)將其與即將到來的勞資協(xié)議(CBA)談判 / 可能的停擺風(fēng)險(xiǎn)聯(lián)系起來。相比之下,答案 1 則顯得有些陳舊,更像是在解釋上一個(gè)休賽期的一筆創(chuàng)紀(jì)錄合同,并沒有那么精準(zhǔn)地回應(yīng)用戶的問題,也缺乏足夠的相關(guān)性。

更流暢、更直截了當(dāng)?shù)膶?duì)話風(fēng)格

GPT-5.2 Instant 的語氣有時(shí)會(huì)讓人覺得有些尷尬,顯得過于強(qiáng)勢(shì),或者對(duì)用戶的意圖和情緒做出未經(jīng)依據(jù)的假設(shè)。

5.3 Instant 帶來了更加專注且自然的對(duì)話風(fēng)格,減少了不必要的宣告式表達(dá),以及諸如停一下,深呼吸之類的語句。

和往常一樣,在 GPT-5.3 Instant 中,你仍然可以在設(shè)置中調(diào)整模型的語氣風(fēng)格,比如溫暖程度或表達(dá)熱情的程度。

舉例來說,用戶提問:為什么我在舊金山找不到愛情?





比較分析:GPT-5.3 Instant 直接進(jìn)入問題的核心進(jìn)行回答,而沒有加入那種不必要、也并無實(shí)質(zhì)幫助的「你沒有問題,這也不只是你的原因」之類的安慰性開場(chǎng)白。

更可靠、更準(zhǔn)確的回答

與之前的模型相比,GPT-5.3 Instant 提供了更加準(zhǔn)確的事實(shí)性回答,顯著減少了幻覺。

在高風(fēng)險(xiǎn)領(lǐng)域評(píng)估中,與此前模型相比,GPT-5.3 Instant 在使用聯(lián)網(wǎng)功能時(shí)將幻覺率降低了 26.8%;僅依賴內(nèi)部知識(shí)時(shí),幻覺率降低了 19.7%。

在基于用戶反饋的評(píng)估中,使用聯(lián)網(wǎng)功能時(shí)幻覺率下降了 22.5%;未使用聯(lián)網(wǎng)功能時(shí),下降了 9.6%。

更強(qiáng)的寫作能力,更豐富的表達(dá)層次

GPT-5.3 Instant 寫作能力也非常出色。無論你是在創(chuàng)作小說、潤色段落,還是探索新的想法,它都更擅長幫助你寫出有感染力、富有想象力且沉浸感強(qiáng)的文字。

舉個(gè)例子:寫一首具有情感沖擊力的短詩:一位費(fèi)城的郵遞員在退休那天完成他最后一輪投遞。





結(jié)果比較:GPT-5.3 的詩更有生活氣息,更具體,也更有結(jié)構(gòu)上的控制感。結(jié)尾的情緒收束更加自然,而不是直接去解釋情感。相比之下,GPT-5.2 的作品依然不錯(cuò),但略微更依賴抒情和抽象表達(dá);而 GPT-5.3 則通過對(duì)細(xì)節(jié)的觀察來構(gòu)建情緒。

局限性

盡管 GPT-5.3 Instant 在日常使用體驗(yàn)方面取得了實(shí)質(zhì)性進(jìn)步,但仍有改進(jìn)空間:

  • 非英語語言:在某些語言(如日語和韓語)中,ChatGPT 的回答風(fēng)格可能仍顯得生硬或過于直譯。提升多語言語氣的自然度與表達(dá)流暢性,仍是持續(xù)優(yōu)化的重點(diǎn)。
  • 語氣:雖然 GPT-5.3 Instant 的整體語氣更加順滑自然,OpenAI 表示仍會(huì)持續(xù)收集反饋,在改進(jìn)模型表現(xiàn)的同時(shí),進(jìn)一步擴(kuò)展個(gè)性化語氣定制選項(xiàng)。

可用性

GPT-5.3 Instant 從今天起向所有 ChatGPT 用戶開放,同時(shí)也向開發(fā)者在 API 中以 gpt-5.3-chat-latest 的名稱提供。Thinking 和 Pro 版本的更新也將在近期推出。

GPT-5.2 Instant 將在接下來的三個(gè)月內(nèi)繼續(xù)向付費(fèi)用戶提供,可在模型選擇器的 Legacy Models(舊版模型)分類中找到;之后將于 2026 年 6 月 3 日正式下線。

https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/

https://x.com/GoogleDeepMind/status/2028872381477929185

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
林俊旸宣布離開阿里千問

林俊旸宣布離開阿里千問

每日經(jīng)濟(jì)新聞
2026-03-04 06:28:05
一場(chǎng)戰(zhàn)爭(zhēng)把中國打醒!美軍最毒的不是裝備,中國用30年才真正看清

一場(chǎng)戰(zhàn)爭(zhēng)把中國打醒!美軍最毒的不是裝備,中國用30年才真正看清

達(dá)文西看世界
2026-03-02 14:25:12
復(fù)制粘貼,青島一家三口街頭散步“齊頭并進(jìn)”,爸爸兒子女兒身高統(tǒng)一1米82;網(wǎng)友:建議每個(gè)人分我5厘米

復(fù)制粘貼,青島一家三口街頭散步“齊頭并進(jìn)”,爸爸兒子女兒身高統(tǒng)一1米82;網(wǎng)友:建議每個(gè)人分我5厘米

臺(tái)州交通廣播
2026-03-04 20:20:50
“正常男生不會(huì)這樣坐”,家長曬學(xué)霸兒子,被調(diào)侃:已預(yù)定圖靈班

“正常男生不會(huì)這樣坐”,家長曬學(xué)霸兒子,被調(diào)侃:已預(yù)定圖靈班

妍妍教育日記
2026-03-04 18:16:15
罕見,7家頂級(jí)施工單位同一天因圍標(biāo)串標(biāo)被全軍拉黑!

罕見,7家頂級(jí)施工單位同一天因圍標(biāo)串標(biāo)被全軍拉黑!

黯泉
2026-03-04 21:52:22
伊朗已徹底認(rèn)慫

伊朗已徹底認(rèn)慫

仰望星空的一粒沙子
2026-03-02 09:55:15
法國和浙江同為6000萬人口,2025年法國創(chuàng)3萬億美元GDP,浙江呢?

法國和浙江同為6000萬人口,2025年法國創(chuàng)3萬億美元GDP,浙江呢?

八斗小先生
2026-02-28 18:56:17
美軍方曾威脅:若中國敢拿下東沙島,美就炸平所有南海人工島礁?

美軍方曾威脅:若中國敢拿下東沙島,美就炸平所有南海人工島礁?

走進(jìn)事件的中心
2026-03-04 23:54:48
“高速節(jié)假日免費(fèi)”改“每年固定里程免費(fèi)”,連續(xù)4年都有全國兩會(huì)代表委員提建議,專家:短期內(nèi)不具備全面落地可行性

“高速節(jié)假日免費(fèi)”改“每年固定里程免費(fèi)”,連續(xù)4年都有全國兩會(huì)代表委員提建議,專家:短期內(nèi)不具備全面落地可行性

極目新聞
2026-03-04 12:28:35
突發(fā)!房貸貼息正式落地!

突發(fā)!房貸貼息正式落地!

南通樓市說說
2026-03-04 17:59:16
“一人食”在深圳超市悄悄走紅!單身打工人評(píng)論區(qū)曬起了菜譜…

“一人食”在深圳超市悄悄走紅!單身打工人評(píng)論區(qū)曬起了菜譜…

極目新聞
2026-03-04 22:37:09
霍爾木茲海峽封閉后,首艘油輪安全通過

霍爾木茲海峽封閉后,首艘油輪安全通過

鳳凰網(wǎng)財(cái)經(jīng)
2026-03-03 23:50:10
美國對(duì)中國滲透沒白費(fèi),扶持的“內(nèi)鬼”,終于開始在中國露頭了

美國對(duì)中國滲透沒白費(fèi),扶持的“內(nèi)鬼”,終于開始在中國露頭了

歷史求知所
2025-12-01 11:30:06
恭喜!薩巴倫卡接受男友求婚,前男友自殺后1個(gè)月開始交往

恭喜!薩巴倫卡接受男友求婚,前男友自殺后1個(gè)月開始交往

全景體育V
2026-03-04 14:26:51
神話破滅!伊朗摧毀美軍薩德反導(dǎo)系統(tǒng),給中國提了個(gè)醒

神話破滅!伊朗摧毀美軍薩德反導(dǎo)系統(tǒng),給中國提了個(gè)醒

兵國大事
2026-03-05 00:05:12
我存了87萬,表姑問存款多少,我說7萬,隔天表姑說她要來

我存了87萬,表姑問存款多少,我說7萬,隔天表姑說她要來

小秋情感說
2026-03-01 10:01:59
世預(yù)賽亞大區(qū)最新實(shí)力榜:中國男籃從11狂飆至第2 僅落后澳大利亞

世預(yù)賽亞大區(qū)最新實(shí)力榜:中國男籃從11狂飆至第2 僅落后澳大利亞

狼叔評(píng)論
2026-03-04 19:58:18
炸鍋!密歇根學(xué)者清真寺公然宣揚(yáng)征服世界,言論離譜到刷新認(rèn)知

炸鍋!密歇根學(xué)者清真寺公然宣揚(yáng)征服世界,言論離譜到刷新認(rèn)知

老馬拉車莫少裝
2026-03-04 21:42:24
IF椰子水否認(rèn)產(chǎn)品摻假:天然純粹!未添加任何外源糖/水/香精

IF椰子水否認(rèn)產(chǎn)品摻假:天然純粹!未添加任何外源糖/水/香精

快科技
2026-03-04 17:37:05
生死存亡關(guān)頭,伊朗撥通中國電話,對(duì)華作出保證,王毅說了3句話

生死存亡關(guān)頭,伊朗撥通中國電話,對(duì)華作出保證,王毅說了3句話

娛樂圈的筆娛君
2026-03-03 19:25:32
2026-03-05 01:23:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12410文章數(shù) 142578關(guān)注度
往期回顧 全部

科技要聞

多位核心離職,阿里親手廢掉最強(qiáng)AI天團(tuán)?

頭條要聞

外媒稱伊朗封鎖霍爾木茲海峽只讓中俄船通行 中方回應(yīng)

頭條要聞

外媒稱伊朗封鎖霍爾木茲海峽只讓中俄船通行 中方回應(yīng)

體育要聞

2026年中超,為什么值得你多看一眼?

娛樂要聞

謝謝謝娜 貢獻(xiàn)出26年內(nèi)娛的第一個(gè)笑話

財(cái)經(jīng)要聞

人大代表建議:將農(nóng)民養(yǎng)老金提到500元

汽車要聞

鴻蒙智行首款獵裝車 尚界Z7/Z7T首發(fā)

態(tài)度原創(chuàng)

數(shù)碼
手機(jī)
親子
教育
軍事航空

數(shù)碼要聞

蘋果發(fā)布新款Studio Display與Studio Display XDR專業(yè)顯示器

手機(jī)要聞

一加15T 全面升級(jí),官方劇透來了

親子要聞

保護(hù)孩子寶媽必學(xué),孩子這種行為不是遺傳!

教育要聞

定了:2028年8月開始,英政府要向國際留學(xué)生額外征收925英鎊稅了

軍事要聞

伊朗為遭到美以空襲小學(xué)遇難者舉行葬禮

無障礙瀏覽 進(jìn)入關(guān)懷版