網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

谷歌、OpenAI同日發(fā)布模型，一個(gè)最快最具性價(jià)比，一個(gè)主打人情味

2026-03-04 14:39:09　來源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心編輯部

深夜，兩大科技巨頭谷歌和 OpenAI 硬剛起來，相繼推出了新版本大模型，分別是 Gemini 3.1 Flash-Lite、GPT?5.3 Instant。

谷歌稱，Gemini 3.1 Flash-Lite 專為大規(guī)模智能設(shè)計(jì)，是目前為止最具性價(jià)比的 Gemini 3 系列模型，定價(jià)為輸入 0.25 美元 / 百萬 tokens，輸出 1.50 美元 / 百萬 tokens，而在遠(yuǎn)低于更大模型成本的情況下，仍能提供顯著增強(qiáng)的性能。

Artificial Analysis 的基準(zhǔn)測(cè)試結(jié)果顯示，在保持同等甚至更高質(zhì)量的前提下，與 Gemini 2.5 Flash 相比，3.1 Flash-Lite 的首 token 響應(yīng)時(shí)間（TTFT）要快 2.5 倍，且輸出速度提升了 45%。

GPT?5.3 Instant 則在語氣、相關(guān)性和對(duì)話性方面都有所提升，并且拒絕率更低。與前代產(chǎn)品相比，幻覺減少高達(dá) 26.8%，并且 ChatGPT 和 API 都支持此模型。

有意思的是，在宣布 GPT-5.3 Instant 后，OpenAI 隨即暗示這個(gè)新模型也可能即將退役。OpenAI 在 X 上發(fā)表的一篇文章中表示，GPT-5.4 的到來比你想象的要快。

Gemini 3.1 Flash-Lite：專為大規(guī)模智能而打造

谷歌今日推出的 Gemini 3.1 Flash-Lite，是 Gemini 3 系列中速度最快、成本效率最高的模型。該模型專為大規(guī)模開發(fā)者工作負(fù)載而設(shè)計(jì)，在其價(jià)格和模型級(jí)別上提供了出色的性能表現(xiàn)。

官方稱，從今天起，3.1 Flash-Lite 已通過 Gemini API 向開發(fā)者開放預(yù)覽，可在 Google AI Studio 中使用，同時(shí)企業(yè)用戶也可通過 Vertex AI 訪問。

極致性價(jià)比，性能不妥協(xié)

目前，3.1 Flash-Lite 的官方定價(jià)是：輸入為 0.25 美元 / 百萬 tokens；輸出為 1.50 美元 / 百萬 tokens。

在遠(yuǎn)低于更大模型成本的情況下，仍能提供顯著增強(qiáng)的性能。

根據(jù) Artificial Analysis 的基準(zhǔn)測(cè)試，在保持同等甚至更高質(zhì)量的前提下，與 Gemini 2.5 Flash 相比，3.1 Flash-Lite 的首 token 響應(yīng)時(shí)間（TTFT）要快 2.5 倍，且輸出速度提升了 45%。

這種低延遲對(duì)于高頻工作流至關(guān)重要，使其成為開發(fā)者構(gòu)建實(shí)時(shí)響應(yīng)型應(yīng)用體驗(yàn)的理想模型。

Gemini 3.1 Flash-Lite 在速度和質(zhì)量上均超越了 2.5 Flash。

在 Arena.ai 排行榜上，3.1 Flash-Lite 獲得了高達(dá) 1432 的 Elo 評(píng)分。在推理能力和多模態(tài)理解等基準(zhǔn)測(cè)試中，它的表現(xiàn)也要優(yōu)于同級(jí)別的其他模型，包括 GPQA Diamond（86.9%）和 MMMU Pro（76.8%），甚至超過了上一代更大規(guī)模的 Gemini 模型，如 2.5Flash。

面向開發(fā)者的大規(guī)模自適應(yīng)智能

除了性能之外，Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中默認(rèn)支持可調(diào)節(jié)的「思考等級(jí)」（thinking levels）。這意味著，開發(fā)者可以靈活控制模型在任務(wù)中「思考」的深度，從而在成本、速度和推理能力之間取得平衡，而這一點(diǎn)對(duì)于高頻任務(wù)尤為關(guān)鍵。

大規(guī)模任務(wù)：3.1 Flash-Lite 可以處理成本敏感的大批量任務(wù)，如大規(guī)模翻譯和內(nèi)容審核；
復(fù)雜工作流：3.1 Flash-Lite 也能處理需要深入推理的任務(wù)，例如生成用戶界面和儀表盤、創(chuàng)建模擬環(huán)境或遵循復(fù)雜指令。

下面可以來看一下具體的例子。

比如，3.1 Flash-Lite 可以自動(dòng)為一個(gè)電商線框頁面填充數(shù)百個(gè)不同類別的商品：

3.1 Flash-Lite 能夠利用實(shí)時(shí)預(yù)報(bào)和歷史數(shù)據(jù)，實(shí)時(shí)生成動(dòng)態(tài)天氣儀表盤：

3.1 Flash-Lite 還可以創(chuàng)建 SaaS 智能體，能夠?yàn)槠髽I(yè)執(zhí)行多種復(fù)雜的、多步驟的任務(wù)：

3.1 Flash-Lite 還能夠快速分析并分類海量內(nèi)容，如圖像：

行業(yè)應(yīng)用與開發(fā)者反饋

目前，通過 AI Studio 和 Vertex AI 獲得早期訪問權(quán)限的開發(fā)者，以及 Latitude、Cartwheel 和 Whering 等公司，已經(jīng)開始使用 3.1 Flash-Lite 來解決大規(guī)模復(fù)雜問題。

早期測(cè)試者表示，該模型在效率與推理能力之間取得了良好平衡：能像更大型模型一樣精確處理復(fù)雜輸入，并能穩(wěn)定遵循指令并保持輸出一致性。

GPT?5.3 Instant：提供更順暢、更實(shí)用的日常對(duì)話體驗(yàn)

作為 ChatGPT 最新版本，GPT?5.3 Instant 讓日常對(duì)話更加穩(wěn)定、實(shí)用且流暢。

具體而言，GPT-5.3 Instant 提供了更準(zhǔn)確的回答，在進(jìn)行網(wǎng)頁搜索時(shí)能夠給出更豐富、語境更充分的結(jié)果，同時(shí)減少那些打斷對(duì)話節(jié)奏的無謂死胡同、過多的免責(zé)聲明，以及過于武斷的表述方式。

它不是在拼基準(zhǔn)分?jǐn)?shù)，而是優(yōu)化日常使用體驗(yàn)，語氣更舒服、內(nèi)容更相關(guān)、對(duì)話更流暢。簡(jiǎn)單說，就是讓 ChatGPT 更像一個(gè)真正順暢的對(duì)話助手，而不是一臺(tái)生硬的問答機(jī)器。

在是否拒絕回答方面判斷更合理，同時(shí)減少不必要的免責(zé)聲明

之前 GPT-5.2 Instant 的回答有時(shí)會(huì)太謹(jǐn)慎，明明可以安全回答的問題，卻選擇拒絕，或者在回答前加很多防御性、說教式的免責(zé)聲明，尤其是在涉及敏感話題時(shí)。

GPT-5.3 Instant 顯著減少了不必要的拒答，同時(shí)弱化了那些在回答問題前顯得過度防御或道德化的開場(chǎng)說明。當(dāng)問題本身適合提供有用答案時(shí)，模型現(xiàn)在會(huì)更直接地給出回應(yīng)，而不是附加多余的免責(zé)聲明。

在使用聯(lián)網(wǎng)功能時(shí)，提供更有用、整合得更好的答案

GPT-5.3 Instant 還提升了在使用網(wǎng)絡(luò)信息時(shí)的回答質(zhì)量。它能更好地將在網(wǎng)上獲取的信息與自身已有的知識(shí)和推理能力之間取得平衡，例如，在解讀最新新聞時(shí)，會(huì)結(jié)合自身理解進(jìn)行背景說明，而不是簡(jiǎn)單地羅列或總結(jié)搜索結(jié)果。

更廣泛來說，GPT-5.3 Instant 不再像之前那樣過度依賴網(wǎng)頁結(jié)果，避免出現(xiàn)冗長的鏈接列表或信息拼接松散的問題。它更善于理解問題的潛臺(tái)詞，并優(yōu)先呈現(xiàn)最重要的信息，尤其是在回答開頭部分，使得答案更加相關(guān)、更加易用，同時(shí)不會(huì)犧牲響應(yīng)速度或?qū)υ捳Z氣。

舉例來說：2025-26 賽季美國職業(yè)棒球大聯(lián)盟（MLB）休賽期最大的一筆簽約是哪一筆？它為什么會(huì)對(duì)棒球的長期發(fā)展格局產(chǎn)生影響？

兩者相比，可以看出 GPT-5.3 Instant 的回答顯得更有時(shí)效性，也更貼合用戶的真實(shí)意圖：它準(zhǔn)確識(shí)別出人們正在討論的、來自最近一個(gè)休賽期且具有長期影響的一筆簽約，并將這筆簽約放在聯(lián)盟更宏觀的趨勢(shì)背景下進(jìn)行解讀（例如人才集中化和薪資差距擴(kuò)大的趨勢(shì)），同時(shí)將其與即將到來的勞資協(xié)議（CBA）談判 / 可能的停擺風(fēng)險(xiǎn)聯(lián)系起來。相比之下，答案 1 則顯得有些陳舊，更像是在解釋上一個(gè)休賽期的一筆創(chuàng)紀(jì)錄合同，并沒有那么精準(zhǔn)地回應(yīng)用戶的問題，也缺乏足夠的相關(guān)性。

更流暢、更直截了當(dāng)?shù)膶?duì)話風(fēng)格

GPT-5.2 Instant 的語氣有時(shí)會(huì)讓人覺得有些尷尬，顯得過于強(qiáng)勢(shì)，或者對(duì)用戶的意圖和情緒做出未經(jīng)依據(jù)的假設(shè)。

5.3 Instant 帶來了更加專注且自然的對(duì)話風(fēng)格，減少了不必要的宣告式表達(dá)，以及諸如停一下，深呼吸之類的語句。

和往常一樣，在 GPT-5.3 Instant 中，你仍然可以在設(shè)置中調(diào)整模型的語氣風(fēng)格，比如溫暖程度或表達(dá)熱情的程度。

舉例來說，用戶提問：為什么我在舊金山找不到愛情？

比較分析：GPT-5.3 Instant 直接進(jìn)入問題的核心進(jìn)行回答，而沒有加入那種不必要、也并無實(shí)質(zhì)幫助的「你沒有問題，這也不只是你的原因」之類的安慰性開場(chǎng)白。

更可靠、更準(zhǔn)確的回答

與之前的模型相比，GPT-5.3 Instant 提供了更加準(zhǔn)確的事實(shí)性回答，顯著減少了幻覺。

在高風(fēng)險(xiǎn)領(lǐng)域評(píng)估中，與此前模型相比，GPT-5.3 Instant 在使用聯(lián)網(wǎng)功能時(shí)將幻覺率降低了 26.8%；僅依賴內(nèi)部知識(shí)時(shí)，幻覺率降低了 19.7%。

在基于用戶反饋的評(píng)估中，使用聯(lián)網(wǎng)功能時(shí)幻覺率下降了 22.5%；未使用聯(lián)網(wǎng)功能時(shí)，下降了 9.6%。

更強(qiáng)的寫作能力，更豐富的表達(dá)層次

GPT-5.3 Instant 寫作能力也非常出色。無論你是在創(chuàng)作小說、潤色段落，還是探索新的想法，它都更擅長幫助你寫出有感染力、富有想象力且沉浸感強(qiáng)的文字。

舉個(gè)例子：寫一首具有情感沖擊力的短詩：一位費(fèi)城的郵遞員在退休那天完成他最后一輪投遞。

結(jié)果比較：GPT-5.3 的詩更有生活氣息，更具體，也更有結(jié)構(gòu)上的控制感。結(jié)尾的情緒收束更加自然，而不是直接去解釋情感。相比之下，GPT-5.2 的作品依然不錯(cuò)，但略微更依賴抒情和抽象表達(dá)；而 GPT-5.3 則通過對(duì)細(xì)節(jié)的觀察來構(gòu)建情緒。

局限性

盡管 GPT-5.3 Instant 在日常使用體驗(yàn)方面取得了實(shí)質(zhì)性進(jìn)步，但仍有改進(jìn)空間：

非英語語言：在某些語言（如日語和韓語）中，ChatGPT 的回答風(fēng)格可能仍顯得生硬或過于直譯。提升多語言語氣的自然度與表達(dá)流暢性，仍是持續(xù)優(yōu)化的重點(diǎn)。
語氣：雖然 GPT-5.3 Instant 的整體語氣更加順滑自然，OpenAI 表示仍會(huì)持續(xù)收集反饋，在改進(jìn)模型表現(xiàn)的同時(shí)，進(jìn)一步擴(kuò)展個(gè)性化語氣定制選項(xiàng)。

可用性

GPT-5.3 Instant 從今天起向所有 ChatGPT 用戶開放，同時(shí)也向開發(fā)者在 API 中以 gpt-5.3-chat-latest 的名稱提供。Thinking 和 Pro 版本的更新也將在近期推出。

GPT-5.2 Instant 將在接下來的三個(gè)月內(nèi)繼續(xù)向付費(fèi)用戶提供，可在模型選擇器的 Legacy Models（舊版模型）分類中找到；之后將于 2026 年 6 月 3 日正式下線。

https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/

https://x.com/GoogleDeepMind/status/2028872381477929185

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.