国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛,讓谷歌翻身的Gemini 3,上線Flash版

0
分享至




機器之心編輯部

OpenAI 還在卷跑分,谷歌已經(jīng)打穿應(yīng)用層了。

北京時間周四零點,Google 發(fā)布了高速、低成本模型 Gemini 3 Flash,作為其今年大模型領(lǐng)域的收官之作。

該模型基于上個月發(fā)布的 Gemini 3,明顯帶有搶 OpenAI 風(fēng)頭的意味。與此同時,Google 還將 Gemini 3 Flash 設(shè)為 Gemini 應(yīng)用和搜索 AI 模式中的默認(rèn)模型。

這款新的 Flash 模型距離 Google 發(fā)布 Gemini 2.5 Flash 僅過去六個月,但在性能上實現(xiàn)了顯著躍升?;鶞?zhǔn)測試顯示,Gemini 3 Flash 相比前代模型有大幅提升,并在部分指標(biāo)上達到了 Gemini 3 Pro 和 GPT-5.2 等前沿模型的水平。

在智能 / 成本上,它成為了全球性價比最高的模型。



例如,在 Humanity’s Last Exam 基準(zhǔn)測試中(該測試旨在評估模型在不同專業(yè)領(lǐng)域的綜合能力),在不使用工具的情況下,Gemini 3 Flash 取得了 33.7% 的成績。作為對比,Gemini 3 Pro 的得分為 37.5%,Gemini 2.5 Flash 為 11%,而新發(fā)布的 GPT-5.2 則為 34.5%。

與此同時,谷歌也將這款新模型在全球范圍內(nèi)向數(shù)以百萬計的用戶開放,覆蓋以下渠道:

  1. 開發(fā)者:通過 Google AI Studio 中的 Gemini API、Gemini CLI,以及全新的智能體開發(fā)平臺 Google Antigravity
  2. 所有用戶:通過 Gemini 應(yīng)用,以及搜索中的 AI 模式(AI Mode in Search)
  3. 企業(yè)用戶:通過 Vertex AI 和 Gemini Enterprise

Gemini 3 Flash 發(fā)布后,大家第一時間進行了使用測試,發(fā)現(xiàn)這個 AI 回答問題的響應(yīng)速度基本都在 1 秒以內(nèi),的確是跟搜索引擎一樣快。而且它在回答問題的時候相比以前更加詳細,知識的覆蓋面、準(zhǔn)確性也很高,看起來像是默認(rèn)聯(lián)網(wǎng)的。

網(wǎng)友們猜測,Gemini 3 Flash 可以被谷歌用來代替搜索引擎,或是逐漸移植到移動端側(cè)。不論如何,新模型都預(yù)示著 AI 模型的新時代正在到來。

Gemini 3 Flash:規(guī)模化的前沿智能

Gemini 3 Flash 證明了,速度與規(guī)模并不必然以犧牲智能為代價。在多項博士級推理與知識基準(zhǔn)測試中,例如 GPQA Diamond(90.4%) 和 Humanity’s Last Exam(在不使用工具的情況下為 33.7%),Gemini 3 Flash 均展現(xiàn)出前沿級性能,可與更大規(guī)模的前沿模型相媲美,并在多項基準(zhǔn)測試中顯著超越了此前最強的 2.5 代模型 ——Gemini 2.5 Pro。

同時,在多模態(tài)推理基準(zhǔn) MMMU Pro 上,Gemini 3 Flash 以 81.2% 的高分達到了當(dāng)前最先進水平,其表現(xiàn)與 Gemini 3 Pro 不相上下。



從基準(zhǔn)測試上可以看到,Gemini 3 Flash 性能強大,在各方面都超越了 Gemini 2.5 Pro,甚至在 ARC-AGI-2 和 SWE-Bench Verified 測試中勝過了 Gemini 3 Pro。

現(xiàn)在,精簡后的模型(體積縮小 3-4 倍)已經(jīng)超越了 6 個月前的「前沿」模型。

除了具備前沿級的推理能力和多模態(tài)能力之外,Gemini 3 Flash 在設(shè)計之初就以極高的效率為目標(biāo),進一步推動了質(zhì)量與成本、速度之間的帕累托前沿。

在最高思考等級下運行時,Gemini 3 Flash 能夠動態(tài)調(diào)節(jié)自身的思考深度:面對更復(fù)雜的使用場景,它會投入更長時間進行推理;而在處理日常任務(wù)時,則能以更高性能完成目標(biāo),同時在典型業(yè)務(wù)流量下,平均使用的 token 數(shù)量比 Gemini 2.5 Pro 減少約 30%。

這使得 Gemini 3 Flash 能夠在保證準(zhǔn)確性的同時,以更低的成本和更高的效率完成日常任務(wù)。



Jeff Dean 表示:「我們再次突破了效率與智能之間的帕累托邊界。」

Gemini 3 Flash 的核心優(yōu)勢在于其極致的原生速度,延續(xù)并強化了開發(fā)者和消費者早已青睞的 Flash 系列特性。根據(jù) Artificial Analysis 的基準(zhǔn)測試結(jié)果,Gemini 3 Flash 在性能上超越 Gemini 2.5 Pro 的同時,速度提升達到 3 倍,而成本僅為其一小部分。

在定價方面,Gemini 3 Flash 的費用為:

  1. 輸入:每 100 萬 token 收費 0.50 美元
  2. 輸出:每 100 萬 token 收費 3 美元
  3. 音頻輸入:仍為每 100 萬 token 收費 1 美元



Gemini 3 Flash 在速度和效率上均顯著優(yōu)于 Gemini 2.5 Pro。在上一代模型尚未完成處理之前,Gemini 3 Flash 已經(jīng)生成了復(fù)雜圖形、3D 模型以及一個 Web 應(yīng)用。

面向開發(fā)者:始終跟得上節(jié)奏的智能

Gemini 3 Flash 專為高頻迭代開發(fā)而打造,在保持低延遲的同時,提供 Gemini 3 Pro 級別的代碼能力,能夠在高并發(fā)、快節(jié)奏的工作流中迅速進行推理并解決問題。

在用于評估代碼智能體能力的基準(zhǔn)測試 SWE-bench Verified 上,Gemini 3 Flash 取得了 78% 的成績,不僅超越了 2.5 系列模型,也優(yōu)于 Gemini 3 Pro。

這使 Gemini 3 Flash 在智能體編程(agentic coding)、生產(chǎn)級系統(tǒng)以及高響應(yīng)性的交互式應(yīng)用場景中,實現(xiàn)了性能、速度與成本之間的理想平衡。

Gemini 3 Flash 在推理能力、工具使用以及多模態(tài)能力方面的強勁表現(xiàn),使其非常適合希望開展更復(fù)雜的視頻分析、數(shù)據(jù)抽取和視覺問答(Visual Q&A) 的開發(fā)者。這也意味著,它能夠支撐更具智能水平的應(yīng)用場景 —— 例如游戲內(nèi)助手或 A/B 測試實驗,在這些場景中,既需要快速響應(yīng),又要求深度推理能力。



Gemini 3 Flash 在一款手勢追蹤的投球解謎游戲中實現(xiàn)了多模態(tài)推理,提供了近乎實時的 AI 輔助。



Gemini 3 Flash 能夠近乎實時地構(gòu)建和進行 A/B 測試新的加載指示器設(shè)計,從而簡化了從設(shè)計到編碼的流程。

采用 Gemini 3 Flash 的企業(yè)反饋非常積極。包括 JetBrains、Bridgewater Associates 和 Figma 在內(nèi)的多家公司,已經(jīng)開始使用該模型推動業(yè)務(wù)轉(zhuǎn)型,并認(rèn)可其在推理速度、效率以及推理能力方面的表現(xiàn),能夠與更大規(guī)模的模型相媲美。

目前,Gemini 3 Flash 已通過 Vertex AI 和 Gemini Enterprise 正式向企業(yè)客戶開放。

Cursor 開發(fā)者體驗副總裁表示,他們的工程師發(fā)現(xiàn),Gemini 3 Flash 與 Cursor 的 Debug Mode 配合使用效果非常出色。該模型在問題排查和定位 Bug 根本原因方面表現(xiàn)出速度快、準(zhǔn)確性高的優(yōu)勢。



面向所有人:Gemini 3 Flash 全球上線

Gemini 3 Flash 現(xiàn)已成為 Gemini 應(yīng)用的默認(rèn)模型,取代了 2.5 Flash。這意味著全球 Gemini 用戶都已能免費體驗 Gemini 3,從而大幅提升日常任務(wù)的處理效率。

憑借 Gemini 3 Flash 卓越的多模態(tài)推理能力,你可以利用它更快地查看、聆聽和理解各種類型的信息。例如,你可以讓 Gemini 理解視頻和圖像,并在短短幾秒鐘內(nèi)將這些內(nèi)容轉(zhuǎn)化為實用且可行的計劃。



或者,你無需任何編程知識,即可使用語音快速從零開始構(gòu)建實用的應(yīng)用程序。只需隨時隨地向 Gemini 發(fā)出語音指令,它就能在幾分鐘內(nèi)將人們零散的想法轉(zhuǎn)化為功能完善的應(yīng)用程序。

使用 Gemini 3 Flash 描述一個想法,并在幾分鐘內(nèi)將其轉(zhuǎn)化為可行的原型。

Gemini 3 Flash 也正在逐步推廣,谷歌希望它能成為全球用戶使用的搜索功能中 AI 模式的默認(rèn)模型。

基于 Gemini 3 Pro 的推理能力,搭載 Gemini 3 Flash 的 AI 模式能夠更有效地理解你問題的細微之處。它會考慮查詢的各個方面,提供全面的回復(fù),以易于理解的方式呈現(xiàn) —— 從網(wǎng)絡(luò)上提取實時本地信息和有用的鏈接。最終結(jié)果有效地將研究與實際行動相結(jié)合:生成條理清晰的分析以及具體的建議。最后,一切都以搜索的速度完成。

在處理需要考慮多個因素的復(fù)雜目標(biāo)時,例如計劃一次說走就走的旅行,或快速學(xué)習(xí)復(fù)雜的教育概念,這項功能尤其出色。

谷歌表示,Gemini 3 Flash 現(xiàn)已通過 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供預(yù)覽版。你還可以通過其他開發(fā)者工具(例如 Gemini CLI 和 Android Studio)訪問新模型。此外,它也已開始在 Gemini 應(yīng)用和搜索的 AI 模式中面向所有用戶推出。

參考鏈接:https://blog.google/products/gemini/gemini-3-flash/

文中視頻鏈接:
https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
大莫里斯:自從東契奇來到湖人之后 詹皇就越來越不被人尊重了

大莫里斯:自從東契奇來到湖人之后 詹皇就越來越不被人尊重了

818體育
2025-12-18 23:04:53
2025-12-19 08:28:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11950文章數(shù) 142513關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

美媒:美國下水一艘新軍艦中國已造好三艘 差距驚人

頭條要聞

美媒:美國下水一艘新軍艦中國已造好三艘 差距驚人

體育要聞

紐約尼克斯,板正的球隊

娛樂要聞

絲芭放大招了!實名舉報鞠婧祎經(jīng)濟犯罪

財經(jīng)要聞

尹艷林:呼吁加快2.5億新市民落戶進程

汽車要聞

在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

態(tài)度原創(chuàng)

時尚
健康
藝術(shù)
房產(chǎn)
軍事航空

陳妍希這婚,離晚了

這些新療法,讓化療不再那么痛苦

藝術(shù)要聞

李苦禪寫菊,酣暢淋漓

房產(chǎn)要聞

搶藏瘋潮!封關(guān)時代,??陧斏萃跽▔狠S,傳世資產(chǎn)即刻登場!

軍事要聞

福建艦入列后首過臺海 臺方談為何"甲板上沒有艦載機"

無障礙瀏覽 進入關(guān)懷版