国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Gemini 3.1:小小小小更新壓過對(duì)手大迭代,Google卷飛了

0
分享至


作者 | 王兆洋和他的 Kimi 2.5 Agent集群
郵箱 | wangzhaoyang@pingwest.com

1

Gemini 3.1 來了

2026年2月19日,Google發(fā)布Gemini 3.1 Pro。這是Google首次以".1"作為版本增量發(fā)布Gemini模型——此前的版本迭代均為0.5遞進(jìn)(1.0→1.5→2.0→2.5→3.0)。

Google將此次更新定位為"核心推理能力的進(jìn)步"(a step forward in core reasoning),其技術(shù)基礎(chǔ)是上周Gemini 3 Deep Think更新中引入的"核心智能"(core intelligence)架構(gòu)。

在兩項(xiàng)關(guān)鍵基準(zhǔn)測(cè)試中,Gemini 3.1 Pro呈現(xiàn)顯著性能提升。ARC-AGI-2測(cè)試得分77.1%,較Gemini 3 Pro的31.1%提升超過一倍。在Humanity's Last Exam測(cè)試中,Gemini 3.1 Pro得分44.4%,高于Gemini 3 Pro的37.5%和GPT-5.2的34.5%。


Artificial Analysis獨(dú)立評(píng)測(cè)顯示:整體智能維度Gemini 3.1 Pro以57分居首,Claude Opus 4.6以53分位列第二;編碼能力Gemini 3.1 Pro以56分排名第一;Agentic任務(wù)方面Claude Opus 4.6以68分領(lǐng)先,Gemini 3.1 Pro為59分。


訪問渠道已同步開放。開發(fā)者可通過Gemini API、Google AI Studio、Gemini CLI、Google Antigravity及Android Studio(預(yù)覽版)調(diào)用;企業(yè)用戶可使用Vertex AI和Gemini Enterprise;普通消費(fèi)者可在Gemini App和NotebookLM中使用,其中Pro和Ultra訂閱用戶享有更高額度。

此次更新最“嚇人”的地方是,Google一個(gè)“超級(jí)小”版本的迭代,達(dá)到了其他家模型大迭代的效果。

當(dāng)然版本號(hào)隨便定,但這個(gè)信號(hào)背后,Google這樣處理版號(hào)策略的調(diào)整——從0.5增量改為0.1增量——直接意味著Google將加快模型迭代節(jié)奏,以更細(xì)粒度的方式推送能力改進(jìn)。

也就是,此前一段時(shí)間多少還比較淡定的Google,也要開卷了!

1

官方給出的驚艷案例:更智能,更美,更全面

在官方發(fā)布的演示中,四個(gè)案例展示了Gemini 3.1 Pro的代碼生成能力。

第一個(gè)案例是將文學(xué)風(fēng)格轉(zhuǎn)化為網(wǎng)站設(shè)計(jì)。系統(tǒng)以《呼嘯山莊》為靈感,假設(shè)書中角色是一位風(fēng)景攝影師,生成了一套完整的個(gè)人作品集網(wǎng)站。視覺上,網(wǎng)站采用了與小說氛圍相符的色調(diào)和排版,將文學(xué)意境直接映射為界面元素。

第二個(gè)案例是3D椋鳥群飛模擬。用戶可以通過界面交互控制鳥群的運(yùn)動(dòng)方向,鳥群的飛行動(dòng)態(tài)會(huì)實(shí)時(shí)生成對(duì)應(yīng)的音景,聲音隨鳥群密度和運(yùn)動(dòng)狀態(tài)變化。這是一個(gè)將視覺、交互和音頻整合在一起的完整演示。

第三個(gè)案例是國際空間站位置可視化。系統(tǒng)生成了一個(gè)HTML儀表盤,集成了第三方API獲取的實(shí)時(shí)數(shù)據(jù),在地圖上顯示空間站的當(dāng)前位置和運(yùn)行軌跡。這展示了模型處理外部數(shù)據(jù)接口的能力。

第四個(gè)案例是動(dòng)畫SVG生成。模型直接輸出了可在網(wǎng)頁中使用的動(dòng)畫SVG文件,這種矢量格式可以任意縮放而不損失畫質(zhì),適合需要響應(yīng)式設(shè)計(jì)的項(xiàng)目。

這些案例的共同特點(diǎn)是:它們都是完整的、可直接運(yùn)行的代碼產(chǎn)物,而非片段或偽代碼。從文學(xué)作品到交互模擬,從數(shù)據(jù)可視化到圖形生成,覆蓋了不同的應(yīng)用場(chǎng)景。模型在這些任務(wù)中的表現(xiàn)如何,讀者可以自行判斷。

Gemini 3.1 Pro的技術(shù)迭代,體現(xiàn)了一條務(wù)實(shí)的路徑:在顛覆式重構(gòu)不太會(huì)經(jīng)常出現(xiàn)后,要追求對(duì)現(xiàn)有架構(gòu)的精細(xì)化打磨。



架構(gòu)層面延續(xù)了MoE(混合專家)路線,100萬token的上下文窗口和64,000 token的輸出上限維持不變。這個(gè)規(guī)模在當(dāng)前的模型梯隊(duì)中仍屬頭部,足以支撐長文檔分析、代碼庫理解等場(chǎng)景。真正值得關(guān)注的,是推理機(jī)制的重構(gòu)。

三層思考模式(Low/Medium/High)的引入,本質(zhì)上是對(duì)"計(jì)算-質(zhì)量-成本"三角關(guān)系的顯式化管理。Low模式追求響應(yīng)速度,適合高并發(fā)場(chǎng)景;High模式則調(diào)用完整推理能力,處理復(fù)雜問題可能需要數(shù)分鐘——這種設(shè)計(jì)讓用戶能夠根據(jù)任務(wù)難度主動(dòng)權(quán)衡成本,而非被動(dòng)接受統(tǒng)一計(jì)價(jià)。Medium層級(jí)的加入填補(bǔ)了此前的空白,為日常任務(wù)提供了更經(jīng)濟(jì)的中間選項(xiàng)。

同時(shí),Deep Think技術(shù)也出現(xiàn)了“下放”,上周Gemini 3 Deep Think在ARC-AGI-2測(cè)試中取得84.6%成績(jī)所依賴的"并行思考技術(shù)",已被整合進(jìn)基礎(chǔ)模型。這意味著模型能夠同時(shí)探索多條解題路徑,再通過內(nèi)部評(píng)估篩選最優(yōu)解。與此同時(shí),原本用于Flash模型的強(qiáng)化學(xué)習(xí)技術(shù)也被遷移至Pro版本,這種技術(shù)棧的橫向打通,比單純的參數(shù)堆疊更有價(jià)值。

幻覺控制方面的進(jìn)步也很關(guān)鍵。AA-Omniscience Index從13分躍升至30分,在主流模型中排名第一。這一指標(biāo)衡量的是模型對(duì)自身知識(shí)邊界的認(rèn)知能力——知道"不知道什么",比知道"知道什么"更難,也更重要。

總體而言,Gemini 3.1 Pro的升級(jí)邏輯清晰:不追求單項(xiàng)指標(biāo)的驚艷,而是在可控成本下,系統(tǒng)性地提升模型的可用性和可靠性。

1

榜單之外,更重要是Google也開始卷了

Gemini 3.1 Pro發(fā)布后,技術(shù)社區(qū)的聲音呈現(xiàn)出明顯的分化。

樂觀派將目光投向了數(shù)據(jù)。ARC-AGI-2基準(zhǔn)77.1%的得分被視為實(shí)質(zhì)性突破——這不僅是上一代31.1%的兩倍以上,也意味著模型在處理全新邏輯模式時(shí)的能力躍升。

幻覺抗性指標(biāo)(AA-Omniscience Index)從Gemini 3 Pro的13躍升至30,遠(yuǎn)超Claude Opus 4.6的11,這一進(jìn)步被開發(fā)者群體頻繁提及。三層思考模式的設(shè)計(jì)也受到好評(píng)——讓用戶根據(jù)任務(wù)復(fù)雜度自主選擇"快速/深度/深度+"模式,被認(rèn)為是對(duì)控制權(quán)的合理讓渡。

但質(zhì)疑聲同樣值得傾聽。Gartner分析師William McKeon-White的評(píng)價(jià)代表了一種審慎態(tài)度:"這是好的持續(xù)進(jìn)步,但沒有什么根本性的游戲規(guī)則改變者。"華盛頓大學(xué)教授Chirag Shah則提出了更深層的問題:更好的推理能力確實(shí)是處理復(fù)雜任務(wù)的必要條件,但并非充分條件——"更何況,'復(fù)雜'本身的定義就不明確。"LMArena的盲測(cè)數(shù)據(jù)也提供了另一種視角:3.1 Pro相比Gemini 3 Pro的提升幅度有限,在擴(kuò)展文本和代碼任務(wù)上仍落后于Claude。

中立觀察者更關(guān)注宏觀趨勢(shì)。AI模型排行榜被形容為"搶椅子游戲"——Claude、Gemini、GPT輪流登頂,每次領(lǐng)先周期只有數(shù)周。發(fā)布節(jié)奏的密集同樣引人注目:Anthropic Sonnet 4.6于2月17日發(fā)布,Google Gemini 3.1 Pro緊隨其后于2月19日登場(chǎng)。一個(gè)被反復(fù)提及的觀察是:基準(zhǔn)分?jǐn)?shù)與真實(shí)用戶體驗(yàn)之間存在落差,排行榜上的領(lǐng)先不等于實(shí)際工作流中的優(yōu)勢(shì)。

其實(shí),相比于在榜單上幾個(gè)小數(shù)點(diǎn)的提升,更重要的是Google自己策略的更加激進(jìn)化。

Gemini 3.1 Pro的發(fā)布,首先標(biāo)志著Google產(chǎn)品策略的微妙轉(zhuǎn)向。首次采用".1"版本號(hào),意味著從過去追求"大版本震撼"的發(fā)布節(jié)奏,轉(zhuǎn)向更貼近工程實(shí)際的持續(xù)迭代模式。

這種轉(zhuǎn)變本身說明:AI競(jìng)賽已進(jìn)入長跑階段,單次爆發(fā)的窗口期正在收窄。在高端推理市場(chǎng),Google終于拿出了與GPT-5.2和Claude正面交鋒的產(chǎn)品,而其真正的護(hù)城河或許不在于模型本身,而在于Cloud和Workspace構(gòu)成的企業(yè)基礎(chǔ)設(shè)施——這是OpenAI和Anthropic短期內(nèi)難以復(fù)制的。

從行業(yè)視角看,推理能力正在成為模型競(jìng)爭(zhēng)的新高地。Gemini 3.1 Pro與Anthropic的發(fā)布時(shí)間間隔僅兩天,這種以天為單位的跟進(jìn)速度,反映出頭部廠商的技術(shù)差距正在收窄。更具信號(hào)意義的是定價(jià)策略:最高性能模型的價(jià)格反而更低,這意味著價(jià)格戰(zhàn)已從"性價(jià)比競(jìng)爭(zhēng)"升級(jí)為"性能溢價(jià)消失"的新階段。

Gemini 3.1 Pro定價(jià)為$4.50/百萬token(混合價(jià)格),低于GPT-5.2的$4.80、Claude Sonnet 4.6的$6和Claude Opus 4.6的$10。API定價(jià)分檔:≤200K tokens時(shí)輸入$2、輸出$12;>200K tokens時(shí)輸入$4、輸出$18。

免費(fèi)用戶可直接在Gemini Web UI使用Gemini 3.1 Pro,無需訂閱Gemini Advanced。


點(diǎn)個(gè)愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
男子在300公里高速沿途累計(jì)發(fā)現(xiàn)62具貓狗尸體,其中不少身穿寵物衣服,推測(cè)系帶貓狗上高速不放車內(nèi)遭遇意外

男子在300公里高速沿途累計(jì)發(fā)現(xiàn)62具貓狗尸體,其中不少身穿寵物衣服,推測(cè)系帶貓狗上高速不放車內(nèi)遭遇意外

大風(fēng)新聞
2026-02-28 11:54:08
5年資產(chǎn)縮水270億,賣酒套現(xiàn)1.1億,劉鑾雄終是向歲月低下了頭

5年資產(chǎn)縮水270億,賣酒套現(xiàn)1.1億,劉鑾雄終是向歲月低下了頭

八斗小先生
2026-02-28 17:24:32
6分鐘19個(gè)導(dǎo)彈連全軍覆沒,82架戰(zhàn)機(jī)被擊落,此戰(zhàn)給我們敲響警鐘

6分鐘19個(gè)導(dǎo)彈連全軍覆沒,82架戰(zhàn)機(jī)被擊落,此戰(zhàn)給我們敲響警鐘

混沌錄
2026-02-04 22:25:03
為什么交通部約談高德?業(yè)務(wù)全踩紅線,五天被約談三次

為什么交通部約談高德?業(yè)務(wù)全踩紅線,五天被約談三次

小蜜情感說
2026-02-27 06:43:29
英國宣布參與對(duì)伊朗軍事行動(dòng) 戰(zhàn)機(jī)已升空

英國宣布參與對(duì)伊朗軍事行動(dòng) 戰(zhàn)機(jī)已升空

桂系007
2026-02-28 23:56:12
金正恩向主要領(lǐng)導(dǎo)干部贈(zèng)送新一代狙擊步槍

金正恩向主要領(lǐng)導(dǎo)干部贈(zèng)送新一代狙擊步槍

環(huán)球網(wǎng)資訊
2026-02-28 06:36:25
柬埔寨國王72歲了:沒錢沒權(quán),無妻無子,和89歲老母親相依為命

柬埔寨國王72歲了:沒錢沒權(quán),無妻無子,和89歲老母親相依為命

照見古今
2025-12-31 20:48:07
樊振東落選!世界杯名單公布,王勵(lì)勤說到做到,溫瑞博成最大黑馬

樊振東落選!世界杯名單公布,王勵(lì)勤說到做到,溫瑞博成最大黑馬

冷紫葉
2026-02-28 19:07:29
被停職審查、轉(zhuǎn)移格力資產(chǎn)、搞辦公室戀情,71 歲董明珠身上的謠言越來越離譜

被停職審查、轉(zhuǎn)移格力資產(chǎn)、搞辦公室戀情,71 歲董明珠身上的謠言越來越離譜

互聯(lián)網(wǎng)思維
2026-02-28 23:34:40
特朗普聲稱伊朗最高領(lǐng)袖哈梅內(nèi)伊身亡,此前曾遭遇多次暗殺,去年6月已布局完整繼承體系,1989年曾以總統(tǒng)身份訪華

特朗普聲稱伊朗最高領(lǐng)袖哈梅內(nèi)伊身亡,此前曾遭遇多次暗殺,去年6月已布局完整繼承體系,1989年曾以總統(tǒng)身份訪華

極目新聞
2026-03-01 07:51:03
美國軍力全球第一,敢打任何國家?俄潑冷水:這4國你敢打誰?

美國軍力全球第一,敢打任何國家?俄潑冷水:這4國你敢打誰?

近史談
2026-01-19 10:09:51
玄學(xué)真相:凡事“反著來”,你就贏了——這才是人生最高級(jí)的破局之道

玄學(xué)真相:凡事“反著來”,你就贏了——這才是人生最高級(jí)的破局之道

青蘋果sht
2026-02-27 06:28:52
阿曼外交大臣:美伊談判就濃縮鈾“零庫存”達(dá)成一致

阿曼外交大臣:美伊談判就濃縮鈾“零庫存”達(dá)成一致

參考消息
2026-02-28 11:09:36
“以為是六個(gè)博士,結(jié)果是六個(gè)送外賣的!”六個(gè)兒子征婚視頻火了

“以為是六個(gè)博士,結(jié)果是六個(gè)送外賣的!”六個(gè)兒子征婚視頻火了

阿凱銷售場(chǎng)
2026-03-01 01:46:42
疑似王一博被爆私密聊天記錄,鹿晗肖戰(zhàn)躺槍,工作室成已取證

疑似王一博被爆私密聊天記錄,鹿晗肖戰(zhàn)躺槍,工作室成已取證

娛文速遞
2026-02-28 10:24:07
特朗普下令:所有聯(lián)邦政府機(jī)構(gòu)將立即停用Anthropic

特朗普下令:所有聯(lián)邦政府機(jī)構(gòu)將立即停用Anthropic

財(cái)聯(lián)社
2026-02-28 05:45:05
楊紫自律生活:少吃多睡,告別不良習(xí)慣

楊紫自律生活:少吃多睡,告別不良習(xí)慣

草莓解說體育
2026-03-01 10:45:01
要么投降,要么死在洞里——內(nèi)塔尼亞胡拒絕放走被困地道的哈馬斯

要么投降,要么死在洞里——內(nèi)塔尼亞胡拒絕放走被困地道的哈馬斯

桂系007
2025-11-05 23:52:21
不慣著!女子回婆家過年,車被妯娌砸爛,報(bào)警硬剛到底,結(jié)局亮了

不慣著!女子回婆家過年,車被妯娌砸爛,報(bào)警硬剛到底,結(jié)局亮了

川渝視覺
2026-02-28 09:15:48
2026鐵飯碗排名出爐!教師竟然跌到第9,第1名讓所有人都沉默了!

2026鐵飯碗排名出爐!教師竟然跌到第9,第1名讓所有人都沉默了!

金哥說新能源車
2026-02-27 05:18:50
2026-03-01 12:12:49
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個(gè)星球。
2896文章數(shù) 10458關(guān)注度
往期回顧 全部

數(shù)碼要聞

價(jià)格已漲2.5倍!網(wǎng)友網(wǎng)購2條8GB內(nèi)存故障退貨:還被商家收15%折舊費(fèi)

頭條要聞

伊朗伊斯蘭革命衛(wèi)隊(duì)總司令身亡

頭條要聞

伊朗伊斯蘭革命衛(wèi)隊(duì)總司令身亡

體育要聞

球隊(duì)主力全報(bào)銷?頂風(fēng)擺爛演都不演了

娛樂要聞

《江山為聘》:吳謹(jǐn)言陳哲遠(yuǎn)燃炸朝堂

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂部

汽車要聞

小米汽車2月交付超20000臺(tái) 雷軍:為新SU7量產(chǎn)作準(zhǔn)備

態(tài)度原創(chuàng)

本地
親子
旅游
手機(jī)
公開課

本地新聞

津南好·四時(shí)總相宜

親子要聞

深圳光明以“生態(tài)育人”賦能高質(zhì)量發(fā)展 這所幼兒園提供樣本

旅游要聞

春節(jié)假期珠峰景區(qū)游客量創(chuàng)新高

手機(jī)要聞

華為HarmonyOS 6花粉Beta版更新包超18G,曝端側(cè)模型占大半

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版