国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌Gemini最“小”的一次迭代,姚順宇為何高呼“不可阻擋”?

0
分享至


本文來自微信公眾號:字母AI,作者:小金牙,編輯:王靖,題圖來自:AI生成

人們還在津津樂道OpenAI和Anthropic兩家公司的老板拒絕牽手,以至于握拳高舉的滑稽畫面,另一邊,谷歌一個反手迭代了模型。


而且這次迭代,頗像是狼披上了羊皮——從模型后綴的數(shù)字序號看,這是谷歌最“小”的一次迭代,之前都是從Gemini 2.0到Gemini 2.5這樣的迭代,這次從Gemini 3.0到Gemini 3.1Pro Preview。


但是這“.1”的迭代,進步得卻不是一星半點。

谷歌CEO皮查伊(Sundar Pichai)表示,新代模型非常擅長處理“超級復雜的任務”。例如將復雜概念可視化、將數(shù)據(jù)綜合成單一視圖或者將創(chuàng)意項目變?yōu)楝F(xiàn)實。


姚順宇也專門在X上發(fā)帖為Gemini 3.1 Pro Preview振臂,盛贊:

“Gemini不僅僅是一個好模型,更好的模型正在以不可阻擋之勢到來?!?/p>


需要注意的是,大約一周前,谷歌推出了“專用推理模式”Gemini 3 Deep Think,專為科學、研究、工程等復雜、開放式問題設計。

Demini 3 Deep Think是姚順宇從Anthropic跳槽到谷歌DeepMind之后參與的第一個項目。

而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千絲萬縷的關(guān)系,官方表示“直接構(gòu)建在Gemini 3 Deep Think的經(jīng)驗和技術(shù)之上”。相當于把Deep Think的核心推理提升技術(shù)“下放”到更廣泛可用的Pro模型中。

一、Gemini 3.1 Pro Preview能做什么

既然這次新代模型的突出能力在處理“超級復雜”的任務,那么普通的對話放一邊,谷歌的官方博文中,重點給出了幾種示例秀肌肉。

第一,通過簡單的提示詞,創(chuàng)建SVG動畫。

這個功能前代也有,但是對比之下進步明顯。

比如提示詞“生成一個SVG,描繪一只變色龍靜靜地坐在樹枝上。讓變色龍的眼睛跟隨用戶的鼠標光標在屏幕上移動?!?/p>

Gemini 3 Pro生成的動畫背景是單一的白色,變色龍也看起來很呆板,甚至一側(cè)有兩只眼睛。

Gemini 3.1 Pro生成的動畫則有豐富的“深綠色叢林”背景,變色龍身體有黃色斑紋和圓點裝飾,眼睛立體,腿部姿勢自然彎曲。


再比如提示詞“生成一個滑動切換開關(guān)的SVG,當鼠標懸停在太陽圖標上時,將其變成發(fā)光的月亮,同時背景從明亮平滑漸變到黑暗。采用干凈的扁平UI風格。”

Gemini 3 Pro給出的動畫雖然完成了任務,圖標可以隨鼠標變化,但是主圖標單一,是一個缺角的圓形圖案,用黃色代表白天,白色代表夜間。

Gemini 3.1 Pro生成的動畫要復雜得多,白天是黃日白云,夜間是月牙繁星,兩套圖標絲滑變換。


總而言之,Gemini 3 Pro做的動畫,讓人想起多年前那個“學了三年動畫”的梗。


而Gemini 3.1 Pro交付的SVG動畫,已經(jīng)達到了可以直接使用的效果。

第二,構(gòu)建工程級別系統(tǒng)。

Gemini 3.1 Pro已經(jīng)可以根據(jù)一段高復雜度的自然語言指令,直接生成一個集3D渲染、實時太陽星歷計算、API異步拉取和物理光效于一體的完整交互系統(tǒng),而不是簡單頁面demo。

谷歌給出的示例中,用戶給出文字指令,Gemini 3.1 Pro生成了構(gòu)建一個高保真、可交互的3D國際空間站(ISS)軌道追蹤器。使用高分辨率的Blue Marble紋理貼圖渲染一個精細的3D地球模型。


第三,生成交互式創(chuàng)意系統(tǒng)。

在另一個示例中,谷歌展示了Gemini 3.1 Pro編寫的一個復雜的3D椋鳥群舞(murmuration)模擬。


它不僅生成視覺代碼,還構(gòu)建了一個沉浸式體驗,用戶可以通過手部追蹤操控鳥群,并聆聽根據(jù)鳥群運動變化的生成式配樂。

對于研究人員和設計師而言,這提供了一種強有力的方式來原型化感官豐富的界面。

第四,將文學主題轉(zhuǎn)化為可運行的代碼。

這個示例可能是普通人最容易get到厲害之處的一個。


當被要求為艾米莉·勃朗特(Emily Bront?)的《呼嘯山莊》(Wuthering Heights)打造一個現(xiàn)代個人作品集網(wǎng)站時,該模型并未簡單地總結(jié)文本內(nèi)容,而是基于小說的氛圍與情緒進行推理,設計出一個簡潔、當代感十足的界面,創(chuàng)建出一個捕捉主人公精神內(nèi)核的網(wǎng)站。

抽象推理,這種能力的含金量不用多說。

二、到底有多強?

新代模型免不了過一下刷榜這一步。

而“.1”的升級,獲得了動輒倍數(shù)躍升的成績。

根據(jù)谷歌官方博文放出的測試結(jié)果,在ARC-AGI-2基準測試中,3.1 Pro的驗證得分達到了77.1%。比3 Pro的推理性能提升了一倍以上。

這也符合3.1 Pro的示例,因為這個測試評估的是模型解決全新邏輯模式的能力。用人話說就是,抽象推理解謎的能力。


此外,在GPQA Diamond(科學知識測試)中,3.1 Pro得分94.3%;智能體類基準MCP Atlas上,得分69.2%;真實網(wǎng)絡瀏覽與信息整合能力的基準BrowseComp上,得分85.9%。

這些成績,均超過了Anthropic的Sonnet 4.6、Opus 4.6,以及OpenAI的GPT-5.2與GPT-5.3-Codex。

谷歌Gemini 3.1 Pro這次在ARC抽象推理和BrowseComp搜索任務上顯著拉開差距,顯示出明顯的Agent傾向,而非單純知識模型。

此外,專門做大模型基準測試與對比分析的第三方評測機構(gòu)也發(fā)布了相關(guān)測試結(jié)果,大贊Gemini 3.1 Pro在構(gòu)成Artificial Analysis Intelligence Index的10項評測中領先6項,相較于Gemini 3 Pro Preview在多項能力上顯著提升,尤其是在推理與知識、代碼能力以及降低幻覺方面進步最大。


而且,Gemini 3.1 Pro Preview保持較高的token效率。

運行完整Artificial Analysis Intelligence Index約需5700萬token(比Gemini 3 Pro Preview多100萬)。

這一token使用量低于其他在最大推理模式下運行的前沿模型,如Opus 4.6(max)和GPT-5.2(xhigh)。

結(jié)合更低的單token定價,Gemini 3.1 Pro Preview在前沿模型中具有成本優(yōu)勢,運行完整Intelligence Index的成本不到Opus 4.6(max)的一半,不過仍約為領先開源模型GLM-5的兩倍。

三、能力翻倍價格不變

谷歌官方API定價顯示,Gemini 3 Pro/3.1 Pro Preview的收費結(jié)構(gòu)是按token計費的:

小于200k tokens時,每百萬token輸入約2美元,輸出價格為4美元。大于200k tokens時,每百萬token輸入4美元,輸出18美元。

在上下文緩存方面,根據(jù)提示詞規(guī)模,每百萬 token 收取 0.20 至 0.40 美元,外加每小時每百萬 token 4.50 美元的存儲費。

這個價格,整體上和Gemini自己的上一代3 Pro一致,但要是和 Anthropic Opus 系列比起來,還是相對便宜的。 Opus這類模型輸入/輸出單價能在$5/$25左右。

尤其是結(jié)合當下它在模型能力上相當突出,這個價格更顯得極具競爭力。

不要忘了,谷歌這次發(fā)布的只是“預覽(Preview)”,谷歌很快就會推出正式版。而“.1”的迭代,谷歌也是在暗示其只是小秀肌肉。

目前,開發(fā)者可以在AI Studio、Gemini API、Gemini CLI、智能體開發(fā)平臺Google Antigravity以及Android Studio使用3.1 Pro;企業(yè)用戶則可以在Vertex AI和Gemini Enterprise使用;普通用戶在Gemini應用和NotebookLM都能用上,不過后者僅限Pro和Ultra訂閱用戶。

各個社區(qū)里已經(jīng)有不少人迫不及待上手操作,真的就和谷歌的演示一樣,手搓了不少驚艷的玩意。

有人用Gemini 3.1 Pro 生成了一個可交互的 3D 機械級汽車懸架系統(tǒng)模擬器,包含真實幾何結(jié)構(gòu)、連桿約束與實時轉(zhuǎn)向和行程計算,相當于把機械工程建模、物理邏輯和3D可視化一次性寫成可運行工具,接近工程級原型能力。


有人用3.1 Pro制作“捉鬼獵人走過一棟鬧鬼的房子”的循環(huán)動畫,驚呼“Gemini沒有開玩笑”。


總之,谷歌這回是真憋了個大招。

小小一個“.1”,卻把推理和代碼能力拉得飛起,定價還這么穩(wěn)。

社區(qū)里滿溢的手搓demo的熱情,也證明了它的能力與實用性。

AI圈越來越現(xiàn)實了。模型再強,終究得看賬單值不值。企業(yè)開始精打細算每個token的回報,開發(fā)者也得掂量掂量性價比。谷歌這一步,不僅是搶回王座,更是把競爭推向“誰更會過日子”的新階段。

且看接下來,捏著拳頭的Anthropic和OpenAI,以及xAI、Meta、微軟等一眾競爭對手該如何應對吧。

本文來自微信公眾號:字母AI,作者:小金牙,編輯:王靖

本內(nèi)容由作者授權(quán)發(fā)布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯(lián)系 tougao@huxiu.com。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4835960.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
亞歷山大談多爾特被驅(qū)逐:我沒看到發(fā)生了什么,但他只是想贏

亞歷山大談多爾特被驅(qū)逐:我沒看到發(fā)生了什么,但他只是想贏

懂球帝
2026-02-28 21:46:40
第一性原理為何如此重要?讀懂此文,2026事業(yè)起飛

第一性原理為何如此重要?讀懂此文,2026事業(yè)起飛

高博新視野
2026-02-27 17:17:48
杉杉集團破產(chǎn),事實證明:美女主持人只會排節(jié)目,對管理無能為力

杉杉集團破產(chǎn),事實證明:美女主持人只會排節(jié)目,對管理無能為力

晨光蘇醒a
2026-02-27 06:33:24
抱頭鼠竄塔利班求助安理會,川普力挺巴基斯坦再狠一點!

抱頭鼠竄塔利班求助安理會,川普力挺巴基斯坦再狠一點!

移光幻影
2026-02-28 13:25:17
陳秀英:百歲媽媽,因近親結(jié)婚生下3個“猴娃”,50年沒出過村子

陳秀英:百歲媽媽,因近親結(jié)婚生下3個“猴娃”,50年沒出過村子

雍親王府
2026-01-25 09:30:03
日本新晉女神!阿部夏樹,魔鬼般的身材比例,算得上是頂級天賦。

日本新晉女神!阿部夏樹,魔鬼般的身材比例,算得上是頂級天賦。

情感大頭說說
2026-02-28 15:21:28
此隧道一旦建成,將打破青島交通死角格局,使其成為東北亞樞紐?

此隧道一旦建成,將打破青島交通死角格局,使其成為東北亞樞紐?

好笑娛樂君每一天
2026-02-28 11:46:51
大量瑞幸新年禮盒流入閑魚,內(nèi)含便攜咖啡機,全新最低46塊

大量瑞幸新年禮盒流入閑魚,內(nèi)含便攜咖啡機,全新最低46塊

閑搞機
2026-02-27 11:02:52
白馬會所一夜覆滅

白馬會所一夜覆滅

來科點譜
2026-02-28 07:45:18
普京宮殿的“遺產(chǎn)”:65億盧布天降橫財,最終都流向了同一個人

普京宮殿的“遺產(chǎn)”:65億盧布天降橫財,最終都流向了同一個人

老馬拉車莫少裝
2026-02-26 18:52:14
王楚欽怒了,4-0很強勢!賽后采訪高情商談張禹珍,裁判無地自容

王楚欽怒了,4-0很強勢!賽后采訪高情商談張禹珍,裁判無地自容

有范又有料
2026-02-28 16:57:31
內(nèi)馬爾:我跟維尼修斯說,他進球再做和首回合同樣的慶祝動作

內(nèi)馬爾:我跟維尼修斯說,他進球再做和首回合同樣的慶祝動作

懂球帝
2026-02-28 19:27:26
54歲仍未婚,有北京戶口卻為母親定居青島,譚凱坦言從沒后悔過

54歲仍未婚,有北京戶口卻為母親定居青島,譚凱坦言從沒后悔過

風月得自難尋
2026-02-27 21:37:53
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
中東誰也打不過的以色列,在東亞算什么水平?韓國:誰也打不過

中東誰也打不過的以色列,在東亞算什么水平?韓國:誰也打不過

比利
2025-11-29 18:49:51
一家三口看《飛馳人生》, 老婆約小三坐旁邊偷情, 被老公炸裂抓奸

一家三口看《飛馳人生》, 老婆約小三坐旁邊偷情, 被老公炸裂抓奸

扮貓騎老虎
2026-02-26 17:21:01
你啥時候意識到錢的重要性?網(wǎng)友:錢能解決85%以上的雞毛蒜皮事

你啥時候意識到錢的重要性?網(wǎng)友:錢能解決85%以上的雞毛蒜皮事

帶你感受人間冷暖
2026-02-23 01:22:30
特朗普官宣:美軍大規(guī)模進攻伊朗,政權(quán)更迭、全面摧毀目標全公開

特朗普官宣:美軍大規(guī)模進攻伊朗,政權(quán)更迭、全面摧毀目標全公開

老馬拉車莫少裝
2026-02-28 21:53:45
又一個“扶弟魔”!訂婚宴上彩禮臨時漲價38萬,男方被逼直接退婚

又一個“扶弟魔”!訂婚宴上彩禮臨時漲價38萬,男方被逼直接退婚

丫頭舫
2026-02-28 11:22:55
深圳灣公園晚上“黑燈瞎火”被吐槽,公園管理中心回應:為了讓鳥兒睡好覺,主要出入口等地保留了基礎照明

深圳灣公園晚上“黑燈瞎火”被吐槽,公園管理中心回應:為了讓鳥兒睡好覺,主要出入口等地保留了基礎照明

揚子晚報
2026-02-27 12:33:02
2026-02-28 22:28:49
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
25787文章數(shù) 687513關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

87歲哈梅內(nèi)伊對拉里賈尼委以重任 還建立完整繼承體系

頭條要聞

87歲哈梅內(nèi)伊對拉里賈尼委以重任 還建立完整繼承體系

體育要聞

球隊主力全報銷?頂風擺爛演都不演了

娛樂要聞

疑似王一博被爆私密聊天記錄

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

親子
健康
數(shù)碼
房產(chǎn)
時尚

親子要聞

萌娃堅稱自己最可愛,給出的理由讓人哭笑不得

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

Pulsar推出X2N CrazyLight輕量化鼠標,收腰高背對稱抓握模具

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

發(fā)現(xiàn)4種春季很襯膚色的辦法,照著穿

無障礙瀏覽 進入關(guān)懷版