国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌數(shù)到3,這次輪到Gemini遙遙領(lǐng)先|Landing AI

0
分享至



現(xiàn)在輪到谷歌數(shù)到3了。

今天凌晨,谷歌正式公布了Gemini 3系列模型,并率先上線Gemini 3 Pro預覽版。按照介紹,開發(fā)者現(xiàn)可以在Google AI Studio直接調(diào)用API,Gemini應用已同步切換到新模型,企業(yè)與開發(fā)平臺側(cè)的更新則也已經(jīng)納入近期計劃。

對外而言,這次發(fā)布看似沿襲了大模型迭代的慣常節(jié)奏,但從谷歌的表述方式到模型本身呈現(xiàn)出來的能力,都暗示著一個趨勢:Gemini 3不再只是參數(shù)與跑分的躍遷,而是在嘗試重新定義“模型在系統(tǒng)中的位置”。

Gemini 3 Pro被谷歌歸納為三個核心變化:推理強度提升、事實一致性增強、多模態(tài)能力從設(shè)計之初就內(nèi)置而非附加。這意味著模型在對話中處理文本、圖像、音頻、視頻不再需要分階段切換,而是以統(tǒng)一的方式理解信息結(jié)構(gòu)。

官方給出的示例依舊貼近日常場景:把家里幾種語言混寫的手寫菜譜拍照丟給它,它能整理成一本統(tǒng)一格式的家庭菜譜;把一串長視頻講座交給它,它會把關(guān)鍵知識點拆成交互式卡片,甚至生成簡單的可視化工具來輔助記憶。在Gemini應用中,Canvas工作區(qū)能夠支持更完整的“小項目”;在Gemini Labs里,它也能根據(jù)你的問題生成類似雜志排版的界面。

這些特性看上去像是一次體驗層面的升級,但真正讓Gemini 3 Pro與以往不同的,是它在各類評估中的表現(xiàn)出現(xiàn)了領(lǐng)先式的變化,而不僅是“略微更準一點”。

過去一年,模型在各類基準測試中的差距往往停留在小范圍波動?,F(xiàn)在,一些關(guān)鍵指標第一次被明顯拉開。


最突出的表現(xiàn)落在高難度數(shù)學與復雜推理方向。Gemini 3 Pro在MathArena Apex中拿到23.4%的正確率,而上一代模型為0.5%、Claude為1.6%、GPT-5.1為1.0%——這是長期停滯區(qū)間第一次被大幅突破。

在跨領(lǐng)域推理考試中,這種差距繼續(xù)擴大。例如在Humanity’s Last Exam中,Gemini 3 Pro的無工具得分達到37.5%,工具模式則提升至45.8%,高于上一代的21.6%和GPT-5.1的26.5%。在GPQA Diamond中,它也以91.9%領(lǐng)先于同類模型的83%—88%區(qū)間。

多模態(tài)方面的變化則更集中體現(xiàn)在“界面理解”能力上。谷歌首次在技術(shù)資料中單列屏幕截圖理解,模型不僅能識別內(nèi)容,還能把握界面結(jié)構(gòu)、按鈕層級與可操作區(qū)域。

在ScreenSpot-Pro中,Gemini 3 Pro達到72.7%,而GPT-5.1僅為3.5%,Claude為36.2%,上一代Gemini為11.4%。這里的差距不只是識別率問題,而是決定了Agent是在“憑感覺點擊”,還是確實理解界面語境。

這種能力直接關(guān)系到Agent在操作電腦時是否能保持“情境意識”——能否基于界面判斷接下來會發(fā)生什么。對于任何期待AI“完成任務”的系統(tǒng)而言,這類能力遠比單純的圖像識別更關(guān)鍵。

更廣泛的表現(xiàn)也與谷歌想強調(diào)的方向一致:Gemini 3 Pro在多學科理解、視頻推理和事實一致性上都拉開差距,并在工程類任務中顯現(xiàn)出更高的穩(wěn)定度。

例如在SimpleQA Verified中,Gemini 3 Pro達到72.1%,而同類模型普遍落在30%—35%區(qū)間;多語言綜合能力的MMLU中,它拿下91.8%,略高于GPT-5.1的91.0%,并領(lǐng)先Claude的89.1%。

在工程類任務上,它不僅能處理更復雜的代碼生成,還能在涉及實際環(huán)境的測試中穩(wěn)定執(zhí)行。例如在Terminal-Bench 2.0中,Gemini 3 Pro達到54.2%,而Claude為42.8%,GPT-5.1為47.6%;在長鏈路任務Vending-Bench 2中,它的收益為5478美元,而其他模型普遍在1500—3800美元之間。

不過,Gemini 3真正有意義的部分,不在于單項能力的提升,而是谷歌圍繞它構(gòu)建的系統(tǒng)形態(tài)。伴隨此次更新推出的Antigravity,是一個以Agent為核心的開發(fā)環(huán)境。它并不是“補齊代碼空缺”的工具,而是讓模型能夠直接參與開發(fā)流程:理解需求、拆分任務、生成代碼、運行測試、檢查界面效果,再回到代碼層面調(diào)整。

于此,谷歌通過把不同模型組合使用,讓Agent在編輯器、終端與瀏覽器之間自由切換,從而承接一段完整的執(zhí)行鏈。對于結(jié)構(gòu)不算復雜的項目,它已經(jīng)能承擔起實際工作。

面向普通用戶的變化,則更集中體現(xiàn)在Gemini應用和Google搜索上。Gemini 3 Pro從第一天起就是默認模型,而應用內(nèi)的“Gemini Agent”可以處理多步?jīng)Q策任務,例如歸檔郵件、安排行程或處理需要反復查找信息的事務。搜索端的AI Mode也開始呈現(xiàn)更動態(tài)的信息布局,包括結(jié)構(gòu)化數(shù)據(jù)、圖片、時間軸甚至交互組件。這些變化來自于Gemini 3對查詢的拆分與重組,再由生成式界面組合展示,背后依賴的是更強的意圖理解能力。

此外,谷歌在這一代模型中主動強調(diào)了一個方向:Gemini 3 Pro在回答時更少迎合用戶,而更傾向于提供有信息密度的反饋?!敖档陀闲浴奔葘衲甑膶υ挵踩懻摚舱f明谷歌正在嘗試把“內(nèi)容質(zhì)量”變成產(chǎn)品特性,而不是語言風格。

基于上述這些,不難發(fā)現(xiàn),Gemini 3的意義并不僅僅在于“跑分領(lǐng)先多少”,而更多的是,它把能力重新組織成一個能堅持執(zhí)行任務、能跨模態(tài)整合、能在真實環(huán)境中保持結(jié)構(gòu)穩(wěn)定的系統(tǒng)。對谷歌來說,這提出了一個與GPT系列不同的回答:AI不僅要強,更要穩(wěn);不僅要會生成,更要懂場景;不僅能理解界面,更要能在界面中持續(xù)行動。

當然,接下來,Gemini 3能夠走多遠,所依仗的遠非這些看起來很漂亮的跑分和能力,而是在日常使用中,能有多少真正留得住的地方。

Landing AI

Landing AI是由動點科技策劃的一檔聚焦人工智能領(lǐng)域的專題報道欄目。通過對AI落地前景以及幕后故事的發(fā)掘,我們將在這一專題中深入淺出地探討關(guān)于AI新浪潮下的一切可能。

本文為動點科技記者原創(chuàng)文章,未經(jīng)授權(quán)不得轉(zhuǎn)載,如需轉(zhuǎn)載或開白請在后臺回復“轉(zhuǎn)載”。

- - - - - - - - END - - - - - - - -

*想要獲取行業(yè)資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群里更有不定期福利發(fā)放!

精彩好文值得推薦

一鍵轉(zhuǎn)發(fā),戳個在看


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為什么有個漂亮老婆還是想要分 網(wǎng)友講出自身經(jīng)歷真是一言難盡

為什么有個漂亮老婆還是想要分 網(wǎng)友講出自身經(jīng)歷真是一言難盡

侃神評故事
2026-03-10 18:50:04
奔馳官宣:S級將在華投產(chǎn)!在2026年底

奔馳官宣:S級將在華投產(chǎn)!在2026年底

網(wǎng)上車市
2026-03-26 21:41:53
搞笑經(jīng)典上學糗事冷笑話,一日上課半路上室友說:手機忘帶了回去拿回去拿!

搞笑經(jīng)典上學糗事冷笑話,一日上課半路上室友說:手機忘帶了回去拿回去拿!

天天明星
2026-03-25 15:11:50
人民日報“點名”馮鞏,釋放3個強烈信號,事實證明郭德綱沒說錯

人民日報“點名”馮鞏,釋放3個強烈信號,事實證明郭德綱沒說錯

八斗小先生
2026-03-27 10:09:43
熱身賽:U16國少2-3歐塞爾U17,劉凱源、冀政浩分別破門

熱身賽:U16國少2-3歐塞爾U17,劉凱源、冀政浩分別破門

懂球帝
2026-03-27 16:05:07
滬指、創(chuàng)業(yè)板指均跌超1%

滬指、創(chuàng)業(yè)板指均跌超1%

每日經(jīng)濟新聞
2026-03-27 09:34:14
張雪峰好兄弟曝內(nèi)情泣不成聲,人民日報悼念官媒定義,衛(wèi)健委追責

張雪峰好兄弟曝內(nèi)情泣不成聲,人民日報悼念官媒定義,衛(wèi)健委追責

潮鹿逐夢
2026-03-26 10:55:41
張雪峰靈堂遺照曝光!員工輪流守靈小聲哭泣,女兒發(fā)聲悼念惹淚目

張雪峰靈堂遺照曝光!員工輪流守靈小聲哭泣,女兒發(fā)聲悼念惹淚目

180視角
2026-03-27 11:35:55
公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

另子維愛讀史
2026-03-25 22:28:47
一點不比王鈺棟差,替補奇兵讓人眼前一亮,有望在王鈺棟之前留洋

一點不比王鈺棟差,替補奇兵讓人眼前一亮,有望在王鈺棟之前留洋

體壇風之子
2026-03-27 04:30:03
奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

品牌營銷報
2026-02-23 11:31:10
張愛玲:人生最大的悲哀不是選錯伴侶,也不是沒掙到錢,而是人到中年才發(fā)現(xiàn),從未真正為自己活過

張愛玲:人生最大的悲哀不是選錯伴侶,也不是沒掙到錢,而是人到中年才發(fā)現(xiàn),從未真正為自己活過

四行書
2026-03-27 12:33:32
我軍頂級的軍事天才只有一人,他打的仗,西點軍校復盤也打不出來

我軍頂級的軍事天才只有一人,他打的仗,西點軍校復盤也打不出來

秀心文雅
2026-03-27 10:13:04
黎筍之子黎堅誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

黎筍之子黎堅誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

磊子講史
2025-12-24 11:04:05
惡心到家了!《逐玉》大結(jié)局,是我今年看過“最離譜的大結(jié)局”!

惡心到家了!《逐玉》大結(jié)局,是我今年看過“最離譜的大結(jié)局”!

離離言幾許
2026-03-27 11:25:18
2026大決戰(zhàn):霍爾木茲海峽的宿命對決

2026大決戰(zhàn):霍爾木茲海峽的宿命對決

紀史行者
2026-03-18 09:08:50
人社部明確:事業(yè)編制改革啟動,3100萬人的“鐵飯碗”要變了

人社部明確:事業(yè)編制改革啟動,3100萬人的“鐵飯碗”要變了

慧眼看世界哈哈
2026-03-24 06:36:05
醫(yī)生說出真相:70歲后得癌癥,別急著做手術(shù),先問自己這5個問題

醫(yī)生說出真相:70歲后得癌癥,別急著做手術(shù),先問自己這5個問題

消化石醫(yī)生
2026-03-27 10:00:49
反轉(zhuǎn)!馬杜羅二次庭審徹底慫,從喊“我是總統(tǒng)”到哭窮請不起律師

反轉(zhuǎn)!馬杜羅二次庭審徹底慫,從喊“我是總統(tǒng)”到哭窮請不起律師

戧詞奪理
2026-03-27 10:04:54
“岳母,這是家宴,你是外人不配上桌”鳳凰男說完被凈身出戶了

“岳母,這是家宴,你是外人不配上桌”鳳凰男說完被凈身出戶了

廣西秦胖胖
2026-03-26 16:20:20
2026-03-27 19:36:49
動點科技 incentive-icons
動點科技
關(guān)注值得關(guān)注的科技創(chuàng)新
25543文章數(shù) 148798關(guān)注度
往期回顧 全部

科技要聞

楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

頭條要聞

美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

頭條要聞

美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

體育要聞

邵佳一:足球就像一場馬拉松

娛樂要聞

張雪峰靈堂內(nèi)景曝光,四周擺滿了鮮花

財經(jīng)要聞

我在小吃培訓機構(gòu)學習“科技與狠活”

汽車要聞

與眾08,金標大眾不能輸?shù)囊粦?zhàn)

態(tài)度原創(chuàng)

房產(chǎn)
健康
藝術(shù)
公開課
軍事航空

房產(chǎn)要聞

剛剛,海南樓市,官方數(shù)據(jù)發(fā)布!

干細胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

張大千:形成于未畫之先,神留于既畫之后

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗:已組織超100萬人為地面戰(zhàn)斗做準備

無障礙瀏覽 進入關(guān)懷版