国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌Gemini 3 Pro 屠榜,新的Agent IDE 免費(fèi)使用Gemini 3 Pro、Claude Sonnet 4.5

0
分享至


大家好,我是 Ai 學(xué)習(xí)的老章。

這兩天應(yīng)該都被 Gemini-3-Pro 刷屏了


號稱通向 AGI 的新里程碑

  • 頂尖的推理能力

  • ?深度多模態(tài)理解

  • 強(qiáng)大的一鍵編碼能力,讓你從提示到應(yīng)用一步到位

  • 提升的代理能力,可以按照你的指示代你完成任務(wù)

本文梳理一下關(guān)于 Gemini-3-Pro 的全部情報(bào)

大力屠榜

Gemini 3 來的還有點(diǎn)靜悄悄,最開始只是 i 流傳出一個 Model Card,幾乎在所有基準(zhǔn)測試中拿下第一


Gemini 3 Pro 憑借最先進(jìn)的推理與多模態(tài)能力,能夠?qū)崿F(xiàn)任何創(chuàng)意。它在每一項(xiàng)主要的 AI 基準(zhǔn)測試中,表現(xiàn)都顯著超越 2.5 Pro。它以突破性的 1501 Elo 分?jǐn)?shù)榮登 LMArena 排行榜榜首。在 Humanity’s Last Exam(未使用任何工具的情況下得分 37.5%)和 GPQA Diamond(91.9%)中取得高分,展現(xiàn)了博士級的推理能力。它也為前沿模型的數(shù)學(xué)能力樹立了新標(biāo)準(zhǔn),在 MathArena Apex 上達(dá)到了 23.4% 的新高。除了文字,Gemini 3 Pro 也重新定義了多模態(tài)推理,在 MMMU-Pro 獲得 81%,在 Video-MMMU 獲得 87.6%。它還在 SimpleQA Verified 中取得了領(lǐng)先業(yè)界的 72.1%,展現(xiàn)了在事實(shí)準(zhǔn)確性上的巨大進(jìn)步。這意味著 Gemini 3 Pro 具備高度可靠性,能夠解決科學(xué)和數(shù)學(xué)等廣泛主題中的復(fù)雜問題。

后續(xù)其他基準(zhǔn)測試我就不在放了,只看一下我經(jīng)常關(guān)注的 Artificial Analysis 放出的一個最新指數(shù)——知識和幻覺評估基準(zhǔn) AA-Omniscience

Gemini 3 Pro 在AA-Omniscience指數(shù)中占據(jù)了第一名的位置。


0 表示正確和錯誤答案數(shù)量相當(dāng),負(fù)分表示錯誤答案多于正確答案。

在評估中,Gemini 3 Pro 的幻覺率為 88%,與 Gemini 2.5 Pro 和 Gemini 2.5 Flash 相同。這表明 Gemini 3 Pro 在知識方面取得了顯著進(jìn)步。


AA-全知準(zhǔn)確率(越高越好)衡量的是模型正確回答的問題數(shù)占總問題數(shù)的比例,不論模型是否選擇作答。


AA-全知幻覺率(越低越好)衡量模型在本應(yīng)拒絕時答錯的頻率,定義為所有非正確嘗試中錯誤答案的比例。這一部分 Gemini 3 就差點(diǎn)意思了


更多詳情:Artificial Analysis Evaluations

其他細(xì)節(jié)-API使用 1. 思考等級 (Thinking Level)

thinking_level參數(shù)用于控制模型在生成回答之前進(jìn)行內(nèi)部推理過程的最大深度。

  • low:低延遲,低成本。適合簡單指令、聊天。

  • high(默認(rèn)):最大化推理深度。適合復(fù)雜任務(wù)。

注意:OpenAI 的reasoning_effort參數(shù)會自動映射到thinking_level(中等映射到高)。

2. 溫度設(shè)置 (Temperature)

對于 Gemini 3,強(qiáng)烈建議將溫度保持為默認(rèn)值 1.0。 Gemini 3 的推理能力已針對默認(rèn)設(shè)置進(jìn)行了優(yōu)化。降低溫度可能會導(dǎo)致循環(huán)或性能下降。

3. 媒體分辨率

Gemini 3 提供了更精細(xì)的媒體控制:

媒體類型

推薦設(shè)置

Token 上限

圖片media_resolution_high

1120

最佳質(zhì)量,適合分析細(xì)節(jié)。

PDFmedia_resolution_medium

560

適合文檔理解,性價比最高。

視頻media_resolution_low

70/幀

適合大多數(shù)動作識別。


4. API 定價與規(guī)格

模型 ID

上下文窗口

知識截止

定價 (輸入/輸出)

gemini-3-pro-preview

100 萬 / 6.4 萬

2025 年 1 月

12 (<200k)
18 (>200k)

價格按每百萬 token 計(jì)算。

免費(fèi)使用的話,強(qiáng)烈推薦這個谷歌剛剛與 Gemini 3 Pro 一同推出的 Google Antigravity:下一代 Agent 開發(fā)平臺,該平臺目前處于免費(fèi)預(yù)覽階段。它由 Gemini 3 Pro 提供支持,支持瀏覽器控制并提供工作證明。此外,該平臺還集成了 Claude Sonnet 和 GPT-OSS。


訪問 antigravity.google/download 免費(fèi)下載公共預(yù)覽版(支持 MacOS、Windows 和 Linux

我看了一下 Price 頁,被感動了:個人用戶目前可以 0 元購,免費(fèi)使用 Gemini 3 Pro 和 Claude Sonnet 4.5


Antigravity 有三個“面板”:

  1. 代理管理儀表板

  2. VS Code 風(fēng)格的編輯器

  3. 深度瀏覽器集成(通過 Chrome 擴(kuò)展)

整體與 Cusor、Winsurf 幾乎沒啥區(qū)別


總結(jié):Google 這一次不僅在模型性能上重回巔峰,更通過 Antigravity 和全棧生態(tài)的整合,展現(xiàn)了可怕的統(tǒng)治力。Gemini 3 + Android + Workspace,這才是真正的 AI 原生體驗(yàn)。加上最佳圖像生成- Nano Banana 2、最佳視頻生成- Veo 3.1、最佳模型- Gemini 3,谷歌真就要贏下 AI 競賽了嗎……

老章薦書

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
司馬遷之死,細(xì)思極恐

司馬遷之死,細(xì)思極恐

漢周讀書
2025-07-30 12:40:08
黃日華:一生一個郭靖便足矣,他卻演了6個別人無法超越的角色

黃日華:一生一個郭靖便足矣,他卻演了6個別人無法超越的角色

芳芳?xì)v史燴
2025-12-27 13:12:38
10人埃及成功復(fù)仇!19年首勝南非,薩拉赫連場破門,連刷4紀(jì)錄

10人埃及成功復(fù)仇!19年首勝南非,薩拉赫連場破門,連刷4紀(jì)錄

奧拜爾
2025-12-27 01:03:10
退役僅一個月,陳清晨再破天花板,讓林丹和整個羽毛球圈沉默了

退役僅一個月,陳清晨再破天花板,讓林丹和整個羽毛球圈沉默了

郭蛹包工頭
2025-12-27 05:20:15
金銀滾滾擋不??!3生肖12月26日起結(jié)緣財(cái)神,鈔票滿天飛

金銀滾滾擋不??!3生肖12月26日起結(jié)緣財(cái)神,鈔票滿天飛

人閒情事
2025-12-26 08:08:17
完了,沒有隱私了!

完了,沒有隱私了!

鈞言堂
2025-12-26 22:38:27
哪一刻意識到自己沒見過世面?網(wǎng)友:從此再沒喝過茶

哪一刻意識到自己沒見過世面?網(wǎng)友:從此再沒喝過茶

另子維愛讀史
2025-12-13 21:53:50
進(jìn)入搶分模式,曼城豪取各項(xiàng)賽事8連勝

進(jìn)入搶分模式,曼城豪取各項(xiàng)賽事8連勝

懂球帝
2025-12-27 22:49:28
當(dāng)“務(wù)實(shí)派”玩起豪華,廣汽豐田鉑智7一點(diǎn)都“不基礎(chǔ)”

當(dāng)“務(wù)實(shí)派”玩起豪華,廣汽豐田鉑智7一點(diǎn)都“不基礎(chǔ)”

愛駕天下
2025-12-27 06:40:06
洪都拉斯新總統(tǒng)上任第一件事,或?qū)⑴c中國斷交?中方回應(yīng)暗藏鋒芒

洪都拉斯新總統(tǒng)上任第一件事,或?qū)⑴c中國斷交?中方回應(yīng)暗藏鋒芒

文史旺旺旺
2025-12-26 19:56:13
闊腿褲已經(jīng)下崗了,今年流行的是“瑜伽褲”,百搭顯瘦還時髦

闊腿褲已經(jīng)下崗了,今年流行的是“瑜伽褲”,百搭顯瘦還時髦

朝史暮夕
2025-12-25 10:38:23
韓國懸疑劇《韓國制造》今日全球上線:玄彬鄭雨盛主演,太好看了

韓國懸疑劇《韓國制造》今日全球上線:玄彬鄭雨盛主演,太好看了

韓馳
2025-12-27 22:53:02
看了熱搜上臭名昭著的母女,我確信世上真有天生的壞種,代代遺傳

看了熱搜上臭名昭著的母女,我確信世上真有天生的壞種,代代遺傳

洞見
2025-12-26 21:13:17
發(fā)現(xiàn)了蘋果官網(wǎng)一個有趣的小細(xì)節(jié),你發(fā)現(xiàn)了嗎?

發(fā)現(xiàn)了蘋果官網(wǎng)一個有趣的小細(xì)節(jié),你發(fā)現(xiàn)了嗎?

XCiOS俱樂部
2025-12-25 14:30:11
日本加息的真實(shí)目的,傷敵一千自損八百,只為拉爆中國房地產(chǎn)

日本加息的真實(shí)目的,傷敵一千自損八百,只為拉爆中國房地產(chǎn)

小明嘩撲
2025-12-26 00:34:06
探訪浙江龐萊臣舊宅:展出9件真跡,龐家曾捐藏品給故宮南博

探訪浙江龐萊臣舊宅:展出9件真跡,龐家曾捐藏品給故宮南博

大風(fēng)新聞
2025-12-27 17:59:04
3000 名老紅軍達(dá)不到授銜要求,解決方案遲遲未決,毛主席一錘定音:全部授予少校

3000 名老紅軍達(dá)不到授銜要求,解決方案遲遲未決,毛主席一錘定音:全部授予少校

源溯歷史
2025-12-19 17:57:09
22名敢死隊(duì)員拼死拿下瀘定橋后神秘消失,40年后河北一份絕密檔案,意外揭開塵封半個世紀(jì)的驚人真相

22名敢死隊(duì)員拼死拿下瀘定橋后神秘消失,40年后河北一份絕密檔案,意外揭開塵封半個世紀(jì)的驚人真相

源溯歷史
2025-12-18 19:06:21
大批人開始返鄉(xiāng)!有人判斷,不出5年,農(nóng)村會開始越來越熱鬧

大批人開始返鄉(xiāng)!有人判斷,不出5年,農(nóng)村會開始越來越熱鬧

小談食刻美食
2025-12-26 16:45:23
快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

FM93浙江交通之聲
2025-10-28 00:01:43
2025-12-28 00:27:00
機(jī)器學(xué)習(xí)與Python社區(qū) incentive-icons
機(jī)器學(xué)習(xí)與Python社區(qū)
機(jī)器學(xué)習(xí)算法與Python
3235文章數(shù) 11081關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

手機(jī)
藝術(shù)
家居
游戲
公開課

手機(jī)要聞

榮耀第二款“萬級”電池曝光,下月發(fā)

藝術(shù)要聞

震撼!Tamara Dean的水中人像攝影,油畫般的絕美畫面!

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

我真幸運(yùn):《泰拉瑞亞》1.4.5更新定檔1月份!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版