国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌深夜炸場(chǎng):Gemini 3正式發(fā)布!自ChatGPT發(fā)布以來最激動(dòng)人心的事件

0
分享至


剛剛,谷歌Gemini 3正式發(fā)布,我的初步體驗(yàn)和第一感覺是這玩意完全超越GPT-5 和 Claude sonnet 4.5,強(qiáng)到離譜,編程和寫作都達(dá)到了T0級(jí)別,可以說這是自從OpenAI 發(fā)布ChatGPT以來,最令我心跳不已的事件,現(xiàn)在就可以在Gemini App和 Google AI Studio中使用了

隨手測(cè)試:直接看效果(更詳細(xì)的測(cè)試隨后幾天奉上)

1.制作速度可調(diào)的電風(fēng)扇svg


2.模擬彈力球從空中一層一層掉落并彈起的物理過程(目前我測(cè)過的只有Claude sonnet 4.5可以抽卡成功)


3.模擬核聚變過程并添加背景樂(這個(gè)是復(fù)現(xiàn)谷歌官方的)

官方的發(fā)布核心信息要點(diǎn):

谷歌官方把Gemini 3定義為“通往AGI之路的又一大步”。它不僅在多模態(tài)理解上全球領(lǐng)先,更是谷歌迄今為止最強(qiáng)大的Agent(智能體)和“Vibe Coding”模型。

此次發(fā)布包含兩個(gè)核心版本:Gemini 3 Pro(即日預(yù)覽上線)以及增強(qiáng)推理模式的Gemini 3 Deep Think

與此同時(shí),谷歌宣布Gemini 3即刻全面接入谷歌生態(tài)——從Search(搜索)到AI Studio,再到全新的Agent開發(fā)平臺(tái)Google Antigravity

一起來看Gemini 3到底有多強(qiáng)。

數(shù)據(jù)屠榜:LMArena突破1501分

Gemini 3 Pro主打深度推理和多模態(tài)能力,在每一項(xiàng)主流AI基準(zhǔn)測(cè)試中都大幅超越了Gemini 2.5 Pro


推理與數(shù)學(xué):

LMArena Leaderboard:以1501 Elo的突破性得分登頂。

Humanity’s Last Exam(人類最后一次考試):在不使用工具的情況下得分為37.5%,展現(xiàn)出博士級(jí)推理能力

GPQA Diamond:得分91.9%

MathArena Apex:達(dá)到23.4%,確立了前沿模型在數(shù)學(xué)領(lǐng)域的SOTA(State-of-the-art)新標(biāo)準(zhǔn)

多模態(tài)與事實(shí)性:

MMMU-Pro:81%。
Video-MMMU:87.6%,重新定義多模態(tài)推理。
SimpleQA Verified:72.1%(SOTA),在事實(shí)準(zhǔn)確性上取得重大進(jìn)展。

官方強(qiáng)調(diào),Gemini 3 Pro不再是簡(jiǎn)單的問答,而是能夠理解語境和意圖,“不僅能讀懂文字和圖像,更能讀懂空氣(reading the room)”。它可以摒棄陳詞濫調(diào),提供真知灼見,甚至能通過生成代碼將晦澀的科學(xué)概念轉(zhuǎn)化為高保真的可視化效果

Deep Think模式:推理能力的階躍

除了Pro版本,谷歌還祭出了大殺器——Gemini 3 Deep Think

這是一種增強(qiáng)推理模式,旨在解決最復(fù)雜的難題。測(cè)試數(shù)據(jù)顯示,其性能進(jìn)一步超越了本就強(qiáng)悍的Pro版本:


Humanity’s Last Exam:41.0%(無工具)

GPQA Diamond:93.8%

ARC-AGI-2:取得了前所未有的45.1%(含代碼執(zhí)行,ARC Prize Verified),證明了其解決新穎挑戰(zhàn)的能力。

Deep Think模式將在未來幾周內(nèi)向Google AI Ultra訂閱用戶開放。

Google Antigravity:重塑開發(fā)者體驗(yàn)

隨著Gemini 3的發(fā)布,谷歌推出了全新的Agent開發(fā)平臺(tái)——Google Antigravity

這不只是一個(gè)AI IDE,它將Agent提升到了核心地位

自主權(quán):Agent擁有對(duì)編輯器、終端和瀏覽器的直接訪問權(quán)限

能力:利用Gemini 3的推理和工具使用能力,Agent可以自主規(guī)劃并執(zhí)行復(fù)雜的端到端軟件任務(wù),同時(shí)自我驗(yàn)證代碼

模型組合:該平臺(tái)不僅集成了Gemini 3 Pro,還緊密耦合了最新的Gemini 2.5 Computer Use模型(用于瀏覽器控制)和頂級(jí)圖像編輯模型Nano Banana(Gemini 2.5 Image)。

在編碼能力基準(zhǔn)測(cè)試中,Gemini 3同樣表現(xiàn)出色:

WebDev Arena:1487 Elo,位居榜首。

SWE-bench Verified:76.2%,大幅超越2.5 Pro,這一項(xiàng)沒有超越Claude sonnet 4.5

Terminal-Bench 2.0:54.2%,展示了通過終端操作計(jì)算機(jī)的能力。

全能助手:從學(xué)習(xí)到規(guī)劃

Gemini 3不僅面向開發(fā)者,更旨在幫助普通用戶“學(xué)習(xí)、構(gòu)建和規(guī)劃一切”。

學(xué)習(xí)(Learn):

利用100萬token的上下文窗口,它可以綜合處理文本、圖像、視頻、音頻和代碼

示例: 它可以解讀不同語言的手寫食譜并整理成家庭烹飪書;通過分析匹克球(Pickleball)比賽視頻,生成針對(duì)性的訓(xùn)練計(jì)劃。

搜索進(jìn)化: 在Search的AI模式中,Gemini 3支持生成式UI體驗(yàn),能根據(jù)查詢即時(shí)生成交互式工具和沉浸式視覺布局

規(guī)劃(Plan):

Gemini 3在長(zhǎng)時(shí)程規(guī)劃上取得了長(zhǎng)足進(jìn)步

Vending-Bench 2測(cè)試: 該測(cè)試要求管理模擬自動(dòng)售貨機(jī)業(yè)務(wù)。Gemini 3 Pro在全年的模擬運(yùn)營(yíng)中保持了一致的決策力,未偏離任務(wù),并帶來了更高的回報(bào),位居榜首

這由意味著它能更好地處理預(yù)訂服務(wù)、整理收件箱等現(xiàn)實(shí)生活中的多步驟工作流

谷歌宣布,這是首次在發(fā)布首日就將新一代Gemini模型引入搜索(Search)。

具體推出計(jì)劃如下:

普通用戶:Gemini App及Search中的AI模式(針對(duì)Google AI Pro和Ultra訂閱用戶)即日起可用

開發(fā)者:通過Google AI Studio、Google Antigravity、Gemini CLI及Vertex AI訪問

企業(yè)用戶: 通過Vertex AI和Gemini Enterprise訪問。

Deep Think模式:需等待安全評(píng)估,預(yù)計(jì)數(shù)周后向Ultra訂閱用戶開放。

劈柴哥表示,過去兩年,AI Overviews月活已達(dá)20億,Gemini App月活超6.5億。Gemini 3的發(fā)布,標(biāo)志著谷歌以“全棧式AI”策略,正式將Gemini部署到了谷歌的每一個(gè)角落

參考:

https://blog.google/products/gemini/gemini-3/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=-development

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國(guó)官員稱:主宰這個(gè)世界的是實(shí)力 武力與權(quán)力

美國(guó)官員稱:主宰這個(gè)世界的是實(shí)力 武力與權(quán)力

看看新聞Knews
2026-01-08 11:01:03
超級(jí)網(wǎng)紅,賣了天價(jià)

超級(jí)網(wǎng)紅,賣了天價(jià)

中國(guó)新聞周刊
2026-01-08 07:54:07
情況已經(jīng)開始不對(duì)勁兒了,馬杜羅成燙手山芋,把人交給俄羅斯?

情況已經(jīng)開始不對(duì)勁兒了,馬杜羅成燙手山芋,把人交給俄羅斯?

小陸搞笑日常
2026-01-07 08:15:51
王石田樸珺婚變風(fēng)波升級(jí),女方整容前舊照被扒,曾為王石跪式服務(wù)

王石田樸珺婚變風(fēng)波升級(jí),女方整容前舊照被扒,曾為王石跪式服務(wù)

瓜汁橘長(zhǎng)Dr
2026-01-05 16:48:07
伊朗民眾開始持槍抗議,警察大量倒戈,天快亮了

伊朗民眾開始持槍抗議,警察大量倒戈,天快亮了

金召點(diǎn)評(píng)
2026-01-08 08:37:00
74歲王石坐公務(wù)艙出行!沒戴假發(fā)狀態(tài)疲憊,拿手機(jī)坐窗口認(rèn)真拍照

74歲王石坐公務(wù)艙出行!沒戴假發(fā)狀態(tài)疲憊,拿手機(jī)坐窗口認(rèn)真拍照

李健政觀察
2026-01-07 23:45:35
昆山一外企電子大廠突發(fā)解散:300多名員工獲N+1補(bǔ)償金和購(gòu)物卡

昆山一外企電子大廠突發(fā)解散:300多名員工獲N+1補(bǔ)償金和購(gòu)物卡

六子吃涼粉
2026-01-08 12:34:04
錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個(gè)醒

錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個(gè)醒

阿笎評(píng)論哥
2026-01-08 06:40:37
中方通告全球,對(duì)日下達(dá)禁令,誰幫就追究誰的責(zé)任,日本12字回應(yīng)

中方通告全球,對(duì)日下達(dá)禁令,誰幫就追究誰的責(zé)任,日本12字回應(yīng)

時(shí)時(shí)有聊
2026-01-07 21:32:21
澤連斯基引發(fā)的鏈?zhǔn)椒磻?yīng):俄羅斯的盟友接連倒下

澤連斯基引發(fā)的鏈?zhǔn)椒磻?yīng):俄羅斯的盟友接連倒下

高博新視野
2026-01-07 18:42:18
宜家的問題已經(jīng)挺嚴(yán)重了

宜家的問題已經(jīng)挺嚴(yán)重了

蔚然未來消費(fèi)
2026-01-08 08:34:50
央視怒批,人民日?qǐng)?bào)點(diǎn)名封殺,這5位目無法紀(jì)的大網(wǎng)紅,徹底涼涼

央視怒批,人民日?qǐng)?bào)點(diǎn)名封殺,這5位目無法紀(jì)的大網(wǎng)紅,徹底涼涼

一娛三分地
2025-12-04 17:00:33
中國(guó)焊死了工業(yè)化大門?真相很殘酷:不是中國(guó)卷,是游戲規(guī)則變了

中國(guó)焊死了工業(yè)化大門?真相很殘酷:不是中國(guó)卷,是游戲規(guī)則變了

遠(yuǎn)方風(fēng)林
2026-01-06 23:28:13
就換個(gè)LOGO?格力海報(bào)被抄襲,怒喊友商:“抄得挺像的,下次別抄了”

就換個(gè)LOGO?格力海報(bào)被抄襲,怒喊友商:“抄得挺像的,下次別抄了”

LOGO研究所
2026-01-08 09:32:19
《尋秦記》片酬曝光,古天樂零收入,林峯第二,最高的你想不到

《尋秦記》片酬曝光,古天樂零收入,林峯第二,最高的你想不到

電影票房預(yù)告片
2026-01-08 00:02:54
這下麻煩大了!不到48小時(shí),閆學(xué)晶再迎2大噩耗,何慶魁也被牽連

這下麻煩大了!不到48小時(shí),閆學(xué)晶再迎2大噩耗,何慶魁也被牽連

阿纂看事
2026-01-07 12:16:27
為什么總統(tǒng)被綁架,委內(nèi)瑞拉股票和債券反而雙雙暴漲?背后有一個(gè)冷酷的真相!

為什么總統(tǒng)被綁架,委內(nèi)瑞拉股票和債券反而雙雙暴漲?背后有一個(gè)冷酷的真相!

識(shí)局Insight
2026-01-08 07:19:46
女子開車碾壓草場(chǎng)后續(xù):揚(yáng)言撞死牧民,真實(shí)身份被扒,公司被牽連

女子開車碾壓草場(chǎng)后續(xù):揚(yáng)言撞死牧民,真實(shí)身份被扒,公司被牽連

奇思妙想草葉君
2026-01-07 23:56:24
湖人本季12場(chǎng)失利分差均超10分創(chuàng)紀(jì)錄!東契奇:沒有詹姆斯太難了

湖人本季12場(chǎng)失利分差均超10分創(chuàng)紀(jì)錄!東契奇:沒有詹姆斯太難了

Emily說個(gè)球
2026-01-08 13:17:56
喬丹后首人,弗拉格總得分、籃板、助攻和搶斷均為隊(duì)內(nèi)最高

喬丹后首人,弗拉格總得分、籃板、助攻和搶斷均為隊(duì)內(nèi)最高

懂球帝
2026-01-08 10:57:22
2026-01-08 13:35:00
AI寒武紀(jì) incentive-icons
AI寒武紀(jì)
專注于人工智能,科技領(lǐng)域
1026文章數(shù) 393關(guān)注度
往期回顧 全部

科技要聞

雷軍:現(xiàn)在聽到營(yíng)銷這兩個(gè)字都有點(diǎn)惡心

頭條要聞

委內(nèi)瑞拉外長(zhǎng):感謝中方支持

頭條要聞

委內(nèi)瑞拉外長(zhǎng):感謝中方支持

體育要聞

約基奇倒下后,一位故人邪魅一笑

娛樂要聞

2026春節(jié)檔將有六部電影強(qiáng)勢(shì)上映

財(cái)經(jīng)要聞

微軟CTO韋青:未來人類會(huì)花錢"戒手機(jī)"

汽車要聞

不談?lì)嵏才c奇跡,智駕企業(yè)還能聊點(diǎn)什么?

態(tài)度原創(chuàng)

時(shí)尚
教育
旅游
房產(chǎn)
公開課

藍(lán)色+灰色、紅色+棕色,這4組配色怎么搭都好看!

教育要聞

孩子的科技教育怎么跟上時(shí)代?

旅游要聞

萬歲山武俠城:與錦上添花文旅簽署“排他協(xié)議”,非與萬歲山合作不再打造武俠類景區(qū)

房產(chǎn)要聞

三亞新房,又全國(guó)第一了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版