国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛Gemini上新模型,全球只有7人比它會編程,谷歌姚順宇參與

0
分享至



編輯|澤南

從此以后,AI 不再是工具,要尊稱為「硅基博學家」了。

北京時間周五凌晨,谷歌發(fā)布了 Gemini 3 Deep Think 的重大升級,作為專門用于復雜任務的推理模式,Deep Think 代表 AI 前沿的最強智能水平,旨在解決科學、工程領域的諸多挑戰(zhàn)。



去年 9 月加入 Google DeepMind 的清華物理系傳奇姚順宇(Shunyu Yao)也是這次 Deep Think 新模型的參與者。



去年,谷歌展示了專門開發(fā)的 Deep Think 版本能夠成功應對一些最棘手的推理挑戰(zhàn),并在數(shù)學和編程世界錦標賽上取得了金牌成績。最近,Deep Think 又使專門開發(fā)的智能體能夠進行研究級別的數(shù)學探索。

更新后的深度思考模式繼續(xù)拓展智能的邊界,在最嚴格的學術基準測試中取得了新的高度,其中包括:

  • 在「人類的最后考試」(一項旨在測試現(xiàn)代前沿模型極限的基準測試)中,該模型取得了新的 SOTA(48.4%,不使用任何工具)。
  • 在 ARC-AGI-2 測試中取得了前所未有的 84.6% 的成績,并經(jīng) ARC Prize 基金會驗證。
  • 在 Codeforces 上取得了驚人的 3455 Elo 分數(shù),Codeforces 是一個包含各種競技編程挑戰(zhàn)的基準測試平臺。
  • 在 2025 年國際數(shù)學奧林匹克競賽中取得金牌水平。



新版 Gemini 3 Deep Think 在 ARC-AGI-1 上的成績是 96.0%,每任務花費 7.17 美元;在 ARC-AGI-2 上已經(jīng)達到了 84.6% 的分數(shù),每任務成本為 13.62 美元。



大約 14 個月前,OpenAI 模型 o3-preview 的「高計算」版本在 ARC-AGI-1 測試中達到了約 88% 的分數(shù),每個任務的成本約為 2000 至 3000 美元。而 Gemini 3 Deep Think 的每任務成本僅為 7.17 美元,成本降低了約 280 至 420 倍。

這意味著我們現(xiàn)在需要再次為 AI 準備更復雜的測試題了。

除了數(shù)學和編程競賽之外,Gemini 3 Deep Think 現(xiàn)在在化學和物理等廣泛的科學領域也表現(xiàn)出色。更新后的 Deep Think 模式在 2025 年國際物理奧林匹克競賽和化學奧林匹克競賽的筆試部分取得了金牌級別的成績。它還展現(xiàn)了在高等理論物理方面的能力,在 CMT-Benchmark 測試中取得了 50.5% 的分數(shù)。



還有這個在 Codeforces 上獲得的 3455 分,Gemini 3 Deep Think 已經(jīng)相當于世界排名第八的頂尖競技程序員的水平。之前的最佳成績是來自一年多以前 OpenAI o3 的 2727 分,排名第 175。

地球上只有 7 個人能在編程比賽中擊敗 Gemini 3 Deep Think。



對于 AI 和整個科技領域而言,這是一個以往難以想象的成果。

谷歌與科學家和研究人員緊密合作,對 Gemini 3 Deep Think 進行了升級。Deep Think 將深厚的科學知識與日常工程實踐相結合,超越了抽象理論,推動了實際應用。

借助更新后的 Deep Think,你可以將草圖轉化為可 3D 打印的實體模型。Deep Think 會分析圖紙,對復雜形狀進行建模,并生成用于 3D 打印的實體文件。



谷歌展示了一些早期測試用戶使用最新版 Deep Think 的成果:

羅格斯大學的數(shù)學家 Lisa Carbone 致力于研究高能物理學界所需的數(shù)學結構,以彌合愛因斯坦引力理論和量子力學之間的鴻溝。由于該領域缺乏大量的訓練數(shù)據(jù),她利用 Deep Think 技術審閱了一篇高度專業(yè)的數(shù)學論文。Deep Think 成功地識別出了一個細微的邏輯缺陷,而這個缺陷此前在人工同行評審中均未被發(fā)現(xiàn)。



在杜克大學,Haozhe "Harry" Wang 帶領的實驗室利用 Deep Think 技術優(yōu)化了復雜晶體生長的制備方法,以期發(fā)現(xiàn)新的半導體材料。Deep Think 成功設計了一種能夠生長厚度大于 100 微米薄膜的工藝,達到了以往方法難以企及的精確目標。



或許隨著更多人的使用,我們不久之后能夠基于 Gemini 3 Deep Think 實現(xiàn)更多科研突破。

全新 Deep Think 現(xiàn)已在 Gemini 應用中上線,目前 Google AI Ultra 訂閱用戶可以使用。此外,谷歌首次通過 Gemini API 向部分研究人員、工程師和企業(yè)開放 Deep Think 的使用權限。

參考內容:

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

https://x.com/shaneguML/status/2021999801911718029

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

火山詩話
2026-02-24 21:56:12
女孩當小姐,一晚要提供4到5次上門服務,2015年被親人點到不赴約

女孩當小姐,一晚要提供4到5次上門服務,2015年被親人點到不赴約

漢史趣聞
2025-11-08 09:27:32
真正的“逆齡運動”,堅持一年大腦年輕2.3歲!不是跑步、走路……

真正的“逆齡運動”,堅持一年大腦年輕2.3歲!不是跑步、走路……

人民日報健康客戶端
2026-02-25 07:34:27
上海一行人橫穿快速路被撞身亡,家屬索賠150萬,法院判決司機等無責

上海一行人橫穿快速路被撞身亡,家屬索賠150萬,法院判決司機等無責

上觀新聞
2026-02-25 18:39:10
平頂山打人夫妻被逮捕,老家村干部發(fā)聲:他們有兩個孩子,老家房子已塌不在村里居住,完全想不到兩人會做這種事

平頂山打人夫妻被逮捕,老家村干部發(fā)聲:他們有兩個孩子,老家房子已塌不在村里居住,完全想不到兩人會做這種事

極目新聞
2026-02-25 20:18:11
中國連發(fā)11號12號公告,日本叫囂對等制裁,兩招反擊,高市增兵

中國連發(fā)11號12號公告,日本叫囂對等制裁,兩招反擊,高市增兵

吳欣純Deborah
2026-02-25 12:25:13
威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

小火箭愛體育
2026-02-26 09:05:55
總第60順位!雷霆隊可能選中,又一個中國球員!

總第60順位!雷霆隊可能選中,又一個中國球員!

德譯洋洋
2026-02-26 12:22:07
跟腱撕裂!塔圖姆即將復出!轟動整個NBA聯(lián)盟

跟腱撕裂!塔圖姆即將復出!轟動整個NBA聯(lián)盟

籃球教學論壇
2026-02-26 12:30:21
一路走好!2026春節(jié)才過7天,已有6位大佬離世,最年輕的才40歲

一路走好!2026春節(jié)才過7天,已有6位大佬離世,最年輕的才40歲

鯨探所長
2026-02-24 19:34:36
重磅!3月1日起,CT檢查這三項費用全面取消,全國統(tǒng)一執(zhí)行!

重磅!3月1日起,CT檢查這三項費用全面取消,全國統(tǒng)一執(zhí)行!

悅心知足
2026-02-25 15:53:58
具俊曄已回韓國,他清空了賬號,和好兄弟一起吃泡菜美食

具俊曄已回韓國,他清空了賬號,和好兄弟一起吃泡菜美食

素素娛樂
2026-02-26 08:05:09
一場5-0,讓榜首易主,前3只差3分,C羅點射:21場轟入21球

一場5-0,讓榜首易主,前3只差3分,C羅點射:21場轟入21球

足球狗說
2026-02-26 07:09:06
江西小伙去深圳擰螺絲,伙食一頓15塊,干了3天,連忙提桶跑路了

江西小伙去深圳擰螺絲,伙食一頓15塊,干了3天,連忙提桶跑路了

餐飲新紀元
2026-02-26 07:12:27
一份末日推演,傳得神乎其神,2028年就會到來?

一份末日推演,傳得神乎其神,2028年就會到來?

中產(chǎn)先生
2026-02-25 11:30:39
同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

大風新聞
2026-02-25 17:00:14
貝加爾湖事故升級!妻女遇難,逃生者是父親,疑動作慢被網(wǎng)暴慘了

貝加爾湖事故升級!妻女遇難,逃生者是父親,疑動作慢被網(wǎng)暴慘了

聽風喃
2026-02-25 13:53:39
我見過最傻的父母,攥著大把的存款和退休金,卻等著給子女當遺產(chǎn)

我見過最傻的父母,攥著大把的存款和退休金,卻等著給子女當遺產(chǎn)

i書與房
2026-02-25 17:22:34
長沙市重大項目集中簽約開工,總投資額超260億元

長沙市重大項目集中簽約開工,總投資額超260億元

界面新聞
2026-02-26 09:37:06
小米狂出六款新車!雷軍徹底失控了

小米狂出六款新車!雷軍徹底失控了

李東陽朋友圈
2026-02-25 13:03:08
2026-02-26 13:07:01
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12362文章數(shù) 142569關注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

頭條要聞

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

短劇市場風云突變!有人投百萬賠得精光

汽車要聞

第五代宏光MINIEV煥新 四門玩趣代步車來襲

態(tài)度原創(chuàng)

房產(chǎn)
親子
旅游
數(shù)碼
公開課

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

親子要聞

產(chǎn)后第一周:身體發(fā)出的5個“正常信號”,新手媽媽請收藏!

旅游要聞

一整年都有新驚喜!上海迪士尼十周年慶典即將啟幕,三大娛樂演出煥新升級

數(shù)碼要聞

消息稱蘋果入門MacBook起售價699美元,不支持原彩顯示與快充

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版