国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌與OpenAI同獲ICPC 2025金牌!GPT-5滿分奪冠,Gemini攻破人類隊(duì)伍都沒解出的難題

0
分享至


整理 | 鄭麗媛

出品 | CSDN(ID:CSDNnews)

在過去幾十年里,國際大學(xué)生程序設(shè)計(jì)競(jìng)賽(ICPC)一直被視為計(jì)算機(jī)程序設(shè)計(jì)領(lǐng)域的“奧林匹克”。然而今年,賽場(chǎng)上的風(fēng)頭卻被兩位“非人類”選手搶走——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink。

GPT-5 和 Gemini 2.5 Deep Think 作為參賽模型,受 ICPC 官方規(guī)則與組織監(jiān)督,參與了與人類選手相同的解題環(huán)節(jié)。雖然它們并非與學(xué)生團(tuán)隊(duì)直接同場(chǎng)競(jìng)技,卻交出了驚艷答卷:

● GPT-5 拿下滿分,12 道題全解,相當(dāng)于“金牌”水準(zhǔn)。

● Gemini 2.5 Deep Think 在 677 分鐘內(nèi)解出 12 題中的 10 題,也達(dá)到金牌級(jí)別。根據(jù)谷歌的說法,這樣的成績放在人類排名里將是全球第二。

要知道,本屆 ICPC 的人類金牌隊(duì)伍來自圣彼得堡國立大學(xué)、東京大學(xué)、北京交通大學(xué)和清華大學(xué)??杉幢闶沁@些頂尖學(xué)府的強(qiáng)隊(duì),也沒有任何一支做到全對(duì)(最好成績是 11/12)。換句話說,這是 AI 第一次在這類算法競(jìng)賽中實(shí)現(xiàn)了“超車”。



ICPC:程序員的“林匹克

ICPC 是全球最頂尖的大學(xué)生編程賽事,自 1970 年代起,這項(xiàng)賽事就匯聚了全球高校最頂尖的算法天才。今年,ICPC 總決賽共有來自 103 個(gè)國家、139 所高校的戰(zhàn)隊(duì)參賽,大賽規(guī)則看似簡(jiǎn)單:

● 每支隊(duì)伍由三名大學(xué)生組成;

● 5 小時(shí)內(nèi)解答 12 道算法題;

● 排名取決于解題數(shù)和用時(shí)。

但背后的難度遠(yuǎn)超一般編程比賽。據(jù)悉,ICPC 的題目常涉及圖論、數(shù)論、動(dòng)態(tài)規(guī)劃、組合優(yōu)化、網(wǎng)絡(luò)流等前沿算法。既考察編碼速度,也考察數(shù)學(xué)功底與團(tuán)隊(duì)合作。歷年來,能在 ICPC 拿到金牌的隊(duì)伍,幾乎都成為了全球科技公司的核心技術(shù)人才。

也正因?yàn)?ICPC 的權(quán)威與挑戰(zhàn)性,本屆 AI 的入局顯得尤為標(biāo)志性:這是把AI直接推上了最嚴(yán)苛的算法競(jìng)技場(chǎng)。


GPT-5 給出完美答卷,Gemini 2.5解出人類沒有答出的問題C

根據(jù) OpenAI 官方披露,GPT-5 參賽時(shí)并沒有針對(duì) ICPC 做特別訓(xùn)練,也沒有任何“外掛”工具。它像其他人類隊(duì)伍一樣:直接拿到同樣的 PDF 賽題、通過官方判題系統(tǒng)提交答案、在 5 小時(shí)內(nèi)完成所有解答。

結(jié)果令人瞠目:有 11 道題都是一遍過,唯一的難題在第 9 次提交時(shí)才解出,最終達(dá)成 12/12 滿分——要知道,今年人類最強(qiáng)隊(duì)伍的成績是 11/12,而 GPT-5 直接拿下滿分,這在 ICPC 的歷史上極為罕見。

基于此,OpenAI 也在 X 平臺(tái)分享了 GPT-5 的成績:

“我們?cè)?ICPC 的 AI 賽道正式參賽,同樣是 5 小時(shí)解 12 道題,答案由 ICPC 評(píng)測(cè)系統(tǒng)實(shí)時(shí)判定。結(jié)果顯示,12 道題中有 11 道題一次提交就通過,最難的一題則是在第 9 次提交時(shí)才解出。最終,GPT-5 完成了全部 12 道題,而最好的人類隊(duì)伍只解出 11 道?!?/blockquote>

與此同時(shí),Google 也公布了 Gemini 2.5 Deep Think 的比賽細(xì)節(jié):45 分鐘內(nèi)解出 8 題;3 小時(shí)內(nèi)解出 10 題;更令人震驚的是,Gemini 在比賽前半小時(shí)內(nèi),就成功解決了問題 C——一道沒有任何大學(xué)隊(duì)伍解出的難題。


據(jù)悉,這道題目要求:在由多個(gè)水庫和管道組成的復(fù)雜網(wǎng)絡(luò)中,找到一種管道開關(guān)配置,使所有水庫在最短時(shí)間內(nèi)被注滿。每條管道可以開、關(guān)或部分開啟,組合幾乎無限,導(dǎo)致搜索最優(yōu)解極其困難。

面對(duì)這道題,Gemini 2.5 Deep Think 的解題思路堪稱“巧妙”:

1、先為每個(gè)水庫設(shè)定一個(gè)“優(yōu)先級(jí)值”,表示它相對(duì)于其他水庫應(yīng)被分配的程度;

2、在給定優(yōu)先級(jí)值后,通過動(dòng)態(tài)規(guī)劃找到最優(yōu)管道配置;

3、進(jìn)一步應(yīng)用極小化極大定理,將問題轉(zhuǎn)化為尋找“最受約束”的優(yōu)先級(jí)組合;

4、最后在凸優(yōu)化空間中,利用嵌套三分搜索快速收斂到最優(yōu)解。

這一思路并非賽題官方題解的“標(biāo)準(zhǔn)做法”,而是模型自己推演出的路徑。換句話說,Gemini 在賽場(chǎng)上展示了超越記憶的原創(chuàng)性算法思維。為此Google 也在博客中強(qiáng)調(diào),這不僅是一次正確解答,更是一次“創(chuàng)造性突破”。


為什么這次意義非凡?

其實(shí),大模型在各種考試、基準(zhǔn)測(cè)試中的高分表現(xiàn)早已不是新聞:

● ChatGPT、Gemini 等 LLM 在 SAT、律師資格考試、托福等人類考試中屢屢高分;

● 今年7月,Gemini在國際數(shù)學(xué)奧林匹克(IMO) 拿到金牌;

● 在各種 NLP、邏輯推理 benchmark 上,LLM 也早已“刷榜”。

但這些成績往往被質(zhì)疑為“靠記憶訓(xùn)練數(shù)據(jù)”或“靠海量算力暴力搜索”。而 ICPC 這種現(xiàn)場(chǎng)算法競(jìng)賽不同:首先題目新穎,幾乎不可能出現(xiàn)在訓(xùn)練語料中;其次需要綜合運(yùn)用數(shù)學(xué)建模、推理和代碼實(shí)現(xiàn);最為重要的是,必須在有限時(shí)間內(nèi)找到解法,而不是離線慢慢思考。

此次GPT-5 與 Gemini 2.5 Deep Think在ICPC中的表現(xiàn),證明了它們已經(jīng)具備臨場(chǎng)推理、抽象建模、創(chuàng)造性解題的能力,這比在標(biāo)準(zhǔn)化考試中得高分更能說明問題。為此在社交媒體上,許多 AI 工程師感嘆:“過去我們擔(dān)心 AI 只是會(huì)背題庫;現(xiàn)在它在現(xiàn)場(chǎng)比賽里擊敗人類冠軍。這感覺像是見證了‘人機(jī)智力平權(quán)’的時(shí)刻。”

這不是終點(diǎn),而是一個(gè)開始。接下來,AI 是否會(huì)把這種能力擴(kuò)展到更復(fù)雜的現(xiàn)實(shí)問題中還有待考驗(yàn),但可以確定的是:如今,AI 不再只是“會(huì)寫代碼的助手”,而是真正具備了與人類智力正面對(duì)抗的實(shí)力。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
未來5年,預(yù)計(jì)有70%以上的鄉(xiāng)鎮(zhèn)和村級(jí)組織,會(huì)被迫“自食其力”?

未來5年,預(yù)計(jì)有70%以上的鄉(xiāng)鎮(zhèn)和村級(jí)組織,會(huì)被迫“自食其力”?

三農(nóng)雷哥
2026-03-07 19:54:53
33歲人妻球場(chǎng)換裝驚艷四座,這豐滿胸圍是真實(shí)存在的嗎?

33歲人妻球場(chǎng)換裝驚艷四座,這豐滿胸圍是真實(shí)存在的嗎?

娛樂領(lǐng)航家
2026-03-06 20:00:03
鸚鵡動(dòng)輒能活到百年,而且它只會(huì)在最后一段時(shí)間變老,這是真的嗎

鸚鵡動(dòng)輒能活到百年,而且它只會(huì)在最后一段時(shí)間變老,這是真的嗎

向航說
2026-03-07 00:05:03
山東大媽眼看著家門口挖出5億年石海,卻說出了大家都不敢說的話

山東大媽眼看著家門口挖出5億年石海,卻說出了大家都不敢說的話

黑哥講現(xiàn)代史
2026-03-07 08:32:58
貶值3000%!145萬僅換1美元,生活開銷暴漲30倍,伊朗人陷入絕望

貶值3000%!145萬僅換1美元,生活開銷暴漲30倍,伊朗人陷入絕望

知法而形
2026-03-07 09:39:20
臺(tái)州街頭已大量出現(xiàn),有車的人尤其注意!

臺(tái)州街頭已大量出現(xiàn),有車的人尤其注意!

環(huán)球網(wǎng)資訊
2026-03-08 07:44:42
豐滿到被浪姐集體摸胸?原來她這身材才是內(nèi)娛最有料的…

豐滿到被浪姐集體摸胸?原來她這身材才是內(nèi)娛最有料的…

健身迷
2026-03-07 11:35:29
很遺憾這兩位沒有在一起,多么郎才女貌,天作之合,好般配呀

很遺憾這兩位沒有在一起,多么郎才女貌,天作之合,好般配呀

草莓解說體育
2026-03-06 14:49:46
一場(chǎng)戰(zhàn)爭(zhēng)把中國打醒!美軍最毒的不是裝備,中國用30年才真正看清

一場(chǎng)戰(zhàn)爭(zhēng)把中國打醒!美軍最毒的不是裝備,中國用30年才真正看清

達(dá)文西看世界
2026-03-02 14:25:12
孩子跟爸爸睡和跟媽媽睡的區(qū)別,濃濃的反差感,笑死了

孩子跟爸爸睡和跟媽媽睡的區(qū)別,濃濃的反差感,笑死了

浩源的媽媽
2026-02-05 05:48:47
浙江小伙愛上云南富婆,富婆大他17歲,結(jié)婚時(shí)送給小伙一輛寶馬X5

浙江小伙愛上云南富婆,富婆大他17歲,結(jié)婚時(shí)送給小伙一輛寶馬X5

情感藝術(shù)家
2026-02-26 15:16:58
伊朗反擊變?nèi)酰瑢?dǎo)彈和無人機(jī)數(shù)量斷崖式下降,這是一個(gè)危險(xiǎn)的信號(hào)

伊朗反擊變?nèi)?,?dǎo)彈和無人機(jī)數(shù)量斷崖式下降,這是一個(gè)危險(xiǎn)的信號(hào)

麓谷隱士
2026-03-06 07:37:46
主將重現(xiàn)!

主將重現(xiàn)!

求實(shí)處
2026-03-07 23:01:34
59歲于文華現(xiàn)狀:與丈夫住河北農(nóng)村,穿著樸素趕大集,愛田園生活

59歲于文華現(xiàn)狀:與丈夫住河北農(nóng)村,穿著樸素趕大集,愛田園生活

銀河史記
2026-02-20 23:33:34
德云社弟子人氣大洗牌!4人上桌,3人邊緣,2人換桌,岳云鵬退場(chǎng)

德云社弟子人氣大洗牌!4人上桌,3人邊緣,2人換桌,岳云鵬退場(chǎng)

洲洲影視娛評(píng)
2026-03-07 13:20:10
諾基亞N97殺瘋了:7.2英寸直屏+6000mAh+2億主攝

諾基亞N97殺瘋了:7.2英寸直屏+6000mAh+2億主攝

涼了時(shí)光人
2026-03-07 09:31:03
港劇女神拍短劇遭酸:掉價(jià)!拍8天流量破10億 「喪子哭戲」被贊教科書

港劇女神拍短劇遭酸:掉價(jià)!拍8天流量破10億 「喪子哭戲」被贊教科書

ETtoday星光云
2026-03-05 16:10:07
明確了!嘉閔線將可無縫換乘地鐵1號(hào)線、5號(hào)線!

明確了!嘉閔線將可無縫換乘地鐵1號(hào)線、5號(hào)線!

尚虹橋
2026-03-07 19:34:42
申花有攻城錘了,雙前鋒+3中場(chǎng)攻守平衡 薛慶浩自信 1將首秀失誤

申花有攻城錘了,雙前鋒+3中場(chǎng)攻守平衡 薛慶浩自信 1將首秀失誤

替補(bǔ)席看球
2026-03-08 08:24:21
1332人遇難!中美罕見一致,內(nèi)塔尼亞胡或下臺(tái),特朗普開始找?guī)褪?>
    </a>
        <h3>
      <a href=李健政觀察
2026-03-07 17:33:12
2026-03-08 10:08:49
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術(shù)的創(chuàng)造者和使用者
2639文章數(shù) 7660關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

媒體:伊朗問題要注意普京的動(dòng)向 其在向美以喊話

頭條要聞

媒體:伊朗問題要注意普京的動(dòng)向 其在向美以喊話

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

汪小菲曝親媽猛料,張?zhí)m公開財(cái)產(chǎn)分配

財(cái)經(jīng)要聞

油價(jià)要失控?

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
本地
教育
數(shù)碼

藝術(shù)要聞

他是二王書法的化身?米芾的秘密揭曉!

2026春夏一定要擁有的6只包,好看又百搭

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

教育要聞

成長路上的心靈迷霧:青春期女生常見心理

數(shù)碼要聞

跌破3000元指日可待,蘋果Macbook Neo會(huì)賣爆嗎?

無障礙瀏覽 進(jìn)入關(guān)懷版