網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Claude Opus 4.5來(lái)了：谷歌把Anthropic逼到了墻角

2025-11-25 13:08:43　來(lái)源: AI進(jìn)化論花生

北京舉報(bào)

分享至

上周，Google實(shí)在是太猛了，拳打OpenAI，腳踢Anthropic。Gemini 3 Pro模型在編程、數(shù)學(xué)、推理等能力上都達(dá)到了當(dāng)之無(wú)愧的SOTA級(jí)別。

被逼到墻角之后，就看誰(shuí)先有能力掀桌坐不住了。

于是，就在今天，Anthropic發(fā)布了Claude Opus 4.5。

Opus 4.5的核心還是聚焦在編程能力，可以說(shuō)很炸裂：SWE-bench Verified達(dá)到80.9%，首次突破80%，超越Gemini 3 Pro的76.2%。

以及，很少見(jiàn)的是，他們甚至降價(jià)了！價(jià)格從之前的貴得離譜的$15/$75直接降到$5/$25 per million tokens，直降66%?。?/strong>

Opus 4.5的發(fā)布，說(shuō)明Anthropic是真的急了——或者說(shuō)，終于認(rèn)真了。

Opus 4.5到底有多強(qiáng)？

先說(shuō)benchmark數(shù)據(jù)。

SWE-bench Verified：80.9%

這是業(yè)界公認(rèn)的編程能力測(cè)試標(biāo)準(zhǔn)。Opus 4.5是第一個(gè)突破80%的模型。

對(duì)比一下：

- Gemini 3 Pro：76.2%

- Claude Sonnet 4.5：77.2%

- GPT-5.1：76.3%/77.9%

80.9%是什么概念？Anthropic內(nèi)部拿性能工程師的面試題測(cè)試，Opus 4.5的得分超過(guò)了所有人類(lèi)候選人。

Terminal-bench 2.0：59.3%

這個(gè)測(cè)試主要看模型在終端環(huán)境下的編程能力。Opus 4.5比Gemini 3 Pro高了5個(gè)百分點(diǎn)（54.2%），比自家的Sonnet 4.5高了近10個(gè)百分點(diǎn)（50.0%）。

這個(gè)差距說(shuō)明一個(gè)事實(shí)：Claude在真實(shí)開(kāi)發(fā)環(huán)境下，就是比其他模型強(qiáng)。

GPQA Diamond：87.0%

這是研究生級(jí)別的推理測(cè)試，涵蓋物理、化學(xué)、生物。Opus 4.5在這個(gè)測(cè)試上落后于Gemini 3 Pro（91.9%），但87%的成績(jī)也不差。

總結(jié)一下：編程能力世界第一，推理能力也不弱。

價(jià)格策略的巨大轉(zhuǎn)變

Opus 4.5最讓人意外的，是在性能提升的同時(shí)，價(jià)格還暴降了。

新定價(jià)：

- 輸入：$5 / million tokens

- 輸出：$25 / million tokens

Anthropic的官方說(shuō)法是："making Opus-level capabilities accessible to even more users, teams, and enterprises"（讓更多用戶(hù)、團(tuán)隊(duì)和企業(yè)能用上Opus級(jí)別的能力）。

邏輯很明顯：Anthropic需要更多人用Opus。

之前Opus的定位是"高端用戶(hù)"，但高端市場(chǎng)就那么大?，F(xiàn)在降價(jià)，是要搶占"中端市場(chǎng)"——那些之前用Sonnet，但其實(shí)需要更強(qiáng)能力的開(kāi)發(fā)者。

不到一周，正面交鋒

11月18日，Google發(fā)布Gemini 3 Pro。

11月24日，Anthropic發(fā)布Claude Opus 4.5。

不到一周，兩個(gè)頂級(jí)模型連續(xù)發(fā)布。

這不是巧合。

Gemini 3 Pro發(fā)布時(shí)，各種benchmark數(shù)據(jù)都很炸裂，尤其是GPQA Diamond的91.9%，直接刷新了推理能力的記錄。當(dāng)時(shí)AI圈的共識(shí)是：Google這次真的起來(lái)了。

Anthropic當(dāng)然不會(huì)讓Google獨(dú)占風(fēng)頭。

Opus 4.5的發(fā)布時(shí)機(jī)，明顯是沖著Gemini 3來(lái)的。而且，Anthropic選擇的戰(zhàn)場(chǎng)很聰明：不和你比推理，和你比編程。

Gemini 3 Pro在推理上確實(shí)強(qiáng)（91.9% vs 87.0%），但在編程上，Claude Opus 4.5領(lǐng)先了近5個(gè)百分點(diǎn)（80.9% vs 76.2%）。

更關(guān)鍵的是，編程能力是開(kāi)發(fā)者最關(guān)心的指標(biāo)。推理能力再?gòu)?qiáng)，如果寫(xiě)不出好代碼，開(kāi)發(fā)者也不會(huì)買(mǎi)單。

這就是Anthropic的策略：在自己最擅長(zhǎng)的領(lǐng)域，做到絕對(duì)領(lǐng)先。

為什么Anthropic能在編程上這么強(qiáng)？

之前我在測(cè)試Claude Code時(shí)，有個(gè)很深的感受：

Claude Code好用的邏輯，不是因?yàn)樗墙K端工具，而是因?yàn)锳nthropic有模型成本和模型認(rèn)知的優(yōu)勢(shì)。

他們可以更無(wú)所畏懼地投喂代碼上下文燒token，能知道如何擠壓模型Agentic的能力實(shí)現(xiàn)更長(zhǎng)步驟的推理，可以用agentic search而非RAG的方式處理上下文。

這些優(yōu)勢(shì)，說(shuō)白了就一個(gè)原因：Anthropic從一開(kāi)始就是奔著編程和Agent去優(yōu)化模型的。

我之前評(píng)價(jià)Claude 4時(shí)說(shuō)：最強(qiáng)編程模型 + 最強(qiáng)Agent基建。

Anthropic對(duì)模型的所有優(yōu)化，都是奔著To B做AI coding和讓開(kāi)發(fā)者建agent而去的。他們主要做了這幾個(gè)方面的優(yōu)化：

1. 擴(kuò)展思維與工具使用：允許模型在思考和使用工具之間來(lái)回切換，形成"思考-執(zhí)行-再思考"的循環(huán)

2. 改進(jìn)的記憶能力：可以創(chuàng)建和維護(hù)"記憶文件"來(lái)存儲(chǔ)關(guān)鍵信息，支持長(zhǎng)時(shí)間任務(wù)

3. 更強(qiáng)的指令遵循能力：可以處理超過(guò)10000個(gè)token的系統(tǒng)提示

4. 減少獎(jiǎng)勵(lì)黑客行為：模型為了達(dá)到目標(biāo)而走捷徑的傾向降低了80%以上

這些優(yōu)化，放在Opus 4.5上，效果更明顯了。

相比之下，Gemini 3的優(yōu)勢(shì)在于多模態(tài)。如果你的任務(wù)涉及視覺(jué)、圖片、視頻，Gemini 3會(huì)更強(qiáng)。但如果是純編程任務(wù)，Claude Opus 4.5幾乎沒(méi)有對(duì)手。

產(chǎn)品層面的配合

Opus 4.5的發(fā)布，不是孤立的。

Anthropic同時(shí)推出了幾個(gè)重要的產(chǎn)品更新：

1. Claude Code進(jìn)入桌面端：支持并行運(yùn)行多個(gè)本地和遠(yuǎn)程會(huì)話，長(zhǎng)對(duì)話自動(dòng)總結(jié)早期上下文

2. Claude for Chrome：擴(kuò)展至所有Max用戶(hù)

3. Claude for Excel：面向所有Max、Team和Enterprise用戶(hù)正式發(fā)布

這些產(chǎn)品更新，都是在強(qiáng)化一個(gè)信號(hào)：Claude不只是一個(gè)聊天模型，它是一個(gè)生產(chǎn)力工具。

尤其是Claude Code。

我之前說(shuō)過(guò)，從工具層面來(lái)說(shuō)，從Cursor這種IDE圖形界面退回到Claude Code這種終端命令行工具，其實(shí)是個(gè)挺大的退步。但Claude Code之所以還是比Cursor好用，就是因?yàn)樗澈蟮哪Ｐ湍芰μ珡?qiáng)了。

現(xiàn)在Opus 4.5出來(lái)了，Claude Code的優(yōu)勢(shì)會(huì)更明顯。

而且，Anthropic還宣布了和Microsoft、NVIDIA的戰(zhàn)略合作：Claude擴(kuò)展至Azure平臺(tái)，由NVIDIA提供算力支持。這意味著，Claude的To B布局在快速推進(jìn)。

開(kāi)發(fā)者該怎么選？

最后說(shuō)點(diǎn)實(shí)際的：如果你是開(kāi)發(fā)者，該選Claude還是Gemini？

我的建議是：

選Claude Opus 4.5，如果你的任務(wù)主要是：

純代碼編寫(xiě)和調(diào)試
后端邏輯和復(fù)雜推理
長(zhǎng)時(shí)間的編程任務(wù)（需要記憶和上下文管理）

選Gemini 3 Pro，如果你的任務(wù)主要是：

多模態(tài)任務(wù)（涉及圖片、視頻、視覺(jué)）
前端、UI設(shè)計(jì)
需要超強(qiáng)推理能力的研究級(jí)任務(wù) 如果預(yù)算夠，最好的辦法是：兩個(gè)都用。

Claude處理編程，Gemini處理多模態(tài)。各取所長(zhǎng)。

我前兩天剛剛同時(shí)用Claude Code+Gemini 3 Pro，開(kāi)發(fā)了一個(gè)有儀式感地記錄日常生活和靈感碎片的app「小票筆記 - Thermal」，在開(kāi)發(fā)這款app時(shí)，我的工作步驟和體驗(yàn)是：

1）Gemini 3在生成和復(fù)刻前端效果上明顯表現(xiàn)更優(yōu)

2）實(shí)際的開(kāi)發(fā)和解決bug的過(guò)程，Claude Code還是比Cursor + Gemini 3 Pro，或者使用Antigravity的體驗(yàn)，因?yàn)殚L(zhǎng)程的編程能力還需要工具更好的工程化能力，以及模型更底層的編程能力。

最后

Opus 4.5的發(fā)布，不是孤立事件。

它是Anthropic在編程和Agent這條路上的又一次發(fā)力，是對(duì)Gemini 3的正面回應(yīng)，也是對(duì)自己商業(yè)化策略的調(diào)整。

Anthropic這么跳，說(shuō)明AI大模型的競(jìng)爭(zhēng)進(jìn)入白熱化了。

對(duì)開(kāi)發(fā)者來(lái)說(shuō)，這是好事。模型越來(lái)越強(qiáng)，價(jià)格越來(lái)越低，工具越來(lái)越好用。

接下來(lái)，看OpenAI怎么接招。

當(dāng)然，如果你因?yàn)橛嗛喕蛘呔W(wǎng)絡(luò)問(wèn)題不方便使用原版Claude Code的話，也歡迎試試我前段時(shí)間開(kāi)發(fā)的GLM Code：

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁(yè) 下載網(wǎng)易新聞客戶(hù)端

相關(guān)推薦

熱點(diǎn)推薦

寧波一旅游團(tuán)所乘郵輪滯留迪拜，船上有約200名中國(guó)游客

上觀新聞 2026-03-02 16:05:11
4795 跟貼 4795

剛下飛機(jī)行李就沒(méi)了！杭州姑娘花10多萬(wàn)去南極旅游卻崩潰：衣物全靠借

環(huán)球網(wǎng)資訊 2026-03-03 08:53:57
5520 跟貼 5520

中國(guó)母女迪拜36萬(wàn)囤12張機(jī)票等回國(guó)

大象新聞 2026-03-03 10:47:07
5623 跟貼 5623

冷空氣攜風(fēng)雨襲粵多地氣溫明顯下降

中國(guó)能源網(wǎng) 2026-03-03 17:13:05
58 跟貼 58

重慶6家三甲醫(yī)院被罰2962萬(wàn)，主要涉及重復(fù)收費(fèi)過(guò)度檢查，其中一家一年被罰5次；醫(yī)保局：處罰程序合法合規(guī)

大風(fēng)新聞 2026-03-03 13:49:04
521 跟貼 521

男子要半米焊錫絲，聽(tīng)到報(bào)價(jià)一元后反問(wèn)店主這還要錢(qián)，店主：我有成本為什么不要錢(qián)

觀威海 2026-03-03 17:39:07
1027 跟貼 1027

美國(guó)國(guó)會(huì)將就限制總統(tǒng)戰(zhàn)爭(zhēng)權(quán)力議案舉行投票

界面新聞 2026-03-03 12:19:29
809 跟貼 809

蘋(píng)果推出iPhone 17e 3月4日起接受預(yù)購(gòu)

界面新聞 2026-03-02 22:11:14
7982 跟貼 7982

男子爬到何仙姑雕像頭頂拍照，山東蓬萊閣景區(qū)回應(yīng)：“八仙過(guò)?！笔駥儆诠矃^(qū)域無(wú)人值守，后續(xù)會(huì)加強(qiáng)巡邏

三湘都市報(bào) 2026-02-28 13:37:39
1179 跟貼 1179

冰天雪地開(kāi)車(chē)遇不明動(dòng)物求助，女子開(kāi)出幾公里后掉頭帶回：是只狗

星視頻 2026-03-03 18:28:48
26 跟貼 26

河南店主在上海賣(mài)早餐被催開(kāi)門(mén)！一天接到200多個(gè)陌生電話

大象新聞 2026-03-03 07:02:10
647 跟貼 647

年前100多元一斤，年后價(jià)格腰斬！有湖北人已迫不及待下單

環(huán)球網(wǎng)資訊 2026-02-27 09:52:19
1805 跟貼 1805

對(duì)話走丟25年回國(guó)認(rèn)親東北小伙張?jiān)迄i：對(duì)親生父母無(wú)怨言，今后會(huì)?；貋?lái)看望丨紅星尋人

紅星新聞 2026-03-03 17:54:34
182 跟貼 182

重慶兩地通報(bào)“地下暗河被污染”：確認(rèn)污染來(lái)自養(yǎng)殖場(chǎng)，未影響飲用水源

澎湃新聞 2026-03-03 15:00:30
50 跟貼 50

阿聯(lián)酋總統(tǒng)現(xiàn)身迪拜購(gòu)物中心喝咖啡，與小女孩合影，當(dāng)晚阿聯(lián)酋民航總局宣布開(kāi)通“特殊疏散航班”

極目新聞 2026-03-03 22:04:30
164 跟貼 164

學(xué)生返校被逐個(gè)開(kāi)包檢查還用金屬探測(cè)儀掃描

閃電新聞 2026-03-03 15:05:21
445 跟貼 445

楊瀚森、王俊杰7月有望回歸中國(guó)男籃，目標(biāo)是以小組第二進(jìn)入第二階段

大風(fēng)新聞 2026-03-03 16:49:04
59 跟貼 59

招聘員工要求 30 歲以下？哈啰致歉：堅(jiān)決反對(duì)就業(yè)歧視

中國(guó)能源網(wǎng) 2026-03-03 10:43:07
702 跟貼 702

扎克伯格夫婦據(jù)報(bào)1.7億美元于邁阿密置業(yè)

界面新聞 2026-03-03 08:19:31
102 跟貼 102

全國(guó)政協(xié)十四屆四次會(huì)議4日下午開(kāi)幕會(huì)期7天

央視新聞客戶(hù)端 2026-03-03 15:07:51
16 跟貼 16

“2026年春運(yùn)綠皮火車(chē)嚴(yán)重超員”一造謠者主動(dòng)投案（2026·03·03）

今日辟謠 2026-03-03 17:22:13
82 跟貼 82

豫韻飄香莫斯科文明互鑒譜新篇——2026“歡樂(lè)春節(jié)·感知中原”活動(dòng)在俄成功舉辦

中國(guó)日?qǐng)?bào)網(wǎng) 2026-03-03 11:26:19
3 跟貼 3

2026-03-04 03:19:00

AI進(jìn)化論花生

AI博主，AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開(kāi)發(fā)者

149文章數(shù) 66關(guān)注度

往期回顧全部

科技要聞

擁抱AI的"牛馬"：邊提效邊自嘲"自費(fèi)"上班

手機(jī)AI在MWC上卷出了新高度

MWC26首日：AI重構(gòu)智能網(wǎng)絡(luò)底座，廠商6G卡位搶跑

美國(guó)真的在用AI介入這次戰(zhàn)爭(zhēng)嗎？

蘋(píng)果iPhone17e發(fā)布：4499元起升級(jí)A19芯片

頭條要聞

美國(guó)突發(fā)史無(wú)前例撤離令引外界擔(dān)憂(yōu)：終極空襲或來(lái)臨

美防長(zhǎng)：伊朗不是伊拉克美這次不打"政治正確"的戰(zhàn)爭(zhēng)

美官員曾在1月會(huì)見(jiàn)小巴列維其系伊朗末代國(guó)王的兒子

有分析稱(chēng)中方或采取更大膽行動(dòng)宣示領(lǐng)土主張中方回應(yīng)

特朗普最新表態(tài)：伊朗想談判太遲了

頭條要聞

美國(guó)突發(fā)史無(wú)前例撤離令引外界擔(dān)憂(yōu)：終極空襲或來(lái)臨

美防長(zhǎng)：伊朗不是伊拉克美這次不打"政治正確"的戰(zhàn)爭(zhēng)

美官員曾在1月會(huì)見(jiàn)小巴列維其系伊朗末代國(guó)王的兒子

有分析稱(chēng)中方或采取更大膽行動(dòng)宣示領(lǐng)土主張中方回應(yīng)

特朗普最新表態(tài)：伊朗想談判太遲了

體育要聞

35輪后積分-7，他們?cè)庥鍪飞献钤绲慕导?jí)

女足亞洲杯-中國(guó)2-0孟加拉國(guó)奪開(kāi)門(mén)紅王霜張睿建功

伯恩茅斯vs布倫特福德：阿萊士-希門(mén)尼斯、埃萬(wàn)尼爾松首發(fā)，亨德森、凱萊赫出戰(zhàn)

卡拉菲奧里：我會(huì)有天回到羅馬，在那的經(jīng)歷有點(diǎn)像沒(méi)真正結(jié)束

卡拉菲奧里：我們每天訓(xùn)練時(shí)間不算長(zhǎng)，訓(xùn)練節(jié)奏很快強(qiáng)度也高

娛樂(lè)要聞

謝娜霸氣護(hù)夫：喊話薛之謙給張杰道歉

香港偶遇阿Sa，談男友嘟嘴賣(mài)萌滿(mǎn)臉幸福

宋丹丹回國(guó)過(guò)元宵，兩孫兒捧鮮花接機(jī)

演員田重從迪拜回國(guó)！自曝妻子預(yù)感不好催他回國(guó)

BY2合體帶媽媽游希臘，同框好像三姐妹

財(cái)經(jīng)要聞

特朗普“不惜一切”！全球股債齊崩

近萬(wàn)噸新疆三文魚(yú)，都去哪兒了？

伊朗匯率崩了！攢了一輩子的錢(qián)變成廢紙

凈利暴跌31%，“掃地茅”市值蒸發(fā)600億！

軍采“拉黑”海瀾之家企業(yè)個(gè)人遭“雙罰”

汽車(chē)要聞

第一梯隊(duì)輔助駕駛加持 iCAR V27定檔3月13日上市

長(zhǎng)安汽車(chē)2月銷(xiāo)量151922輛環(huán)比逆勢(shì)增長(zhǎng)12.8%

嵐圖1-2月銷(xiāo)量同比增長(zhǎng)18% 2月單月交付8358輛

小鵬第二代VLA推送:智駕從"極客嘗鮮"到"大眾常用"

26款海獅06EV實(shí)車(chē)到店配367馬力+天神之眼B

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

藝術(shù)

教育

手機(jī)

親子

本地新聞

食味印象｜一口入魂！康樂(lè)烤肉串起千年絲路香

津南好·四時(shí)總相宜

妝藝大游行2026：愿

春花齊放2026：《駿馬奔騰迎新歲》

藝術(shù)要聞

柔滑裙裝女神出場(chǎng)，驚艷程度超乎想象！

你絕對(duì)想不到，林徽因的書(shū)法竟如此驚艷！

Nihad Aghazada：當(dāng)代阿塞拜疆畫(huà)家

14個(gè)字，您能全認(rèn)嗎？探討情緒對(duì)人際關(guān)系的影響。

教育要聞

最新數(shù)據(jù)：研究生擴(kuò)招8.1萬(wàn)人！

為什么說(shuō)去英國(guó)讀本科的和碩士的是兩類(lèi)人？

東高地第三小學(xué)教育集團(tuán)舉行2026年春季開(kāi)學(xué)典禮

陜西大荔：迎接新學(xué)期健康第一課

剛剛，2026淄博、濟(jì)寧、威海、日照高考體檢安排出爐

手機(jī)要聞

榮耀Magic V6下周見(jiàn)，開(kāi)啟折疊屏7000mAh時(shí)代

vivo X300 Ultra視頻能力巨幅提升，實(shí)際效果令人期待

曝REDMI K90至尊版有望下月發(fā)，天璣9500性能旗艦

曝OPPO Find X9 Ultra將登陸全球市場(chǎng)，折疊新機(jī)蓄勢(shì)待發(fā)

親子要聞

寶媽?xiě)驯鍌€(gè)月大嬰兒站在扶梯上，突然背后滑下一輛玩具車(chē)，被鏟倒后孩子脫手飛出頭部多處受傷！

父母不公平

大型寒假作業(yè)趕工現(xiàn)場(chǎng)，萌娃搞笑日常

測(cè)試一下兒子的安全意識(shí)

猜猜這是什么？

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

Claude Opus 4.5來(lái)了：谷歌把Anthropic逼到了墻角

擁抱AI的"牛馬"：邊提效邊自嘲"自費(fèi)"上班

美國(guó)突發(fā)史無(wú)前例撤離令引外界擔(dān)憂(yōu)：終極空襲或來(lái)臨

美國(guó)突發(fā)史無(wú)前例撤離令引外界擔(dān)憂(yōu)：終極空襲或來(lái)臨

35輪后積分-7，他們?cè)庥鍪飞献钤绲慕导?jí)

謝娜霸氣護(hù)夫：喊話薛之謙給張杰道歉

特朗普“不惜一切”！全球股債齊崩

第一梯隊(duì)輔助駕駛加持 iCAR V27定檔3月13日上市

態(tài)度原創(chuàng)

食味印象｜一口入魂！康樂(lè)烤肉串起千年絲路香

柔滑裙裝女神出場(chǎng)，驚艷程度超乎想象！

榮耀Magic V6下周見(jiàn)，開(kāi)啟折疊屏7000mAh時(shí)代

寶媽?xiě)驯鍌€(gè)月大嬰兒站在扶梯上，突然背后滑下一輛玩具車(chē)，被鏟倒后孩子脫手飛出頭部多處受傷！

35輪后積分-7，他們?cè)庥鍪飞献钤绲慕导?jí)

特朗普“不惜一切”！全球股債齊崩

柔滑裙裝女神出場(chǎng)，驚艷程度超乎想象！

榮耀Magic V6下周見(jiàn)，開(kāi)啟折疊屏7000mAh時(shí)代

寶媽?xiě)驯鍌€(gè)月大嬰兒站在扶梯上，突然背后滑下一輛玩具車(chē)，被鏟倒后孩子脫手飛出頭部多處受傷！