国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude Opus 4.5來了:谷歌把Anthropic逼到了墻角

0
分享至

上周,Google實在是太猛了,拳打OpenAI,腳踢Anthropic。Gemini 3 Pro模型在編程、數(shù)學、推理等能力上都達到了當之無愧的SOTA級別。


被逼到墻角之后,就看誰先有能力掀桌坐不住了。

于是,就在今天,Anthropic發(fā)布了Claude Opus 4.5。


Opus 4.5的核心還是聚焦在編程能力,可以說很炸裂:SWE-bench Verified達到80.9%,首次突破80%,超越Gemini 3 Pro的76.2%。


以及,很少見的是,他們甚至降價了!價格從之前的貴得離譜的$15/$75直接降到$5/$25 per million tokens,直降66%??!

Opus 4.5的發(fā)布,說明Anthropic是真的急了——或者說,終于認真了。

Opus 4.5到底有多強?

先說benchmark數(shù)據(jù)。

SWE-bench Verified:80.9%

這是業(yè)界公認的編程能力測試標準。Opus 4.5是第一個突破80%的模型。

對比一下:

- Gemini 3 Pro:76.2%

- Claude Sonnet 4.5:77.2%

- GPT-5.1:76.3%/77.9%

80.9%是什么概念?Anthropic內(nèi)部拿性能工程師的面試題測試,Opus 4.5的得分超過了所有人類候選人。


Terminal-bench 2.0:59.3%

這個測試主要看模型在終端環(huán)境下的編程能力。Opus 4.5比Gemini 3 Pro高了5個百分點(54.2%),比自家的Sonnet 4.5高了近10個百分點(50.0%)。

這個差距說明一個事實:Claude在真實開發(fā)環(huán)境下,就是比其他模型強。

GPQA Diamond:87.0%

這是研究生級別的推理測試,涵蓋物理、化學、生物。Opus 4.5在這個測試上落后于Gemini 3 Pro(91.9%),但87%的成績也不差。

總結(jié)一下:編程能力世界第一,推理能力也不弱。

價格策略的巨大轉(zhuǎn)變

Opus 4.5最讓人意外的,是在性能提升的同時,價格還暴降了。

新定價:

- 輸入:$5 / million tokens

- 輸出:$25 / million tokens

Anthropic的官方說法是:"making Opus-level capabilities accessible to even more users, teams, and enterprises"(讓更多用戶、團隊和企業(yè)能用上Opus級別的能力)。

邏輯很明顯:Anthropic需要更多人用Opus。

之前Opus的定位是"高端用戶",但高端市場就那么大?,F(xiàn)在降價,是要搶占"中端市場"——那些之前用Sonnet,但其實需要更強能力的開發(fā)者。

不到一周,正面交鋒

11月18日,Google發(fā)布Gemini 3 Pro。

11月24日,Anthropic發(fā)布Claude Opus 4.5。

不到一周,兩個頂級模型連續(xù)發(fā)布。

這不是巧合。

Gemini 3 Pro發(fā)布時,各種benchmark數(shù)據(jù)都很炸裂,尤其是GPQA Diamond的91.9%,直接刷新了推理能力的記錄。當時AI圈的共識是:Google這次真的起來了。


Anthropic當然不會讓Google獨占風頭。

Opus 4.5的發(fā)布時機,明顯是沖著Gemini 3來的。而且,Anthropic選擇的戰(zhàn)場很聰明:不和你比推理,和你比編程。

Gemini 3 Pro在推理上確實強(91.9% vs 87.0%),但在編程上,Claude Opus 4.5領(lǐng)先了近5個百分點(80.9% vs 76.2%)。

更關(guān)鍵的是,編程能力是開發(fā)者最關(guān)心的指標。推理能力再強,如果寫不出好代碼,開發(fā)者也不會買單。

這就是Anthropic的策略:在自己最擅長的領(lǐng)域,做到絕對領(lǐng)先。

為什么Anthropic能在編程上這么強?

之前我在測試Claude Code時,有個很深的感受:

Claude Code好用的邏輯,不是因為它是終端工具,而是因為Anthropic有模型成本和模型認知的優(yōu)勢。

他們可以更無所畏懼地投喂代碼上下文燒token,能知道如何擠壓模型Agentic的能力實現(xiàn)更長步驟的推理,可以用agentic search而非RAG的方式處理上下文。

這些優(yōu)勢,說白了就一個原因:Anthropic從一開始就是奔著編程和Agent去優(yōu)化模型的。

我之前評價Claude 4時說:最強編程模型 + 最強Agent基建。

Anthropic對模型的所有優(yōu)化,都是奔著To B做AI coding和讓開發(fā)者建agent而去的。他們主要做了這幾個方面的優(yōu)化:

1. 擴展思維與工具使用:允許模型在思考和使用工具之間來回切換,形成"思考-執(zhí)行-再思考"的循環(huán)

2. 改進的記憶能力:可以創(chuàng)建和維護"記憶文件"來存儲關(guān)鍵信息,支持長時間任務(wù)

3. 更強的指令遵循能力:可以處理超過10000個token的系統(tǒng)提示

4. 減少獎勵黑客行為:模型為了達到目標而走捷徑的傾向降低了80%以上

這些優(yōu)化,放在Opus 4.5上,效果更明顯了。

相比之下,Gemini 3的優(yōu)勢在于多模態(tài)。如果你的任務(wù)涉及視覺、圖片、視頻,Gemini 3會更強。但如果是純編程任務(wù),Claude Opus 4.5幾乎沒有對手。

產(chǎn)品層面的配合

Opus 4.5的發(fā)布,不是孤立的。

Anthropic同時推出了幾個重要的產(chǎn)品更新:

1. Claude Code進入桌面端:支持并行運行多個本地和遠程會話,長對話自動總結(jié)早期上下文

2. Claude for Chrome:擴展至所有Max用戶

3. Claude for Excel:面向所有Max、Team和Enterprise用戶正式發(fā)布

這些產(chǎn)品更新,都是在強化一個信號:Claude不只是一個聊天模型,它是一個生產(chǎn)力工具。

尤其是Claude Code。

我之前說過,從工具層面來說,從Cursor這種IDE圖形界面退回到Claude Code這種終端命令行工具,其實是個挺大的退步。但Claude Code之所以還是比Cursor好用,就是因為它背后的模型能力太強了。

現(xiàn)在Opus 4.5出來了,Claude Code的優(yōu)勢會更明顯。

而且,Anthropic還宣布了和Microsoft、NVIDIA的戰(zhàn)略合作:Claude擴展至Azure平臺,由NVIDIA提供算力支持。這意味著,Claude的To B布局在快速推進。

開發(fā)者該怎么選?

最后說點實際的:如果你是開發(fā)者,該選Claude還是Gemini?

我的建議是:

選Claude Opus 4.5,如果你的任務(wù)主要是:

  • 純代碼編寫和調(diào)試

  • 后端邏輯和復雜推理

  • 長時間的編程任務(wù)(需要記憶和上下文管理)

選Gemini 3 Pro,如果你的任務(wù)主要是:

  • 多模態(tài)任務(wù)(涉及圖片、視頻、視覺)

  • 前端、UI設(shè)計

  • 需要超強推理能力的研究級任務(wù) 如果預算夠,最好的辦法是:兩個都用。

Claude處理編程,Gemini處理多模態(tài)。各取所長。

我前兩天剛剛同時用Claude Code+Gemini 3 Pro,開發(fā)了一個有儀式感地記錄日常生活和靈感碎片的app「小票筆記 - Thermal」,在開發(fā)這款app時,我的工作步驟和體驗是:

1)Gemini 3在生成和復刻前端效果上明顯表現(xiàn)更優(yōu)

2)實際的開發(fā)和解決bug的過程,Claude Code還是比Cursor + Gemini 3 Pro,或者使用Antigravity的體驗,因為長程的編程能力還需要工具更好的工程化能力,以及模型更底層的編程能力。




最后

Opus 4.5的發(fā)布,不是孤立事件。

它是Anthropic在編程和Agent這條路上的又一次發(fā)力,是對Gemini 3的正面回應(yīng),也是對自己商業(yè)化策略的調(diào)整。

Anthropic這么跳,說明AI大模型的競爭進入白熱化了。

對開發(fā)者來說,這是好事。模型越來越強,價格越來越低,工具越來越好用。

接下來,看OpenAI怎么接招。

當然,如果你因為訂閱或者網(wǎng)絡(luò)問題不方便使用原版Claude Code的話,也歡迎試試我前段時間開發(fā)的GLM Code:

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
國家在號召符合條件的退役士兵可以再次入伍,外交部:警鐘已敲響

國家在號召符合條件的退役士兵可以再次入伍,外交部:警鐘已敲響

百態(tài)人間
2025-12-24 16:40:00
一旦臺海戰(zhàn)爭爆發(fā),可能造成上億傷亡,解放軍或需解決4大戰(zhàn)場

一旦臺海戰(zhàn)爭爆發(fā),可能造成上億傷亡,解放軍或需解決4大戰(zhàn)場

滄海旅行家
2025-12-11 15:28:35
美媒:若開拓者擺爛瀚森將成最大受益者 交易兩人能為他打開局面

美媒:若開拓者擺爛瀚森將成最大受益者 交易兩人能為他打開局面

羅說NBA
2025-12-28 06:53:32
下車救人還是肇事逃逸?警方回應(yīng):真的是下車救人,網(wǎng)友們別再誤會了

下車救人還是肇事逃逸?警方回應(yīng):真的是下車救人,網(wǎng)友們別再誤會了

封面新聞
2025-12-28 13:05:04
陳剛和“陳剛”合影

陳剛和“陳剛”合影

觀察者網(wǎng)
2025-12-27 09:46:55
萬萬沒想到,畢福劍敗光的體面,如今被29歲“丑女兒”掙回來了!

萬萬沒想到,畢福劍敗光的體面,如今被29歲“丑女兒”掙回來了!

知鑒明史
2025-09-03 18:55:30
南博風波后續(xù):全網(wǎng)追查“借畫不還”的神秘老同志,揭開歷史迷霧

南博風波后續(xù):全網(wǎng)追查“借畫不還”的神秘老同志,揭開歷史迷霧

公子麥少
2025-12-21 14:54:43
中方反制不到24小時,美悍然宣布:中國違法,我們九屆政府都護臺

中方反制不到24小時,美悍然宣布:中國違法,我們九屆政府都護臺

博覽歷史
2025-12-27 16:31:18
普京強硬表態(tài):若烏方不愿和平解決 俄方就打到問題解決

普京強硬表態(tài):若烏方不愿和平解決 俄方就打到問題解決

新華社
2025-12-28 11:18:09
利好:維拉兩大主力停賽無緣戰(zhàn)阿森納!槍手12月最佳射手:烏龍球

利好:維拉兩大主力停賽無緣戰(zhàn)阿森納!槍手12月最佳射手:烏龍球

足球偵探
2025-12-28 16:23:29
“后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

“后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

詩意世界
2025-11-30 11:04:47
18家大國企全軍覆沒!昔日世界第一的中國機床,現(xiàn)還有翻身機會嗎

18家大國企全軍覆沒!昔日世界第一的中國機床,現(xiàn)還有翻身機會嗎

牛牛叨史
2025-12-20 21:06:35
5名“大法官”未達6人門檻仍下判決,翁曉玲:臺灣距離邪惡時代不遠了

5名“大法官”未達6人門檻仍下判決,翁曉玲:臺灣距離邪惡時代不遠了

海峽導報社
2025-12-21 08:44:14
原軍事交通學院政委王少君將軍逝世,曾參加邊境自衛(wèi)反擊戰(zhàn)

原軍事交通學院政委王少君將軍逝世,曾參加邊境自衛(wèi)反擊戰(zhàn)

澎湃新聞
2025-12-28 10:40:26
陳曉帶著,秦昊護著,郭京飛寵著,演了19部戲,終于紅了

陳曉帶著,秦昊護著,郭京飛寵著,演了19部戲,終于紅了

小椰的奶奶
2025-12-28 08:54:10
金融圈刷屏,“私募魔女”李蓓開投資課:收費12888元,但“不指望靠這個賺錢,我不缺幾千萬”!旗下有兩只產(chǎn)品近三年跑輸滬深300

金融圈刷屏,“私募魔女”李蓓開投資課:收費12888元,但“不指望靠這個賺錢,我不缺幾千萬”!旗下有兩只產(chǎn)品近三年跑輸滬深300

每日經(jīng)濟新聞
2025-12-27 19:22:17
李兆會的18年復仇路

李兆會的18年復仇路

詩意世界
2025-10-10 14:09:20
周總理當了27年總理,有四人先后擔任第一副總理

周總理當了27年總理,有四人先后擔任第一副總理

文史茶館2020
2025-12-28 11:15:51
俄警告歐洲國家勿向烏派兵

俄警告歐洲國家勿向烏派兵

界面新聞
2025-12-28 14:26:52
姜昆翻車,美國境內(nèi)唱紅歌,早年抵制洋節(jié)掛在嘴邊,回應(yīng)未移民!

姜昆翻車,美國境內(nèi)唱紅歌,早年抵制洋節(jié)掛在嘴邊,回應(yīng)未移民!

你食不食油餅
2025-12-26 06:13:35
2025-12-28 19:08:49
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發(fā)者
102文章數(shù) 46關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

本地
家居
旅游
房產(chǎn)
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

旅游要聞

【直播】元旦游上海,黃浦普陀專場:黃浦新年三重奏?普陀“半馬蘇河”,靈!

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版