国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude Opus 4.5發(fā)布:價格腰斬、無限對話,重奪代碼王座?。?/h1>
0
分享至

就在今天凌晨,AI領(lǐng)域迎來了一場足以改寫行業(yè)格局的重磅發(fā)布!Anthropic正式推出其旗艦模型Claude Opus 4.5,以令人震驚的定價策略和突破性的性能表現(xiàn),在大模型戰(zhàn)場上投下了一枚"核彈"。這不僅是技術(shù)迭代,更是一場深刻的市場革命——API調(diào)用成本直降三分之二,在嚴格的軟件工程測試中歷史性地超越所有人類工程師,標志著AI技術(shù)正式邁入一個全新的發(fā)展階段。



頂級AI能力進入普惠時代

Anthropic此次的定價調(diào)整堪稱"毀滅性打擊"。具體來看,Opus 4.5的輸入token價格從之前的每百萬15美元驟降至5美元,輸出token價格從75美元暴跌至25美元,整體降幅達到了驚人的67%!這一價格水平甚至讓許多競爭對手的中端模型都顯得黯然失色。

更值得關(guān)注的是,Anthropic同時宣布了一系列普惠性政策:32K上下文窗口現(xiàn)在完全免費開放,此前需要額外付費的"無限對話"功能也向所有付費用戶全面開放。這意味著開發(fā)者和企業(yè)用戶現(xiàn)在可以用更低的成本,享受到更強大的AI能力。



Anthropic產(chǎn)品負責人Scott White在接受CNBC專訪時表示:"我們真切地希望確保這項技術(shù)能夠為所有想要使用這些模型的人真正發(fā)揮作用。我們的核心關(guān)注點始終是:如何讓Claude更好地幫助您完成那些在工作中不一定想親自處理的任務?"

編碼能力首次超越人類專家

在最具權(quán)威性和挑戰(zhàn)性的SWE-bench Verified測試中,Opus 4.5取得了80.9%的驚人成績。這一表現(xiàn)不僅顯著超越了OpenAI剛剛發(fā)布的GPT-5.1-Codex-Max(77.9%)和谷歌上周推出的Gemini 3 Pro(76.2%),更在Anthropic內(nèi)部最嚴格的工程能力測試中創(chuàng)造了新的歷史記錄。



"在我們規(guī)定的2小時時限內(nèi),Claude Opus 4.5的得分高于任何人類候選人",Anthropic在官方博客中鄭重宣布。這項測試原本是為選拔頂級性能工程師而設計的,專門評估候選人在時間壓力下的技術(shù)能力和專業(yè)判斷力。



雖然公司方面謹慎地表示,這項測試并不衡量候選人可能具備的其他關(guān)鍵技能,如協(xié)作、溝通或多年經(jīng)驗形成的本能,但這一里程碑式的結(jié)果無疑引發(fā)了業(yè)界對"AI將如何重塑工程技術(shù)行業(yè)"的深度思考。

智能與成本的完美平衡

Opus 4.5引入了創(chuàng)新的"努力參數(shù)"(effort parameter)機制,讓開發(fā)者能夠在性能與成本之間找到最佳平衡點。這一設計充分體現(xiàn)了Anthropic對實際應用場景的深刻理解。

具體數(shù)據(jù)顯示,在中等努力水平設置下,Opus 4.5能夠匹配Sonnet 4.5在SWE-bench Verified上的最佳表現(xiàn),同時輸出token使用量減少了76%。而在高等努力水平下,Opus 4.5的性能比Sonnet 4.5高出4.3個百分點,同時token使用量仍減少48%

這種效率提升在實際企業(yè)應用中產(chǎn)生了顯著效果。GitHub首席產(chǎn)品官Mario Rodriguez證實:"早期測試顯示,Opus 4.5在內(nèi)部編碼基準測試中表現(xiàn)卓越,同時將token使用量減半,特別適合代碼遷移和代碼重構(gòu)等復雜任務。"

Replit總裁Michele Catasta進一步補充道:"Opus 4.5在我們的內(nèi)部基準測試中擊敗了Sonnet 4.5和競爭對手,同時使用更少的token解決相同問題。在規(guī)模應用中,這種效率優(yōu)勢將產(chǎn)生復合效應。"

AI智能體學會自主優(yōu)化

更令人驚嘆的是,Opus 4.5展現(xiàn)出了前所未有的自我優(yōu)化能力。日本電商巨頭樂天公司的測試結(jié)果令人震驚:基于Opus 4.5的AI代理僅用4次迭代就達到了峰值性能,而其他模型即使經(jīng)過10次迭代仍無法達到同等質(zhì)量水平。

樂天商業(yè)AI總經(jīng)理Yusuke Kaji表示:"我們的代理能夠自主優(yōu)化自身能力——在4次迭代中就達到了峰值性能,而其他模型即使在10次迭代后也無法匹配這種質(zhì)量。"

Anthropic的Albert解釋說,這種能力并非模型在更新自身的權(quán)重參數(shù),而是在迭代改進解決問題的工具和方法。"它在一個任務中迭代優(yōu)化某項技能,試圖通過優(yōu)化技能來獲得更好的性能,從而完成這個任務。"

這種自我進化能力不僅限于編碼任務。Albert表示,Anthropic在創(chuàng)建專業(yè)文檔、電子表格和演示文稿等方面也觀察到了顯著的改進。"測試者告訴我們,這是他們在模型代際之間見過的最大的飛躍,甚至從Sonnet 4.5到Opus 4.5的進步,比過去任何兩個連續(xù)模型之間的進步都要大。"

全面升級的工作流集成

伴隨著模型的重磅發(fā)布,Anthropic同步推出了一系列生產(chǎn)力工具的重大更新:

Claude for Chrome現(xiàn)已全面向所有Max用戶開放,實現(xiàn)了真正的跨瀏覽器智能操作能力。用戶現(xiàn)在可以在瀏覽器標簽頁中無縫使用Claude的各項功能,大大提升了工作效率。

Claude for Excel正式面向Max、Team和Enterprise用戶發(fā)布,新增了對數(shù)據(jù)透視表、圖表分析和文件上傳等高級功能的支持。這意味著財務分析師、顧問和會計師等知識工作者現(xiàn)在可以更高效地處理復雜的數(shù)據(jù)分析任務。

桌面版Claude Code現(xiàn)在支持本地與云端開發(fā)會話的并行運行,為開發(fā)者提供了前所未有的靈活性。同時,新引入的"程序化工具調(diào)用"功能允許Claude直接編寫和執(zhí)行代碼來調(diào)用函數(shù),極大地擴展了其自動化能力。

企業(yè)級防護能力全面提升

在安全性能方面,Opus 4.5展現(xiàn)了顯著的進步。根據(jù)Anthropic發(fā)布的系統(tǒng)卡數(shù)據(jù),新模型在抵御提示注入攻擊方面的穩(wěn)健性大幅提升:

在單次提示注入攻擊測試中,Opus 4.5的成功率僅為4.7%,遠低于Gemini 3 Pro的12.5%和GPT-5.1的12.6%。即使在10次攻擊嘗試下,成功率也控制在33.6%,相比競爭對手的60.7%和58.2%有了明顯改善。



在代理編碼評估中,Opus 4.5對150個惡意編碼請求的拒絕率達到了100%,展現(xiàn)了出色的安全防護能力。不過,在Claude Code環(huán)境下測試惡意軟件創(chuàng)建、DDoS攻擊代碼編寫等場景時,模型的拒絕率約為78%,而在計算機使用場景中的拒絕率超過88%,這說明在特定環(huán)境下仍需保持警惕。

開發(fā)生態(tài):為下一代AI應用奠基

Anthropic此次還對Claude開發(fā)者平臺進行了重要升級。增強的上下文管理和內(nèi)存功能使代理任務性能提升了近15%,而新的多代理協(xié)調(diào)能力讓構(gòu)建復雜AI系統(tǒng)變得更加可行。



這些改進在實際應用中已經(jīng)產(chǎn)生了顯著效果。金融建模公司Fundamental Research Labs聯(lián)合創(chuàng)始人Nico Christie報告稱:"在我們內(nèi)部的評估中,準確率提高了20%,效率提升了15%,曾經(jīng)看似無法完成的復雜任務現(xiàn)在變得可以實現(xiàn)了。"

Cursor CEO Michael Truell評價道:"Opus 4.5相比之前的Claude模型在Cursor內(nèi)部有了顯著改進,在困難編碼任務上具有更好的定價和智能表現(xiàn)。"Cognition CEO Scott Wu補充說:"該模型在我們最困難的評估中提供了更強結(jié)果,并在30分鐘自主編碼會話中保持了一致的性能。"

AI民主化進程加速

此次發(fā)布正值A(chǔ)I競爭進入白熱化階段——OpenAI在上周剛剛推出GPT-5.1系列,谷歌的Gemini 3也才亮相七天。Anthropic在短短兩個月內(nèi)完成了Haiku、Sonnet、Opus三個產(chǎn)品線的迭代更新,展現(xiàn)了驚人的研發(fā)速度和技術(shù)積累。

更令人印象深刻的是,Anthropic在2025年第一季度實現(xiàn)了20億美元的年化收入,較前期的10億美元翻了一番。年消費超過10萬美元的客戶數(shù)量同比增長了八倍,這充分顯示了市場對其技術(shù)的高度認可。

Albert坦言,這種快速的發(fā)布節(jié)奏部分得益于使用Claude來加速自身開發(fā)。"我們在實際產(chǎn)品構(gòu)建和模型研究方面都看到了Claude本身的很多協(xié)助和加速作用。"

當AI在專業(yè)工程測試中開始系統(tǒng)性超越人類專家,我們正站在一個歷史性的轉(zhuǎn)折點上。Claude Opus 4.5的發(fā)布不僅代表了技術(shù)的突破,更預示著工作方式的根本性變革。這一刻,我們見證的不僅是另一個AI模型的發(fā)布,而是智能計算新時代的開啟。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
日本剛部署導彈,中國就取消所有中日航班!王毅:不許日本翻案

日本剛部署導彈,中國就取消所有中日航班!王毅:不許日本翻案

井普椿的獨白
2026-03-12 18:15:06
美因石油漲價放寬對俄制裁

美因石油漲價放寬對俄制裁

界面新聞
2026-03-13 08:43:29
保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

今夜有個好故事
2026-03-11 17:26:56
叫停采購!中國再出手!必和必拓急了!

叫停采購!中國再出手!必和必拓急了!

新浪財經(jīng)
2026-03-12 21:54:35
這才是標準的東方美人,長相柔和大氣,端莊優(yōu)雅,一臉旺夫相!

這才是標準的東方美人,長相柔和大氣,端莊優(yōu)雅,一臉旺夫相!

可樂談情感
2026-03-13 09:21:04
20+11不是張子宇極限!梅斯曼送女籃2句忠告,王思雨楊舒予尷尬了

20+11不是張子宇極限!梅斯曼送女籃2句忠告,王思雨楊舒予尷尬了

后仰大風車
2026-03-13 07:10:09
“鐵飯碗”太香!網(wǎng)傳武漢一銀行員工月公積金8053元,余額82萬多

“鐵飯碗”太香!網(wǎng)傳武漢一銀行員工月公積金8053元,余額82萬多

火山詩話
2026-03-13 07:42:10
伊朗都敢打美軍基地,解放軍憑啥不打?美專家:反華決戰(zhàn)失算

伊朗都敢打美軍基地,解放軍憑啥不打?美專家:反華決戰(zhàn)失算

滄海旅行家
2026-03-12 15:19:17
“臭哄大炕有啥可顯擺的”,東北嫡長女被嘲沒教養(yǎng),難登大雅之堂

“臭哄大炕有啥可顯擺的”,東北嫡長女被嘲沒教養(yǎng),難登大雅之堂

妍妍教育日記
2026-03-11 18:07:53
深圳能源大廈,“看得我強迫癥都要犯了”

深圳能源大廈,“看得我強迫癥都要犯了”

GA環(huán)球建筑
2026-03-13 00:14:29
《逐玉》熱播,女主田曦薇扛的豬被浙江網(wǎng)友一眼認出:金華兩頭烏!本地人認證:真的很好吃

《逐玉》熱播,女主田曦薇扛的豬被浙江網(wǎng)友一眼認出:金華兩頭烏!本地人認證:真的很好吃

極目新聞
2026-03-10 17:14:59
蘇桂浙粵等地多個學校取消家長護學崗,有關(guān)部門回復:家長護學崗原本就是不強制的,是否取消以每個學校的具體通知為準

蘇桂浙粵等地多個學校取消家長護學崗,有關(guān)部門回復:家長護學崗原本就是不強制的,是否取消以每個學校的具體通知為準

大風新聞
2026-03-12 17:48:02
央視直播13日重慶冠軍賽,孫穎莎對迪亞茲,梁靖崑戰(zhàn)邱黨

央視直播13日重慶冠軍賽,孫穎莎對迪亞茲,梁靖崑戰(zhàn)邱黨

乒乓球球
2026-03-12 22:18:45
伊朗警察總長:街頭即戰(zhàn)場,抗議者是敵人

伊朗警察總長:街頭即戰(zhàn)場,抗議者是敵人

老馬拉車莫少裝
2026-03-11 07:55:28
人大代表哽咽為農(nóng)民發(fā)聲:每月百元養(yǎng)老金咋活?多部委連夜回應

人大代表哽咽為農(nóng)民發(fā)聲:每月百元養(yǎng)老金咋活?多部委連夜回應

夏末moent
2026-03-12 21:19:45
光漂亮有何用?全場3中0,0板0斷0帽+空籃不中,球迷:用高頌換她

光漂亮有何用?全場3中0,0板0斷0帽+空籃不中,球迷:用高頌換她

法老不說教
2026-03-12 12:24:44
猛降10℃!長沙將迎降溫降雨!

猛降10℃!長沙將迎降溫降雨!

環(huán)球網(wǎng)資訊
2026-03-13 09:07:01
美伊沖突升級致臺灣能源告急,臺當局向大陸求援,國臺辦明確答復

美伊沖突升級致臺灣能源告急,臺當局向大陸求援,國臺辦明確答復

風眼軍情
2026-03-11 20:33:18
兩極反轉(zhuǎn)?國產(chǎn)特斯拉2月銷量暴漲91%,比亞迪跌了65%

兩極反轉(zhuǎn)?國產(chǎn)特斯拉2月銷量暴漲91%,比亞迪跌了65%

泡泡網(wǎng)
2026-03-12 11:42:30
無名指比食指長的人,不是普通人,是帶天命而來

無名指比食指長的人,不是普通人,是帶天命而來

糖逗在娛樂
2026-03-12 18:20:44
2026-03-13 11:48:49

山自 incentive-icons
山自
寫點有趣的。關(guān)注自動駕駛和AI商業(yè)變革。
120文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

兩伊朗高官被疑是"內(nèi)鬼" 其中一人多次在襲擊中"幸存"

頭條要聞

兩伊朗高官被疑是"內(nèi)鬼" 其中一人多次在襲擊中"幸存"

體育要聞

叕戰(zhàn)奧運,張雨霏要做回“小將”

娛樂要聞

小S復工錄制 感謝賈永婕陪大S走到最后

財經(jīng)要聞

"短劇"苦抄襲

汽車要聞

本田汽車全年業(yè)績由盈轉(zhuǎn)虧 高管們降薪3個月以擔責

態(tài)度原創(chuàng)

藝術(shù)
家居
教育
時尚
游戲

藝術(shù)要聞

吳冠中:歷代畫竹大都缺乏厚度與深度

家居要聞

藝術(shù)之家 法式優(yōu)雅

教育要聞

治愈,不是讓你活成不倒的“神”:允許脆弱,自我確信,向內(nèi)探求

當世界變得復雜,時裝開始變得清晰

《1348:圣誓》天崩開局 玩家嘲諷:那些支持覺醒的人呢?

無障礙瀏覽 進入關(guān)懷版