国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude Opus 4.7 來(lái)了,編程能力又炸了

Claude Opus4.7

0
分享至

今天繼續(xù)聊 Claude —— Anthropic 剛剛正式發(fā)布了 Claude Opus 4.7,編程能力這次又是一次暴擊

Benchmark 一覽

下圖是 Anthropic 給出的跨領(lǐng)域 benchmark 對(duì)比,Opus 4.7 在大多數(shù)任務(wù)上超過(guò)了 Opus 4.6,以及 GPT-5.4 和 Gemini 3.1 Pro:


Claude Opus 4.7 跨領(lǐng)域 Benchmark 對(duì)比 它比 Opus 4.6 強(qiáng)在哪?

Anthropic 官方說(shuō),Opus 4.7 在高級(jí)軟件工程上是 Opus 4.6 的「顯著提升」,尤其是在那些最難的任務(wù)上

這話我本來(lái)要打個(gè)折,但看了一圈測(cè)試用戶的反饋之后,我信了

幾個(gè)讓我印象深刻的數(shù)據(jù):

  • Cursor :在 93 個(gè)編程任務(wù)的 benchmark 上,任務(wù)解決率比 Opus 4.6 **提升了 13%**,包括 4 個(gè) Opus 4.6 和 Sonnet 4.6 都搞不定的任務(wù)

  • Rakuten :在 SWE-bench 上,Opus 4.7 解決的真實(shí)生產(chǎn) bug 是 Opus 4.6 的 3 倍 。

  • XBOW(自主滲透測(cè)試) :視覺(jué)準(zhǔn)確性從 Opus 4.6 的 54.5% 直接干到 **98.5%**,這簡(jiǎn)直是量變引發(fā)質(zhì)變

  • Notion :工具調(diào)用準(zhǔn)確率和規(guī)劃能力提升超過(guò) **10%**,更難得的是,它是第一個(gè)通過(guò)隱式需求測(cè)試(implicit-need tests)的模型

視覺(jué)能力:分辨率翻了 3 倍多

這次 Opus 4.7 的視覺(jué)升級(jí)幅度相當(dāng)大

之前的 Claude 模型能接受的圖片分辨率,現(xiàn)在 Opus 4.7 可以接受最長(zhǎng)邊 2,576 像素(約 3.75 百萬(wàn)像素),是之前版本的 3 倍以上

這意味著什么?

  • 讀密集截圖的 computer-use agent,再也不會(huì)因?yàn)槲淖痔】床磺宥鲥e(cuò)

  • 從復(fù)雜圖表里提取數(shù)據(jù),精度大幅提升

  • 科學(xué)、法律文檔里那些需要像素級(jí)精準(zhǔn)的工作,終于能干了

來(lái)自 Solve Intelligence(生命科學(xué)專利工作流)的反饋印證了這一點(diǎn):從化學(xué)結(jié)構(gòu)式到復(fù)雜技術(shù)圖紙,理解能力大幅躍升

注意這是模型層面的變化,不是 API 參數(shù),圖片會(huì)自動(dòng)以更高精度處理。但因?yàn)楦叻直媛蕡D片消耗 token 更多,如果你不需要那么高的精度,可以在發(fā)送前先降采樣

指令遵循:這次是認(rèn)真的

Opus 4.7 在指令遵循上大幅提升

聽起來(lái)是好事,但 Anthropic 自己也提醒了:之前給舊模型寫的 prompt,有時(shí)候會(huì)跑出意外結(jié)果——因?yàn)榕f模型對(duì)指令是「松散理解」甚至跳過(guò)某些部分,現(xiàn)在 Opus 4.7 是字面意思照單全收

所以如果你是 API 用戶,升級(jí)前最好重新審視一下你的 prompt,該精確的地方要精確,該刪掉的廢話要?jiǎng)h掉

新功能:xhigh 努力等級(jí)

Opus 4.7 引入了全新的 xhigh(extra high)努力等級(jí),介于原來(lái)的 highmax 之間

這給用戶提供了更細(xì)粒度的控制:在硬問(wèn)題上,你可以選擇在「思考質(zhì)量」和「響應(yīng)延遲」之間找到更合適的平衡點(diǎn)

在 Claude Code 里,現(xiàn)在默認(rèn)把所有計(jì)劃的努力等級(jí)提升到了 xhigh

官方建議在編程和 Agent 場(chǎng)景下測(cè)試時(shí),從 highxhigh 開始

下圖是不同努力等級(jí)下,token 使用量和任務(wù)得分的關(guān)系:


不同努力等級(jí)下的 token 使用量與任務(wù)得分對(duì)比 網(wǎng)絡(luò)安全:先邁一步,但很謹(jǐn)慎

Anthropic 上周公布了 Project Glasswing,直面 AI 在網(wǎng)絡(luò)安全領(lǐng)域的兩面性——風(fēng)險(xiǎn)與機(jī)遇。

Opus 4.7 是 Glasswing 框架下第一個(gè)正式落地的模型,它的網(wǎng)絡(luò)安全能力不如 Claude Mythos Preview(目前最強(qiáng)的 Anthropic 模型),Anthropic 在訓(xùn)練階段專門做了差異化處理,有意限制了部分網(wǎng)絡(luò)安全能力

同時(shí),Opus 4.7 配備了自動(dòng)檢測(cè)和攔截高危網(wǎng)絡(luò)安全請(qǐng)求的防護(hù)機(jī)制

真正有合法需求的安全研究人員、滲透測(cè)試工程師,可以通過(guò) Cyber Verification Program 加入白名單

這條路子我覺(jué)得挺對(duì)的:先在能力較弱的模型上驗(yàn)證防護(hù)機(jī)制是否有效,積累經(jīng)驗(yàn)后,再逐步向更強(qiáng)的 Mythos 級(jí)別模型開放

安全性測(cè)評(píng)
Claude Opus 4.7 行為審計(jì)評(píng)分

在安全對(duì)齊方面,Opus 4.7 和 Opus 4.6 整體差不多——欺騙行為、諂媚、濫用配合率都處于低水平

部分維度(比如誠(chéng)實(shí)性、對(duì)抗 prompt 注入攻擊)比 4.6 有改進(jìn),少數(shù)地方(比如有害物質(zhì)信息的過(guò)度詳細(xì)回復(fù))略微退步

整體結(jié)論:「大體對(duì)齊、基本可信,但還沒(méi)達(dá)到理想狀態(tài)」

Mythos Preview 依然是 Anthropic 目前對(duì)齊效果最好的模型

價(jià)格 & 可用性

好消息:價(jià)格不變,和 Opus 4.6 一樣:

  • 輸入:**$5 / 百萬(wàn) tokens**

  • 輸出:**$25 / 百萬(wàn) tokens**

支持平臺(tái):

  • Claude 全產(chǎn)品線

  • Claude API(模型 ID: claude-opus-4-7

  • Amazon Bedrock

  • Google Cloud Vertex AI

  • Microsoft Foundry

還有這些新東西一起上

隨 Opus 4.7 一起發(fā)布的還有幾個(gè)配套更新:

  1. /ultrareview 命令 (Claude Code):一鍵啟動(dòng)深度代碼審查,像一個(gè)認(rèn)真的 reviewer 一樣幫你找 bug 和設(shè)計(jì)問(wèn)題,Pro 和 Max 用戶各有 3 次免費(fèi)試用額度。

  2. Task Budgets(公測(cè)) (API):給開發(fā)者一個(gè)新機(jī)制,引導(dǎo) Claude 在長(zhǎng)任務(wù)中合理分配 token 預(yù)算,避免前緊后松或前松后緊

  3. Auto Mode 擴(kuò)展 :Max 用戶現(xiàn)在也可以開啟 Auto Mode,讓 Claude 在長(zhǎng)任務(wù)里自主決策權(quán)限請(qǐng)求,減少中斷

升級(jí)注意事項(xiàng)

如果你在生產(chǎn)上用 Opus 4.6,升級(jí)到 4.7 有兩個(gè)點(diǎn)要注意:

  1. 新 tokenizer :同樣的輸入,token 數(shù)大約會(huì)增加 1.0–1.35 倍 ,取決于內(nèi)容類型

  2. 更高努力等級(jí)下思考更多 :尤其是 Agent 場(chǎng)景的后續(xù)對(duì)話輪次,輸出 token 會(huì)增加

Anthropic 提供了遷移指南,建議先在真實(shí)流量上測(cè)一下差異

總結(jié)

Opus 4.7 的核心關(guān)鍵詞:編程更強(qiáng)、視覺(jué)更清、指令更準(zhǔn)、安全更嚴(yán)

如果你是:

  • Claude Code 用戶 :直接用,默認(rèn)已升級(jí)到 xhigh 努力等級(jí),新的 /ultrareview 也很值得試

  • API 開發(fā)者 :記得重新調(diào) prompt,關(guān)注 token 用量變化,遷移指南先讀一遍

  • 網(wǎng)絡(luò)安全從業(yè)者 :有合法需求的走 Cyber Verification Program

最讓我感興趣的其實(shí)是這個(gè)關(guān)于「更好同事」的描述——一個(gè)會(huì)在技術(shù)討論中反駁你、幫你做出更好決定的 AI

這可能才是 AI 應(yīng)該有的樣子,不是附和你,是真的幫你。

.7

制作不易,如果這篇文章覺(jué)得對(duì)你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日本壟斷全球90%!一旦斷供,別國(guó)造不出,中國(guó)咋辦?

日本壟斷全球90%!一旦斷供,別國(guó)造不出,中國(guó)咋辦?

今墨緣
2026-04-14 09:57:22
NBA賽季最佳教練?奧尼爾:我選烏度卡,不知道馬刺教練是誰(shuí)

NBA賽季最佳教練?奧尼爾:我選烏度卡,不知道馬刺教練是誰(shuí)

懂球帝
2026-04-20 21:15:08
爭(zhēng)議?對(duì)手疑似伸腿踹張雪機(jī)車惹怒中國(guó)網(wǎng)友 張雪:很正常+很干凈

爭(zhēng)議?對(duì)手疑似伸腿踹張雪機(jī)車惹怒中國(guó)網(wǎng)友 張雪:很正常+很干凈

風(fēng)過(guò)鄉(xiāng)
2026-04-20 06:45:19
俄羅斯馬戲團(tuán)老虎演出時(shí)躍入觀眾席 部分觀眾一動(dòng)不動(dòng) 網(wǎng)友:不愧是戰(zhàn)斗民族

俄羅斯馬戲團(tuán)老虎演出時(shí)躍入觀眾席 部分觀眾一動(dòng)不動(dòng) 網(wǎng)友:不愧是戰(zhàn)斗民族

快科技
2026-04-20 20:11:33
軍事 | 與自衛(wèi)隊(duì)有關(guān)的一系列事情,他們不是普通地刷存在感!

軍事 | 與自衛(wèi)隊(duì)有關(guān)的一系列事情,他們不是普通地刷存在感!

新民周刊
2026-04-20 09:08:09
我敢說(shuō),大部分會(huì)跟我一樣,選擇黑色衣服那個(gè)女孩!

我敢說(shuō),大部分會(huì)跟我一樣,選擇黑色衣服那個(gè)女孩!

草莓解說(shuō)體育
2026-04-12 17:05:01
中國(guó)航司大面積取消日本航班,武漢已無(wú)直飛日本航班

中國(guó)航司大面積取消日本航班,武漢已無(wú)直飛日本航班

極目新聞
2026-04-19 19:55:25
何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

扒點(diǎn)半吃瓜
2026-03-10 07:00:13
提到本山大叔家的公子趙大牛,他的座駕在沈陽(yáng)街頭可算相當(dāng)拉風(fēng)。

提到本山大叔家的公子趙大牛,他的座駕在沈陽(yáng)街頭可算相當(dāng)拉風(fēng)。

情感大頭說(shuō)說(shuō)
2026-04-12 05:21:17
打臉的冷知識(shí):這9樣?xùn)|西,“反著用”效果更好,別再為難自己了

打臉的冷知識(shí):這9樣?xùn)|西,“反著用”效果更好,別再為難自己了

摳搜俠
2026-04-18 14:25:36
孫藝珍曬兒子拍的合影,她穿玄彬外套給玄彬臉打貼紙,真的好幸福

孫藝珍曬兒子拍的合影,她穿玄彬外套給玄彬臉打貼紙,真的好幸福

動(dòng)物奇奇怪怪
2026-04-20 18:51:04
富國(guó)銀行:全球經(jīng)濟(jì)已進(jìn)入第四輪 “貨幣貶值周期” 金價(jià)2027年或飆升至8000美元

富國(guó)銀行:全球經(jīng)濟(jì)已進(jìn)入第四輪 “貨幣貶值周期” 金價(jià)2027年或飆升至8000美元

財(cái)聯(lián)社
2026-04-20 10:26:41
姐夫手術(shù)我墊50萬(wàn),他們不提還錢,今年他二次病危,姐撥99通電話

姐夫手術(shù)我墊50萬(wàn),他們不提還錢,今年他二次病危,姐撥99通電話

千秋文化
2026-04-20 19:48:09
外媒爆料:特朗普情緒失控,大吼大叫數(shù)小時(shí),啥事情讓他恐懼?

外媒爆料:特朗普情緒失控,大吼大叫數(shù)小時(shí),啥事情讓他恐懼?

地球記
2026-04-21 01:04:56
革命衛(wèi)隊(duì)與伊朗政府矛盾公開化,伊朗內(nèi)部分裂愈演愈烈

革命衛(wèi)隊(duì)與伊朗政府矛盾公開化,伊朗內(nèi)部分裂愈演愈烈

修明札記
2026-04-19 11:47:24
英媒:拉爵當(dāng)初收到切爾西對(duì)加納喬的報(bào)價(jià)時(shí)笑得合不攏嘴

英媒:拉爵當(dāng)初收到切爾西對(duì)加納喬的報(bào)價(jià)時(shí)笑得合不攏嘴

懂球帝
2026-04-21 00:47:56
AI算力爆發(fā)!算力租賃10大龍頭,業(yè)績(jī)暴漲、訂單鎖死至2028年

AI算力爆發(fā)!算力租賃10大龍頭,業(yè)績(jī)暴漲、訂單鎖死至2028年

我不叫阿哏
2026-04-19 11:54:29
中考政策重磅調(diào)整!2026年6月前執(zhí)行,全國(guó)初三生都將受影響

中考政策重磅調(diào)整!2026年6月前執(zhí)行,全國(guó)初三生都將受影響

戶外阿毽
2026-04-19 01:05:28
獎(jiǎng)金28萬(wàn)!丁俊暉10-5晉級(jí)世錦賽16強(qiáng),會(huì)師趙心童,比賽時(shí)間如下

獎(jiǎng)金28萬(wàn)!丁俊暉10-5晉級(jí)世錦賽16強(qiáng),會(huì)師趙心童,比賽時(shí)間如下

侃球熊弟
2026-04-20 19:47:11
57歲好萊塢女星太敢說(shuō):自曝生猛夫妻生活,不用生娃更盡興

57歲好萊塢女星太敢說(shuō):自曝生猛夫妻生活,不用生娃更盡興

橙星文娛
2026-04-18 16:47:02
2026-04-21 03:00:49
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3339文章數(shù) 11138關(guān)注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價(jià)10999元起

頭條要聞

19歲女孩挪用自家1700萬(wàn)當(dāng)"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬(wàn)當(dāng)"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂(lè)要聞

《八千里路云和月》田家泰暗殺

財(cái)經(jīng)要聞

利潤(rùn)暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

健康
手機(jī)
親子
旅游
藝術(shù)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

手機(jī)要聞

OPPO影像旗艦高端發(fā)力 Find X9 Ultra走出國(guó)門

親子要聞

【孤獨(dú)癥科普】啥是孤獨(dú)癥,哪些孩子易發(fā)生,如何應(yīng)對(duì)?

旅游要聞

以“Fun”為名,深圳布吉將發(fā)布全域旅游品牌IP

藝術(shù)要聞

沙特官宣:全球最大單體建筑,延期十年!網(wǎng)友:又是畫餅?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版