国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,Claude Opus 4.7突然發(fā)布:不是最強(qiáng),但奧特曼又得失眠

0
分享至


今年 Anthropic 的勢(shì)頭異常兇猛。

不僅熱度居高不下,口碑也持續(xù)攀升,穩(wěn)坐 AI 圈「頂流」的交椅。現(xiàn)在幾乎每天醒來(lái),都能看到他們準(zhǔn)點(diǎn)推送的新產(chǎn)品或新功能。久而久之,大家也從興奮變成了「是你,果然又是你」的默契感。

而就在剛剛,萬(wàn)眾期待的 Claude Opus 4.7 也正式發(fā)布,依舊是熟悉的配方,熟悉的高分選手。


有趣的是,Anthropic 在公告里非常坦誠(chéng),甚至帶著點(diǎn)驕傲:「這并非我們最強(qiáng)大的模型?!鼓莻€(gè)傳說(shuō)強(qiáng)得可怕的 Claude Mythos Preview 依然還在藏。

但就是這個(gè)并非最強(qiáng)的 Opus 4.7,卻依舊引發(fā)了極大的關(guān)注。因?yàn)樗鉀Q了一個(gè)比聰明更重要的痛點(diǎn):靠譜。不是那種你說(shuō)什么它就做什么的靠譜,而是當(dāng)你提出一個(gè)愚蠢的方案時(shí),它敢于反駁你,并自己把坑填上的靠譜。

當(dāng)靠譜成為比聰明更稀缺的品質(zhì)

基準(zhǔn)測(cè)試結(jié)果顯示,在業(yè)界公認(rèn)最硬核的 SWE-bench Pro 上,4.7 從前代的 53.4% 直接拉到 64.3%,單代升級(jí)漲了近 11 個(gè)百分點(diǎn),把 GPT-5.4(57.7%)和 Gemini 3.1 Pro(54.2%)都甩在了身后。

視覺(jué)推理的 CharXiv 基準(zhǔn)從 69.1% 跳到 82.1%,對(duì)應(yīng)的是它新獲得的 2576 像素長(zhǎng)邊識(shí)別能力——清晰度是前代的 3 倍以上。

這不只是「看得更清楚」這么簡(jiǎn)單。更高的分辨率直接帶動(dòng)了輸出質(zhì)量的連鎖提升:生成界面、制作幻燈片、排版文檔,細(xì)節(jié)精度也全面提升。

工具調(diào)用規(guī)?;u(píng)測(cè) MCP-Atlas 上,4.7 跑出 77.3%,超過(guò) GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺(tái) Harvey 測(cè)試中,4.7 在 BigLaw 基準(zhǔn)上拿下 90.9%,正確區(qū)分了歷來(lái)是前沿模型死穴的「轉(zhuǎn)讓條款」與「控制權(quán)變更條款」。


不過(guò),4.7 也并非全然遙遙領(lǐng)先,在 Agentic search 評(píng)測(cè) BrowseComp 上,4.7 反而從前代的 83.7% 下降到了 79.3%,被 GPT-5.4(89.3%)和 Gemini(85.9%)超越。

這個(gè)退步并非偶然。一個(gè)遇到缺失信息會(huì)直接報(bào)錯(cuò)、不肯亂編答案的 Agent,在以「是否給出答案」為評(píng)判標(biāo)準(zhǔn)的基準(zhǔn)上,天然會(huì)吃虧。

而數(shù)據(jù)之外,更值得關(guān)注的問(wèn)題是:這種「靠譜」,在真實(shí)工作里到底意味著什么?

過(guò)去一年,業(yè)界對(duì)代碼大模型的期待,普遍還停留在「寫個(gè)函數(shù)、找個(gè) Bug」的層面,但 Claude 4.7 在早期測(cè)試?yán)?,展現(xiàn)出了一種截然不同的氣質(zhì)。

知名云端開發(fā)平臺(tái) Replit 的負(fù)責(zé)人這樣描述:「它在技術(shù)討論中會(huì)反駁我,幫我做出更好的決定。它真的感覺(jué)像一個(gè)更好的同事?!?/p>


它不再一味地「唯命是從」,也不再為了交差而胡編亂造。在數(shù)據(jù)科學(xué)平臺(tái) Hex 的測(cè)試?yán)铮?.7 遇到缺失數(shù)據(jù)時(shí)會(huì)直接報(bào)錯(cuò),而不是像前代那樣塞一個(gè)「看似合理但完全錯(cuò)誤」的備選值。Hex 團(tuán)隊(duì)甚至直言:「低消耗狀態(tài)下的 4.7,等同于中等消耗狀態(tài)下的 4.6?!?/p>

這種「拒絕順從」的特質(zhì),恰恰是高級(jí)軟件工程里最稀缺的東西。

當(dāng)然,凡事有兩面。為舊模型寫的 prompt,到了 4.7 手里可能會(huì)產(chǎn)生意想不到的結(jié)果。那些過(guò)去被模型「意會(huì)」掉的模糊指令,4.7 會(huì)一字一字地字面執(zhí)行。這也意味著越懂得清楚表達(dá)需求的人,越能從 4.7 這里拿到好結(jié)果。

光會(huì)「頂嘴」還不夠,遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個(gè)大的變化,是任務(wù)韌性。


以往大模型在多步任務(wù)中遇到工具調(diào)用失敗,往往直接停機(jī)報(bào)錯(cuò)。Notion 團(tuán)隊(duì)測(cè)試發(fā)現(xiàn),4.7 的工具錯(cuò)誤率降到了原來(lái)的三分之一,更關(guān)鍵的是,它能在工具鏈崩潰時(shí)自己繞過(guò)障礙,繼續(xù)把任務(wù)跑完。

當(dāng) AI 停止諂媚,真正的生產(chǎn)力才開始爆發(fā)。

Anthropic 公布的一個(gè)極端案例里,4.7 在沒(méi)有任何人類干預(yù)的情況下,從零構(gòu)建了一個(gè)完整的 Rust 文本轉(zhuǎn)語(yǔ)音引擎——寫神經(jīng)網(wǎng)絡(luò)模型、SIMD 內(nèi)核和瀏覽器演示,還自己把輸出喂給語(yǔ)音識(shí)別器做驗(yàn)證,連測(cè)試都一并完成了。

前端框架巨頭 Vercel 還發(fā)現(xiàn)了一個(gè)過(guò)去從未有過(guò)的行為:4.7 會(huì)在開始寫系統(tǒng)級(jí)代碼之前,先自己進(jìn)行數(shù)學(xué)證明。這已經(jīng)超出了寫代碼的范疇,進(jìn)入了嚴(yán)謹(jǐn)工程設(shè)計(jì)的領(lǐng)域。

雇傭 AI「資深專家」的代價(jià)

為了驗(yàn)證它在細(xì)節(jié)上的處理能力,我設(shè)定了三個(gè)前端交互場(chǎng)景,評(píng)判標(biāo)準(zhǔn)只有一個(gè):細(xì)節(jié)是否敷衍,一眼便知。

第一個(gè)場(chǎng)景,是讓它做一個(gè)俯視視角的黑膠唱片機(jī)界面,其難點(diǎn)在于「金屬光澤」與「呼吸光暈」的呈現(xiàn)。4.7 并沒(méi)有用廉價(jià)的色彩漸變敷衍了事,而是通過(guò)復(fù)雜的 CSS 樣式疊加,逼真地還原了金屬質(zhì)感。


第二個(gè)場(chǎng)景是只用 CSS,不用 JavaScript 做一個(gè)老式電風(fēng)扇。 面對(duì)這個(gè)限制嚴(yán)格的題目,一些模型會(huì)悄悄違規(guī)使用 JS,但 4.7 遵守了規(guī)則。它用純 CSS 做出了風(fēng)扇的立體結(jié)構(gòu),低中高三檔過(guò)渡流暢,底座透視和陰影的處理也真有一點(diǎn)實(shí)物感,它在規(guī)則允許的范圍內(nèi)找到了很好的解決辦法。


第三個(gè)場(chǎng)景是做一個(gè)復(fù)古磁帶隨身聽,帶有錄像帶那種老舊的噪點(diǎn)效果。磁帶轉(zhuǎn)動(dòng)的細(xì)節(jié)也是有的。


當(dāng)然,變聰明是有代價(jià)的。Opus 4.7 現(xiàn)已在所有 Claude 產(chǎn)品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺(tái)上推出。

基礎(chǔ)定價(jià)維持在每百萬(wàn)輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器,同樣的文本會(huì)拆分出比原來(lái)多 1.0 到 1.35 倍的 Token。


疊加上它在高強(qiáng)度任務(wù)中本身就傾向于「多想一會(huì)兒」,實(shí)際消耗幾乎必然上升。

此外,Anthropic 在原有的難度選項(xiàng)之上,加入了全新的 xhigh(超高)級(jí)別。在這個(gè)級(jí)別下,面對(duì)復(fù)雜難題,Claude 4.7 會(huì)消耗更多的 Token,花更多的時(shí)間去「思考」。Claude Code 已經(jīng)把所有套餐的默認(rèn) effort level 直接拉到了 xhigh。

Anthropic 用行動(dòng)告訴所有人,對(duì)于真正的編碼任務(wù),省著用不如想清楚。

為了匹配這種工作流,Claude Code 順勢(shì)推出了兩個(gè)殺手級(jí)功能:

/ultrareview(深度審查):開啟一個(gè)專門的審查會(huì)話,像一個(gè)極其挑剔的資深 Reviewer 一樣,通讀所有代碼更改,精準(zhǔn)標(biāo)記出深層的架構(gòu)設(shè)計(jì)缺陷和 Bug。Pro 和 Max 用戶可以免費(fèi)試用三次。

Auto Mode(自動(dòng)模式)擴(kuò)展到 Max 用戶:一種介于「逐項(xiàng)授權(quán)」和「跳過(guò)所有權(quán)限」之間的新權(quán)限模式。Claude 會(huì)在你授權(quán)的范圍內(nèi)自主做決策,既能跑完漫長(zhǎng)無(wú)聊的任務(wù),又比完全放權(quán)更安全。

為了防止這個(gè)「太能思考」的 AI 把賬戶余額刷爆,API 端還推出了「任務(wù)預(yù)算」(Task Budgets)功能公測(cè)版,讓開發(fā)者可以顯式規(guī)劃 Claude 在長(zhǎng)任務(wù)中的 Token 支出優(yōu)先級(jí)。


當(dāng)然,4.7 并不是 Anthropic 手里最強(qiáng)的牌。

那個(gè)更強(qiáng)的 Claude Mythos Preview,本月剛以「Project Glasswing」的名義,小范圍開放給了一批企業(yè)用于網(wǎng)絡(luò)安全研究。Mythos 沒(méi)有公開發(fā)布,原因則是因?yàn)樗木W(wǎng)絡(luò)攻防能力太強(qiáng),Anthropic 覺(jué)得還沒(méi)想清楚怎么安全地推給所有人。

4.7 本身也做了主動(dòng)取舍,訓(xùn)練階段就壓低了網(wǎng)絡(luò)攻防能力,內(nèi)置自動(dòng)攔截機(jī)制,碰到高風(fēng)險(xiǎn)請(qǐng)求直接擋掉。有合規(guī)需求的安全研究人員,可以通過(guò)官方渠道單獨(dú)申請(qǐng)。

不急著把最強(qiáng)的牌打出去,和不停地往桌上加新牌,背后是同一套邏輯。實(shí)際上,Anthropic 真正的護(hù)城河,是交付節(jié)奏本身。

在今年 2 月 1 日至 3 月 24 日,短短 52 天里,Anthropic 一共更新了 74 款產(chǎn)品,平均不到兩天一個(gè)。Cowork、插件……這些動(dòng)作扎扎實(shí)實(shí)地?fù)糁辛寺殘?chǎng)辦公的痛點(diǎn)。

如今的 Claude 生態(tài),早就超越了單純的「聊天機(jī)器人」。對(duì)于那些渴望將 AI 深度嵌入實(shí)際工作流的團(tuán)隊(duì)而言,這種穩(wěn)定、高頻且可預(yù)期的更新節(jié)奏,才是最讓人感到踏實(shí)的定心丸。

今天發(fā)布的 Claude 4.7,是這條鏈條上最新的一塊壓艙石。而那個(gè) Mythos Preview,遲早也會(huì)來(lái)。到那時(shí)候,我們現(xiàn)在覺(jué)得已經(jīng)很能打的 4.7,可能只是個(gè)開端。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全場(chǎng)嘩然!29歲女子在相親舞臺(tái)稱“娶我一定讓你爽”,王婆也懵了

全場(chǎng)嘩然!29歲女子在相親舞臺(tái)稱“娶我一定讓你爽”,王婆也懵了

火山詩(shī)話
2026-04-19 06:42:57
55歲上海炒股冠軍罕見發(fā)聲:如果本金有20W,建議死磕這五條鐵律

55歲上海炒股冠軍罕見發(fā)聲:如果本金有20W,建議死磕這五條鐵律

股經(jīng)縱橫談
2026-04-19 19:03:09
以色列麻煩了!比伊朗還狠的角色,已畫下開戰(zhàn)紅線!

以色列麻煩了!比伊朗還狠的角色,已畫下開戰(zhàn)紅線!

財(cái)經(jīng)要參
2026-04-19 16:54:53
撿漏神操作!曼聯(lián)鎖定 5200 萬(wàn)皇馬巨星,完爆隊(duì)內(nèi)廢柴

撿漏神操作!曼聯(lián)鎖定 5200 萬(wàn)皇馬巨星,完爆隊(duì)內(nèi)廢柴

瀾歸序
2026-04-20 01:07:19
重磅突破!以色列科學(xué)家:吸100%純氧3個(gè)月,生理倒拔20歲

重磅突破!以色列科學(xué)家:吸100%純氧3個(gè)月,生理倒拔20歲

劉曠
2026-04-19 15:27:33
罕見!黃仁勛談芯片禁售突然情緒失控:你不是在和一個(gè)Loser說(shuō)話

罕見!黃仁勛談芯片禁售突然情緒失控:你不是在和一個(gè)Loser說(shuō)話

DeepAuto車探
2026-04-19 20:37:54
五一假期火車票開售以來(lái),鐵路12306拒絕出票105.6萬(wàn)張

五一假期火車票開售以來(lái),鐵路12306拒絕出票105.6萬(wàn)張

環(huán)球網(wǎng)資訊
2026-04-19 15:23:04
山東乳山銀灘“195平米復(fù)式房”1萬(wàn)元起拍,已有多人競(jìng)價(jià),拍賣公司:產(chǎn)證面積97.94平米,另有贈(zèng)送面積,非法拍可隨時(shí)過(guò)戶

山東乳山銀灘“195平米復(fù)式房”1萬(wàn)元起拍,已有多人競(jìng)價(jià),拍賣公司:產(chǎn)證面積97.94平米,另有贈(zèng)送面積,非法拍可隨時(shí)過(guò)戶

極目新聞
2026-04-19 14:06:31
6歲男孩為躲母親毆打,離家出走22年,長(zhǎng)大后才得知母親悲慘人生

6歲男孩為躲母親毆打,離家出走22年,長(zhǎng)大后才得知母親悲慘人生

哄動(dòng)一時(shí)啊
2026-04-19 14:38:19
以軍:打死阿里·里達(dá)·阿巴斯

以軍:打死阿里·里達(dá)·阿巴斯

南方都市報(bào)
2026-04-19 21:17:31
37歲福原愛(ài)宣布三胎出生:母子健康平安,產(chǎn)后照曝光,前夫已祝福

37歲福原愛(ài)宣布三胎出生:母子健康平安,產(chǎn)后照曝光,前夫已祝福

開開森森
2026-04-19 07:41:03
4月19日最新油價(jià),國(guó)際油價(jià)大降21.8%,國(guó)內(nèi)汽柴油“顯著”下跌中

4月19日最新油價(jià),國(guó)際油價(jià)大降21.8%,國(guó)內(nèi)汽柴油“顯著”下跌中

豬友巴巴
2026-04-19 17:30:03
小學(xué)生拒絕“借”車遭毆打還被搜家,8人未滿14歲不處罰、1人被處行拘免執(zhí)行,家長(zhǎng)稱看施暴視頻氣得吃救心丸

小學(xué)生拒絕“借”車遭毆打還被搜家,8人未滿14歲不處罰、1人被處行拘免執(zhí)行,家長(zhǎng)稱看施暴視頻氣得吃救心丸

極目新聞
2026-04-19 22:39:27
烏克蘭對(duì)俄本土發(fā)起狂風(fēng)暴雨打擊,俄羅斯遭遇黑色星期六

烏克蘭對(duì)俄本土發(fā)起狂風(fēng)暴雨打擊,俄羅斯遭遇黑色星期六

史政先鋒
2026-04-19 19:18:27
重現(xiàn)死亡之瞳!詹姆斯19+8+13單核制勝 創(chuàng)8項(xiàng)紀(jì)錄+4項(xiàng)歷史第一

重現(xiàn)死亡之瞳!詹姆斯19+8+13單核制勝 創(chuàng)8項(xiàng)紀(jì)錄+4項(xiàng)歷史第一

醉臥浮生
2026-04-19 11:20:27
越領(lǐng)導(dǎo)坐了12個(gè)小時(shí)高鐵回國(guó),直言落后太多,這是最狠的一次拒絕

越領(lǐng)導(dǎo)坐了12個(gè)小時(shí)高鐵回國(guó),直言落后太多,這是最狠的一次拒絕

田園小歸
2026-04-19 08:40:30
突發(fā)!朝鮮向日本方向猛烈發(fā)射導(dǎo)彈:日本太狼狽,反華氣焰被打臉

突發(fā)!朝鮮向日本方向猛烈發(fā)射導(dǎo)彈:日本太狼狽,反華氣焰被打臉

影像溫度
2026-04-19 19:02:44
大數(shù)據(jù)分析,在中國(guó),找個(gè)身高1米7年入20萬(wàn)的老公,到底有多難?

大數(shù)據(jù)分析,在中國(guó),找個(gè)身高1米7年入20萬(wàn)的老公,到底有多難?

深度報(bào)
2026-04-18 23:37:27
女子稱酒店回訪暴露她開房隱私:丈夫查她開房記錄,和她離婚了

女子稱酒店回訪暴露她開房隱私:丈夫查她開房記錄,和她離婚了

江山揮筆
2026-04-19 10:57:54
緊急!全體車主注意:4月30日前必須辦完,5月1日起直接扣分罰款

緊急!全體車主注意:4月30日前必須辦完,5月1日起直接扣分罰款

芭比衣櫥
2026-04-19 21:58:51
2026-04-20 02:11:00
愛(ài)范兒 incentive-icons
愛(ài)范兒
消費(fèi)科技第一媒體
38716文章數(shù) 2601514關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂(lè)要聞

何潤(rùn)東漲粉百萬(wàn)!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

家居
手機(jī)
旅游
親子
教育

家居要聞

法式線條 時(shí)光靜淌

手機(jī)要聞

8.8英寸小鋼炮!REDMI K Pad 2核心配置揭曉

旅游要聞

北京投入2.2億元建成和田“三館一院”

親子要聞

孩子總打噴嚏、起疹子,時(shí)過(guò)敏嗎?

教育要聞

655家單位、1.29萬(wàn)個(gè)崗位,湖南用心幫大學(xué)生找工作

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版