国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude 這個(gè)更新,讓模型能力提升10%+!

0
分享至

大多數(shù)人低估了昨天 Claude開放 100 萬(wàn)上下文長(zhǎng)度的更新,從 200K 到 1M,上下文長(zhǎng)度其實(shí)不是提升到原來(lái)的 5 倍,而是 7 倍、8 倍、9 倍。

因?yàn)樵瓉?lái) 200K 的上下文里有很大一部分會(huì)被系統(tǒng)提示詞、記憶、skills,以及預(yù)留的 compact buffer 所占據(jù)。所以你真正可使用的項(xiàng)目上下文長(zhǎng)度其實(shí)就 100K 出頭,現(xiàn)在在 1M 上下文里,項(xiàng)目可用的上下文提升到了 900K 左右。

我打開 /context 截了兩張圖:

Sonnet 4.6(200K)——打開對(duì)話就用掉了 25%


Opus 4.6(1M)——同樣的 skill 配置,用掉的比例縮到 4%


Free space 的對(duì)比:

· Sonnet 4.6(200K):free space 118k(58.8%)

· Opus 4.6(1M):free space 923k(92.3%)

923 ÷ 118 ≈ 7.8 倍。名義上 5 倍,實(shí)際可用空間接近 8 倍。對(duì)于 skill 配置越重的用戶,這個(gè)數(shù)字越夸張——這就是我說(shuō)它等效于 6-10 倍的原因。

被 compact 折磨過(guò)的人都懂這是什么感覺(jué)。對(duì)話太長(zhǎng)觸發(fā) compact,有時(shí)候順,有時(shí)候直接失敗,對(duì)話就卡死了。重開,手動(dòng)粘貼上下文,每次都有信息損耗,然后模型在同一個(gè)地方再犯一遍你以為解決了的錯(cuò)。

上下文不是容量,是草稿紙

費(fèi)曼不相信自己說(shuō)不清楚的東西。他的標(biāo)準(zhǔn)是:把所有符號(hào)去掉還能講清楚,才算真理解。上下文限制限制的不只是能放進(jìn)去多少內(nèi)容。

你正在解一道復(fù)雜的數(shù)學(xué)題,做到一半,我把你的草稿紙拿走了。你變笨了嗎?沒(méi)有。但你能解出那道題嗎?也不能了。

問(wèn)題出在草稿紙,不在你的大腦。模型的上下文就是它的草稿紙。

記憶不只是存儲(chǔ),是推理的原材料。推導(dǎo)結(jié)論,前提和中間步驟得記在某個(gè)地方,才能一步步往下走。每推一步就忘一步,算力再猛也推不出來(lái)。上下文窗口就是模型的有效記憶范圍,超出去只能猜。

所以模型出錯(cuò)很多時(shí)候不是不夠聰明,是看不見:

代碼開發(fā):bug 的根源在三個(gè)文件之前引入的變量定義。那個(gè)定義超出上下文了,模型看不見,只能猜。

長(zhǎng)文寫作:寫到后半段,前面某個(gè)論點(diǎn)超出窗口了。模型開始隱隱復(fù)述已經(jīng)說(shuō)過(guò)的東西,或者前后邏輯出現(xiàn)細(xì)微矛盾。你改稿時(shí)才發(fā)現(xiàn),時(shí)間沒(méi)了。

多輪對(duì)話:第 3 輪定的約束到第 30 輪消失了。建議越來(lái)越奇怪,你說(shuō)不出哪里不對(duì),就是感覺(jué)「它沒(méi)在聽」。

上下文越小,這類殘缺越多,判斷越差。

數(shù)據(jù):上下文越長(zhǎng),Claude 和其他模型差距越大

數(shù)據(jù)也能說(shuō)明這件事。Anthropic 用 MRCR v2(8-needle)測(cè)了一組長(zhǎng)上下文檢索,任務(wù)是在超長(zhǎng)文本里同時(shí)找多個(gè)藏起來(lái)的關(guān)鍵信息。


模型

256K

1M

Claude Opus 4.6 91.9% 78.3% Claude Sonnet 4.6 90.6% 65.1%

GPT-5.4

79.3%?

36.6%

Gemini 3.1 Pro

59.1%

25.9%

? GPT-5.4 的 256K 數(shù)據(jù)為 128K–256K 區(qū)間均值

上下文越長(zhǎng),差距越大。 256K 時(shí)幾個(gè)模型還擠在一起,拉到 1M,GPT-5.4 掉到 36.6%,Gemini 3.1 Pro 掉到 25.9%,Claude Opus 4.6 還在 78.3%。不是 Claude 在短上下文里更強(qiáng)——是拉長(zhǎng)之后別人扛不住,Claude 還在。

Claude Code 的 PM Boris Cherny 也在推上確認(rèn)了一件事:

Opus 4.6 1M 現(xiàn)在是 Claude Code Max、Team、Enterprise 的默認(rèn)模型,不用改任何設(shè)置。Pro 版和 Sonnet 用 /extra-usage 手動(dòng)開啟。

Anthropic 還引用了個(gè)客戶案例:用上 1M 上下文之后,自動(dòng)壓縮事件減少了 15%。這跟我自己的體感對(duì)得上。我自己估,對(duì)長(zhǎng)期迭代的復(fù)雜項(xiàng)目,這個(gè)價(jià)值至少等于模型能力提升 10%-20%。

API也取消溢價(jià)了

900K token 的請(qǐng)求和 9K token,現(xiàn)在一個(gè)價(jià):

服務(wù)商

長(zhǎng)上下文怎么收費(fèi)

Anthropic Claude ? 無(wú)溢價(jià),和短上下文一個(gè)價(jià)

OpenAI GPT-5.4

超過(guò) 272K 輸入收 2× 單價(jià),輸出 1.5×

OpenAI 收長(zhǎng)度稅,Anthropic 現(xiàn)在不收了。終于,上下文成了top模型的標(biāo)配。理論上長(zhǎng)上下文也確實(shí)不該是高級(jí)功能,本身就該是個(gè)模型基礎(chǔ)能力。

Claude Code Max 用戶(100 刀/月那檔)更簡(jiǎn)單,1M 上下文直接就有,不用加參數(shù),不用多付錢。

順帶還有兩件事

更新

圖片 / PDF 上限 100 → 600

以前一堆 PDF 要手動(dòng)拆批,現(xiàn)在一次喂進(jìn)去。我每次寫文章要整理十幾張截圖和參考資料,這個(gè)直接省了好幾步。

更新

Adaptive Thinking 轉(zhuǎn)正式版

模型自己判斷什么時(shí)候慢想、什么時(shí)候直接答,不用你手動(dòng)配置推理深度。少了一層不必要的決策。

Context,Not Control.

AI 工具的進(jìn)步有兩種:模型變聰明,或者把已有的能力真正釋放出來(lái)。1M 上下文 GA 是后者。但對(duì)于長(zhǎng)期項(xiàng)目、復(fù)雜開發(fā)、以及被 compact 搞崩過(guò)的人,實(shí)際影響不比前者小。

費(fèi)曼說(shuō)過(guò),背下來(lái)一個(gè)公式,和能自己從頭推導(dǎo)出來(lái),是兩回事,重量完全不同。給模型喂答案,和給它喂能推導(dǎo)出答案的所有信息,也是兩回事。后者更難,但結(jié)果更靠譜。

上下文窗口,決定了你能給它多少推導(dǎo)所需的信息。之前太小,你得做減法——剪掉那些「可能有用但放不進(jìn)去」的東西。每次剪,都是在賭這段信息不重要。賭對(duì)了沒(méi)感覺(jué),賭錯(cuò)了,模型就在某個(gè)你看不見的地方犯了一個(gè)你找不出原因的錯(cuò)。

現(xiàn)在,你完全可以肆無(wú)忌憚去給模型投喂任何你覺(jué)得它該知道的信息了。

這個(gè)管理理念不止是在Netflix和字節(jié),在大模型的使用和管理上也越來(lái)越有效了

Context,Not Control.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
龍珠,日本男子花160萬(wàn)還原布爾瑪19,簡(jiǎn)直太絕了!

龍珠,日本男子花160萬(wàn)還原布爾瑪19,簡(jiǎn)直太絕了!

動(dòng)漫心世界
2026-04-21 17:33:31
馬克龍:霍爾木茲海峽再被封,美伊雙方都有責(zé)任

馬克龍:霍爾木茲海峽再被封,美伊雙方都有責(zé)任

看看新聞Knews
2026-04-21 10:52:33
爆!張?zhí)鞇?ài)被指當(dāng)小三卷入富豪婚變,社媒淪陷,仍分享日常!

爆!張?zhí)鞇?ài)被指當(dāng)小三卷入富豪婚變,社媒淪陷,仍分享日常!

可樂(lè)談情感
2026-04-20 19:57:35
海軍四川艦赴南海開展試驗(yàn)訓(xùn)練

海軍四川艦赴南海開展試驗(yàn)訓(xùn)練

界面新聞
2026-04-21 23:23:46
恒大集團(tuán)許家印牽連的12個(gè)女人

恒大集團(tuán)許家印牽連的12個(gè)女人

地產(chǎn)微資訊
2026-04-21 17:02:14
萬(wàn)達(dá)女子墜樓!滿頭是血當(dāng)場(chǎng)死亡,網(wǎng)友曝更多,或不止墜樓那簡(jiǎn)單

萬(wàn)達(dá)女子墜樓!滿頭是血當(dāng)場(chǎng)死亡,網(wǎng)友曝更多,或不止墜樓那簡(jiǎn)單

呼呼歷史論
2026-04-22 00:54:47
被中方反制打痛了?捷克拒絕議長(zhǎng)竄臺(tái),高呼永遠(yuǎn)堅(jiān)定一個(gè)中國(guó)原則

被中方反制打痛了?捷克拒絕議長(zhǎng)竄臺(tái),高呼永遠(yuǎn)堅(jiān)定一個(gè)中國(guó)原則

近史博覽
2026-04-22 04:03:26
86年我在工廠值夜班,半夜撞見廠長(zhǎng)媳婦從倉(cāng)庫(kù)出來(lái),她讓我別聲張

86年我在工廠值夜班,半夜撞見廠長(zhǎng)媳婦從倉(cāng)庫(kù)出來(lái),她讓我別聲張

千秋文化
2026-04-21 20:11:53
比賴清德還狂的人出現(xiàn)了,如果她當(dāng)選臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

比賴清德還狂的人出現(xiàn)了,如果她當(dāng)選臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

芳芳?xì)v史燴
2026-03-29 21:09:31
深圳一行業(yè)巨頭跌停,市值一夜蒸發(fā)超118億

深圳一行業(yè)巨頭跌停,市值一夜蒸發(fā)超118億

南方都市報(bào)
2026-04-21 19:49:48
一夜被吞!四川27家銀行集體解散,釋放啥信號(hào)?

一夜被吞!四川27家銀行集體解散,釋放啥信號(hào)?

夜深愛(ài)雜談
2026-04-21 07:47:30
1960年閻錫山去世,臨終前留下奇怪遺言:我死后你們不要放聲大哭

1960年閻錫山去世,臨終前留下奇怪遺言:我死后你們不要放聲大哭

云霄紀(jì)史觀
2026-04-22 01:31:13
美國(guó)、以色列最新表態(tài)

美國(guó)、以色列最新表態(tài)

魯中晨報(bào)
2026-04-21 21:44:03
克洛普若執(zhí)教皇馬,第一刀砍向歐冠功勛!26歲王牌遭清洗

克洛普若執(zhí)教皇馬,第一刀砍向歐冠功勛!26歲王牌遭清洗

瀾歸序
2026-04-22 01:12:12
羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個(gè)月

羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個(gè)月

翰飛觀事
2026-04-20 19:43:28
劉少奇位次何以反超周恩來(lái)?長(zhǎng)征殘兵營(yíng)里死守一張底牌

劉少奇位次何以反超周恩來(lái)?長(zhǎng)征殘兵營(yíng)里死守一張底牌

人生錄
2026-04-21 20:24:11
美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

懂球帝
2026-04-21 15:19:11
我的蛋糕沒(méi)了...

我的蛋糕沒(méi)了...

果粉之家
2026-04-21 12:36:56
韋德:得知杜蘭特G1不打的時(shí)候,我就知道詹姆斯會(huì)徹底掌控比賽

韋德:得知杜蘭特G1不打的時(shí)候,我就知道詹姆斯會(huì)徹底掌控比賽

懂球帝
2026-04-21 12:07:09
女兒用父親公司賬戶1700萬(wàn)元打賞主播、拆卡,已前往當(dāng)?shù)嘏沙鏊允?能否以“職務(wù)侵占”立案仍需調(diào)查

女兒用父親公司賬戶1700萬(wàn)元打賞主播、拆卡,已前往當(dāng)?shù)嘏沙鏊允?能否以“職務(wù)侵占”立案仍需調(diào)查

紅星新聞
2026-04-21 12:54:20
2026-04-22 04:43:00
AI進(jìn)化論花生 incentive-icons
AI進(jìn)化論花生
AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
189文章數(shù) 111關(guān)注度
往期回顧 全部

科技要聞

創(chuàng)造4萬(wàn)億帝國(guó)、訪華20次,庫(kù)克留下了什么

頭條要聞

三國(guó)取消飛航許可 賴清德無(wú)法竄訪斯威士蘭

頭條要聞

三國(guó)取消飛航許可 賴清德無(wú)法竄訪斯威士蘭

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂(lè)要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財(cái)經(jīng)要聞

現(xiàn)實(shí)是最大的荒誕:千億平臺(tái)的沖突始末

汽車要聞

全新坦克700正式上市 售價(jià)42.8萬(wàn)-50.8萬(wàn)元

態(tài)度原創(chuàng)

本地
時(shí)尚
教育
數(shù)碼
公開課

本地新聞

春色滿城關(guān)不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

頂流復(fù)工,已判若兩人

教育要聞

對(duì)不起,我有點(diǎn)“摳”

數(shù)碼要聞

大疆DJI Mic Mini 2發(fā)布:329元起 可更換麥克風(fēng)磁吸前蓋

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版