国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

貼臉嘲諷ChatGPT后,這家公司又發(fā)了個(gè)最強(qiáng)模型。

0
分享至


誰能想到呢,本周的硅谷AI圈,已經(jīng)演變到了大家喜聞樂見的互噴環(huán)節(jié)。

起因是周三晚上,Anthropic在他們美國人的“春晚”上,放了幾條廣告,明牌嘲諷OpenAI在ChatGPT里塞廣告,直接把諷刺都打到公屏上了:廣告在入侵AI,但不會(huì)出現(xiàn)在 Claude。


奧特曼當(dāng)場(chǎng)就坐不住了,凌晨六點(diǎn)在X上敲了一篇長文,說Anthropic的廣告"明顯不誠實(shí)","德州用ChatGPT免費(fèi)版的人比全美用Claude的人還多"。。

不過插廣告這事兒確實(shí)不是大伙喜歡的,可以預(yù)見的,評(píng)論區(qū)一邊倒地,說他破防了。

哎,光說不解氣,不然打一架?

第二天,還真打起來了。不過不是線下真實(shí)嗷,是 Anthropic 把 Claude Opus 4.6 擺上了臺(tái)面。


OpenAI 那邊也不甘示弱,在Opus 4.6上線二十多分鐘之后,火速掏出了GPT-5.3 Codex應(yīng)戰(zhàn)。


不過,這波對(duì)轟雖然熱鬧,兩邊的招式其實(shí)不太一樣。 Anthropic 這次,是拿出了自己最強(qiáng)的通用模型,而 OpenAI 拿出的 Codex,其實(shí)是個(gè)專精代碼的“偏科生”,對(duì)大多數(shù)人來說用不到。。總感覺氣勢(shì)上就輸一頭啊。

所以今天世超先撇開那個(gè)寫代碼的,還是來聊聊大家更感興趣的通用模型, Claude Opus 4.6 吧。

先說結(jié)論,在"干活"這件事上,Opus 4.6 應(yīng)該可以算目前最強(qiáng)的大模型。

跑分圖什么的,大伙估計(jì)都看膩了,也基本都是分?jǐn)?shù)要比老模型高一點(diǎn)點(diǎn),當(dāng)然也有少量不如的,不過對(duì)咱來說,看的還是綜合體驗(yàn)嘛。


所以我們仔細(xì)翻了下 Anthropic 官方的介紹和 System Card,把幾個(gè)真正有料的升級(jí)給各位拎了出來。

首先,上下文窗口終于破百萬Tokens了。

之前,Opus系列最讓人詬病的,就是20萬Token的上下文,而隔壁 Gemini 的百萬上下文早用了快兩年了。

而 Opus 4.6 在 MRCR v2 這個(gè)評(píng)測(cè)里拿了76分,我們俗稱“大海撈針”,也就是在巨長上下文里找到我們想找的東西,而上一代Sonnet 4.5是18.5分,一下提升了四倍,可以說是質(zhì)變了。


但上下文這玩意,重點(diǎn)不是數(shù)字大不大,而是能不能真好用啊,很多模型號(hào)稱百萬上下文,實(shí)際上塞到后面就開始記憶錯(cuò)亂,胡言亂語了。

所以這次 Anthropic 是有備而來,他們提了一個(gè)叫“上下文衰減”的概念,是指上下文過長時(shí),注意力分配被稀釋,導(dǎo)致模型難以精準(zhǔn)捕捉一些細(xì)小的信息。說白了就是 AI 的腦容量被稀釋了,讀了后面忘前面,在海量信息里找不著重點(diǎn)。


而Claude現(xiàn)在的解決思路,叫“上下文壓縮”,能在對(duì)話達(dá)到 Token 閾值時(shí),自動(dòng)將冗長的歷史記錄壓縮成高濃度的摘要,就好比你追了幾百集電視劇腦子不夠用了,它不僅幫你把前面那些啰嗦的情節(jié)刪了給大腦騰內(nèi)存,還能自動(dòng)生成前情提要讓你無縫銜接下一集。

但世超實(shí)測(cè)了一下,是有點(diǎn)想吐槽的。

我缺的是上下文嗎,好像是額度??!Pro 版訂閱根本聊不到上下文頂點(diǎn)就用光光了。


而且我試了一下,一次喂大量上下文的能力,是干不過Gemini的。比如我最近有個(gè)研究物理的項(xiàng)目,找到了一份天文學(xué)家里希爾的原版著作,在閱讀中碰到了疑問,因?yàn)樗囊粋€(gè)計(jì)算結(jié)果和牛頓老師完全不同!

然后我把這個(gè)200多頁的書丟給Gemini,問他到底是誰的問題。

Gemini讀完,理解得又快又準(zhǔn),并且精確指出了里希爾原文的頁碼數(shù),一通操作指出,牛頓是對(duì)的。


而 Opus 4.6 這邊好像是有 bug,一本書根本喂不進(jìn)去,顯示error。我最后只好給它拆成了兩半。


不過拆完就蠻順利的了,它成功找到了出問題的頁碼數(shù),還給了精確的推理分析,質(zhì)量跟Gemini 3 Pro不相上下。


所以能力這塊是完全過關(guān)的,至于為什么一次喂不進(jìn)一本書,可能是一種仁慈的防token爆炸機(jī)制吧。

當(dāng)然就這也不夠說“干活最強(qiáng)”,Claude現(xiàn)在最強(qiáng)的地方,其實(shí)是“實(shí)操”的能力。

咋說呢?你就看之前AI圈爆火的干活工具,什么 MCP,Skill,都是Claude先用上,就連不久前爆火的 Clawdbot (現(xiàn)OpenClaw)現(xiàn)在的默認(rèn)推薦模型都是Opus 4.6。


就是因?yàn)?Opus 這玩意,操作電腦的能力,確實(shí)太狠了。

比如我問它,我現(xiàn)在用的顯示器,二手貨最便宜能多少錢。


我就只需要給它說一句話,它就能自己調(diào)用MCP,連接我的電腦,查看我的顯示器型號(hào),再自己上網(wǎng)去閑魚搜最低價(jià)。


最終搜出來的價(jià)格,跟我自己上閑魚搜的大差不差,而且最騷的是它還知道國補(bǔ),讓我別買二手,考慮直接加錢換新,全程不需要我干預(yù),可以說真的很像真人助理了。


除了這個(gè),Claude Opus的編碼能力一直是壓著其他家打的,從競(jìng)技場(chǎng)排名來看,Opus 4.5已經(jīng)打遍無敵手了,現(xiàn)在又來了個(gè)4.6,真遙遙領(lǐng)先了。


再配合上超模的動(dòng)手能力,能力據(jù)說已經(jīng)能媲美高級(jí)工程師——這評(píng)價(jià)來自日本樂天公司的AI總經(jīng)理,說 Opus 4.6 一天之內(nèi)自己修好并關(guān)閉了 13 個(gè) Bug,還看懂了另外 12 個(gè)問題是誰負(fù)責(zé)的,自動(dòng)把活派給了對(duì)應(yīng)的程序員。


咱也來了點(diǎn)簡(jiǎn)單的活,讓它寫個(gè) CS 的 demo 發(fā)到我電腦上。


結(jié)果確實(shí)好用,html文件直接出現(xiàn)在了桌面,點(diǎn)開就能玩,血量、地圖、子彈都顯示得完全正確。


最后,Opus 4.6 還有個(gè)最頂級(jí)的能力,搜集信息,而且不是一般的信息,是各種你不確定的,犄角旮旯里的信息,它都能給你找著。AI 界把這叫做 BrowseComp,Opus 4.6 強(qiáng)勢(shì)登頂。


這一點(diǎn)在世超日常使用時(shí)也深有體會(huì),其他模型搜不到的情報(bào),Claude 能直接給你定位來源,然后端上來。

比如,差友都知道咱差評(píng)有個(gè)內(nèi)部梗,就是925,不算出圈,基本只有咱差友自己知道。

那可能有些新差友,不知道這個(gè)梗,可以去哪搜呢?咱先用Gemini和GPT試試。

結(jié)果無一例外,全部敗下陣來。



結(jié)果去問了下Claude,直接一個(gè)精準(zhǔn)命中,連今日最佳都知道,原來 Claude 也是差友吧。。


這也是為啥世超最近驗(yàn)證傳言、搜集事實(shí)都用 Claude Opus,省心的不止一星半點(diǎn)啊。

這一堆子體驗(yàn)下來,Claude Opus 整體給人一種成熟穩(wěn)重的感覺,如果你讓我選擇一個(gè)“它辦事我放心”的AI,我毫不猶豫選的就是Claude。既然這么強(qiáng),為啥在用戶這塊老不溫不火啊?世超覺得,和 Claude 選擇的路線脫不開關(guān)系。

Anthropic 從一開始就奔著"最能干的AI同事"去的,你看它的產(chǎn)品線,Claude Code、Cowork、Excel插件,全都一個(gè)目的,幫你把活干完。

而這,也是老板最喜歡的特質(zhì),所以企業(yè)客戶占了 Anthropic 收入的 80%,這條路確實(shí)它最能打。

Claude 的風(fēng)格這么偏商務(wù)風(fēng),我覺得也跟它目標(biāo)客戶有關(guān)。(說是這么說,感覺比其他兩家好看多了。。)


而其他兩家則是各有各的說法。

ChatGPT 這邊,奧特曼的野心顯然不只在做一個(gè)“好員工”了,最近的產(chǎn)品節(jié)奏也是真的猛,光 2026 年到現(xiàn)在就發(fā)了ChatGPT Health、Codex 桌面 App、Prism(科研工具),以及剛發(fā)布的企業(yè)平臺(tái) Frontier,還想搶塊企業(yè)市場(chǎng)的蛋糕。 這意思像是,C 端靠用戶量和廣告,B 端靠平臺(tái)和生態(tài),兩手都要抓,就是不知道抓不抓得住了。

至于Gemini,則想靠生態(tài)進(jìn)行一個(gè)降維打擊,在Gemini里你能干谷歌生態(tài)里的任何事,回郵件,傳網(wǎng)盤,甚至看Youtube。再加上幾十億臺(tái)安卓手機(jī),如果 AI 真像水電一樣滲進(jìn)你每天都在用的 App 里時(shí),單純賣模型的公司只能拿頭打。

至于誰能笑到最后?

有個(gè)網(wǎng)友的評(píng)論我覺得很到位:"2026年最聰明的做法不是選一個(gè)最好的模型,而是知道每個(gè)模型最擅長什么,換著用。"

說得非常對(duì)啊,我認(rèn)可,但唯一的缺點(diǎn)是我錢包有點(diǎn)不對(duì)了。

撰文:不咕

編輯:江江&面線

美編:不咕

圖片、資料來源

Anthropic、X


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普的深層恐懼,資本家不允許再出現(xiàn)第二個(gè)羅斯福

特朗普的深層恐懼,資本家不允許再出現(xiàn)第二個(gè)羅斯福

月滿大江流
2026-02-27 07:00:03
谷愛凌回應(yīng)冬奧神圖出圈:當(dāng)時(shí)在自己的眼神里看到了王者

谷愛凌回應(yīng)冬奧神圖出圈:當(dāng)時(shí)在自己的眼神里看到了王者

懂球帝
2026-02-25 13:42:11
樊振東也沒想到,德國總理訪華僅1天,自己竟因一段采訪口碑暴漲

樊振東也沒想到,德國總理訪華僅1天,自己竟因一段采訪口碑暴漲

法老不說教
2026-02-27 15:10:32
遭多國退貨,演習(xí)不敵殲10C,實(shí)戰(zhàn)被擊落,中國的蘇35還有啥用?

遭多國退貨,演習(xí)不敵殲10C,實(shí)戰(zhàn)被擊落,中國的蘇35還有啥用?

書紀(jì)文譚
2026-02-25 20:51:08
1960年,毛主席在杭州聽?wèi)?,演出結(jié)束,主席興猶未盡,想見一人

1960年,毛主席在杭州聽?wèi)?,演出結(jié)束,主席興猶未盡,想見一人

輿圖看世界
2026-02-25 10:45:04
大批F16出動(dòng),美重兵逼近黃海,不到1天,特朗普:中方實(shí)力太強(qiáng)大

大批F16出動(dòng),美重兵逼近黃海,不到1天,特朗普:中方實(shí)力太強(qiáng)大

通文知史
2026-02-22 22:57:13
在日華人直言:如今中國要是再和日本發(fā)生沖突,根本撐不過14年!

在日華人直言:如今中國要是再和日本發(fā)生沖突,根本撐不過14年!

南權(quán)先生
2026-02-12 15:39:07
買前白月光,買后真垃圾!這6個(gè)家居物品,坑了太多人!

買前白月光,買后真垃圾!這6個(gè)家居物品,坑了太多人!

室內(nèi)設(shè)計(jì)師有料兒
2026-02-24 15:06:49
為什么梅威瑟要復(fù)出對(duì)戰(zhàn)泰森和帕奎奧?他太窮了

為什么梅威瑟要復(fù)出對(duì)戰(zhàn)泰森和帕奎奧?他太窮了

仰臥撐FTUer
2026-02-26 18:01:03
81歲林豆豆現(xiàn)狀:已退休23年,獨(dú)居在北京老房子,用閱讀打發(fā)時(shí)間

81歲林豆豆現(xiàn)狀:已退休23年,獨(dú)居在北京老房子,用閱讀打發(fā)時(shí)間

攬星河的筆記
2025-11-12 12:36:17
大二年入百萬的唐尚珺,要為母親蓋別墅了,坦言這是他第三次流淚

大二年入百萬的唐尚珺,要為母親蓋別墅了,坦言這是他第三次流淚

江山揮筆
2026-02-26 17:08:46
耗資12億建世界最高佛,如今水喝不起拜不起

耗資12億建世界最高佛,如今水喝不起拜不起

時(shí)光流轉(zhuǎn)追夢(mèng)人
2026-02-20 13:09:13
“開光改命”的瓜?

“開光改命”的瓜?

文刀萬
2026-02-25 18:50:04
業(yè)績(jī)大增300%,機(jī)器人獨(dú)角獸,登頂全國第一!

業(yè)績(jī)大增300%,機(jī)器人獨(dú)角獸,登頂全國第一!

飛鯨投研
2026-02-26 19:01:05
67歲岳躍利:與二婚妻子住北京,不敢退休,邊拍戲邊伺候33歲女兒

67歲岳躍利:與二婚妻子住北京,不敢退休,邊拍戲邊伺候33歲女兒

白面書誏
2026-02-27 14:09:31
向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

娛樂看阿敞
2025-12-12 15:50:00
李嘉欣15歲兒子回香港過年,與父母外出拜年,身高近1.9米太矚目

李嘉欣15歲兒子回香港過年,與父母外出拜年,身高近1.9米太矚目

樹娃
2026-02-26 11:34:21
還原小米SU7成都事故最后時(shí)刻:撞擊后9秒斷電致門把手失效,燃爆前6.5s曾三次制動(dòng)

還原小米SU7成都事故最后時(shí)刻:撞擊后9秒斷電致門把手失效,燃爆前6.5s曾三次制動(dòng)

第一財(cái)經(jīng)資訊
2026-02-26 20:59:11
黃曉明戀情疑曝光僅1天,女方被扒底朝天,暴露了小圈子的惡俗

黃曉明戀情疑曝光僅1天,女方被扒底朝天,暴露了小圈子的惡俗

往史過眼云煙
2026-02-26 23:54:49
詹姆斯和保羅可能賣公司,籌集資金加入拉斯維加斯擴(kuò)張團(tuán)隊(duì)計(jì)劃

詹姆斯和保羅可能賣公司,籌集資金加入拉斯維加斯擴(kuò)張團(tuán)隊(duì)計(jì)劃

籃球看比賽
2026-02-27 14:21:34
2026-02-27 16:07:00
差評(píng)XPIN incentive-icons
差評(píng)XPIN
用知識(shí)和觀點(diǎn)Debug the world!
10325文章數(shù) 489469關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)業(yè)績(jī)亮眼仍跌5% 兩大因素成核心隱憂

頭條要聞

24歲女子生下1男4女五胞胎 孩子爸爸稱"心情像過山車"

頭條要聞

24歲女子生下1男4女五胞胎 孩子爸爸稱"心情像過山車"

體育要聞

一場(chǎng)必須要贏的比賽,男籃何止擊敗了裁判

娛樂要聞

繼網(wǎng)暴谷愛凌后 美國欲沒收其全部收入

財(cái)經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

寶馬X5傳承版發(fā)布:給經(jīng)典G05的一場(chǎng)體面謝幕?

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
游戲
時(shí)尚
公開課

房產(chǎn)要聞

重磅!海南“十五五”規(guī)劃出爐!未來五年,方向定了!

數(shù)碼要聞

聯(lián)想Lenovo Tab Plus Gen2平板電腦現(xiàn)身,大外凸揚(yáng)聲器模組

爪哇海海戰(zhàn)84周年!戰(zhàn)艦世界上線紀(jì)念活動(dòng),3艘史實(shí)船超低價(jià)入手

今年春天最美搭配:西裝+半裙,怎么穿都好看!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版