国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.5參數(shù)有10T?病毒式論文剛剛被打假,實際縮水至1.5T

0
分享至


新智元報道

編輯:Aeneas KingHZ

【新智元導(dǎo)讀】五一假期前,AI社區(qū)被一篇「GPT-5.5擁有近10萬億參數(shù)」的論文刷屏,今天這項研究就被研究者打假了!研究者表示,修正論文中的各種問題后,GPT-5.5的參數(shù)很可能約為1.5T。

2026年4月底,AI界被一篇名為《不可壓縮知識探針》(Incompressible Knowledge Probes,簡稱 IKP)的論文震動了。


論文地址:https://www.alphaxiv.org/abs/2604.24827

Pine AI的首席科學(xué)家Bojie Li發(fā)表了一項研究,聲稱通過一種全新的「黑盒探測法」,推算出了那些閉源模型的真實體量。

  • GPT-5.5:9.7萬億(9.7T)參數(shù)

  • Claude Opus 4.7:4.0萬億(4.0T)參數(shù)

  • o1:3.5萬億(3.5T)參數(shù)

這個數(shù)據(jù)瞬間引爆了社交媒體。

要知道,如果GPT-5.5真的達(dá)到了10T規(guī)模,那意味著它比傳聞中的GPT-4(約1.8T)大了5倍有余。

一時間,這個參數(shù)瞬間傳遍全網(wǎng)。


然而,僅僅幾天后,反轉(zhuǎn)就來了。

邏輯的漏洞:從10T到1.5T的縮水內(nèi)幕

最近,來自UC伯克利CHAI實驗室的Lawrence Chan和UK AISI的研究員Ben Sturgeon對這篇論文進(jìn)行了深挖。


他們發(fā)現(xiàn),這篇聲稱「逆推大模型規(guī)!沟谋鹫撐模谷淮嬖趪(yán)重的邏輯與代碼偏差。


修復(fù)這些問題后,GPT-5.5的參數(shù)約為1.5T(90% 置信區(qū)間:256B-8.3T)。


被修飾的擬合曲線

在原始論文中,作者聲稱沒有對模型的得分進(jìn)行「保底處理」(flooring)。但在復(fù)現(xiàn)代碼時,研究者發(fā)現(xiàn)作者在計算小模型得分時,偷偷地將負(fù)分歸零了。

科普:當(dāng)模型遇到不知道的冷知識時,如果亂猜(幻覺),得分會是負(fù)數(shù)。

如果把這個「歸零」操作去掉,小模型的得分會大幅下降。這意味著原本陡峭的「得分-參數(shù)」擬合曲線會變得平緩。修正后,估算的GPT-5.5規(guī)模直接從9.7T暴跌至1.5T



「人工智障」出題:25%的題目本身就有錯

研究者發(fā)現(xiàn),這套用來測試模型的「冷知識題庫」質(zhì)量同樣堪憂。

  • 歧義性:約25%的專家知識題存在歧義(例如重名研究員)。

  • 事實錯誤:部分標(biāo)準(zhǔn)答案本身就是錯的。

最戲劇性的是,原作者Bojie Li后來坦言:這篇研究是他在AI智能體的輔助下,僅用4天時間完成的早期探索。

這種「AI寫論文研究AI」的模式,被Lawrence Chan戲稱為「充滿槽點的Vibe-coding」。



核心理論依然堅挺

知識「不可壓縮」

用嚴(yán)謹(jǐn)?shù)脑捳f,論文的核心思想——IKP 得分與對數(shù)參數(shù)數(shù)量之間的線性關(guān)系——仍然成立,但參數(shù)數(shù)量的估計卻不成立。


解決這兩個問題后,基于IKP的前沿模型估計的參數(shù)數(shù)量通常會下降,置信區(qū)間會擴大:

GPT 5.5:9.7T -> 1.5T

Claude Opus 4.7:4.0T -> 1.1T

DeepSeek R1(實際大小671B):424 B -> 760 B


難得的是,論文中的三種說法,承受住了各種測試,被證明依然是正確的。

比如,IKP分?jǐn)?shù)和模型的參數(shù)呈對數(shù)線性關(guān)系。


總之,論文提出的核心模型依然得到了學(xué)界的認(rèn)可:不可壓縮知識探針(IKP)。

這個理論認(rèn)為,大模型的能力可以分為兩部分。

  1. 程序性能力(邏輯、推理、代碼):這是可以壓縮的。隨著架構(gòu)優(yōu)化,更小的模型可以擁有更強的推理能力。

  2. 事實性知識(某人的出生日期、冷門研究領(lǐng)域):這是不可壓縮的。

你可以把模型想象成一個硬盤,存一個事實就需要占幾個比特位。

因此,測試模型到底知道多少「不可壓縮」的冷知識,確實是目前探測閉源模型參數(shù)最科學(xué)的「測力計」。

誰才是真正的「知識之王」?

而且,盡管參數(shù)規(guī)模下調(diào)了,但各家模型的「有效容量」排名依然極具參考價值。

梯隊格局

  • 第一梯隊(巔峰王者):GPT-5.5。雖然可能只有1.5T左右,但它在T6級別的超冷門知識表現(xiàn)上依然冠絕群雄。

  • 第二梯隊(貼身肉搏):Claude Opus 4.7、o1、Grok-4。這幾款模型的有效容量高度接近,競爭進(jìn)入白熱化。

  • MoE(混合專家模型)的秘密:研究發(fā)現(xiàn),MoE模型的知識量取決于其總參數(shù),而非每次運行時的「激活參數(shù)」。這意味著,如果你想讓模型博學(xué),堆參數(shù)依然是唯一的硬道理。

「思考模式」的玄學(xué)

測試顯示,開啟「思維鏈」(Thinking Mode)并不能顯著增加模型的知識量。這再次印證了:思考能提高邏輯,但不能憑空變出你沒讀過的書。

最后,Lawrence Chan吐槽說:這項工作果然是AI智能體在四天內(nèi)完成的,因為網(wǎng)站和代碼庫到處都體現(xiàn)著vibe coding的粗糙風(fēng)格。


GPT-5.5參數(shù)有9.7T?

4月30日,Pine AI的首席科學(xué)家李博杰的這篇論文引發(fā)了熱議。


核心觀點是:事實性容量與模型規(guī)模呈對數(shù)線性關(guān)系。

論文展示了 7 個知識層級,其中T7對所有模型來說幾乎都是0%左右,這表明預(yù)訓(xùn)練仍有巨大的提升空間。


Gemini 3.1 Pro很可能超過 10T,因為它被用作錨點,但論文中沒有對其直接估算。

這意味著,我們可以在一定程度上推斷不同模型的訓(xùn)練成本,以及它們的后訓(xùn)練效果——即在給定規(guī)模下,在某些非事實性任務(wù)上的表現(xiàn)。

在原作中,李博杰構(gòu)建了一個包含1400個事實性問題的數(shù)據(jù)集,并將準(zhǔn)確率與參數(shù)數(shù)量進(jìn)行擬合。

通過反轉(zhuǎn)擬合,從閉源模型的數(shù)據(jù)集得分,研究人員推斷出其參數(shù)數(shù)量。


特別要注意最后一行的90%預(yù)測區(qū)間「Predicition interval, PI」非常大。

此前,就有網(wǎng)友注意到這些「規(guī)模只是推測,不應(yīng)當(dāng)作事實」。


現(xiàn)在許多人,想知道估算對方法論有多敏感——


李博杰直言,「同一個評估任務(wù),結(jié)果橫跨60倍區(qū)間 → 任何單一的點估計都不誠實。」


不過,IKP本是一個起點,而非終點。

作者坦誠自己匆忙上傳了一篇未成熟的arXiv論文,只是為了把這個想法放出來。

論文、代碼、數(shù)據(jù)集和網(wǎng)站都是在 4 天內(nèi)完成的,主要借助 Claude Code,發(fā)布前未經(jīng)同行審閱。采用下限處理和 λ=?1,是為了在開放權(quán)重模型上最大化R2。

我們期待未來的工作能將它做得更好!

Scaling Law失效了嗎?

這次「參數(shù)神話」的破滅,給行業(yè)敲響了警鐘:盲目崇拜大數(shù)字的時代正在過去。

GPT-5.5從10T降到1.5T,并不意味著它變?nèi)趿耍且馕吨鳲penAI可能在數(shù)據(jù)質(zhì)量和參數(shù)效率上做了更驚人的優(yōu)化。

正如Lawrence Chan在總結(jié)中所說:「GPT-5.5到底有多少參數(shù)?我們依然不確定。但這種通過探測知識容量來反推規(guī)模的方法,為我們揭開黑盒模型的面紗提供了一條新路徑。」

在通往AGI的路上,我們需要的或許不再是更大的硬盤,而是更聰明的索引方式。

參考資料:

https://x.com/deedydas/status/2049523583517634862

https://x.com/justanotherlaw/status/2050399317782155726

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
全網(wǎng)猜張柏芝三胎生父,廣東法院判決書揭真相,謝霆鋒王菲活透了

全網(wǎng)猜張柏芝三胎生父,廣東法院判決書揭真相,謝霆鋒王菲活透了

一盅情懷
2026-05-02 15:59:43
59歲鞏俐身材引熱議,外套都快撐不住豐腴身材了,卻被夸少女體態(tài)

59歲鞏俐身材引熱議,外套都快撐不住豐腴身材了,卻被夸少女體態(tài)

一盅情懷
2026-03-16 16:52:57
西班牙25歲芭蕾舞演員赴日旅游,摸完奈良鹿后發(fā)燒嘔吐半年,確診萊姆病,曾前往多個國家求醫(yī),如今幾乎無法下床

西班牙25歲芭蕾舞演員赴日旅游,摸完奈良鹿后發(fā)燒嘔吐半年,確診萊姆病,曾前往多個國家求醫(yī),如今幾乎無法下床

大象新聞
2026-05-03 14:46:04
5.3國乒前腳在世乒賽上失利,后腳馬龍,許昕就奔赴機場,團(tuán)魂!

5.3國乒前腳在世乒賽上失利,后腳馬龍,許昕就奔赴機場,團(tuán)魂!

郝小小看體育
2026-05-03 16:59:45
看來是真的,港媒:055驅(qū)逐艦在菲律賓附近發(fā)射鷹擊-20導(dǎo)彈

看來是真的,港媒:055驅(qū)逐艦在菲律賓附近發(fā)射鷹擊-20導(dǎo)彈

愛吃醋的貓咪
2026-04-29 21:16:58
陳都靈,瘦的讓人心疼

陳都靈,瘦的讓人心疼

陳意小可愛
2026-05-01 10:53:54
莫氏雞煲已報警,10萬元加盟是假的!莫氏雞煲多地開新店,有人凌晨5點出發(fā)排隊,湯包不到5秒被搶光,老莫回應(yīng)欠債180萬元

莫氏雞煲已報警,10萬元加盟是假的!莫氏雞煲多地開新店,有人凌晨5點出發(fā)排隊,湯包不到5秒被搶光,老莫回應(yīng)欠債180萬元

21世紀(jì)經(jīng)濟報道
2026-05-02 11:25:13
佛說:人若欠你,天必還你,即使再忙也要看完

佛說:人若欠你,天必還你,即使再忙也要看完

金沛的國學(xué)筆記
2026-05-02 11:42:14
國家出手逮捕的3名華人首富,瘋狂斂財坑害百姓,每個都罪有應(yīng)得

國家出手逮捕的3名華人首富,瘋狂斂財坑害百姓,每個都罪有應(yīng)得

林輕吟
2026-03-25 07:15:32
張軍被查創(chuàng)下多個尷尬“紀(jì)錄”,18年前曾因酒駕被查

張軍被查創(chuàng)下多個尷尬“紀(jì)錄”,18年前曾因酒駕被查

元芳有看法
2026-04-30 09:25:44
哈佛教授揭開7個健康謊言:你越努力鍛煉,可能越走在錯誤的路上

哈佛教授揭開7個健康謊言:你越努力鍛煉,可能越走在錯誤的路上

真相Truth
2026-04-26 21:51:51
馬奎斯想不通!自己拼死拼活跑比賽,在中國知名度竟被老實人碾壓

馬奎斯想不通!自己拼死拼活跑比賽,在中國知名度竟被老實人碾壓

童叔不飆車
2026-04-30 14:17:56
安徽一28歲美女相親,不料,遇車禍右腿被截肢!相親對象竟說:“嫁給我,醫(yī)藥費我出”

安徽一28歲美女相親,不料,遇車禍右腿被截肢!相親對象竟說:“嫁給我,醫(yī)藥費我出”

勵職派
2026-04-17 12:44:31
中央5臺直播乒羽時間表:5月3日CCTV5直播尤伯杯中韓爭冠+世乒賽

中央5臺直播乒羽時間表:5月3日CCTV5直播尤伯杯中韓爭冠+世乒賽

薇說體育
2026-05-03 10:33:14
港獨、罵中國人,如今卻還想來內(nèi)地?fù)平穑@3位香港明星令人作嘔

港獨、罵中國人,如今卻還想來內(nèi)地?fù)平,這3位香港明星令人作嘔

傲傲講歷史
2026-04-19 01:20:08
垃圾分類“不喊了”,不是放棄,而是中國垃圾已經(jīng)變成搖錢樹

垃圾分類“不喊了”,不是放棄,而是中國垃圾已經(jīng)變成搖錢樹

青眼財經(jīng)
2026-05-02 21:27:52
能否復(fù)出?愛德華茲本賽季常規(guī)賽對馬刺:36.7分3.0板4.0助

能否復(fù)出?愛德華茲本賽季常規(guī)賽對馬刺:36.7分3.0板4.0助

林子說事
2026-05-02 22:13:14
特朗普精力充沛,養(yǎng)生秘訣是吃大量阿司匹林,日常三餐吃麥當(dāng)勞

特朗普精力充沛,養(yǎng)生秘訣是吃大量阿司匹林,日常三餐吃麥當(dāng)勞

南權(quán)先生
2026-04-04 05:05:03
毛主席臨終前,給鄧公下達(dá)一個命令,鄧公為何臨終前也未能實現(xiàn)

毛主席臨終前,給鄧公下達(dá)一個命令,鄧公為何臨終前也未能實現(xiàn)

近史閣
2026-05-03 07:08:58
被捕9個月后,釋永信再迎噩耗,4大罪名坐實,最后的體面都沒了

被捕9個月后,釋永信再迎噩耗,4大罪名坐實,最后的體面都沒了

好賢觀史記
2026-03-21 17:07:15
2026-05-03 19:16:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15123文章數(shù) 66832關(guān)注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應(yīng)鏈卡脖子

頭條要聞

機票價大跳水接近"腰斬" 上海出發(fā)機票最高降幅達(dá)7成

頭條要聞

機票價大跳水接近"腰斬" 上海出發(fā)機票最高降幅達(dá)7成

體育要聞

裁判準(zhǔn)備下班,結(jié)果吳宜澤進(jìn)了決賽

娛樂要聞

蔡卓妍婚后首現(xiàn)身 戴結(jié)婚戒指笑容不斷

財經(jīng)要聞

后巴菲特時代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

房產(chǎn)
本地
家居
旅游
軍事航空

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

本地新聞

用青花瓷的方式,打開西溪濕地

家居要聞

靈動實用 生活藝術(shù)場

旅游要聞

雨后京城迎來絕美藍(lán)天,各大重點景區(qū)游人如織

軍事要聞

伊朗公布伊方最新談判方案

無障礙瀏覽 進(jìn)入關(guān)懷版