国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清華2年前預(yù)言,正成為全球共識(shí)!Meta等三大AI機(jī)構(gòu)已得出同一結(jié)論

0
分享至


新智元報(bào)道

編輯:好困 桃子

【新智元導(dǎo)讀】太瘋狂了!Meta和METR剛測(cè)出的AI進(jìn)化數(shù)據(jù),與中國(guó)團(tuán)隊(duì)兩年前提出的「密度定律」完美重合。硅谷猛然回頭,發(fā)現(xiàn)中國(guó)研究者在這條路上已領(lǐng)先兩年!

全球三家最嚴(yán)肅的AI研究機(jī)構(gòu),過去一周集體撞車了!

4月3日,美國(guó)研究機(jī)構(gòu)METR悄悄更新了一份技術(shù)報(bào)告,核心結(jié)論壓成一句話。

AI能力每88.6天翻倍一次。


5天后,4月8日,Meta超級(jí)智能實(shí)驗(yàn)室發(fā)布全新模型Muse Spark,公開了一條內(nèi)部叫做scaling ladder的訓(xùn)練效率曲線,結(jié)論也是一句話。

要追上一年前Llama 4 Maverick的性能,新模型只需要不到十分之一的訓(xùn)練算力。


一份測(cè)任務(wù)時(shí)長(zhǎng),一份測(cè)訓(xùn)練算力。兩家機(jī)構(gòu)沒有任何往來,研究方法毫無重合。

但當(dāng)兩條曲線被換算到同一坐標(biāo)系里,斜率幾乎完全重合

到這里,事情已經(jīng)夠離譜了。

更離譜的是,這條曲線,被一個(gè)中國(guó)團(tuán)隊(duì)兩年前就完整地畫出來過,還登上了Nature子刊。

它叫密度定律。



兩年前,有人提前畫過這條線

這個(gè)概念最早出現(xiàn)在一篇叫「Densing Law of LLMs」的論文里。

作者是面壁智能和清華大學(xué)的聯(lián)合團(tuán)隊(duì),孫茂松和劉知遠(yuǎn)兩位教授領(lǐng)銜,第一作者是博士生肖朝軍。

論文2024年12月掛上arXiv,2025年11月被Nature Machine Intelligence接收。


論文地址:https://arxiv.org/abs/2412.04315


論文地址:https://www.nature.com/articles/s42256-025-01137-0

論文的核心判斷只有一句話。

模型智能密度隨時(shí)間呈指數(shù)級(jí)增強(qiáng),達(dá)到特定智能水平所需的參數(shù)量,每3.5個(gè)月下降一半

放在2024年底,這話聽上去有點(diǎn)過激。

那時(shí)全行業(yè)都在崇拜scaling law。OpenAI在堆模型,Anthropic在堆模型,Meta也在堆模型。

所有人都覺得參數(shù)越大智能越強(qiáng),把GPU燒到極致才是正道。


但研究團(tuán)隊(duì)不這么看。

他們把當(dāng)時(shí)所有有影響力的開源基礎(chǔ)模型,從Llama-1一路到Gemma-2、MiniCPM-3,總共51個(gè)模型都放進(jìn)了同一把尺子里去量。

五大基準(zhǔn)跑完,結(jié)果是幾乎完美的指數(shù)關(guān)系,R2達(dá)到0.934。

考慮到大模型評(píng)測(cè)很容易被數(shù)據(jù)污染干擾,他們又用一個(gè)新構(gòu)建的污染過濾數(shù)據(jù)集MMLU-CF重測(cè)了一次。R2=0.953。

兩次擬合都拿到了接近1的R2。統(tǒng)計(jì)學(xué)上,這幾乎不可能是巧合。

換句話說就是,這兩年發(fā)布的每一個(gè)主流開源模型,不管來自哪個(gè)團(tuán)隊(duì)、用什么架構(gòu),都落在了同一條「每3.5個(gè)月翻倍」的指數(shù)線上。


到這里,故事還只是「一個(gè)中國(guó)團(tuán)隊(duì)提出了一個(gè)看上去很激進(jìn)的經(jīng)驗(yàn)規(guī)律」。

真正讓這件事變成一個(gè)「時(shí)刻」的,是接下來這小半年發(fā)生的事。

三家機(jī)構(gòu),三種方法,同一個(gè)斜率

把面壁、Meta、METR三方的結(jié)論攤開看。

  • 面壁的密度定律衡量的是「同樣的智能水平需要多少參數(shù)」。結(jié)論是參數(shù)需求每3.5個(gè)月減半。

  • Meta的scaling ladder衡量的是「同樣的智能水平需要多少訓(xùn)練算力」。結(jié)論是Muse Spark比一年前的Llama 4 Maverick節(jié)省了一個(gè)數(shù)量級(jí)。

  • METR的時(shí)間跨度報(bào)告衡量的是「同樣的模型能搞定多長(zhǎng)任務(wù)」。結(jié)論是任務(wù)時(shí)長(zhǎng)每88.6天翻倍。

三把尺子。三個(gè)學(xué)術(shù)機(jī)構(gòu)。三種沒有任何重合的研究路徑。

但當(dāng)所有數(shù)字被換算到同一坐標(biāo)系里看時(shí),它們的曲線斜率幾乎完全重合。

這事最容易被忽略的一點(diǎn)是,密度定律是這三者里最早提出的。比Meta的scaling ladder早了近兩年,比METR的完整建模也早了一年多。

而當(dāng)Meta在四月初的發(fā)布博客里畫出那條scaling ladder時(shí),他們大概自己都沒意識(shí)到。這張圖的形狀,和2024年北京一個(gè)學(xué)術(shù)會(huì)議PPT上的曲線,幾乎是同一條線。

什么樣的觀察,才配得上「定律」兩個(gè)字

在科學(xué)界,有一套不成文的標(biāo)準(zhǔn),來判斷一條經(jīng)驗(yàn)觀察是否有資格被叫做「定律」。

不是看數(shù)據(jù)有多漂亮,是看它能不能在多個(gè)獨(dú)立的測(cè)量系統(tǒng)下同時(shí)成立。

摩爾定律之所以是定律,因?yàn)榘雽?dǎo)體行業(yè)從光刻精度、晶體管密度、單位算力成本三個(gè)完全不同的維度,幾十年來一遍遍驗(yàn)證過它。


密度定律走的是同一條路。

它最初只是來自單一團(tuán)隊(duì)的一條擬合曲線。到Nature子刊接收時(shí),它已經(jīng)能在污染過濾后的數(shù)據(jù)集上重現(xiàn)。到這個(gè)月,它在Meta的訓(xùn)練數(shù)據(jù)和METR的任務(wù)評(píng)測(cè)里又被兩次獨(dú)立驗(yàn)證。

放在更大的坐標(biāo)系里看,這一刻像極了1880年代電力剛進(jìn)入紐約的時(shí)候。

那時(shí)也是幾個(gè)不同的發(fā)明家、不同的工程師、不同的城市,各自在搞各自的電網(wǎng)。直到有人把所有項(xiàng)目的發(fā)展曲線畫在一張紙上,人們才反應(yīng)過來。這不是幾個(gè)零散的工程進(jìn)步,這是一個(gè)新時(shí)代正在悄悄鋪開。

只是這一次,從論文發(fā)表到被全球同行驗(yàn)證,只用了不到一年。

三個(gè)推論,每一個(gè)都在改寫行業(yè)假設(shè)

如果密度定律站得住腳,它會(huì)同時(shí)改寫很多東西。

第一,推理成本會(huì)比所有人預(yù)期的都崩得更快。

密度定律的一個(gè)推論是,達(dá)到同樣性能的LLM,推理成本大概每2.6個(gè)月減半。

如今,這個(gè)降幅已經(jīng)被現(xiàn)實(shí)超過了。

Epoch AI最新追蹤數(shù)據(jù)顯示,達(dá)到Claude 3.5 Sonnet性能水平的LLM,過去一年token價(jià)格降了400倍。同檔位性能的最快降幅觸到900倍/年。

2022年底GPT-3.5開價(jià)20美元/百萬token那種水平,今天Mistral Nemo只要0.02美元,便宜了1000倍,模型還更強(qiáng)。

回頭來看,論文里的預(yù)測(cè)還是保守了。

第二,端側(cè)智能的爆發(fā)點(diǎn),比所有人預(yù)想的都近。

把密度定律和摩爾定律相乘,會(huì)得到一個(gè)更刺激的數(shù)字。

按目前估算,在同價(jià)格芯片上能跑的最大有效模型規(guī)模,大約每88天翻一倍。

這個(gè)數(shù)字和METR算出的88.6天幾乎一致。兩家完全不同的推算路徑,在小數(shù)點(diǎn)后撞了車。

未來三五年,在一臺(tái)普通筆記本甚至一部手機(jī)上跑當(dāng)下頂級(jí)GPT級(jí)別模型這件事,可能不再是科幻。

第三,大模型行業(yè)的最優(yōu)策略,正在悄悄反轉(zhuǎn)。

過去三年,行業(yè)對(duì)scaling law的理解一直停留在「堆參數(shù)堆數(shù)據(jù)」

但密度定律給出了一個(gè)反直覺的判斷。在密度持續(xù)指數(shù)增長(zhǎng)的前提下,任何狀態(tài)的最強(qiáng)模型都只有幾個(gè)月的最優(yōu)窗口期。

砸全部資源去訓(xùn)一個(gè)更大的模型,然后等三個(gè)月被一個(gè)體積一半的新模型超越,在經(jīng)濟(jì)賬上是不劃算的。

真正可持續(xù)的路,是把資源砸在密度本身的提升上。更好的架構(gòu),更高質(zhì)量的數(shù)據(jù),更聰明的訓(xùn)練算法。

面壁,一直在沿著自己畫的尺子走

值得說一句的是,密度定律不是一篇發(fā)完就結(jié)束的論文。

提出這套理論的面壁智能,過去兩年一直在用自家的「小鋼炮」MiniCPM系列模型驗(yàn)證它。

MiniCPM-1-2.4B在2024年2月發(fā)布的時(shí)候,跑分能打平或超過2023年9月的Mistral-7B。也就是說,四個(gè)月時(shí)間,35%的參數(shù),達(dá)到了同等性能。

這個(gè)數(shù)字被直接寫進(jìn)了Nature子刊那篇論文里,作為密度定律的第一個(gè)實(shí)證案例。

從那之后,小鋼炮系列一路開源,覆蓋10B以下參數(shù)的文本、多模態(tài)、語音、全模態(tài)四大方向。這個(gè)開源完整度,在國(guó)內(nèi)除了阿里之外,只有面壁一家做到。

到目前為止,小鋼炮系列在全球的開源下載量已經(jīng)突破2400萬次。

它不是行業(yè)里最大的模型。但它是行業(yè)里第一個(gè)把「密度優(yōu)先」當(dāng)作公司方法論來執(zhí)行的團(tuán)隊(duì)。

而當(dāng)Meta和METR在2026年4月這一周用各自的方式驗(yàn)證密度定律時(shí),這家2024年就開始按這套方法論訓(xùn)練模型的中國(guó)公司,其實(shí)已經(jīng)領(lǐng)先了兩年的工程經(jīng)驗(yàn)。

這一次,中國(guó)研究者站在了曲線的起點(diǎn)

一個(gè)中國(guó)研究團(tuán)隊(duì)兩年前提出的理論框架,正在被Meta、METR這些海外最嚴(yán)肅的機(jī)構(gòu),用他們各自的方式,一次次重新發(fā)現(xiàn)。

這件事的份量,可能需要一點(diǎn)時(shí)間才能完全理解。

它不是一個(gè)「我們也行」的故事。它是一個(gè)「我們更早一點(diǎn)看見」的故事。

科學(xué)史上這樣的瞬間不算多。一個(gè)在2024年被懷疑的判斷,在2026年變成了多個(gè)獨(dú)立證據(jù)指向的同一條曲線。

這種跨地域、跨方法、跨機(jī)構(gòu)的「不約而同」,在物理學(xué)里發(fā)生過幾次,每一次都標(biāo)志著一個(gè)舊范式的終結(jié)和一個(gè)新范式的開始。

中國(guó)AI研究者這一次站在了那個(gè)起點(diǎn)上。

而那條曲線,還在以每88天翻一倍的速度往上走。

參考資料:

面壁智能首創(chuàng)的「密度定律」,獲 Meta 等海外頂級(jí)機(jī)構(gòu)認(rèn)可

https://arxiv.org/abs/2412.04315

https://www.nature.com/articles/s42256-025-01137-0

https://metr.org/blog/2026-1-29-time-horizon-1-1/

https://ai.meta.com/blog/introducing-muse-spark-msl/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
山東省菏澤市委常委、秘書長(zhǎng)肖友華接受審查調(diào)查

山東省菏澤市委常委、秘書長(zhǎng)肖友華接受審查調(diào)查

界面新聞
2026-04-13 10:04:23
協(xié)議即將達(dá)成,28國(guó)聯(lián)手對(duì)付中國(guó),名單公開,沒一個(gè)善茬

協(xié)議即將達(dá)成,28國(guó)聯(lián)手對(duì)付中國(guó),名單公開,沒一個(gè)善茬

溫讀史
2026-04-13 10:56:29
25歲男子為尋求刺激,十幾天內(nèi)猥褻7人,專挑天黑獨(dú)自行走或跑步的女性

25歲男子為尋求刺激,十幾天內(nèi)猥褻7人,專挑天黑獨(dú)自行走或跑步的女性

觀威海
2026-04-13 18:24:10
毛焦?fàn)栃稼A得匈牙利國(guó)會(huì)選舉,俄羅斯、德國(guó)、波蘭發(fā)聲表態(tài)

毛焦?fàn)栃稼A得匈牙利國(guó)會(huì)選舉,俄羅斯、德國(guó)、波蘭發(fā)聲表態(tài)

環(huán)球網(wǎng)資訊
2026-04-13 19:07:08
贏球加筆畫,常州北站已經(jīng)變?yōu)槌V薇闭?>
    </a>
        <h3>
      <a href=懂球帝
2026-04-13 18:03:54
為了鄭麗文專機(jī)能順利落地,解放軍果斷亮出底牌,痛擊臺(tái)獨(dú)要害

為了鄭麗文專機(jī)能順利落地,解放軍果斷亮出底牌,痛擊臺(tái)獨(dú)要害

混沌錄
2026-04-09 16:05:22
鄭麗文:絕不放棄武力保臺(tái),洪秀柱怒懟:兩岸和平,豈能不統(tǒng)一?

鄭麗文:絕不放棄武力保臺(tái),洪秀柱怒懟:兩岸和平,豈能不統(tǒng)一?

安夢(mèng)入天下
2026-04-12 17:01:16
科大訊飛回應(yīng)“員工中1500萬彩票”

科大訊飛回應(yīng)“員工中1500萬彩票”

新京報(bào)
2026-04-13 16:39:28
70架軍機(jī)抵達(dá)以色列,伊朗又上當(dāng)了,巴鐵大軍出動(dòng),戰(zhàn)爭(zhēng)隨時(shí)爆發(fā)

70架軍機(jī)抵達(dá)以色列,伊朗又上當(dāng)了,巴鐵大軍出動(dòng),戰(zhàn)爭(zhēng)隨時(shí)爆發(fā)

老謝談史
2026-04-13 19:29:49
《浪姐7》個(gè)人喜愛度,張慧雯倒數(shù)第五,王濛第二,第一名太意外

《浪姐7》個(gè)人喜愛度,張慧雯倒數(shù)第五,王濛第二,第一名太意外

娛樂圈十三太保
2026-04-13 17:04:03
鞏立姣高調(diào)宣布退役5個(gè)月減肥40斤 相當(dāng)于從身上扒下來一頭小豬

鞏立姣高調(diào)宣布退役5個(gè)月減肥40斤 相當(dāng)于從身上扒下來一頭小豬

勁爆體壇
2026-04-13 16:12:05
遼寧80-75戰(zhàn)勝山東 球員評(píng)價(jià):2人優(yōu)秀,6人及格,3人低迷

遼寧80-75戰(zhàn)勝山東 球員評(píng)價(jià):2人優(yōu)秀,6人及格,3人低迷

籃球資訊達(dá)人
2026-04-13 21:43:34
丟大了!馬英九親自召開發(fā)布會(huì),法定人數(shù)都不夠,增加綠營(yíng)人士

丟大了!馬英九親自召開發(fā)布會(huì),法定人數(shù)都不夠,增加綠營(yíng)人士

叮當(dāng)當(dāng)科技
2026-04-13 16:46:43
突發(fā)!劉強(qiáng)東拿下深藍(lán)汽車

突發(fā)!劉強(qiáng)東拿下深藍(lán)汽車

李東陽朋友圈
2026-04-13 12:04:12
曾志偉72歲壽宴這天,邱淑貞臉干癟,葉子楣身材傲人,張耀揚(yáng)壯碩

曾志偉72歲壽宴這天,邱淑貞臉干癟,葉子楣身材傲人,張耀揚(yáng)壯碩

洲洲影視娛評(píng)
2026-04-13 18:39:12
北京一女子報(bào)警:我懷疑插座里有監(jiān)控!

北京一女子報(bào)警:我懷疑插座里有監(jiān)控!

環(huán)球網(wǎng)資訊
2026-04-13 09:06:26
賈乃亮慶祝42歲生日,女兒甜馨溫暖陪伴!網(wǎng)友:盼望亮哥復(fù)婚!

賈乃亮慶祝42歲生日,女兒甜馨溫暖陪伴!網(wǎng)友:盼望亮哥復(fù)婚!

娛樂團(tuán)長(zhǎng)
2026-04-13 20:09:22
重磅!國(guó)務(wù)院發(fā)布大消息!

重磅!國(guó)務(wù)院發(fā)布大消息!

摩爾金融
2026-04-13 18:47:02
馬筱梅帶娃回京被冷落,張?zhí)m曬出差視頻要做好代言人,沒空陪孫子

馬筱梅帶娃回京被冷落,張?zhí)m曬出差視頻要做好代言人,沒空陪孫子

攬星河的筆記
2026-04-13 16:16:30
普斯卡什獎(jiǎng)候選?摩洛哥球員打入一記禁區(qū)弧附近的插花腳世界波

普斯卡什獎(jiǎng)候選?摩洛哥球員打入一記禁區(qū)弧附近的插花腳世界波

懂球帝
2026-04-13 14:33:56
2026-04-13 22:31:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14960文章數(shù) 66768關(guān)注度
往期回顧 全部

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

頭條要聞

美官員:美軍已在中東大規(guī)模部署 能確保切斷港口交通

頭條要聞

美官員:美軍已在中東大規(guī)模部署 能確保切斷港口交通

體育要聞

一支球隊(duì)不夠爛,也是一種悲哀

娛樂要聞

初代“跑男團(tuán)”合體,鄧超、鹿晗缺席

財(cái)經(jīng)要聞

今夜,出大事了,3種結(jié)果

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

健康
家居
親子
數(shù)碼
教育

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

家居要聞

復(fù)古風(fēng)格 自然簡(jiǎn)約

親子要聞

以為只是小小的不舒服 這么小就要遭這份罪,當(dāng)媽滿心心疼,婆婆

數(shù)碼要聞

真相大白!三星顯示器退出中國(guó)市場(chǎng),不是不想做,而是做不下去了

教育要聞

燕子飛時(shí) | 麥田團(tuán)隊(duì)動(dòng)態(tài)20260413期

無障礙瀏覽 進(jìn)入關(guān)懷版