国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

他們在1993年就提出了Scaling Law

0
分享至

明敏 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

原來,Scaling Law在32年前就被提出了!

不是2020年的OpenAI、不是2017年的百度,而是1993年的貝爾實驗室。



在一篇名為《Learning Curves: Asymptotic Values and Rate of Convergence》的文章里提出一種預(yù)測方法:

訓(xùn)練誤差和測試誤差隨訓(xùn)練規(guī)模增加,都會收斂到同一個漸近誤差值,這種收斂符合冪律形式。

通過這種方法,研究人員可以預(yù)測模型在更大數(shù)據(jù)集上的表現(xiàn)。



這和現(xiàn)在大家常提的Scaling Law幾乎一致:

在合理的范圍內(nèi),通過簡單地增加模型參數(shù)量(N)、訓(xùn)練數(shù)據(jù)量(D)和計算量(FLOPS,C),可以以一種可預(yù)測的、平滑的方式顯著提升模型性能。

而1993年的這篇論文來頭也不小,作者一共5位,其中包含了支持向量機的提出者Vladimir Vapnik和Corinna Cortes。



為省算力提出預(yù)測曲線

這篇論文的研究初衷是為了節(jié)省訓(xùn)練分類器(classifiers)的計算資源(果然啥時候都缺算力)。

當時的機器學(xué)習(xí)算法能實現(xiàn)將輸入數(shù)據(jù)分配到某個類別里,比如輸入一張手寫數(shù)字的像素點,判斷它是不是某一個數(shù)組。

為了讓分類器更可靠,往往需要使用大規(guī)模數(shù)據(jù)庫訓(xùn)練。但是研究人員并不確定分類器是否適合給定任務(wù),因此開發(fā)高效的預(yù)測程序非常有必要。

這項研究就是提出了一種預(yù)測方法,先在中等規(guī)模的數(shù)據(jù)集上訓(xùn)練,然后通過提出的學(xué)習(xí)曲線建模外推,預(yù)測其在大數(shù)據(jù)集上的表現(xiàn)。這樣就不用對分類器進行完整訓(xùn)練,從而節(jié)省計算資源。

它首先在幾個中等規(guī)模訓(xùn)練集上分別計算測試誤差、訓(xùn)練誤差,然后他們發(fā)現(xiàn),隨著訓(xùn)練集的規(guī)模變大,訓(xùn)練誤差和測試誤差都會收斂到一個相同的漸近值a,這個指數(shù)a在0.5-1之間。



  • a:漸近誤差(最終無法消除的誤差,比如任務(wù)不可實現(xiàn)性導(dǎo)致的殘余錯誤)。
  • b,c:幅度參數(shù)。
  • α:收斂速率指數(shù)(通常在 0.5~1 之間)

然后變換為對數(shù)線性關(guān)系,在對數(shù)坐標下得到兩條直線。



通過擬合這兩條直線能得到a,b,α。

將估計出的冪律曲線外推到更大的訓(xùn)練集規(guī)模上(比如60000),預(yù)測分類器在完整數(shù)據(jù)上的誤差。

實驗結(jié)果表明,在線性分類器(布爾分類任務(wù))中預(yù)測非常準確。



在多層神經(jīng)網(wǎng)絡(luò)(如LeNet)中,即便在任務(wù)不可實現(xiàn)(non-realizable)的情況下,外推結(jié)果也能很好地預(yù)測大規(guī)模訓(xùn)練的最終表現(xiàn)。

比如僅用12000樣本訓(xùn)練,就能預(yù)測新CNN在60000樣本上會優(yōu)于舊CNN。



此外作者還發(fā)現(xiàn),任務(wù)越困難,漸近誤差越高,收斂速率越小,即學(xué)習(xí)越慢。



這個理論放在當時可以用來淘汰差的模型,將有限的計算資源放在更值得訓(xùn)練的模型上。

作者也是支持向量機提出者

最后不得不提一下這篇研究的幾位作者。

首先來看Vladimir Vapnik,他因在統(tǒng)計學(xué)習(xí)理論和支持向量機方面的貢獻而聞名。



他于1958年在烏茲別克國立大學(xué)獲得數(shù)學(xué)碩士學(xué)位,并于1964年在莫斯科控制科學(xué)研究所獲得統(tǒng)計學(xué)博士學(xué)位。1961年至1990年期間,他一直在該研究所工作,并擔任計算機科學(xué)研究部門的負責人。

Vapnik與Alexey Chervonenkis在1960年至1990年間共同開發(fā)了Vapnik-Chervonenkis理論(也稱為VC理論)。該理論是計算學(xué)習(xí)理論的一種形式,旨在從統(tǒng)計學(xué)角度解釋學(xué)習(xí)過程。

它是統(tǒng)計學(xué)習(xí)理論的基石,為學(xué)習(xí)算法的泛化條件提供了理論基礎(chǔ),并量化了模型的復(fù)雜性(通過VC維)。VC理論在無需定義任何先驗分布的情況下,為機器學(xué)習(xí)提供了一種更通用的方法,與貝葉斯理論形成了對比。

同時Vapnik也是支持向量機(SVM)的主要發(fā)明者。這是一種監(jiān)督學(xué)習(xí)模型,用于數(shù)據(jù)分類和回歸分析。1964年,Vapnik和Chervonenkis首次提出了原始的SVM算法。

1990年代,Vapnik加入貝爾實驗室開始進行機器學(xué)習(xí)方面的深入研究。在1992年他和Bernhard Boser、Isabelle Guyon提出了通過應(yīng)用“核技巧”(kernel trick)來創(chuàng)建非線性分類器的方法,極大地擴展了SVM的應(yīng)用范圍,使其能夠處理非線性可分問題。

1995年Vapnik和Corinna Cortes提出了軟邊距的非線性SVM并將其應(yīng)用于手寫字符識別問題,因為性能表現(xiàn)出色,這篇論文引發(fā)廣泛關(guān)注,也成為機器學(xué)習(xí)發(fā)展中的一塊重要基石。



他撰寫的《統(tǒng)計學(xué)理論的本質(zhì)》也是機器學(xué)習(xí)領(lǐng)域的必讀著作之一。

以及他2014年還給Facebook當過顧問。



另一位重要作者是Corinna Cortes。她現(xiàn)在是Google Research紐約分部的副總裁,負責廣泛的理論和應(yīng)用大規(guī)模機器學(xué)習(xí)問題研究。

她于1989年在哥本哈根大學(xué)尼爾斯·玻爾研究所獲得物理學(xué)碩士學(xué)位。隨后,她于1993年在羅切斯特大學(xué)獲得計算機科學(xué)博士學(xué)位。

在加入Google之前,Cortes在貝爾實驗室工作了十多年。

2022年她被任命為ACM Fellow,以表彰她對機器學(xué)習(xí)領(lǐng)域的貢獻。



其余幾位作者分別是:L. D. Jackel、Sara A. Solla和John S. Denker

其中John S. Denker還和LeCun在手寫識別上合作過多篇論文,也都是機器學(xué)習(xí)經(jīng)典大作了。





而他本人也相當全能,涉獵領(lǐng)域包括機器學(xué)習(xí)、系統(tǒng)安全、好萊塢特效、電子游戲和視頻游戲等,完成了很多開創(chuàng)性工作。還曾在加州理工學(xué)院創(chuàng)建并教授“微處理器設(shè)計”課程(硅谷之所以成為硅谷,和當時美國高校中開始推行芯片設(shè)計課程有很大關(guān)系)。

甚至,他還是一個飛行員,是FFA的航空安全顧問,并寫了一本對飛行原理解釋透徹的行業(yè)教科書。

Denker還曾于1986-87年擔任加州大學(xué)圣巴巴拉分校理論物理研究所的訪問教授。 他以幽默感和“原型瘋狂科學(xué)家”的形象而聞名,他的一些事跡甚至在一些電影中有所體現(xiàn)。



One More Thing

值得一提的是,卷積神經(jīng)網(wǎng)絡(luò)和支持向量機都誕生于貝爾實驗室。它們之間過一段“分庭抗禮”的時期。

在深度學(xué)習(xí)興起之前,CNN因為“黑盒”以及需要大規(guī)模訓(xùn)練,一些研究者對其持有保留態(tài)度;相比之下支持向量機的理論清晰、易于收斂到全局最優(yōu)解。到底誰是正確路線?一時爭論不休。

1995年,Vapnik還和當時的上司Larry Jackel以一頓豪華晚餐打賭,到2000年時,人們能不能解釋清楚大型神經(jīng)網(wǎng)絡(luò)為什么在大規(guī)模訓(xùn)練中表現(xiàn)很好?

Vapnik覺得不能。2000年他贏了;隨后他們又賭,再過5年結(jié)果如何?這一次Vapnik錯了:

在2005年任何頭腦清醒的人都不會再用和1995年時完全相同的模型了。

這場賭局,LeCun是見證人。



論文地址:
https://proceedings.neurips.cc/paper/1993/file/1aa48fc4880bb0c9b8a3bf979d3b917e-Paper.pdf


[1]https://x.com/gdb/status/1962594235263427045
[2]https://yorko.github.io/2022/vapnik-jackel-bet/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
不干涉他國內(nèi)政

不干涉他國內(nèi)政

周邊問題研究所
2025-12-18 21:22:36
趙薇低調(diào)回安徽老家,戴口罩帽子墨鏡全副武裝,打扮土氣像村里人

趙薇低調(diào)回安徽老家,戴口罩帽子墨鏡全副武裝,打扮土氣像村里人

瘋說時尚
2025-12-18 15:10:17
蒯曼更換混雙搭檔,林詩棟面臨單打和混雙挑戰(zhàn),男隊競爭格局改變

蒯曼更換混雙搭檔,林詩棟面臨單打和混雙挑戰(zhàn),男隊競爭格局改變

子水體娛
2025-12-19 13:28:23
1982年,胡啟立說他不打牌不下棋不打球,萬里:你這樣幾年就累垮

1982年,胡啟立說他不打牌不下棋不打球,萬里:你這樣幾年就累垮

帝哥說史
2025-12-18 06:30:02
美國對臺軍售捅馬蜂窩,中國反手大舉賣武器,反美國家搶瘋了。

美國對臺軍售捅馬蜂窩,中國反手大舉賣武器,反美國家搶瘋了。

百態(tài)人間
2025-11-21 17:02:27
三上悠亞、水卜櫻、淺野心、小澤菜穗、川越仁子 日美女明星動態(tài)

三上悠亞、水卜櫻、淺野心、小澤菜穗、川越仁子 日美女明星動態(tài)

鹿鹿156
2025-12-19 10:36:13
湖人三軍用命末節(jié)逆轉(zhuǎn),東契奇詹姆斯?jié)M分,兩輪換及時爆發(fā)

湖人三軍用命末節(jié)逆轉(zhuǎn),東契奇詹姆斯?jié)M分,兩輪換及時爆發(fā)

謝說籃球
2025-12-19 15:05:19
驚訝!金價確是一夜變天,12月19日報價,黃金市場將迎來更強大

驚訝!金價確是一夜變天,12月19日報價,黃金市場將迎來更強大

王二哥老搞笑
2025-12-19 04:33:56
一夜之間有關(guān)大師的文章正在被全網(wǎng)刪除,答案或許就在這里!

一夜之間有關(guān)大師的文章正在被全網(wǎng)刪除,答案或許就在這里!

清哲木觀察
2025-12-17 10:59:57
房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

室內(nèi)設(shè)計師有料兒
2025-12-07 16:05:28
保持代謝旺盛的 5 個小技巧,讓你想胖都難!

保持代謝旺盛的 5 個小技巧,讓你想胖都難!

蝌蚪五線譜
2025-12-17 17:22:53
ESPN:詹姆斯、東契奇、里夫斯同時上場時,防守效率聯(lián)盟墊底

ESPN:詹姆斯、東契奇、里夫斯同時上場時,防守效率聯(lián)盟墊底

陳腕特色體育解說
2025-12-19 14:35:08
這5種香煙已被列入“黑名單”,吸煙的人請注意,最好別抽!

這5種香煙已被列入“黑名單”,吸煙的人請注意,最好別抽!

閱微札記
2025-12-17 15:00:47
第一個力挺中國的戰(zhàn)友出現(xiàn)!只要日本敢出兵,立馬使出一大絕招

第一個力挺中國的戰(zhàn)友出現(xiàn)!只要日本敢出兵,立馬使出一大絕招

凡知
2025-11-19 21:28:17
張本智和飄了!剛拿了冠軍,就喊話王楚欽:世界第一,并不遙遠

張本智和飄了!剛拿了冠軍,就喊話王楚欽:世界第一,并不遙遠

十點街球體育
2025-12-17 12:34:51
1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)!陳賡:這是給鬼子修的墳!

1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)!陳賡:這是給鬼子修的墳!

史海孤雁
2025-12-17 16:50:15
嬸嬸發(fā)來房產(chǎn)證照片:你給你爸爸買的養(yǎng)老小院我過戶給你堂哥了

嬸嬸發(fā)來房產(chǎn)證照片:你給你爸爸買的養(yǎng)老小院我過戶給你堂哥了

小秋情感說
2025-12-19 14:15:57
三石弟弟做大保健!桃太子被“全網(wǎng)封殺”!

三石弟弟做大保健!桃太子被“全網(wǎng)封殺”!

八卦瘋叔
2025-12-19 13:19:37
球迷在評論區(qū)問戴琳賬還完了嗎?戴琳回復(fù):你老婆給我還完了

球迷在評論區(qū)問戴琳賬還完了嗎?戴琳回復(fù):你老婆給我還完了

懂球帝
2025-12-17 12:50:29
沒買電動車的可以笑了!2026年更換電動車,將會在這3個方面受益

沒買電動車的可以笑了!2026年更換電動車,將會在這3個方面受益

電動車的那些事兒
2025-12-19 08:23:13
2025-12-19 15:27:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11881文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

中戲院長郝戎被查 劉燁、章子怡、靳東等為其學(xué)生

頭條要聞

中戲院長郝戎被查 劉燁、章子怡、靳東等為其學(xué)生

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

態(tài)度原創(chuàng)

健康
數(shù)碼
親子
公開課
軍事航空

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

三星Galaxy Book6 Pro筆記本電腦照片曝光

親子要聞

81年男子去幼兒園接女兒放學(xué),被認成爺爺。

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

無障礙瀏覽 進入關(guān)懷版