国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI 研究人員意外發(fā)現(xiàn):我們以為的“學(xué)習(xí)規(guī)律”,原來全錯(cuò)了

0
分享至


【本文翻譯自nearlyright.com】

還記得那條人人遵守的“機(jī)器學(xué)習(xí)鐵律”嗎?模型太大必然過擬合,只會(huì)死記硬背、學(xué)不到東西。這不是傳說,而是寫進(jìn)教科書的定律——三個(gè)世紀(jì)以來的統(tǒng)計(jì)理論都這么說。

直到有一天,這條“神圣不可侵犯”的規(guī)則被打破了。

現(xiàn)在,擁有數(shù)千億甚至數(shù)萬億參數(shù)的神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)著 ChatGPT,破解蛋白質(zhì)結(jié)構(gòu),還引發(fā)了一場高達(dá)數(shù)千億美元的全球 AI 軍備競賽。而真正發(fā)生轉(zhuǎn)變的,不只是算力,而是我們對“學(xué)習(xí)本質(zhì)”的重新理解。

這個(gè)故事揭示了一項(xiàng)劃時(shí)代的 AI 突破,它的誕生源自一群敢于挑戰(zhàn)領(lǐng)域基礎(chǔ)假設(shè)的“異端”。

300 年的偏差-方差法則,是怎么倒下的

在很長一段時(shí)間里,偏差-方差權(quán)衡(bias-variance tradeoff)被視為學(xué)習(xí)理論的基石:模型太簡單,看不到重點(diǎn);模型太復(fù)雜,記住的只是噪聲。

想象一個(gè)小學(xué)生在學(xué)加法。他有兩個(gè)選擇:要么理解進(jìn)位規(guī)則和位值原理,要么死記硬背所有題目和答案。后者在做作業(yè)時(shí)可能無懈可擊,但一到考試就全軍覆沒。

傳統(tǒng)理論認(rèn)為,神經(jīng)網(wǎng)絡(luò)尤其容易“走歪路”。參數(shù)越多,越容易記住全部訓(xùn)練數(shù)據(jù)而無法泛化。于是學(xué)術(shù)界的共識(shí)變成了:模型要小巧精致,結(jié)構(gòu)要嚴(yán)控,正則化必須到位。誰要是提出“加點(diǎn)參數(shù)”來解決問題,簡直是學(xué)術(shù)異端。

異端的反叛,撞出了“雙重下降”

但就在 2019 年,一群研究者反其道而行之。他們不僅不在模型“剛好”學(xué)會(huì)時(shí)停下,反而繼續(xù)擴(kuò)大規(guī)模,一路沖向“理論高危區(qū)”。

結(jié)果呢?模型不僅沒崩塌,反而“第二次變強(qiáng)”。

這一現(xiàn)象被稱為“double descent”(雙重下降):模型先是如理論所預(yù)言地過擬合,誤差上升,但接著神奇地誤差又開始下降,仿佛它穿越了過擬合的深淵,達(dá)到了新境界。提出者 Mikhail Belkin 等人坦言,這與經(jīng)典偏差-方差理論“背道而馳”。

OpenAI 后續(xù)的研究顯示,這種好處不止出現(xiàn)在一個(gè)模型里,而是普遍存在于不同任務(wù)和規(guī)模上。大模型不僅學(xué)得多,還開始具備“舉一反三”的能力——只看幾個(gè)例子就能學(xué)會(huì)一項(xiàng)新任務(wù)。

從那一刻起,整個(gè)行業(yè)徹底掉頭:Google、Microsoft、Meta、OpenAI 紛紛豪擲數(shù)十億美元,一路堆參數(shù)。GPT 模型從 1.17 億擴(kuò)張到 1750 億?!澳P驮酱笤胶谩睆奈羧盏男φ劊兂山裉斓男袠I(yè)信條。

但問題來了:這一切,為什么行得通?

“彩票假說”:為什么大模型反而學(xué)得更好

謎底來自 MIT 的 Jonathan Frankle 和 Michael Carbin。他們研究的是“剪枝”技術(shù)——也就是在訓(xùn)練之后刪掉那些沒用的權(quán)重。沒想到,他們發(fā)現(xiàn)了大模型的秘密。

他們發(fā)現(xiàn),每一個(gè)大模型中都藏著一個(gè)“中獎(jiǎng)小模型”(winning ticket)——一小部分神經(jīng)元構(gòu)成的子網(wǎng)絡(luò),性能可以媲美整個(gè)大模型。他們甚至能刪掉 96% 的參數(shù)而不損失精度。換句話說,大多數(shù)參數(shù)根本沒用。

關(guān)鍵在于,這些“中獎(jiǎng)票”只有在初始隨機(jī)權(quán)重保持不變時(shí)才有效。一旦你換了初始化方式,即便保留架構(gòu),也會(huì)一敗涂地。

于是,“l(fā)ottery ticket hypothesis”(彩票假說)誕生了:大模型不是靠復(fù)雜解取勝,而是靠參數(shù)數(shù)量帶來的機(jī)會(huì)空間。每一個(gè)子網(wǎng)絡(luò)就是一張彩票,大部分注定落空,但參數(shù)足夠多,總有一張是贏家。

整個(gè)訓(xùn)練過程,就是一場規(guī)??涨暗牟势背楠?jiǎng):模型里已有成千上萬個(gè)不同起點(diǎn)的小網(wǎng)絡(luò),訓(xùn)練過程挑出那張“天選之票”,其余統(tǒng)統(tǒng)淘汰。

這個(gè)觀點(diǎn)讓傳統(tǒng)學(xué)習(xí)理論與實(shí)踐奇跡和解了:大模型之所以有效,不是因?yàn)樗`反了規(guī)則,而是它在一個(gè)我們原本沒意識(shí)到的層次上“玩轉(zhuǎn)了規(guī)則”。奧卡姆剃刀依然成立——最簡單的解釋才是最優(yōu)的。規(guī)模只是為了更高效地找到這些簡單解。

重新定義“智能”

如果“學(xué)習(xí)”就是在廣袤的可能空間中尋找最優(yōu)雅的解釋,那“智能”本身也就可以被重新定義了。

人腦有 860 億個(gè)神經(jīng)元、萬億級連接,怎么看都是“過擬合怪獸”。但我們卻能憑幾個(gè)例子學(xué)會(huì)一個(gè)全新概念,并推而廣之。彩票假說指出,人腦的這種“冗余”正是為了讓你有更高的幾率抽中那個(gè)最簡潔的解法。

智能,不是記住所有答案,而是發(fā)現(xiàn)規(guī)律的能力。大規(guī)模參數(shù)帶來的不是儲(chǔ)存空間,而是搜索空間。

科學(xué)進(jìn)步的本質(zhì):敢于懷疑“看似永恒”的法則

這場關(guān)于神經(jīng)網(wǎng)絡(luò)的發(fā)現(xiàn),也提供了科學(xué)哲學(xué)上的啟發(fā):我們很多時(shí)候不是在推翻原理,而是在揭示它們運(yùn)行得比我們以為的更深、更復(fù)雜。

想想大陸漂移,最初被視為荒唐,直到板塊構(gòu)造解釋一切;量子力學(xué)看似不合常理,直到實(shí)驗(yàn)證明一切真實(shí)存在。最深刻的進(jìn)展,往往始于“敢于嘗試看起來不應(yīng)該成功的事”。

彩票假說也沒有推翻傳統(tǒng)學(xué)習(xí)理論,而是賦予它新的維度。偏差-方差權(quán)衡還在,只是我們現(xiàn)在知道,它是在更高維度上發(fā)生作用。

這也意味著,當(dāng)前的“大模型路線”是有效的,但也不是無限擴(kuò)展的萬能鑰匙。越往后,抽中大獎(jiǎng)的邊際收益越小。像 Yann LeCun 這樣的大牛也提醒我們,僅靠規(guī)模,語言模型也許永遠(yuǎn)無法真正理解人類語言,因?yàn)樗鼈內(nèi)狈Ω拘缘募軜?gòu)突破。

AI 革命的真相:原來最重要的不是算力,而是懷疑精神

AI 的這次進(jìn)化,不只是一次技術(shù)飛躍,更是一次思想解放。

真正帶來改變的,是那群“明知不可為而為之”的研究者。他們挑戰(zhàn)了教科書、質(zhì)疑了公理,最終發(fā)現(xiàn):所謂的規(guī)則,其實(shí)并沒有錯(cuò),只是它們的運(yùn)行方式遠(yuǎn)比我們設(shè)想得更優(yōu)雅、更復(fù)雜。

在這個(gè)構(gòu)建于數(shù)學(xué)確定性的學(xué)科里,最重要的突破,卻來自于對“未知”的勇敢擁抱。

【注:】

盡管“偏差-方差權(quán)衡”這一術(shù)語直到 20 世紀(jì)后半葉才逐漸標(biāo)準(zhǔn)化,但它背后的數(shù)學(xué)思想,早在18 世紀(jì)就已萌芽。1763 年,Bayes 定理為后來的統(tǒng)計(jì)推理奠定了基礎(chǔ),使我們能夠用數(shù)據(jù)來更新信念;而Laplace在 1780 年代至 1810 年代之間的研究,則首次明確提出:模型若過于復(fù)雜,容易捕捉噪聲而非信號——必須在擬合度與簡潔性之間保持平衡。

這一思想,正是現(xiàn)代“偏差-方差權(quán)衡”原則的雛形。從那個(gè)時(shí)代開始,統(tǒng)計(jì)學(xué)就逐漸形成了這樣一種哲學(xué):最好的模型不是記住所有細(xì)節(jié),而是用最簡潔的方式解釋世界。

也就是說,當(dāng) AI 研究人員在 2019 年挑戰(zhàn)“模型越大越糟”的共識(shí)時(shí),他們不是在反對幾百年來的統(tǒng)計(jì)智慧,而是在揭示這些原則在更復(fù)雜系統(tǒng)中依舊成立,只是以更微妙的方式運(yùn)行。

本文由「AI 范兒」出品

我每天都在更新,如果你覺得這些內(nèi)容對你有用,

那我們就加個(gè)關(guān)注、交個(gè)朋友。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
房子里有“不干凈”的東西,會(huì)有以下3種特征,占一樣也不得了

房子里有“不干凈”的東西,會(huì)有以下3種特征,占一樣也不得了

神奇故事
2026-01-05 23:24:05
特斯拉新款 Model Y,發(fā)布了!

特斯拉新款 Model Y,發(fā)布了!

花果科技
2026-01-06 10:31:37
6號收評:滬指刷新階段高點(diǎn)!所有人都注意,大盤后市或?qū)⑦@樣走

6號收評:滬指刷新階段高點(diǎn)!所有人都注意,大盤后市或?qū)⑦@樣走

春江財(cái)富
2026-01-06 15:20:06
03年湖南一女教師莫名離世,6次尸檢后得出結(jié)論:特殊性方式導(dǎo)致

03年湖南一女教師莫名離世,6次尸檢后得出結(jié)論:特殊性方式導(dǎo)致

歷來都很現(xiàn)實(shí)
2024-11-23 16:03:32
馬杜羅還有救,聯(lián)合國召開大會(huì),6國出面救人,朝鮮下令發(fā)射導(dǎo)彈

馬杜羅還有救,聯(lián)合國召開大會(huì),6國出面救人,朝鮮下令發(fā)射導(dǎo)彈

軍機(jī)Talk
2026-01-06 10:23:09
大家快看看中間這個(gè)穿紅衣服的美女是誰呀?她真的好有氣質(zhì)

大家快看看中間這個(gè)穿紅衣服的美女是誰呀?她真的好有氣質(zhì)

阿廢冷眼觀察所
2026-01-04 13:31:53
馬杜羅迎來了幫手,六國為其發(fā)聲,四國對美發(fā)通牒,特朗普急了?

馬杜羅迎來了幫手,六國為其發(fā)聲,四國對美發(fā)通牒,特朗普急了?

靚仔情感
2026-01-06 12:59:59
美國千億投資打水漂后,郭臺(tái)銘想通了!帶46臺(tái)光刻機(jī)回國求賞飯

美國千億投資打水漂后,郭臺(tái)銘想通了!帶46臺(tái)光刻機(jī)回國求賞飯

奉壹數(shù)碼
2026-01-05 14:06:20
又是全球銷冠!特斯拉Model Y:他們都不看好你,可你偏偏最爭氣

又是全球銷冠!特斯拉Model Y:他們都不看好你,可你偏偏最爭氣

鄰章
2026-01-05 10:32:05
蘋果官網(wǎng)上架馬年手機(jī)保護(hù)殼,售價(jià)449元

蘋果官網(wǎng)上架馬年手機(jī)保護(hù)殼,售價(jià)449元

界面新聞
2026-01-06 11:14:08
稅務(wù)風(fēng)波僅1月,41歲岳云鵬高調(diào)告別春晚,撕下了僅剩的“體面”

稅務(wù)風(fēng)波僅1月,41歲岳云鵬高調(diào)告別春晚,撕下了僅剩的“體面”

徐幫陽
2026-01-06 21:56:36
羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

瓜汁橘長Dr
2025-12-29 11:29:56
正式確認(rèn)!首鋼第5名外援抵達(dá)北京,此外,還簽約了第6名外援

正式確認(rèn)!首鋼第5名外援抵達(dá)北京,此外,還簽約了第6名外援

體育哲人
2026-01-06 21:14:04
中超轉(zhuǎn)會(huì)動(dòng)態(tài):上海申花官宣首個(gè)本土新援,32歲老將告別上港

中超轉(zhuǎn)會(huì)動(dòng)態(tài):上海申花官宣首個(gè)本土新援,32歲老將告別上港

中超偽球迷
2026-01-06 15:59:34
59年張國燾在香港窮困潦倒,毛主席:可考慮予以補(bǔ)助,但有一要求

59年張國燾在香港窮困潦倒,毛主席:可考慮予以補(bǔ)助,但有一要求

海佑講史
2026-01-04 09:30:15
老用戶成“冤大頭”?新號29元100G 老號89元不夠用 3招破局不換號

老用戶成“冤大頭”?新號29元100G 老號89元不夠用 3招破局不換號

Thurman在昆明
2026-01-03 15:59:21
為什么鳳姐沒有跌入斬殺線?不吸毒、沒助學(xué)貸、生活在華人社會(huì)保護(hù)圈里

為什么鳳姐沒有跌入斬殺線?不吸毒、沒助學(xué)貸、生活在華人社會(huì)保護(hù)圈里

西虹市閑話
2026-01-05 15:18:06
馬杜羅夫婦在美首次出庭,表示不認(rèn)罪!馬杜羅3月17日將再次出庭!聯(lián)合國:“嚴(yán)峻時(shí)刻”

馬杜羅夫婦在美首次出庭,表示不認(rèn)罪!馬杜羅3月17日將再次出庭!聯(lián)合國:“嚴(yán)峻時(shí)刻”

每日經(jīng)濟(jì)新聞
2026-01-06 06:35:53
他出道46年零緋聞,為妻女買了26套房子,夢想回山東樂享晚年

他出道46年零緋聞,為妻女買了26套房子,夢想回山東樂享晚年

大魚簡科
2026-01-06 12:11:03
保時(shí)捷卡宴跑網(wǎng)約車,幾塊錢的單也接!已經(jīng)接了1798單!

保時(shí)捷卡宴跑網(wǎng)約車,幾塊錢的單也接!已經(jīng)接了1798單!

網(wǎng)約車焦點(diǎn)
2026-01-06 11:55:46
2026-01-06 22:36:49
AI范兒 incentive-icons
AI范兒
AI范兒是一個(gè)專注于人工智能領(lǐng)域的資訊和學(xué)習(xí)平臺(tái),提供最新的人工智能資訊
635文章數(shù) 384關(guān)注度
往期回顧 全部

科技要聞

速看!黃仁勛萬字實(shí)錄:甩出"物理AI"王牌

頭條要聞

26歲男子跳橋身亡:辦婚禮不足一月和女方分手

頭條要聞

26歲男子跳橋身亡:辦婚禮不足一月和女方分手

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強(qiáng)喬治

娛樂要聞

2026年央視春晚彩排照曝光!

財(cái)經(jīng)要聞

50萬億存款"洪流"將至 四大去向引關(guān)注

汽車要聞

摩登出街潮品 實(shí)拍奇瑞QQ冰淇淋女王版

態(tài)度原創(chuàng)

房產(chǎn)
旅游
游戲
教育
時(shí)尚

房產(chǎn)要聞

爆發(fā)!三亞開年超千畝城更計(jì)劃曝光,香港城砸下100億!

旅游要聞

新年伊始 入境游持續(xù)火熱

《星際裂變》EA評測:老工廠游戲迷哈氣了"/> 主站 商城 論壇 自運(yùn)營 登錄 注冊 《星際裂變》EA評測:老工廠游戲迷哈氣了 海星罐頭 2026-01...

教育要聞

考試復(fù)習(xí)和打工和創(chuàng)業(yè)的對比-《中考高考備考心理提升訓(xùn)練特輯-12》

冬天,“大衣”是中年女人的穿搭剛需,這樣搭配時(shí)髦提氣質(zhì)

無障礙瀏覽 進(jìn)入關(guān)懷版