国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

伯克利、哈佛、賓夕法尼亞、斯坦福重磅綜述:“學習力學”將成為深度學習的科學理論

0
分享至

來源:市場資訊

(來源:圖靈人工智能)

您想知道的人工智能干貨,第一時間送達



來自Berkeley,Pennsylvania,Harvard,New York,Stanford大學等多位頂尖學者聯合發(fā)表綜述【文獻1】,為深度學習的科學理論做奠基。


觀點

論文開篇提出,一個能刻畫神經網絡訓練過程、隱藏表征、最終權重和性能的科學理論正在形成。

作者整合了五個主要研究方向作為證據:

1)可求解的理想化模型;2)提供洞見的極限分析;3)描述宏觀量的簡單定律;4)對超參數的理論解耦;5)跨系統(tǒng)的普遍行為。

這些工作的共同點是,關注訓練動態(tài)過程、描述粗粒化統(tǒng)計量、強調可證偽的定量預測。

論文將這一新興理論命名為“學習力學”,并主張它應該是一門數學化、基于第一性原理、能精確預測與實證的學科,最終像物理學那樣對整個機器學習領域產生廣泛影響。

1. 引言

深度學習是當前最強大也最令人費解的黑箱方法,理論落后于實踐,模型仍靠大量試錯訓練。論文主張:

一個深度學習的科學理論,正以學習力學的形態(tài)浮現。

1.1 什么是學習力學?


1.2 學習力學為什么重要


2. 證據

深度學習的運動方程是顯式且高度可測量的,核心挑戰(zhàn)是高維非線性帶來的復雜性。

2.1 存在可解析的理想化模型

通過研究簡化但不失代表性的模型來構建直覺,是物理學的成功范式,深度學習亦然。



2.2 富有洞察的極限揭示基本行為

復雜系統(tǒng)在無限大的極限下常會簡化,就像理想氣體定律在粒子數無限的熱力學極限下導出,卻能夠描述現實氣體。這一思路是深度學習理論的核心工具。


無限寬度與惰性核/富特征二分:


其他極限:

無限深度、上下文長度等極限同樣存在。不同變量的聯合縮放極限尤其重要,如將參數和數據量同時推向無窮,是理論解釋計算最優(yōu)縮放定律的關鍵。

離散化假說:

一個普遍信念是,真實網絡可被理解為無限大理想模型的有噪、有限離散化版本。這暗示著,有限寬度、深度等效應通常只是對理想性能的擾動和成本妥協,而不是帶來根本性的優(yōu)勢。

2.3 簡單的經驗定律捕捉有意義的宏觀統(tǒng)計量

科學史上許多重要定律(例如牛頓三定律、歐姆定律)都是先作為經驗規(guī)律被發(fā)現。深度學習同樣具備這一條件。




粗粒化與潛表征權重:

包括神經坍縮,網絡末層特征會形成規(guī)則的幾何結構;神經特征假設,首層權重的結構與輸入梯度的外積相關;以及守恒定律,源自參數化中的對稱性。

2.4 超參數可以被解耦和理解



架構超參數:

最大更新參數化(μP)是這個方向的典范。它在寬度放大時,通過理論設定每一層的初始化方差和學習率縮放,保證了超參數在不同模型尺寸間的可遷移性,使得用小模型搜索最優(yōu)超參數并直接用于大模型成為可能,極大降低了調參成本。


2.5 普遍現象

許多非平凡的行為不止出現一次,而是在不同架構、數據集和任務中反復涌現,或許是理論存在最根本的證據。有三類普遍現象:


3. 視角

3.1 統(tǒng)計和信息論


3.2 機制可解釋性

機制可解釋性可以比作深度學習的生物學,目的是通過解剖神經網絡,在神經元和回路層面理解具體的內部機制,例如特定的安全或不安全的計算環(huán)路。

學習力學則可以比作深度學習的物理學,目的是尋找支配網絡學習、特征形成和動態(tài)演化的普遍第一性原理,就像物理學為所有物質提供底層規(guī)律一樣。

3.3 共生關系

這兩種視角應是共生、互相支持的。


4. 異見

作者坦承,構建這樣的理論很困難,且學界對理論能走到多遠存在合理質質疑。論文逐一回應四種核心反對意見。

4.1 網絡有數十億參數,動態(tài)高度非線性和耦合,不可能有簡潔理論。


4.2 當前理論多基于無限寬度、梯度流、高斯數據等假設,與現實脫節(jié)。


4.3 真實世界的數據分布無比復雜且無法刻畫,理論注定無法處理。


4.4 深度學習進步靠的是算力、工程和直覺,理論并無實際用處。


5. 方向

綜述列舉十個方向展示學習力學當前面臨的挑戰(zhàn)的深度和廣度,吸引不同背景的研究者參與。


為離散化假說建立嚴格基礎:

2.2節(jié)真實網絡是有噪離散近似,需要將這個概念數學化,并定量計算出有限寬度、深度、學習率等引入的修正項,證明它們在有利情況下確實很小。


理解分布式訓練和同步的作用:

大規(guī)模訓練多采用數據并行等分布式策略,這會改變噪聲結構和有效批量大小。理論需要告訴我們分布式訓練何時會改變學習的結果,以及如何最優(yōu)地設置并行度。

與人腦和生物學習建立聯系:

作為長遠愿景,學習力學揭示的約束和最優(yōu)策略,可能會對理解生物大腦的學習規(guī)則和計算原則提供深刻的規(guī)范性洞見。

6. 組織

大家可以找到組織了:learningmechanics.pub 。

對照

與筆者的大模型數理框架對照分析:

與“學習力學”意圖一致,筆者通過數理框架刻畫訓練動力學、表征結構與泛化行為之間的關系,本質上是高維統(tǒng)計系統(tǒng)的演化規(guī)律。




這是筆者心目中的整體圖景:

大模型是一個在高維概率空間中,通過重整化流演化、借助Attention進行粗;,并通過對稱性破缺形成范疇結構的統(tǒng)計物理系統(tǒng)。

這個框架不僅良好匹配前沿的大模型行為,也在神經生物學新發(fā)現中不斷得到驗證。讀者可以參考《清熙》的相應文章。

文獻1,There Will Be a Scientific Theory of Deep Learning,https://arxiv.org/pdf/2604.21691

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
又一省份推動帶薪休假落地

又一省份推動帶薪休假落地

澎湃新聞
2026-04-28 11:11:03
境外勢力掏錢讓你“躺平”?這波操作,真把年輕人當韭菜割了

境外勢力掏錢讓你“躺平”?這波操作,真把年輕人當韭菜割了

迷世書童H9527
2026-04-28 10:30:43
43歲蔡卓妍官宣結婚,婚戒照好幸福,老公比她小10歲是健身教練

43歲蔡卓妍官宣結婚,婚戒照好幸福,老公比她小10歲是健身教練

扒蝦侃娛
2026-04-28 12:34:53
足壇一夜動態(tài):巴黎擊敗拜仁,利雅得新月險勝,世界杯宣布新規(guī)

足壇一夜動態(tài):巴黎擊敗拜仁,利雅得新月險勝,世界杯宣布新規(guī)

足球狗說
2026-04-29 05:40:36
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
深圳這天,吳彥祖發(fā)福、周潤發(fā)干癟,郭富城穿10cm厚底鞋還矮半頭

深圳這天,吳彥祖發(fā)福、周潤發(fā)干癟,郭富城穿10cm厚底鞋還矮半頭

秋姐居
2026-04-27 19:35:02
歐冠名局!大巴黎5-4逆轉,拜仁難了:8強淘汰皇馬的球隊難進決賽

歐冠名局!大巴黎5-4逆轉,拜仁難了:8強淘汰皇馬的球隊難進決賽

體育知多少
2026-04-29 06:17:36
濱州潤達城市發(fā)展集團有限公司原黨委書記、董事長竇利濱被查

濱州潤達城市發(fā)展集團有限公司原黨委書記、董事長竇利濱被查

齊魯壹點
2026-04-28 11:07:07
老人從81歲到91歲還清2077萬的債,96歲“誠信奶奶”陳金英回應:不過是守住了做人的底線

老人從81歲到91歲還清2077萬的債,96歲“誠信奶奶”陳金英回應:不過是守住了做人的底線

九州新聞
2026-04-28 12:44:14
NBA敲定反擺爛方案!命名3-2-1樂透規(guī)則 將于2027年選秀生效

NBA敲定反擺爛方案!命名3-2-1樂透規(guī)則 將于2027年選秀生效

羅說NBA
2026-04-29 06:06:03
警惕!境外組織做局躺平,資助網紅洗腦青年,國安部緊急提醒

警惕!境外組織做局躺平,資助網紅洗腦青年,國安部緊急提醒

青梅侃史啊
2026-04-28 16:52:45
黑八了!真黑八了,88分,從來沒見過這么垃圾的第一

黑八了!真黑八了,88分,從來沒見過這么垃圾的第一

體育新角度
2026-04-28 14:06:05
這條新聞在今天看來,諷刺至極!

這條新聞在今天看來,諷刺至極!

胖胖說他不胖
2026-04-27 09:00:43
極度炸裂!女子和閨蜜爬山游玩,碰到了男友和另一個閨蜜同游!

極度炸裂!女子和閨蜜爬山游玩,碰到了男友和另一個閨蜜同游!

川渝視覺
2026-04-28 23:40:51
面試官:“你一天燒多少 Token?” 我:“不知道! 面試官:“那你別面了,回去吧!

面試官:“你一天燒多少 Token?” 我:“不知道! 面試官:“那你別面了,回去吧。”

程序員魚皮
2026-04-28 13:35:11
她終于重回顏值巔峰!

她終于重回顏值巔峰!

奮斗在韓國
2026-04-27 19:19:56
阿聯酋油企通知客戶下月在霍爾木茲海峽外提貨

阿聯酋油企通知客戶下月在霍爾木茲海峽外提貨

每日經濟新聞
2026-04-28 21:20:34
北京天壇醫(yī)院、協和醫(yī)院等首次證實人腦中存在“微/納米塑料”

北京天壇醫(yī)院、協和醫(yī)院等首次證實人腦中存在“微/納米塑料”

IT之家
2026-04-28 18:11:13
4月28日,人社部召開發(fā)布會,退休人員養(yǎng)老金調整通知公布了嗎?

4月28日,人社部召開發(fā)布會,退休人員養(yǎng)老金調整通知公布了嗎?

閱微札記
2026-04-28 16:51:09
大陸為什么不攔?美最后一批坦克送達臺島,博主:他們甚至沒保密

大陸為什么不攔?美最后一批坦克送達臺島,博主:他們甚至沒保密

領悟看世界
2026-04-28 23:50:06
2026-04-29 06:44:49
新浪財經 incentive-icons
新浪財經
新浪財經是一家創(chuàng)建于1999年8月的財經平臺
3051899文章數 6991關注度
往期回顧 全部

科技要聞

10億周活目標落空!傳OpenAI爆發(fā)內部分歧

頭條要聞

美國禁止本國個人或實體向伊朗繳納霍爾木茲通行費

頭條要聞

美國禁止本國個人或實體向伊朗繳納霍爾木茲通行費

體育要聞

魔術黑八活塞,一步之遙?!

娛樂要聞

蔡卓妍官宣結婚,老公比她小10歲

財經要聞

中央政治局會議定調,八大看點速覽!

汽車要聞

拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

態(tài)度原創(chuàng)

家居
游戲
房產
健康
軍事航空

家居要聞

江景風格 流動的秩序

PS6最大賣點曝光!高端PC終于能平替了

房產要聞

紅利爆發(fā)!海南,沖到全國人口增量第4省!

干細胞治療燒燙傷三大優(yōu)勢!

軍事要聞

德國總理默茨:美國正遭受伊朗領導層的羞辱

無障礙瀏覽 進入關懷版