国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

UC伯克利實(shí)現(xiàn)預(yù)訓(xùn)練機(jī)器學(xué)習(xí)勢(shì)函數(shù)的跨泛函遷移學(xué)習(xí)

0
分享至



作者 | 論文團(tuán)隊(duì)

編輯 | ScienceAI

原子級(jí)模擬為材料性質(zhì)的預(yù)測(cè)與虛擬篩選提供了重要手段,其核心在于準(zhǔn)確描述體系的勢(shì)能面(PES)。相比于傳統(tǒng) PES 的計(jì)算所依賴的方法——從頭算量子化學(xué)方法(如密度泛函理論 DFT)與經(jīng)驗(yàn)力場(chǎng)而言,機(jī)器學(xué)習(xí)原子間勢(shì)函數(shù)可以更好權(quán)衡精度與效率,通過從 DFT 數(shù)據(jù)中學(xué)習(xí)原子間相互作用,對(duì) PES 進(jìn)行準(zhǔn)確構(gòu)建。

近年來,隨著數(shù)據(jù)和模型規(guī)模的擴(kuò)大,基于數(shù)百萬(wàn) DFT 計(jì)算訓(xùn)練的基座勢(shì)能(foundation potentials, FPs)進(jìn)一步展現(xiàn)出跨化學(xué)空間的泛化潛力,已被廣泛用于聲子譜預(yù)測(cè)、相圖構(gòu)建、催化篩選與分子動(dòng)力學(xué)模擬等下游任務(wù),為多尺度材料建模奠定了新的基礎(chǔ)。

然而,絕大多數(shù) FPs 依然是在大量低精度 GGA/GGA+U 的 DFT 泛函數(shù)據(jù)上訓(xùn)練的,隨著我們對(duì)于下游任務(wù)提出更高的模擬精度的需求,經(jīng)低精度數(shù)據(jù)預(yù)訓(xùn)練的模型亟待通過對(duì)于高精度數(shù)據(jù)(如 r2SCAN、HSE06 泛函)的遷移學(xué)習(xí),構(gòu)造為精度更高的模型。

為應(yīng)對(duì)這一跨泛函遷移挑戰(zhàn),來自加州大學(xué)伯克利分校(UCB)的黃旭,鄧博文,鐘佩辰及 Gerbrand Ceder 教授等,在名為 CHGNet 的基座勢(shì)能框架內(nèi)分析了這一跨泛函由低精度數(shù)據(jù)到高精度數(shù)據(jù)遷移學(xué)習(xí)問題的挑戰(zhàn)及解決方案。

該研究以「Cross-functional transferability in foundation machine learning interatomic potentials」為題,于 2025 年 10 月 21 日刊登于《npj Computational Materials》。



論文鏈接:https://www.nature.com/articles/s41524-025-01796-y

基座勢(shì)能在當(dāng)前訓(xùn)練數(shù)據(jù)的局限及跨泛函遷移的挑戰(zhàn)

目前用于晶體材料的基座勢(shì)能(FPs)訓(xùn)練的數(shù)據(jù)集主要是 GGA 和 GGA+U 水平的 DFT 泛函數(shù)據(jù)組成。

首先,GGA/GGA + U 泛函在不同化學(xué)鍵環(huán)境下的遷移能力較低,整體計(jì)算精度較低。其次,為減少 GGA 中的自相互作用誤差而施加的 Hubbard U 校正,本質(zhì)上是半經(jīng)驗(yàn)性的且具有非普適性?!缸顑?yōu)」U 值并沒有明確的定義,線性響應(yīng)法等方法表明,這樣的最優(yōu) U 值通常依賴于具體體系。

然而,GGA/GGA + U 的 FP 數(shù)據(jù)集在生成時(shí),對(duì)每種元素都使用相同的 U 值,而不考慮局部環(huán)境或形式價(jià)態(tài)。再次,我們通常采用一種粗粒度的方案將 GGA 與 GGA + U 混合以構(gòu)建 FPs 訓(xùn)練集。這樣的混合方式可能引發(fā)問題,例如在這些訓(xùn)練數(shù)據(jù)之間移動(dòng)時(shí),原子間勢(shì)能可能會(huì)出現(xiàn)數(shù)百 meV 的突躍,這是不利于平滑勢(shì)能面構(gòu)建的。

在多精度 DFT 數(shù)據(jù)集之間實(shí)現(xiàn)顯式或隱式的跨泛函可遷移性的主要策略有三種:遷移學(xué)習(xí)(transfer learning)、多精度學(xué)習(xí)(multi-fidelity learning)以及混合多精度訓(xùn)練(mixed multi-fidelity training)。

這三種方法有各自的優(yōu)勢(shì)及挑戰(zhàn),其中,遷移學(xué)習(xí)指的是先在大規(guī)模的低精度數(shù)據(jù)集上對(duì)一個(gè)大型神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,然后將該網(wǎng)絡(luò)的預(yù)訓(xùn)練權(quán)重用于初始化在更小規(guī)模的高精度數(shù)據(jù)集上的機(jī)器學(xué)習(xí)任務(wù)。這種方法在計(jì)算和數(shù)據(jù)利用上都非常高效。然而,如果不同精度數(shù)據(jù)集之間的相關(guān)性不夠強(qiáng),遷移學(xué)習(xí)的效果就會(huì)變差,甚至可能導(dǎo)致性能下降,這種現(xiàn)象被稱為「負(fù)遷移」(negative transfer)。

MP-r2SCAN 數(shù)據(jù)集

研究團(tuán)隊(duì)構(gòu)建了一個(gè)來自 Materials Project 數(shù)據(jù)庫(kù)的 r2SCAN 弛豫軌跡解析而成的 r2SCAN 數(shù)據(jù)集(MP-r2SCAN),用于高精度訓(xùn)練任務(wù),包含 34,927 個(gè)材料 ID 和 238,247 個(gè)結(jié)構(gòu)。與 MPtrj 數(shù)據(jù)集(包含 145,923 個(gè)材料 ID 和 1,580,395 個(gè)結(jié)構(gòu))相比,MP-r2SCAN 的數(shù)據(jù)規(guī)模顯著更小。

如下圖圖 b 所示,r2SCAN 與 GGA/GGA + U 的總能量分布在不同的數(shù)值范圍上。從 GGA/GGA + U 到 r2SCAN 的能量偏移量在 0–70 eV/atom 的量級(jí),這遠(yuǎn)大于勢(shì)函數(shù)能量精度(約 30 meV/atom),這表明這些 r2SCAN 能量標(biāo)簽若沒有合適的參考或歸一化處理,是無法直接有效遷移使用的。



使用不同原子參考能量的遷移學(xué)習(xí)及基準(zhǔn)測(cè)試





對(duì)于在具有基于 GGA/GGA + U 總能量擬合的 AtomRef 的勢(shì)函數(shù) FP 上進(jìn)行的跨泛函遷移學(xué)習(xí),可以重新擬合該 FP 的 AtomRef(用基于 r2SCAN 能量擬合得到的 AtomRef 替換原有的基于 GGA/GGA + U 的 AtomRef),從而將 FP 遷移前后圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的能量預(yù)測(cè)部分對(duì)齊到相近的數(shù)值尺度,并提升預(yù)訓(xùn)練與微調(diào)數(shù)據(jù)集之間的相關(guān)性,克服遷移學(xué)習(xí)中「負(fù)遷移」的挑戰(zhàn)。實(shí)際上,Pearson 相關(guān)系數(shù) ρ 從未修正的 GGA/GGA + U 與 r2SCAN 數(shù)據(jù)集之間的 0.0917,提高到了在分別減去各自 AtomRef 后的 r2SCAN 能量與 GGA/GGA + U 能量之間的 0.9250。此外,此種方法也減少了微調(diào)開始階段梯度過大導(dǎo)致的訓(xùn)練不穩(wěn)定性。由下圖可以觀察到,不重新擬合 AtomRef 的方法的初始梯度幅值至少比重新擬合 AtomRef 的方法大一個(gè)數(shù)量級(jí),且重新擬合 AtomRef 后,模型的訓(xùn)練過程更加穩(wěn)定且可靠。



在基準(zhǔn)測(cè)試方面,該研究將重新擬合原子參考能量進(jìn)行遷移學(xué)習(xí)的方法和其他幾個(gè)遷移學(xué)習(xí)方法以及從頭用 r2SCAN 數(shù)據(jù)訓(xùn)練(無遷移學(xué)習(xí))的方法進(jìn)行了對(duì)比,得到在能量、原子間作用力、應(yīng)力、磁矩、熱力學(xué)穩(wěn)定性(形成能、分解能)、密度預(yù)測(cè)方面都更準(zhǔn)確可靠的 FPs。如下圖所示,方法 4(即重新擬合原子參考能量的遷移學(xué)習(xí))在密度預(yù)測(cè)(與實(shí)驗(yàn)密度數(shù)據(jù)對(duì)比)方法顯著優(yōu)于其他方法。此外,實(shí)驗(yàn)值與預(yù)測(cè)值之比的分布顯示,基于 GGA 預(yù)訓(xùn)練的 CHGNet 模型更傾向于低估密度,而方法 4 所得到的分布相比其他方法更緊密地集中在理想值(比值 = 1)附近。上述結(jié)果表明,從 GGA 向 r2SCAN 的遷移學(xué)習(xí)方法是有效的,并且使用 r2SCAN 數(shù)據(jù)、通過方法 4 訓(xùn)練得到的模型在實(shí)際體積與密度預(yù)測(cè)中具有更高的精度潛力。



除了從 GGA/GGA+U 到 r2SCAN 泛函數(shù)據(jù)遷移學(xué)習(xí),團(tuán)隊(duì)也研究了從 GGA/GGA+U 到鹵化物范德華數(shù)據(jù)集和 HSE06 數(shù)據(jù)集的遷移學(xué)習(xí)(見論文中的補(bǔ)充信息),證明了這種遷移方法的普適有效性。

擴(kuò)展定律

為評(píng)估重新擬合原子參考能量的遷移學(xué)習(xí)方法的數(shù)據(jù)效率提升,研究團(tuán)隊(duì)進(jìn)行了擴(kuò)展定律研究(下圖)。線性擬合結(jié)果表明,無論是從頭用 r2SCAN 數(shù)據(jù)訓(xùn)練(無遷移學(xué)習(xí))還是遷移學(xué)習(xí)(藍(lán)色),都表現(xiàn)出線性擴(kuò)展規(guī)律的行為。僅使用 1K 個(gè)高精度數(shù)據(jù)點(diǎn)進(jìn)行遷移學(xué)習(xí),就能超越在超過 10K 個(gè)高精度數(shù)據(jù)點(diǎn)上從頭訓(xùn)練的模型性能,這意味著通過 GGA 預(yù)訓(xùn)練步驟獲得了超過十倍的數(shù)據(jù)效率提升。有趣的是,研究團(tuán)隊(duì)觀察到,即使在包含 24 萬(wàn)個(gè)結(jié)構(gòu)的完整 MP-r2SCAN 數(shù)據(jù)集上,遷移學(xué)習(xí)相較于從頭訓(xùn)練的優(yōu)勢(shì)仍未飽和,表現(xiàn)出出色的數(shù)據(jù)效率。



總結(jié)與展望

研究團(tuán)隊(duì)通過在 MP-r2SCAN 數(shù)據(jù)集上對(duì)不同 TL 方法進(jìn)行得到在能量、原子間作用力、應(yīng)力、磁矩、熱力學(xué)穩(wěn)定性(形成能、分解能)、密度預(yù)測(cè)方面的基準(zhǔn)測(cè)試,證明了 FPs 遷移學(xué)習(xí)中重新擬合原子參考能量的重要性及此方法的有效性。并且,通過比較具有和不具有低精度數(shù)據(jù)集預(yù)訓(xùn)練的擴(kuò)展定律,研究表明了得當(dāng)?shù)倪w移學(xué)習(xí)方法可以實(shí)現(xiàn)顯著的數(shù)據(jù)效率提升。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
79歲李保田現(xiàn)狀:定居山東衰老明顯,兒子李彧長(zhǎng)得像父親“翻版”

79歲李保田現(xiàn)狀:定居山東衰老明顯,兒子李彧長(zhǎng)得像父親“翻版”

小熊侃史
2025-12-20 10:56:45
好消息!老杜再次被刑事控告

好消息!老杜再次被刑事控告

蜻蜓世音
2025-12-27 16:57:03
中國(guó)軍隊(duì)回撤時(shí)越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

中國(guó)軍隊(duì)回撤時(shí)越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

古書記史
2025-12-22 19:50:50
元旦開始咸魚翻身!家有這 3 生肖,財(cái)運(yùn)大開,事業(yè)喜事扎堆來!

元旦開始咸魚翻身!家有這 3 生肖,財(cái)運(yùn)大開,事業(yè)喜事扎堆來!

人閒情事
2025-12-27 16:42:36
女子高峰期占電梯后續(xù):被暴打,正面曝光,已社死,結(jié)局很舒適

女子高峰期占電梯后續(xù):被暴打,正面曝光,已社死,結(jié)局很舒適

尋墨閣
2025-12-27 08:45:27
12月27日俄烏最新:打開對(duì)俄攻擊新的一頁(yè)

12月27日俄烏最新:打開對(duì)俄攻擊新的一頁(yè)

西樓飲月
2025-12-27 19:22:58
何超瓊現(xiàn)身天津!戴珍珠耳環(huán)穿布鞋,走路搖搖晃晃頭發(fā)凌亂像老太

何超瓊現(xiàn)身天津!戴珍珠耳環(huán)穿布鞋,走路搖搖晃晃頭發(fā)凌亂像老太

樂悠悠娛樂
2025-12-26 13:33:22
“早餐這么豐盛,女兒還翻白眼”,2.2w人怒了:讓她餓肚子上學(xué)!

“早餐這么豐盛,女兒還翻白眼”,2.2w人怒了:讓她餓肚子上學(xué)!

卷史
2025-12-26 21:18:25
省隊(duì)接手,跳水隊(duì)不再負(fù)責(zé)全紅嬋?原因曝光,誰(shuí)注意隊(duì)醫(yī)薇姐去向

省隊(duì)接手,跳水隊(duì)不再負(fù)責(zé)全紅嬋?原因曝光,誰(shuí)注意隊(duì)醫(yī)薇姐去向

體育有點(diǎn)水
2025-12-26 15:04:04
向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

娛樂看阿敞
2025-12-12 15:50:00
北京明天傍晚至夜間北風(fēng)再起,元旦降溫或迎“新年雪”

北京明天傍晚至夜間北風(fēng)再起,元旦降溫或迎“新年雪”

新京報(bào)北京知道
2025-12-27 16:25:27
熱刺徹底跌出英超 Big6?從歐冠決賽到恐降級(jí)!多年瞎搞終嘗苦果

熱刺徹底跌出英超 Big6?從歐冠決賽到恐降級(jí)!多年瞎搞終嘗苦果

瀾歸序
2025-12-27 02:09:56
哈登34+2+6!快船14分大逆轉(zhuǎn),看數(shù)據(jù):他是頭號(hào)功臣!

哈登34+2+6!快船14分大逆轉(zhuǎn),看數(shù)據(jù):他是頭號(hào)功臣!

運(yùn)籌帷幄的籃球
2025-12-27 12:20:48
她16歲帶病奪冠,退役后定居美國(guó),嫁美國(guó)帥哥,如今已當(dāng)上大老板

她16歲帶病奪冠,退役后定居美國(guó),嫁美國(guó)帥哥,如今已當(dāng)上大老板

知鑒明史
2025-12-14 10:10:02
“嘎子哥”謝孟偉拒還169萬(wàn)欠款成老賴,原賬號(hào)被封后轉(zhuǎn)戰(zhàn)視頻號(hào),稱“希望大家給次機(jī)會(huì)”

“嘎子哥”謝孟偉拒還169萬(wàn)欠款成老賴,原賬號(hào)被封后轉(zhuǎn)戰(zhàn)視頻號(hào),稱“希望大家給次機(jī)會(huì)”

極目新聞
2025-12-26 22:36:25
廣東宏遠(yuǎn)今日早報(bào)!徐杰最新傷情,朱芳雨深夜發(fā)聲,挖出最大水貨

廣東宏遠(yuǎn)今日早報(bào)!徐杰最新傷情,朱芳雨深夜發(fā)聲,挖出最大水貨

多特體育說
2025-12-27 07:40:03
拼多多存在的意義是什么?網(wǎng)友:會(huì)過日子的打工族都在用它

拼多多存在的意義是什么?網(wǎng)友:會(huì)過日子的打工族都在用它

帶你感受人間冷暖
2025-12-21 00:20:09
日本神奈川某高中因JK校服太可愛了遭扎堆偷拍

日本神奈川某高中因JK校服太可愛了遭扎堆偷拍

隨波蕩漾的漂流瓶
2025-12-26 18:35:03
年?duì)I收300萬(wàn),28個(gè)員工,最后利潤(rùn)8萬(wàn)塊:這就是最真實(shí)小老板!

年?duì)I收300萬(wàn),28個(gè)員工,最后利潤(rùn)8萬(wàn)塊:這就是最真實(shí)小老板!

熊林老師
2025-11-17 18:00:03
2億歐!西媒曝曼聯(lián)明夏簽貝林厄姆,大英帝星將成曼聯(lián)新核心?

2億歐!西媒曝曼聯(lián)明夏簽貝林厄姆,大英帝星將成曼聯(lián)新核心?

夏侯看英超
2025-12-27 19:17:18
2025-12-27 20:23:00
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1191文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗(yàn)?zāi)?回家后工作沒了

頭條要聞

男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗(yàn)?zāi)?回家后工作沒了

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

旅游
時(shí)尚
親子
本地
軍事航空

旅游要聞

來云南野生動(dòng)物園找新年“彩蛋”啦!

從0度穿到20度,這件衣服才是今年冬天的“頂流”!

親子要聞

1歲多的小朋友上托管班,吃飯時(shí)自己拿起勺子就“開炫”,網(wǎng)友:這小孩是來報(bào)恩的吧

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬(wàn)年史書

軍事要聞

英法德三國(guó)領(lǐng)導(dǎo)人通話 重申對(duì)烏支持

無障礙瀏覽 進(jìn)入關(guān)懷版