国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

知識(shí)引導(dǎo)的分子圖像自監(jiān)督學(xué)習(xí)框架,破解活性懸崖識(shí)別難題

0
分享至



作者丨論文團(tuán)隊(duì)

編輯丨ScienceAI

在藥物發(fā)現(xiàn)領(lǐng)域,一個(gè)長(zhǎng)期存在的挑戰(zhàn)是活性懸崖(Activity Cliffs)現(xiàn)象,即兩個(gè)分子結(jié)構(gòu)高度相似但生物活性卻存在顯著差異,然而,由于傳統(tǒng)方法在識(shí)別活性懸崖時(shí),會(huì)出現(xiàn)表征坍塌的問題,因此仍然難以準(zhǔn)確捕捉懸崖分子的細(xì)微差別。

近日,湖南大學(xué)等團(tuán)隊(duì)在《BMC Biology》上發(fā)表了一項(xiàng)研究《MaskMol: knowledge-guided molecular image pre-training framework for activity cliffs with pixel masking》,這項(xiàng)研究開發(fā)了名為 MaskMol 的知識(shí)引導(dǎo)分子圖像自監(jiān)督預(yù)訓(xùn)練框架,該框架能通過細(xì)粒度知識(shí)引導(dǎo)的像素掩碼策略進(jìn)行準(zhǔn)確的活性懸崖估計(jì)。

活性懸崖與傳統(tǒng)模型的局限

分子性質(zhì)預(yù)測(cè)是藥物研發(fā)的核心環(huán)節(jié),其核心假設(shè)是結(jié)構(gòu)相似則性質(zhì)相似(圖 1 左)。然而活性懸崖的存在恰恰是這一理念的例外,這類分子對(duì)結(jié)構(gòu)差異微小,生物活性卻相差顯著。

圖 1 右側(cè)可見,僅一個(gè)原子不同的分子,高活性(紅色標(biāo)注)與低活性(綠色標(biāo)注)形成鮮明對(duì)比,這種結(jié)構(gòu)近、活性遠(yuǎn)的現(xiàn)象,正是活性懸崖的典型特征,而傳統(tǒng)模型難以應(yīng)對(duì)這一挑戰(zhàn)的根源在于表征坍縮問題。



圖 1:特征空間中 SAR(左)和活性懸崖(右)的示意圖。



圖 2:特征空間中 Graph 和 Image 表征的比較。

如圖 2 所示,研究通過對(duì)比分子相似度與特征空間距離,發(fā)現(xiàn)隨著分子相似度(橫軸,Tanimoto 系數(shù))升高,圖模型(如 GCN、MPNN)的特征歐氏距離(縱軸)快速下降,這意味著結(jié)構(gòu)相似的分子在特征空間中幾乎重疊,導(dǎo)致表征坍塌,無法區(qū)分;而分子圖像的特征距離下降更平緩,保留了更多差異信息。

MaskMol框架:知識(shí)引導(dǎo)的分子圖像學(xué)習(xí)

更進(jìn)一步,活性懸崖通常由不同分子層次上的細(xì)微變化引起,例如特定原子取代、鍵修飾或官能團(tuán)取代。例如,在原子層面,將苯環(huán)上的氫原子替換為氯原子,會(huì)導(dǎo)致分子與受體的結(jié)合相互作用發(fā)生顯著變化,從而影響其生物活性。

因此,團(tuán)隊(duì)的目標(biāo)是將已有化學(xué)知識(shí)融入模型,利用這種與活性懸崖相關(guān)的知識(shí)指導(dǎo)模型學(xué)習(xí)分子。從而,文章中提出 MaskMol,以分子圖像為核心表征,通過知識(shí)引導(dǎo)的像素掩碼與細(xì)粒度知識(shí)引導(dǎo)的像素掩碼預(yù)測(cè)任務(wù)構(gòu)建從分子圖像到化學(xué)知識(shí)的映射,其完整流程如圖 3 所示。

MaskMol 框架包含兩大核心模塊:

(1)三種知識(shí)引導(dǎo)的像素掩蔽策略:具體而言,研究團(tuán)隊(duì)首先將分子 SMILES 轉(zhuǎn)換為二維圖像,然后利用 RDKit 分別對(duì)原子、化學(xué)鍵和子結(jié)構(gòu)進(jìn)行高亮標(biāo)記,利用 HSV 檢測(cè)生成掩碼集,并與原始圖像結(jié)合,生成三張不同知識(shí)層次的分子掩碼圖像。

(2)三個(gè)用于預(yù)訓(xùn)練的知識(shí)引導(dǎo)像素掩碼預(yù)測(cè)任務(wù)。訓(xùn)練一個(gè) Vision Transformer(ViT)模型來預(yù)測(cè)被掩碼部分所代表的不同層級(jí)(原子級(jí),化學(xué)鍵級(jí),子結(jié)構(gòu)級(jí))的化學(xué)知識(shí),這種設(shè)計(jì)迫使模型從圖像的剩余上下文中學(xué)習(xí)分子結(jié)構(gòu)的深層化學(xué)語義。



圖 3:MaskMol 框架。

下游任務(wù)性能

研究團(tuán)隊(duì)在活性懸崖估計(jì)(ACE)和化合物效能預(yù)測(cè)(CPP)兩個(gè)關(guān)鍵下游任務(wù)上對(duì) MaskMol 進(jìn)行了全面評(píng)估。在活性懸崖估計(jì)任務(wù)上,MaskMol 與 25 種先進(jìn)的深度學(xué)習(xí)和機(jī)器學(xué)習(xí)方法進(jìn)行了比較,涵蓋了基于序列、圖(2D 和 3D)、圖像及多模態(tài)的模型。如圖 4 所示,MaskMol 在 10 個(gè)不同的 ACE 數(shù)據(jù)集上取得了最低的 RMSE。

特別是在骨架劃分設(shè)置下(圖 5),MaskMol 相比圖像模型(ImageMol)均有顯著提升,平均 RMSE 提升超過了 17.0%,這證明了其優(yōu)秀的泛化能力。同時(shí),MaskMol 在化合物效能預(yù)測(cè)任務(wù)上也表現(xiàn)出色,即使在預(yù)訓(xùn)練數(shù)據(jù)量(200 萬)遠(yuǎn)少于某些基線模型(1000 萬)的情況下,其預(yù)測(cè)精度仍優(yōu)于對(duì)比模型,顯示了框架的數(shù)據(jù)效率。



圖 4:活性懸崖估計(jì)實(shí)驗(yàn)結(jié)果。



圖 5:骨架劃分實(shí)驗(yàn)結(jié)果。

消融實(shí)驗(yàn)

為了深入驗(yàn)證 MaskMol 中各個(gè)組件的有效性,合理性,研究團(tuán)隊(duì)還進(jìn)行了系統(tǒng)的消融實(shí)驗(yàn),結(jié)果如上圖所示:圖 6c 的消融研究揭示了三個(gè)預(yù)訓(xùn)練任務(wù)的重要性,移除任何預(yù)訓(xùn)練任務(wù)都會(huì)導(dǎo)致性能下降,其中 Motif 級(jí)任務(wù)(MMPP)的影響最大,凸顯了子結(jié)構(gòu)知識(shí)對(duì)于捕捉活性懸崖關(guān)鍵細(xì)微差異的核心作用。

在圖中可以看到,與未預(yù)訓(xùn)練的模型相比,完整的預(yù)訓(xùn)練帶來了平均超過 34% 的性能增益。圖 6d 探討了像素掩碼比例的影響,與 BERT(15%)或 MAE(75%)不同,MaskMol 在分子圖像上的最佳掩碼比例為 50%,這很可能與分子圖像本身信息稀疏、有效像素占比較低的特性有關(guān)。

圖 6e 進(jìn)一步分析了圖像大小影響,結(jié)果表明分子圖像的大小對(duì)性能無顯著影響(p>0.05)。



圖 6:消融實(shí)驗(yàn)。

可解釋性分析

為了理解 MaskMol 的成功機(jī)理,研究團(tuán)隊(duì)進(jìn)行了特征空間探索,注意力可視化,化學(xué)知識(shí)解釋等三方面的可解釋性分析。

特征空間探索:圖 7a-b 顯示,基于 MaskMol 學(xué)習(xí)到的分子表征,高活性和低活性分子在二維空間中形成了更清晰的邊界,而基于 ECFP 指紋的表示則混雜在一起。定量分析(圖 7c)進(jìn)一步證實(shí),活性懸崖分子對(duì)在 MaskMol 特征空間中的距離遠(yuǎn)大于在 ECFP 空間中的距離,進(jìn)一步說明 MaskMol 有效緩解了表征坍塌。

注意力可視化:上圖 7d-e 表明,經(jīng)過知識(shí)引導(dǎo)預(yù)訓(xùn)練后,MaskMol 能夠精準(zhǔn)地將注意力集中在與任務(wù)相關(guān)的原子、鍵或子結(jié)構(gòu)上。相比之下,GNN 模型往往將注意力分散在分子的不重要區(qū)域或相同的結(jié)構(gòu)上,而未經(jīng)預(yù)訓(xùn)練的圖像模型則關(guān)注整個(gè)分子而忽略了關(guān)鍵細(xì)節(jié),這證明 MaskMol 確實(shí)學(xué)會(huì)了利用細(xì)微的結(jié)構(gòu)差異進(jìn)行活性懸崖預(yù)測(cè)。

化學(xué)知識(shí)解釋:研究采用子結(jié)構(gòu)掩碼解釋(SME)進(jìn)一步量化子結(jié)構(gòu)對(duì) MaskMol 預(yù)測(cè)的貢獻(xiàn)。通過計(jì)算子結(jié)構(gòu)貢獻(xiàn)度,能深入理解其對(duì)分子活性的影響。如圖8a所示,添加苯環(huán)(歸因值=?1.93,Ki = 5370 nM)和乙醇(歸因值=?0.95,Ki = 758 nM)等子結(jié)構(gòu)時(shí),歸因值均低于零,且苯環(huán)的影響顯著大于乙醇,這與分子活性值高度吻合。除生物活性外,文章中還展示了不同子結(jié)構(gòu)對(duì)毒性的分析,如圖 8c 和 d。



圖 7:特征空間和注意力可視化。



圖 8:化學(xué)知識(shí)解釋。

應(yīng)用前景:從虛擬篩選到腫瘤治療

為了驗(yàn)證 MaskMol 的實(shí)際應(yīng)用潛力,研究團(tuán)隊(duì)將其應(yīng)用于前列腺癌免疫治療潛在靶點(diǎn) EP4 受體的抑制劑虛擬篩選。如圖 9e-f 所示,MaskMol 不僅在內(nèi)部測(cè)試集上表現(xiàn)優(yōu)異(R2 = 0.789),在來自專利文獻(xiàn)的外部驗(yàn)證集上也保持了高預(yù)測(cè)精度(R2 = 0.755),并且能識(shí)別抑制劑和非抑制劑。

更重要的是,MaskMol 成功地從專利集中識(shí)別出了 9 個(gè)已知的 EP4 抑制劑候選化合物,如 Grapiprant、CJ-042794 等,這些分子均經(jīng)過細(xì)胞實(shí)驗(yàn)或臨床試驗(yàn)的驗(yàn)證,這充分證明了 MaskMol 在真實(shí)藥物發(fā)現(xiàn)場(chǎng)景下作為高效虛擬篩選工具的可靠性。



圖 9:EP4 虛擬篩選。

總結(jié)與展望

MaskMol 研究的意義在于,它首次明確指出了活性懸崖任務(wù)中深度學(xué)習(xí)模型表征坍塌的瓶頸,并開創(chuàng)性地通過知識(shí)引導(dǎo)的分子圖像自監(jiān)督學(xué)習(xí)來突破這一瓶頸。該框架不僅顯著提升了預(yù)測(cè)性能,還具備良好的可解釋性,能為藥物化學(xué)家提供有價(jià)值的結(jié)構(gòu)-活性關(guān)系見解。

未來,在多模態(tài)知識(shí)融合、3D 構(gòu)象圖像建模以及跨模態(tài)知識(shí)蒸餾等方向還能進(jìn)一步拓展 MaskMol 的能力,這也將持續(xù)推動(dòng)人工智能在藥物發(fā)現(xiàn)領(lǐng)域的深入應(yīng)用。

論文地址:https://doi.org/10.1186/s12915-025-02389-3

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
您有洗屁股的習(xí)慣嗎?提醒:天天洗肛門的人,能收獲4個(gè)驚人好處

您有洗屁股的習(xí)慣嗎?提醒:天天洗肛門的人,能收獲4個(gè)驚人好處

39健康網(wǎng)
2025-12-13 20:50:34
22名敢死隊(duì)員拼死拿下瀘定橋后神秘消失,40年后河北一份絕密檔案,意外揭開塵封半個(gè)世紀(jì)的驚人真相

22名敢死隊(duì)員拼死拿下瀘定橋后神秘消失,40年后河北一份絕密檔案,意外揭開塵封半個(gè)世紀(jì)的驚人真相

源溯歷史
2025-12-18 19:06:21
意外!上港簽下新鵬城28歲前鋒,上賽季23場(chǎng)2球1助攻,球迷不理解

意外!上港簽下新鵬城28歲前鋒,上賽季23場(chǎng)2球1助攻,球迷不理解

羅掌柜體育
2025-12-27 10:19:57
新加坡坐不住了!開始對(duì)海南封關(guān)展開反擊!

新加坡坐不住了!開始對(duì)海南封關(guān)展開反擊!

荊楚寰宇文樞
2025-12-26 22:25:14
國際乒聯(lián)發(fā)文,蒯曼再破“天花板”,讓王曼昱和女乒們刮目相看

國際乒聯(lián)發(fā)文,蒯曼再破“天花板”,讓王曼昱和女乒們刮目相看

漫婷侃娛樂
2025-12-27 13:49:07
調(diào)查發(fā)現(xiàn):每天都喝酒的人,多數(shù)到了65歲以后,身體或變成這樣?

調(diào)查發(fā)現(xiàn):每天都喝酒的人,多數(shù)到了65歲以后,身體或變成這樣?

健康之光
2025-12-18 09:09:16
火箭悍將太完美!防守積極性感染全隊(duì) 烏度卡:他無處不在

火箭悍將太完美!防守積極性感染全隊(duì) 烏度卡:他無處不在

驚奇侃球
2025-12-26 23:40:43
“生娃送房”,最高75㎡!湖北一地出手

“生娃送房”,最高75㎡!湖北一地出手

中國基金報(bào)
2025-12-27 13:34:56
MVP榜:約基奇蟬聯(lián)榜首 亞歷山大穩(wěn)居次席

MVP榜:約基奇蟬聯(lián)榜首 亞歷山大穩(wěn)居次席

北青網(wǎng)-北京青年報(bào)
2025-12-27 15:55:04
吳彥祖開箱小米17 Ultra徠卡版:So cool

吳彥祖開箱小米17 Ultra徠卡版:So cool

快科技
2025-12-27 14:00:12
金價(jià)暴跌背后的真相,散戶又被割韭菜了

金價(jià)暴跌背后的真相,散戶又被割韭菜了

洞見財(cái)經(jīng)
2025-10-23 00:09:38
一夜暴漲!杭州有人今早緊急出手30斤!“太瘋狂了,要小心……”

一夜暴漲!杭州有人今早緊急出手30斤!“太瘋狂了,要小心……”

環(huán)球網(wǎng)資訊
2025-12-27 15:10:57
弘一法師:少跟孩子生氣,孩子投胎到你家,有這幾種原因

弘一法師:少跟孩子生氣,孩子投胎到你家,有這幾種原因

木言觀
2025-12-23 18:35:55
乒超總決賽兩位世界冠軍“翻車”,王曼昱狀態(tài)下滑,蒯曼意料之外

乒超總決賽兩位世界冠軍“翻車”,王曼昱狀態(tài)下滑,蒯曼意料之外

有范又有料
2025-12-27 14:51:06
本拉登被擊斃后,為何24小時(shí)內(nèi)就被緊急海葬?多年后才知其中真相

本拉登被擊斃后,為何24小時(shí)內(nèi)就被緊急海葬?多年后才知其中真相

素年文史
2025-12-26 10:05:33
何超瓊離婚25年官宣喜訊,揭李嘉欣僅剩體面

何超瓊離婚25年官宣喜訊,揭李嘉欣僅剩體面

老琴才是我的外號(hào)
2025-12-27 10:10:31
《一路繁花2》收官:劉嘉玲口碑反轉(zhuǎn),張柏芝好做作,他情商最低

《一路繁花2》收官:劉嘉玲口碑反轉(zhuǎn),張柏芝好做作,他情商最低

一娛三分地
2025-12-27 12:43:27
太頂了!明明什么都沒露,卻性感得要命!

太頂了!明明什么都沒露,卻性感得要命!

貴圈真亂
2025-12-20 12:02:06
公牛制勝10-0雙殺76人豪取5連勝 恩比德31+5武切三分超喬丹

公牛制勝10-0雙殺76人豪取5連勝 恩比德31+5武切三分超喬丹

醉臥浮生
2025-12-27 11:09:31
【英若誠】英達(dá)的父親:我的文革體驗(yàn)不是那樣,我主動(dòng)積極地度過

【英若誠】英達(dá)的父親:我的文革體驗(yàn)不是那樣,我主動(dòng)積極地度過

年之父
2025-12-27 14:27:13
2025-12-27 16:24:49
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1191文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

"和平計(jì)劃"差臨門一腳 特朗普放話烏命運(yùn)掌握在他手里

頭條要聞

"和平計(jì)劃"差臨門一腳 特朗普放話烏命運(yùn)掌握在他手里

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

劉宇寧:我的價(jià)值不需要靠番位來證明

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

旅游
時(shí)尚
房產(chǎn)
教育
公開課

旅游要聞

貴州舉辦2025滿意旅游“痛客行”頒獎(jiǎng)儀式

從0度穿到20度,這件衣服才是今年冬天的“頂流”!

房產(chǎn)要聞

年銷20億+!中交·藍(lán)色港灣用好房子致敬好生活

教育要聞

美國境內(nèi)旅游簽轉(zhuǎn)學(xué)簽到底需要花多少錢?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版