国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nat Commun |?侯廷軍/康玉/劉煥香聯(lián)合開發(fā)LaMGen:基于大語言模型的多靶點藥物設(shè)計通用?3D?分子生成框架

0
分享至


近日, 浙江大學(xué)侯廷軍、教授團(tuán)隊聯(lián)合澳門理工大學(xué)劉煥香教授團(tuán)隊發(fā)表在 Nature Communications 的研究論文,題為 LaMGen: LLM-Based 3D Molecular Generation for Multi-Target Drug Design ,該研究提出了基于大語言模型的多靶點藥物設(shè)計通用3D分子生成框架LaMGen,打破了現(xiàn)有方法泛化性不足、精度與效率難以兼顧的核心瓶頸,僅通過輸入靶蛋白氨基酸序列即可直接生成量子化學(xué)精度的3D活性分子,在雙靶點、三靶點藥物設(shè)計場景中均展現(xiàn)出優(yōu)越性能,為復(fù)雜疾病的多靶點藥物研發(fā)提供了全新的基礎(chǔ)計算工具。


研究背景

靶向藥設(shè)計是現(xiàn)代藥物研發(fā)的核心任務(wù),而單靶點 藥物設(shè)計 策略在復(fù)雜多因素疾病治療中始終面臨耐藥性、副作用大、療效有限等核心問題。與之相對,多靶點藥物設(shè)計可通過同時調(diào)控疾病多個相關(guān)靶點產(chǎn)生 明確的選擇或 協(xié)同藥理效應(yīng),是攻克癌癥、神經(jīng)退行性疾病等復(fù)雜疾病的關(guān)鍵方向。但多靶點藥物設(shè)計要求候選分子同時滿足多個結(jié)合口袋的結(jié)構(gòu)約束,還要保持優(yōu)異的類藥與成藥性質(zhì),對計算方法提出了極高的要求。近年來,深度學(xué)習(xí)分子生成模型在單靶點藥物設(shè)計中取得了長足進(jìn)步,但向多靶點場景拓展時仍面臨三大核心局限:絕大多數(shù)方法為 基于 配體 的方法 , 高度依賴特定靶點對的活性數(shù)據(jù),對缺乏已知參考分子的靶點組合泛化性極差;部分方法通過強(qiáng)化學(xué)習(xí)引入靶點信息,卻難以平衡靶點特異性獎勵與化學(xué)多樣性,過度優(yōu)化極易導(dǎo)致骨架利用狹窄;基于擴(kuò)散架構(gòu)的通用框架計算密集、生成效率極低, 在復(fù)雜場景下的 生成質(zhì)量與可控性顯著下降 , 難以拓展至三靶點 等 更復(fù)雜的多靶點場景。 近期 ,大語言模型( LLM )在計算藥物研發(fā)領(lǐng)域展現(xiàn)出巨大潛力,但現(xiàn)有相關(guān)模型普遍缺乏對分子 3D 信息的理解,在多靶點藥物生成領(lǐng)域的應(yīng)用幾乎處于空白 。 應(yīng)對 上述行業(yè)痛點 ,研究團(tuán)隊開發(fā)了 LaMGen 框架,首次實現(xiàn)了基于 LLM 的通用型多靶點 3D 分子生成。

方法概述

為打破多靶點分子生成中精度、泛化性與效率的三重壁壘,研究團(tuán)隊構(gòu)建了全流程的 LaMGen 框架,核心創(chuàng)新分為數(shù)據(jù)集構(gòu)建、模型架構(gòu)設(shè)計與訓(xùn)練策略三大模塊。

1. 大規(guī)模多靶點專屬數(shù)據(jù)集 MTD2025 構(gòu)建

針對多靶點藥物設(shè)計領(lǐng)域高質(zhì)量數(shù)據(jù)匱乏的核心問題,研究團(tuán)隊基于 Papyrus 生物活性數(shù)據(jù)庫,整合 ChEMBL 、 ExCAPE -DB 等權(quán)威來源的實驗活性數(shù)據(jù),經(jīng)過系統(tǒng)過濾、配對與重構(gòu),構(gòu)建了 MTD2025 數(shù)據(jù)集。該數(shù)據(jù)集包含 4011 個唯一蛋白、 123024 個唯一小分子,配套超 60 萬個量子 力學(xué) 精度 的 3D 分子構(gòu)象,以及 44.6 萬條雙靶點、 28.3 萬條三靶點關(guān)聯(lián)數(shù)據(jù)。所有分子均通過 CREST 完成構(gòu)象搜索,再經(jīng)量子 力學(xué) 精度的 LiTEN-FF 力場優(yōu)化得到局域最低能量構(gòu)象,確保了數(shù)據(jù)集的結(jié)構(gòu)質(zhì)量與物理合理性,為模型訓(xùn)練提供了高質(zhì)量的數(shù)據(jù)基礎(chǔ)。

2. LaMGen 核心架構(gòu)設(shè)計

LaMGen 基于 Transformer 解碼器架構(gòu)構(gòu)建,整體分為配體預(yù)訓(xùn)練、多靶點微調(diào)、序列驅(qū)動分子生成三大核心階段,核心創(chuàng)新點如下: 3D 旋轉(zhuǎn)感知離散 token 編碼:將配體扭轉(zhuǎn)角等內(nèi)部自由度編碼為離散的 3D 旋轉(zhuǎn)感知 token ,相比原始笛卡爾坐標(biāo),大幅縮短了序列長度,保證了旋轉(zhuǎn)不變性,同時顯著降低了計算復(fù)雜度,讓 LLM 可直接學(xué)習(xí) 分子 SMILES 序列 與 3D 構(gòu)象空間的精準(zhǔn)映射。 ESM-C 蛋白序列編碼:摒棄對蛋白 3D 結(jié)構(gòu)的依賴,僅以氨基酸序列為輸入,通過預(yù)訓(xùn)練蛋白大模型 ESM-C 進(jìn)行編碼,得到能有效捕捉蛋白結(jié)構(gòu)與功能特征的嵌入表示,大幅降低了模型對結(jié)構(gòu)數(shù)據(jù)的依賴,同時借助大規(guī)模序列數(shù)據(jù)庫提升了模型 的泛化能力。 TriCoupleAttention 模塊:創(chuàng)新性地在統(tǒng)一的自注意力框架內(nèi),聯(lián)合建模靶點 - 靶點、配體 - 靶點、配體 - 配體間的自注意力與交叉注意力,通過加權(quán)融合機(jī)制自適應(yīng)平衡雙靶點對配體的影響,實現(xiàn)了對多靶點結(jié)合模式的細(xì)粒度、全維度建模,完美適配多靶點場景的復(fù)雜相互作用捕捉。

3. 兩階段訓(xùn)練策略

模型先在 GEOM 數(shù)據(jù)集的 800 萬 + 高質(zhì)量分子構(gòu)象上完成預(yù)訓(xùn)練,學(xué)習(xí)分子 SMILES 與扭轉(zhuǎn)構(gòu)象的基礎(chǔ)映射關(guān)系;再在 MTD2025 數(shù)據(jù)集上完成多靶點適配微調(diào),讓模型具備基于蛋白序列生成多靶點活性分子的能力。同時,訓(xùn)練過程中引入隨機(jī)因果掩碼策略,顯著提升了模型的魯棒性與泛化性。


圖 1. LaMG en 框架示意圖

結(jié)果與討論

研究團(tuán)隊通過多維度、多場景的系統(tǒng)實驗,全面驗證了 LaMGen 的性能優(yōu)勢與實際應(yīng)用價值。

1. 跨序列相似度靶點的零樣本高親和力分子生成

研究團(tuán)隊構(gòu)建了兩組獨立測試集,分別對應(yīng)全低序列相似度( <0.4 )的完全分布外靶點對,以及 “ 低 + 高 ” 序列相似度的混合靶點對,全面評估模型的泛化能力。在外部測試集上, LaMGen 在 17/20 個靶點對上的結(jié)合親和力優(yōu)于主流開 源雙靶點生成模型 DualDiff ,同時在類藥性( QED )、合成可及性( SAScore )上展現(xiàn)出更優(yōu)異的表現(xiàn);單分子生成平均僅需 0.44 秒,較 DualDiff ( 12.3 秒 / 分子)提速超 30 倍, 可 適配高通量篩選場景。在混合測試集上, LaMGen 生成分子的有效率達(dá) 95% ,內(nèi)部結(jié)構(gòu)多樣性達(dá) 0.89 ,與訓(xùn)練集平均相似度僅 0.11 ,在保證結(jié)構(gòu)創(chuàng)新性的同時,關(guān)鍵類藥性質(zhì)均完全符合成藥區(qū)間,雙靶點平均結(jié)合親和力達(dá) - 9.0 與 - 8.7 kcal/mol ,展現(xiàn)出 優(yōu)越 的分布外泛化能力。

2. 量子 化學(xué) 精度構(gòu)象的直接生成能力

針對分子構(gòu)象生成這一下游應(yīng)用的核心環(huán)節(jié),研究團(tuán)隊開展了系統(tǒng)的構(gòu)象保真度驗證。結(jié)果顯示, LaMGen 生成的構(gòu)象與 LiTEN-FF 優(yōu)化結(jié)構(gòu)的平均 RMSD 僅為 0.5 ? ,超 98% 的構(gòu)象 RMSD 低于 2 ? ,構(gòu)象質(zhì)量全面優(yōu)于 DualDiff ;其生成構(gòu)象的對接得分與 LiTEN-FF 優(yōu)化構(gòu)象高度一致,顯著優(yōu)于 MMFF94 力場優(yōu)化構(gòu)象, PoseBusters 綜合通過率達(dá) 92% ,遠(yuǎn)超 DualDiff 的 68% 。這意味著 LaMGen 可直接生成無需額外 力場 優(yōu)化、即可用于下游對接與性質(zhì)預(yù)測的物理合理 3D 結(jié)構(gòu), 有效 簡化了藥物研發(fā)的計算流程,降低了計算開銷。

3. JNK3/GSK3β 雙靶點設(shè)計的零樣本泛化與微調(diào)潛力

研究團(tuán)隊以神經(jīng)退行性疾病領(lǐng)域經(jīng)典的 JNK3/GSK3β 雙靶點設(shè)計為案例,驗證模型的實際應(yīng)用能力。在零樣本場景下,僅輸入兩個靶點的氨基酸序列, LaMGen 生成的分子有效率達(dá) 94.2% ,多樣性達(dá) 0.863 , 45% 以上的分子對接得分超過已知 活性分子 的平均水平,綜合性能與 AIxFuse 等 SOTA 模型相當(dāng)甚至更優(yōu)。經(jīng)過少量樣本微調(diào)后, LaMGen-FT 的雙靶點對接達(dá)標(biāo)率提升至 33.01% ,超越 AIxFuse ( 31.80% ),多性質(zhì)綜合成藥成功率同樣顯著優(yōu)于 AIxFuse ( 8.46% vs 5.40% ),同時保持了更高的分子多樣性,展現(xiàn)出 優(yōu)秀 的遷移學(xué)習(xí)能力與靶點適配性。

4. 真實 場景雙 / 三靶點任務(wù)的 回溯 性驗證

研究團(tuán)隊進(jìn)一步在癌癥治療相關(guān)的 3 組經(jīng)典雙靶點體系( EGFR/HER2 、 PI3K/mTOR 、 LSD1/HDAC6 ),以及 EGFR/HER2/VEGFR 三靶點體系中開展回顧性驗證。結(jié)果顯示:在雙靶點體系中, LaMGen 可精準(zhǔn)復(fù)現(xiàn)與已知活性分子結(jié)構(gòu)完全一致的化合物,同時能自主生成保留核心藥效團(tuán)、結(jié)合親和力更優(yōu)的骨架類似物,實現(xiàn)了藥效團(tuán)重構(gòu)與骨架躍遷的雙重能力;在三靶點體系中, LaMGen 依然保持了優(yōu)異的生成性能,生成分子在三個靶點上均集中于高親和力區(qū)間,可自適應(yīng)調(diào)整分子復(fù)雜度以滿足第三個靶點的結(jié)合約束,同時保持核心類藥性質(zhì)穩(wěn)定,首次實現(xiàn)了基于 LLM 的三靶點 3D 分子生成。

總結(jié)

LaMGen為多靶點3D分子生成提供了基于大語言模型的新型技術(shù)路徑。該框架能夠直接從 目標(biāo) 蛋 白氨基酸序列出發(fā),快速生成兼具量子 力學(xué) 構(gòu)象精度、高多靶點親和力 且滿足 成藥性 指標(biāo) 的 3D 活性分子,有效平衡了模型泛化性、計算精度與運行效率。作為面向多靶點藥物設(shè)計的 LLM 基礎(chǔ)生成框架, LaMGen 在零樣本場景下表現(xiàn)出可靠的泛化能力,能夠適配功能協(xié)同靶點等多種復(fù)雜設(shè)計需求。隨著與蛋白結(jié)構(gòu)及性質(zhì)預(yù)測模型的深度融合,LaMGen有望AI驅(qū)動多靶點藥物研發(fā)提供有力工具,在針對復(fù)雜疾病的多靶點藥物開發(fā)中發(fā)揮作用。

共同第一作者為 浙江大學(xué) 博士生蘇群、澳門理工大學(xué)博士生茍巧林。

https://www.nature.com/articles/s41467-026-71737-w

制版人: 十一

學(xué)術(shù)合作組織

(*排名不分先后)



戰(zhàn)略合作伙伴

(*排名不分先后)



轉(zhuǎn)載須知


【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。

BioArt

Med

Plants

人才招聘

近期直播推薦


點擊主頁推薦活動

關(guān)注更多最新活動!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
馬克龍證實:有法國士兵身亡

馬克龍證實:有法國士兵身亡

魯中晨報
2026-04-18 21:24:20
貴州36歲劉偉去世,長得帥氣在銀行上班,嘴唇明顯發(fā)紫,媽媽哭暈

貴州36歲劉偉去世,長得帥氣在銀行上班,嘴唇明顯發(fā)紫,媽媽哭暈

社會日日鮮
2026-04-18 13:15:41
難以置信!網(wǎng)傳多年前某殯儀館為省燃料,將多名逝者“拼爐”火化

難以置信!網(wǎng)傳多年前某殯儀館為省燃料,將多名逝者“拼爐”火化

火山詩話
2026-04-18 15:43:01
悲催!上海男子曾年薪百萬,中年失業(yè)被妻子罵廢物,引發(fā)千人共鳴

悲催!上海男子曾年薪百萬,中年失業(yè)被妻子罵廢物,引發(fā)千人共鳴

火山詩話
2026-04-18 06:42:53
哈登22+10!126-113騎士開門紅,看數(shù)據(jù):他才是頭號功臣!

哈登22+10!126-113騎士開門紅,看數(shù)據(jù):他才是頭號功臣!

運籌帷幄的籃球
2026-04-19 02:18:46
決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

奶蓋熊本熊
2026-04-19 00:32:00
騎士126-113贏猛龍,3人迎來里程碑!這一戰(zhàn)我不得不承認(rèn)5個現(xiàn)實

騎士126-113贏猛龍,3人迎來里程碑!這一戰(zhàn)我不得不承認(rèn)5個現(xiàn)實

毒舌NBA
2026-04-19 04:58:48
隆基董事長實名舉報萬科,可能會進(jìn)一步動搖萬科與合作方信任基石

隆基董事長實名舉報萬科,可能會進(jìn)一步動搖萬科與合作方信任基石

老潘聊地產(chǎn)
2026-04-17 21:08:12
1-0!哈登22+10,騎士輕取猛龍,季后賽開門紅!兩隊實力差距不小

1-0!哈登22+10,騎士輕取猛龍,季后賽開門紅!兩隊實力差距不小

老梁體育漫談
2026-04-19 03:49:25
英海上貿(mào)易行動辦公室:霍爾木茲海峽附近發(fā)生多起船只遇襲事件

英海上貿(mào)易行動辦公室:霍爾木茲海峽附近發(fā)生多起船只遇襲事件

界面新聞
2026-04-18 22:59:17
更新大潮來了?中央發(fā)文定調(diào):2026年起20年房齡老房子或又吃香了

更新大潮來了?中央發(fā)文定調(diào):2026年起20年房齡老房子或又吃香了

專業(yè)聊房君
2026-04-18 16:45:50
“不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

“不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

新華社
2026-04-16 20:38:52
揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

頭狼追球
2026-04-18 17:53:28
狀態(tài)略有起伏!趙心童世錦賽衛(wèi)冕首戰(zhàn)打響,第一階段5-4暫時領(lǐng)先

狀態(tài)略有起伏!趙心童世錦賽衛(wèi)冕首戰(zhàn)打響,第一階段5-4暫時領(lǐng)先

全景體育V
2026-04-18 21:09:21
女子吃燒烤花了892元,老板搞活動只收89.2元,她卻讓老板退她100元

女子吃燒烤花了892元,老板搞活動只收89.2元,她卻讓老板退她100元

書畫藝術(shù)收藏
2025-02-23 19:30:08
悲劇還是發(fā)生了!近日,安徽一女子同房后,肚子很疼,黃體破裂!

悲劇還是發(fā)生了!近日,安徽一女子同房后,肚子很疼,黃體破裂!

川渝視覺
2026-04-18 21:37:48
趙心童沒讓眾星徹底嘆服!希金斯:他可能達(dá)到小特高度但無法更高

趙心童沒讓眾星徹底嘆服!希金斯:他可能達(dá)到小特高度但無法更高

楊華評論
2026-04-18 18:39:32
泰國潑水節(jié)242人死亡,1200人受傷

泰國潑水節(jié)242人死亡,1200人受傷

每日經(jīng)濟(jì)新聞
2026-04-18 10:09:13
央視再三提醒,綁銀行卡的手機(jī),務(wù)必開啟這兩項功能

央視再三提醒,綁銀行卡的手機(jī),務(wù)必開啟這兩項功能

另子維愛讀史
2026-04-18 22:46:08
事發(fā)浦東機(jī)場!女子稱兩次拒絕幫陌生人帶行李,多名網(wǎng)友:我也遇到過!

事發(fā)浦東機(jī)場!女子稱兩次拒絕幫陌生人帶行李,多名網(wǎng)友:我也遇到過!

上觀新聞
2026-04-18 20:28:04
2026-04-19 05:51:00
BioArt incentive-icons
BioArt
探索生物藝術(shù)之奧秘
9829文章數(shù) 18510關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

數(shù)碼
親子
本地
公開課
軍事航空

數(shù)碼要聞

華為版的科技春晚來了!Pura 90/Pura X Max下周發(fā):陣容豪華

親子要聞

退燒藥怎么用?90%家長都搞錯了

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

解放軍護(hù)衛(wèi)艦與外艦纏斗20小時 細(xì)節(jié)披露

無障礙瀏覽 進(jìn)入關(guān)懷版