国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

統(tǒng)一虛擬篩選和活性優(yōu)化,IDEA研究院提出親和力基礎(chǔ)模型LigUnity

0
分享至



作者 | 論文團(tuán)隊

編輯 | ScienceAI

2025 年 10 月,一篇題為《Hierarchical affinity landscape navigation through learning a shared pocket-ligand space》的論文,作為封面文章發(fā)表于 Cell 旗下期刊《Patterns》。該研究由粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(IDEA)AI4Science 團(tuán)隊、晶泰科技(XtalPi)及華盛頓大學(xué)的研究團(tuán)隊聯(lián)合攻關(guān),成功開發(fā)了名為 LigUnity 的親和力基礎(chǔ)模型。



論文地址:https://www.cell.com/patterns/fulltext/S2666-3899(25)00219-3?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666389925002193%3Fshowall%3Dtrue

項目地址:https://idea-xl.github.io/LigUnity

開源代碼:https://github.com/IDEA-XL/LigUnity

此項工作不僅是對傳統(tǒng)虛擬篩選工具的優(yōu)化,更是一次范式級的革新 —— 它通過構(gòu)建蛋白質(zhì)與配體的共享表示空間,讓 AI 統(tǒng)一學(xué)習(xí)并駕馭從大規(guī)模篩選到精細(xì)活性優(yōu)化的完整藥物發(fā)現(xiàn)流程。

任務(wù)背景與挑戰(zhàn)

在人體中,上萬種蛋白質(zhì)維持著復(fù)雜的生命活動,其中許多蛋白質(zhì)的異常與疾病直接相關(guān),是潛在的藥物靶點(diǎn)。然而,目前僅有約 10% 的蛋白質(zhì)能被已知的藥物分子高效結(jié)合,絕大多數(shù)靶點(diǎn)仍處于「黑暗」 之中,等待著被有效的藥物「點(diǎn)亮」。

為這些靶點(diǎn)找到合適的藥物分子,通常分為兩個關(guān)鍵步驟:

1. 虛擬篩選 (Virtual Screening):利用計算方法,從包含數(shù)億甚至數(shù)十億分子的巨大化合物庫中,快速篩選出少數(shù)可能與目標(biāo)蛋白質(zhì)結(jié)合的「苗頭化合物」。此階段的核心訴求是速度。

2. 苗頭化合物優(yōu)化 (Hit-to-Lead Optimization):在找到苗頭化合物后,需要對其化學(xué)結(jié)構(gòu)進(jìn)行精細(xì)的修改和優(yōu)化以增強(qiáng)其活性(活性優(yōu)化),最終得到可進(jìn)入后續(xù)試驗的「先導(dǎo)化合物」。此階段的核心訴求是精度。

傳統(tǒng)方法往往將這兩個任務(wù)割裂開來,使用不同的工具和模型。這種分離導(dǎo)致了模型效果限制:專注于篩選的模型可能無法精確區(qū)分結(jié)構(gòu)相似但活性差異巨大的分子;而專注于優(yōu)化的模型則難以泛化到具有全新化學(xué)骨架的潛力分子。

模型方法與核心創(chuàng)新

LigUnity 的核心創(chuàng)新在于構(gòu)建了一個統(tǒng)一的親和力基礎(chǔ)模型,讓 AI 學(xué)會一種能同時理解蛋白質(zhì)結(jié)合口袋和藥物分子的「共同語言」。

為實現(xiàn)這一目標(biāo),研究團(tuán)隊首先構(gòu)建了迄今為止規(guī)模最大的、以實驗(Assay)組織的親和力數(shù)據(jù)庫 PocketAffDB,其中包含了蛋白質(zhì)口袋結(jié)構(gòu)信息和近百萬活性數(shù)據(jù)?;诖?,LigUnity 通過一種創(chuàng)新的「層級式學(xué)習(xí)」策略進(jìn)行訓(xùn)練:

1. 化學(xué)骨架判別:首先,模型利于對比學(xué)習(xí)(Contrastive learning)進(jìn)行粗粒度的區(qū)分。它學(xué)習(xí)識別活性分子和非活性分子的骨架差異,為虛擬篩選任務(wù)打下基礎(chǔ)。

2. 藥效團(tuán)排序:然后,模型利于列表排序(Listwise ranking)進(jìn)行細(xì)粒度的優(yōu)化。它學(xué)習(xí)對一群結(jié)構(gòu)相似的活性分子,根據(jù)其活性的高低進(jìn)行精確排序,以勝任苗頭化合物優(yōu)化任務(wù)。

在預(yù)訓(xùn)練期間,LigUnity 同時優(yōu)化上述目標(biāo);在推理時,LigUnity 將蛋白和口袋映射至同一空間,使用余弦相似度計算其活性。在保證了高精度的同時,LigUnity 的速度比傳統(tǒng)的分子對接方法(如 Glide-SP)快了百萬倍。



實驗結(jié)果

LigUnity 在橫跨 6 大類應(yīng)用場景的 8 個基準(zhǔn)測試中,展現(xiàn)了其卓越的性能。

1. 虛擬篩選任務(wù)

  • 全面領(lǐng)先:在 DUD-E、DEKOIS 2.0 和 LIT-PCBA 這三個主流虛擬篩選基準(zhǔn)測試中,LigUnity 的表現(xiàn)超越了全部 24 種競爭方法,包括傳統(tǒng)的分子對接軟件和各類機(jī)器學(xué)習(xí)模型。
  • 性能巨大提升:與表現(xiàn)最好的基線模型相比,LigUnity 在關(guān)鍵指標(biāo)「富集因子 (EF 1%)」上取得了超過 50% 的性能提升(p < 10??)。
  • 強(qiáng)大的泛化能力:即便在排除了與訓(xùn)練集中蛋白質(zhì)相似(序列相似性 < 30%)的新靶點(diǎn)上進(jìn)行測試,LigUnity 的性能依然顯著優(yōu)于 Glide SP,表現(xiàn)出對未知靶點(diǎn)的強(qiáng)大預(yù)測能力和實用價值。



2. 苗頭化合物優(yōu)化任務(wù)

  • 零樣本性能優(yōu)越:在 JACS 和 Merck 這兩個行業(yè)公認(rèn)的 FEP 基準(zhǔn)測試中,在不使用任何目標(biāo)數(shù)據(jù)(zero-shot)的情況下,LigUnity 的預(yù)測性能已優(yōu)于 Glide-SP、MM/GBSA 等傳統(tǒng)計算方法及其他機(jī)器學(xué)習(xí)模型,展現(xiàn)了其強(qiáng)大的預(yù)訓(xùn)練知識。
  • 少量數(shù)據(jù)即可媲美「金標(biāo)準(zhǔn)」:當(dāng)使用少量(10-20 個)已知數(shù)據(jù)進(jìn)行微調(diào)后,LigUnity 的預(yù)測精度(在 Merck 基準(zhǔn)上 r2 = 0.472)已接近計算成本極度高昂的物理計算「金標(biāo)準(zhǔn)」方法 FEP+(r2 = 0.528),為昂貴的實驗和計算提供了高性價比的替代方案。
  • 良好的可解釋性:盡管未使用蛋白 - 分子結(jié)合構(gòu)象作為輸入,LigUnity 仍成功識別出了對結(jié)合起關(guān)鍵作用的配體原子和口袋殘基,與已知的晶體結(jié)構(gòu)相互作用模式高度吻合,為化學(xué)家優(yōu)化分子提供了可靠指導(dǎo)。



3. 多場景應(yīng)用的通用性

  • 前瞻研究與骨架躍遷:在模擬真實藥物發(fā)現(xiàn)的測試中,LigUnity 表現(xiàn)出眾。在時間分割(用歷史數(shù)據(jù)預(yù)測未來新分子)和化學(xué)骨架分割(泛化至訓(xùn)練集中未見的全新化學(xué)骨架)設(shè)定下,它均超越了所有基線模型,證明其具備突破現(xiàn)有化學(xué)空間、發(fā)現(xiàn)新潛力分子的強(qiáng)大泛化能力。
  • 對多源、異構(gòu)數(shù)據(jù)的魯棒性:真實世界的生物活性數(shù)據(jù)來源多樣、測量單位不一(如 nM vs. % 抑制率)。得益于其獨(dú)特的「列表排序」機(jī)制,LigUnity 天然的對測量單位不敏感。在 OOD 測試中,其性能相比傳統(tǒng)回歸模型提升高達(dá) 40.2%,展現(xiàn)了其作為基礎(chǔ)模型處理復(fù)雜、真實世界數(shù)據(jù)的卓越適應(yīng)性。



  • 主動學(xué)習(xí)應(yīng)用:在模擬真實研發(fā)流程的主動學(xué)習(xí)框架中,研究團(tuán)隊對 TYK2 靶點(diǎn)進(jìn)行研究,從 10,000 個后續(xù)分子中找到活性最好的分子。集成 LigUnity 的框架僅通過 4 輪迭代(400 活性標(biāo)注數(shù)據(jù)),就成功找到了活性最高的 3 個分子,證明其能以極少的實驗成本,高效地指導(dǎo)藥物發(fā)現(xiàn)進(jìn)程。



結(jié)論與展望

LigUnity 通過一個統(tǒng)一的、層級式的學(xué)習(xí)框架,成功地將虛擬篩選與活性優(yōu)化相結(jié)合,在速度、精度和泛化性上均取得了突破。它不僅是一個強(qiáng)大的預(yù)測工具,更是一個具備廣泛適用性的基礎(chǔ)模型,為加速早期藥物發(fā)現(xiàn)的全流程奠定了堅實的基礎(chǔ)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
養(yǎng)老院65歲大媽半夜哭喊下身疼,被送往急診,醫(yī)生檢查后:報警!

養(yǎng)老院65歲大媽半夜哭喊下身疼,被送往急診,醫(yī)生檢查后:報警!

第四思維
2025-09-02 09:31:36
“中國宜家”崩了,創(chuàng)始人套現(xiàn)200億離場,美的太子接盤血虧?

“中國宜家”崩了,創(chuàng)始人套現(xiàn)200億離場,美的太子接盤血虧?

蜉蝣說
2025-12-23 20:00:55
超額完成任務(wù)!世界棋仙戰(zhàn)32強(qiáng)首日中國4勝2負(fù),8名韓棋手僅3人晉級

超額完成任務(wù)!世界棋仙戰(zhàn)32強(qiáng)首日中國4勝2負(fù),8名韓棋手僅3人晉級

L76號
2025-12-24 15:39:00
廣州荔灣山姆開業(yè)驚了,交通直接干到癱瘓,原來消費(fèi)降級就我一個

廣州荔灣山姆開業(yè)驚了,交通直接干到癱瘓,原來消費(fèi)降級就我一個

億通電子游戲
2025-12-24 12:44:02
金正哲聯(lián)手張成澤發(fā)動朝鮮兵變,因一細(xì)節(jié)敗露,雙遭反殺!

金正哲聯(lián)手張成澤發(fā)動朝鮮兵變,因一細(xì)節(jié)敗露,雙遭反殺!

阿胡
2024-02-02 14:55:28
港獨(dú)害人害己:黃之鋒父親賤賣房產(chǎn)舉家飛國外,不會被世界原諒!

港獨(dú)害人害己:黃之鋒父親賤賣房產(chǎn)舉家飛國外,不會被世界原諒!

凡知
2025-12-23 18:59:57
合肥市衛(wèi)健委:深感痛心,已成立調(diào)查組,相關(guān)涉事人員停職調(diào)查

合肥市衛(wèi)健委:深感痛心,已成立調(diào)查組,相關(guān)涉事人員停職調(diào)查

新京報政事兒
2025-12-24 11:56:47
新加坡總統(tǒng):中國不要自給自足,海南封關(guān)將會砸了新加坡的鐵飯碗

新加坡總統(tǒng):中國不要自給自足,海南封關(guān)將會砸了新加坡的鐵飯碗

歲暮的歸南山
2025-12-24 04:33:29
今天,A股觸及3947,做好準(zhǔn)備,明天,12月25號,大概率會這樣走

今天,A股觸及3947,做好準(zhǔn)備,明天,12月25號,大概率會這樣走

有范又有料
2025-12-24 14:57:09
當(dāng)法官宣判死刑,殺了南大女研究生哥哥的兇手在法庭上瘋狂嘶吼

當(dāng)法官宣判死刑,殺了南大女研究生哥哥的兇手在法庭上瘋狂嘶吼

詩意世界
2025-12-14 11:25:24
香港網(wǎng)友談金信煜被解約:他拒絕在人工草訓(xùn)練,而且拿著高薪

香港網(wǎng)友談金信煜被解約:他拒絕在人工草訓(xùn)練,而且拿著高薪

懂球帝
2025-12-24 12:26:29
山東一男子沒工作交不起房貸車貸,妻子崩潰大哭:我不想和你過了

山東一男子沒工作交不起房貸車貸,妻子崩潰大哭:我不想和你過了

觀察鑒娛
2025-12-24 09:34:25
今晚決戰(zhàn),CBA焦點(diǎn)比賽,晚上19點(diǎn)35分,CCTV5直播場次確定

今晚決戰(zhàn),CBA焦點(diǎn)比賽,晚上19點(diǎn)35分,CCTV5直播場次確定

皮皮觀天下
2025-12-24 11:21:10
弗拉格轟33+9+9仍無緣今日最佳!對不起,你碰到創(chuàng)紀(jì)錄的小卡了

弗拉格轟33+9+9仍無緣今日最佳!對不起,你碰到創(chuàng)紀(jì)錄的小卡了

世界體育圈
2025-12-24 14:03:05
美日對中國最恐懼的是海南封關(guān),如果成功,推廣全國就天下無敵了

美日對中國最恐懼的是海南封關(guān),如果成功,推廣全國就天下無敵了

我心縱橫天地間
2025-12-24 16:47:33
徹底瘋狂!溢價高達(dá)70%,引來眾多投資者瘋狂套利!連續(xù)三天漲停,卻鬧出烏龍?

徹底瘋狂!溢價高達(dá)70%,引來眾多投資者瘋狂套利!連續(xù)三天漲停,卻鬧出烏龍?

雪球
2025-12-24 17:00:51
日本女神顏值大比拼,巔峰前十

日本女神顏值大比拼,巔峰前十

吃瓜黨二號頭目
2025-12-24 08:37:22
南博事件再升級!1997年藏品調(diào)撥單申請人凌波,2008年已身居要職

南博事件再升級!1997年藏品調(diào)撥單申請人凌波,2008年已身居要職

鶴羽說個事
2025-12-22 14:11:12
解剖478名胃癌死者,醫(yī)生發(fā)現(xiàn):患胃癌的人,都有一個共同的飲食習(xí)慣

解剖478名胃癌死者,醫(yī)生發(fā)現(xiàn):患胃癌的人,都有一個共同的飲食習(xí)慣

犀利辣椒
2025-12-24 06:41:05
33+9+9!弗拉格正式進(jìn)化!三狀元合體倒計時

33+9+9!弗拉格正式進(jìn)化!三狀元合體倒計時

籃球教學(xué)論壇
2025-12-24 18:37:41
2025-12-24 19:12:49
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1189文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

接送幼兒車輛墜入池塘致8死 村民:事故路面有明顯淤泥

頭條要聞

接送幼兒車輛墜入池塘致8死 村民:事故路面有明顯淤泥

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

財經(jīng)要聞

重磅!北京市優(yōu)化調(diào)整住房限購政策

汽車要聞

“運(yùn)動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

健康
教育
旅游
親子
軍事航空

這些新療法,讓化療不再那么痛苦

教育要聞

家校共育大課堂 | 運(yùn)動享健康,家校護(hù)成長

旅游要聞

跨年游開封萬歲山注意!12月31日至1月1日門票政策有變

親子要聞

紙巾+彩筆+筷子就能做的毛毛蟲,低成本哄娃小游戲輕松get

軍事要聞

"九三"受閱女民兵:96米需踢出128個正步 每步75厘米

無障礙瀏覽 進(jìn)入關(guān)懷版