国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清華首篇Science!用AI一天完成萬(wàn)億藥物配對(duì),覆蓋半數(shù)人類基因

0
分享至

2026 年清華大學(xué)第一篇 Science 論文花落清華大學(xué)智能科學(xué)講席教授、智能產(chǎn)業(yè)研究院(AIR)院長(zhǎng)張亞勤院士團(tuán)隊(duì),該學(xué)院的蘭艷艷教授團(tuán)隊(duì)和合作者研發(fā)出一款名為 DrugCLIP 的 AI 工具,能以前所未有的速度和準(zhǔn)確率,為成千上萬(wàn)個(gè)人類蛋白質(zhì)找到潛在的藥物鑰匙。

它只需使用 8 張頂級(jí)顯卡,就能在不到 24 小時(shí)內(nèi)完成超過(guò) 10 萬(wàn)億次蛋白質(zhì)與分子的匹配計(jì)算,為將近一半的人類基因組找到了超過(guò) 200 萬(wàn)個(gè)潛在的候選藥物分子。

這一研究首次完成了覆蓋人類基因組規(guī)模的藥物虛擬篩選,首次打通了從蛋白結(jié)構(gòu)預(yù)測(cè)到藥物發(fā)現(xiàn)的關(guān)鍵通道,可覆蓋約 1 萬(wàn)個(gè)蛋白靶點(diǎn)、2 萬(wàn)個(gè)蛋白口袋,分析篩選了超過(guò) 5 億個(gè)類藥小分子,借此構(gòu)建了已知最大規(guī)模的蛋白-配體篩選數(shù)據(jù)庫(kù),目前該數(shù)據(jù)庫(kù)已免費(fèi)面向全球科研社區(qū)開(kāi)放 [1]。


圖 | 蘭艷艷(來(lái)源:https://air.tsinghua.edu.cn/info/1046/120

論文共同一作清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)博士后賈寅君告訴DeepTech:“一方面,我們聚焦于藥物研發(fā)最早期的苗頭化合物發(fā)現(xiàn)階段,把蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的AI成功進(jìn)一步推進(jìn)到化合物層面,使研究能與化學(xué)家直接對(duì)話;另一方面,我們致力于以組學(xué)視角系統(tǒng)性探索藥物靶點(diǎn),突破傳統(tǒng)單一靶點(diǎn)研發(fā)模式的局限,旨在通過(guò)對(duì)人類蛋白質(zhì)組的全面篩選,為未來(lái)攻克更多疾病提供新起點(diǎn)。盡管目前距離實(shí)際藥物應(yīng)用仍有 ADME 優(yōu)化、臨床驗(yàn)證等諸多挑戰(zhàn),但本研究為AI驅(qū)動(dòng)的大規(guī)模靶點(diǎn)探索奠定了基礎(chǔ)?!?/p>


圖 | 賈寅君(來(lái)源:賈寅君)

將以文搜圖原理用于 AI 尋藥

研究中,他們并不是讓 AI 去模擬分子擠進(jìn)蛋白質(zhì)口袋的復(fù)雜物理過(guò)程,而是借鑒了人們?cè)谌粘I钪谐S玫囊晕淖炙阉鲌D片的技術(shù)。當(dāng)我們使用搜索引擎以文字搜索圖片,尋找一張符合描述的照片時(shí),背后的技術(shù)并不是比較像素,而是比較圖片被轉(zhuǎn)換成的一組數(shù)字特征也就是向量。對(duì)于語(yǔ)義相似的文字和圖片來(lái)說(shuō),它們的特征向量在數(shù)學(xué)空間里的位置會(huì)非常接近。


(來(lái)源:https://www.science.org/doi/10.1126/science.ads9530)

DrugCLIP 也是這么做的,研究人員訓(xùn)練了兩個(gè)神經(jīng)網(wǎng)絡(luò):

第一個(gè)神經(jīng)網(wǎng)絡(luò)起著分子編碼器的作用,可以把任何一個(gè)小分子化合物,轉(zhuǎn)換成為一組代表其特征的數(shù)字向量;

第二個(gè)神經(jīng)網(wǎng)絡(luò)起著口袋編碼器的功能,可以把蛋白質(zhì)上那個(gè)可以結(jié)合藥物的凹陷區(qū)域也就是結(jié)合口袋,也轉(zhuǎn)換成為一組數(shù)字向量。

訓(xùn)練的目標(biāo)很簡(jiǎn)單:讓能夠結(jié)合的蛋白質(zhì)口袋和分子的向量變得非常相似,也就是在數(shù)字空間里靠得很近;讓不能結(jié)合的向量差異變得很大也就是離得很遠(yuǎn)。

這樣,當(dāng)面對(duì)一個(gè)新的蛋白質(zhì)的時(shí)候,DrugCLIP 只需要做這樣一個(gè)步驟:把這個(gè)蛋白質(zhì)口袋也變成一個(gè)向量,然后去已經(jīng)預(yù)存好的分子向量庫(kù)里,快速地計(jì)算余弦相似度,找出和它最像、也就是最可能結(jié)合的那些分子。這個(gè)過(guò)程非??欤?yàn)楸举|(zhì)上就是大量的向量點(diǎn)乘運(yùn)算,非常適合使用 GPU 進(jìn)行并行加速。

為了讓 AI 在沒(méi)有足夠真實(shí)數(shù)據(jù)的情況下也能學(xué)好,他們想出了這樣一個(gè)方法:使用蛋白質(zhì)自己假裝藥物來(lái)訓(xùn)練。他們從已知的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)中,截取一小段氨基酸鏈比如 3-8 個(gè)氨基酸,把它當(dāng)做偽配體,而它周圍的區(qū)域則被當(dāng)做偽口袋。

蛋白質(zhì)內(nèi)部氨基酸之間的相互作用,與蛋白質(zhì)和藥物分子之間的相互作用原理是相同的。通過(guò)使用這種方法,他們生成了 550 萬(wàn)個(gè)偽復(fù)合物數(shù)據(jù)來(lái)對(duì) AI 進(jìn)行預(yù)訓(xùn)練,從而讓它掌握了識(shí)別結(jié)合模式的基本功。


(來(lái)源:https://www.science.org/doi/10.1126/science.ads9530)

認(rèn)圖不認(rèn)人,無(wú)中生有找新藥

經(jīng)過(guò)訓(xùn)練之后,DrugCLIP 展現(xiàn)出又快又準(zhǔn)的特點(diǎn),在兩個(gè)權(quán)威的虛擬篩選測(cè)試集 DUD-E 和 LIT-PCBA 上,它的準(zhǔn)確率超過(guò)了包括傳統(tǒng)分子對(duì)接和許多其他深度學(xué)習(xí)模型在內(nèi)的所有基線方法。在速度上,它更是達(dá)到傳統(tǒng)分子對(duì)接方法的上千萬(wàn)倍。在篩選 LIT-PCBA 數(shù)據(jù)集上的所有分子時(shí),DrugCLIP 的順序計(jì)算只需要 38 秒,而傳統(tǒng)方法需要幾天甚至更久。

DrugCLIP 還展現(xiàn)出認(rèn)圖不認(rèn)人的特點(diǎn),它無(wú)需依賴精確的蛋白質(zhì)三維結(jié)構(gòu)細(xì)節(jié),針對(duì)蛋白質(zhì)側(cè)鏈的微小錯(cuò)誤不具備敏感性。更重要的是,即使訓(xùn)練數(shù)據(jù)里完全沒(méi)有某個(gè)蛋白質(zhì)家族的信息,它也能很好地為這個(gè)新家族的成員找到潛在配體,具備較強(qiáng)的泛化能力。

DrugCLIP 亦能無(wú)中生有尋找新藥。在濕實(shí)驗(yàn)驗(yàn)證中,針對(duì)抑郁癥靶點(diǎn) 5-羥色胺 2A 受體,它從 78 個(gè)候選分子中找到了 8 個(gè)有活性的激動(dòng)劑,其中最好的分子活性達(dá)到了納摩爾級(jí)別。

針對(duì)另一個(gè)抑郁癥靶點(diǎn)去甲腎上腺素轉(zhuǎn)運(yùn)體,它找到了比常用藥物安非他酮效果更好的新型抑制劑。研究人員甚至使用冷凍電鏡拍下了這些新抑制劑與靶點(diǎn)蛋白緊密結(jié)合的清晰照片,證實(shí)了 AI 預(yù)測(cè)的結(jié)合模式。


(來(lái)源:https://www.science.org/doi/10.1126/science.ads9530)

TRIP12,是一個(gè)與癌癥和神經(jīng)退行性疾病相關(guān)的蛋白質(zhì),此前既沒(méi)有它與小分子結(jié)合的實(shí)驗(yàn)結(jié)構(gòu),也幾乎沒(méi)有已知的抑制劑報(bào)道。為此,研究人員只能使用谷歌 DeepMind 旗下的 AlphaFold2 所預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)。

然而,即使是在這樣的 hard 模式下,DrugCLIP 結(jié)合該團(tuán)隊(duì)研發(fā)的另一款用于優(yōu)化預(yù)測(cè)結(jié)構(gòu)中的口袋定義的工具 GenPack,竟然取得了 17.5% 的命中率,找到了能夠有效結(jié)合并抑制 TRIP12 活性的苗頭化合物,證明了 DrugCLIP 在探索完全未知的靶點(diǎn)上的巨大潛力。


(來(lái)源:https://www.science.org/doi/10.1126/science.ads9530)

構(gòu)建公共數(shù)據(jù)庫(kù),助推打造藥物發(fā)現(xiàn)新模式

這項(xiàng)研究的終極結(jié)果,是構(gòu)建了一個(gè)名為 GenomeScreenDB 的公共數(shù)據(jù)庫(kù)。研究人員利用 AlphaFold2 預(yù)測(cè)的整個(gè)人類蛋白質(zhì)組結(jié)構(gòu),結(jié)合 DrugCLIP 針對(duì) 5 億多個(gè)類藥分子進(jìn)行了全景式掃描,最終為來(lái)自大約 1 萬(wàn)個(gè)人類蛋白質(zhì)的 2 萬(wàn)個(gè)結(jié)合口袋,找到了 200 萬(wàn)個(gè)潛在的候選分子。

這個(gè)數(shù)據(jù)庫(kù)所覆蓋的蛋白質(zhì)靶點(diǎn)數(shù)量,是當(dāng)前最全面的生物活性分子數(shù)據(jù)庫(kù) ChEMBL 的兩倍之多,涵蓋了將近一半的人類基因組。從經(jīng)典的激酶靶點(diǎn)、到鮮有研究的溶質(zhì)載體蛋白、甚至嗅覺(jué)受體,在該數(shù)據(jù)庫(kù)中都有預(yù)測(cè)的結(jié)合分子。目前,這些數(shù)據(jù)已在網(wǎng)站和在線服務(wù)平臺(tái)(https://drugclip.com)面向全球科學(xué)家免費(fèi)開(kāi)放。


(來(lái)源:https://drugclip.com)

自此以后,任何一位研究人員即使沒(méi)有太強(qiáng)的計(jì)算資源,也可以輕松查詢到自己感興趣的靶點(diǎn),快速獲得一些經(jīng)過(guò) AI 預(yù)篩選的候選化合物,并以此作為藥物研發(fā)的起點(diǎn)。這極大地降低了早期藥物發(fā)現(xiàn)的壁壘,尤其有助于針對(duì)那些冷門但是重要的疾病靶點(diǎn)開(kāi)展研究。


(來(lái)源:https://www.science.org/doi/10.1126/science.ads9530)

清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)博士后賈寅君、計(jì)算機(jī)系博士生高博文、生命學(xué)院博士后譚佳鑫、化學(xué)系博士后鄭濟(jì)青以及智能產(chǎn)業(yè)研究院(AIR)博士后洪鑫是本次論文的共同一作;通訊作者為智能產(chǎn)業(yè)研究院(AIR)蘭艷艷教授,清華大學(xué)生命學(xué)院張偉副教授、閆創(chuàng)業(yè)副教授以及清華大學(xué)化學(xué)系劉磊教授。

在后續(xù)計(jì)劃上,賈寅君表示將主要圍繞兩大方向:一是提升優(yōu)化AI發(fā)現(xiàn)的分子的安全性及成藥性,使其更接近實(shí)際制藥應(yīng)用;二是進(jìn)一步提高AI模型準(zhǔn)確性與分子效力,增強(qiáng)初篩分子的生物學(xué)活性。這兩方面均是未來(lái)真正實(shí)現(xiàn)AI終結(jié)一切人類疾病需要攻克的關(guān)鍵問(wèn)題。

參考資料:

相關(guān)論文:https://www.science.org/doi/10.1126/science.ads9530

蘭艷艷官方主頁(yè):https://yanyanlan.com/

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
岳云鵬宣布退出2026春晚,不再參加

岳云鵬宣布退出2026春晚,不再參加

觀察者海風(fēng)
2026-01-07 17:11:33
血的教訓(xùn)!美軍突襲委內(nèi)瑞拉:多虧這套系統(tǒng),解放軍卻從未裝備?

血的教訓(xùn)!美軍突襲委內(nèi)瑞拉:多虧這套系統(tǒng),解放軍卻從未裝備?

南宗歷史
2026-01-07 15:04:25
剛說(shuō)川普可能護(hù)送巴列維進(jìn)入,就傳伊朗斷網(wǎng)和川普可能再次打擊

剛說(shuō)川普可能護(hù)送巴列維進(jìn)入,就傳伊朗斷網(wǎng)和川普可能再次打擊

邵旭峰域
2026-01-09 12:56:47
錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個(gè)醒

錢再多有啥用!“展昭”何家勁的現(xiàn)狀,給所有老年男性提了個(gè)醒

阿笎評(píng)論哥
2026-01-08 06:40:37
特朗普重磅表態(tài):臺(tái)灣屬于中國(guó),鄭麗文訪陸時(shí)間確定,王金平回應(yīng)

特朗普重磅表態(tài):臺(tái)灣屬于中國(guó),鄭麗文訪陸時(shí)間確定,王金平回應(yīng)

卷史
2026-01-09 16:26:16
香港特別行政區(qū)第八屆立法會(huì)主席是她!祖籍廣東佛山

香港特別行政區(qū)第八屆立法會(huì)主席是她!祖籍廣東佛山

南粵女聲
2026-01-09 15:47:03
中國(guó)冰壺混雙6-3力克波蘭:世錦資格賽小組第一!生死戰(zhàn)或戰(zhàn)中國(guó)臺(tái)北

中國(guó)冰壺混雙6-3力克波蘭:世錦資格賽小組第一!生死戰(zhàn)或戰(zhàn)中國(guó)臺(tái)北

生活新鮮市
2026-01-10 09:09:08
凌晨打車22公里收98元?乘客拒付耗到天亮,的哥委屈:是政府定價(jià)

凌晨打車22公里收98元?乘客拒付耗到天亮,的哥委屈:是政府定價(jià)

奇思妙想草葉君
2026-01-07 22:36:16
2026年第一個(gè)驚喜?印媒:中國(guó)第三架殲-36出現(xiàn)后,轟-20即將首飛

2026年第一個(gè)驚喜?印媒:中國(guó)第三架殲-36出現(xiàn)后,轟-20即將首飛

軍機(jī)Talk
2026-01-08 10:24:15
1976年,鄧穎超擔(dān)任人大副委員長(zhǎng),華國(guó)鋒:這是毛主席生前的安排

1976年,鄧穎超擔(dān)任人大副委員長(zhǎng),華國(guó)鋒:這是毛主席生前的安排

元哥說(shuō)歷史
2026-01-10 10:05:03
國(guó)行 Apple Watch 馬上迎來(lái)新功能,為國(guó)內(nèi) 2000 萬(wàn)患者而來(lái)

國(guó)行 Apple Watch 馬上迎來(lái)新功能,為國(guó)內(nèi) 2000 萬(wàn)患者而來(lái)

愛(ài)范兒
2026-01-09 18:41:45
陳雨菲退賽女單告急,國(guó)羽外戰(zhàn)全勝,附大馬賽半決賽賽程

陳雨菲退賽女單告急,國(guó)羽外戰(zhàn)全勝,附大馬賽半決賽賽程

佑銘羽球
2026-01-10 02:45:03
盧卡申科:馬杜羅妻子非常勇敢,拒絕離開(kāi)馬杜羅身邊

盧卡申科:馬杜羅妻子非常勇敢,拒絕離開(kāi)馬杜羅身邊

新京報(bào)政事兒
2026-01-09 13:33:32
玄彬哭紅眼李政宰捧遺像,韓國(guó)半個(gè)影壇為噎死的老影帝長(zhǎng)跪不起

玄彬哭紅眼李政宰捧遺像,韓國(guó)半個(gè)影壇為噎死的老影帝長(zhǎng)跪不起

安寧007
2026-01-09 19:28:49
白宮“購(gòu)島”方案流出:向格陵蘭人一次性付款,以說(shuō)服他們脫離丹麥并可能加入美國(guó),每人或得1萬(wàn)-10萬(wàn)美元

白宮“購(gòu)島”方案流出:向格陵蘭人一次性付款,以說(shuō)服他們脫離丹麥并可能加入美國(guó),每人或得1萬(wàn)-10萬(wàn)美元

都市快報(bào)橙柿互動(dòng)
2026-01-09 08:14:32
72%煙草倒掛逼哭零售戶!寧可不訂也不賠錢,市場(chǎng)根基正在爛根

72%煙草倒掛逼哭零售戶!寧可不訂也不賠錢,市場(chǎng)根基正在爛根

老特有話說(shuō)
2026-01-07 00:40:03
深夜利空,8個(gè)龍頭年報(bào)業(yè)績(jī)暴雷,5股陷入虧損,千萬(wàn)別踩雷

深夜利空,8個(gè)龍頭年報(bào)業(yè)績(jī)暴雷,5股陷入虧損,千萬(wàn)別踩雷

風(fēng)風(fēng)順
2026-01-10 00:57:49
官媒主動(dòng)下場(chǎng),53歲孟晚舟再掀天花板,讓任正非與整個(gè)商界沉默了

官媒主動(dòng)下場(chǎng),53歲孟晚舟再掀天花板,讓任正非與整個(gè)商界沉默了

牛牛叨史
2026-01-07 13:34:04
1980年,王光美拿過(guò)追悼會(huì)名單,狠狠劃掉幾人,卻添上個(gè)正在挨整的將軍:他對(duì)咱家有恩

1980年,王光美拿過(guò)追悼會(huì)名單,狠狠劃掉幾人,卻添上個(gè)正在挨整的將軍:他對(duì)咱家有恩

源溯歷史
2026-01-07 19:28:08
陳博彰當(dāng)選長(zhǎng)沙市市長(zhǎng),原市長(zhǎng)已進(jìn)京任職

陳博彰當(dāng)選長(zhǎng)沙市市長(zhǎng),原市長(zhǎng)已進(jìn)京任職

上觀新聞
2026-01-09 18:12:06
2026-01-10 11:07:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16103文章數(shù) 514467關(guān)注度
往期回顧 全部

科技要聞

傳DeepSeek準(zhǔn)備第二次震驚全世界

頭條要聞

媒體:中國(guó)若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

頭條要聞

媒體:中國(guó)若在其任期統(tǒng)一特朗普不悅 中方回應(yīng)滴水不漏

體育要聞

楊瀚森:上場(chǎng)時(shí)間要去爭(zhēng)取 而不是要求

娛樂(lè)要聞

曹西平遺照曝光:靈堂布置過(guò)于簡(jiǎn)陋

財(cái)經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

寶馬25年全球銷量246.3萬(wàn)臺(tái) 中國(guó)仍是第一大市場(chǎng)

態(tài)度原創(chuàng)

親子
藝術(shù)
教育
旅游
軍事航空

親子要聞

再生氣也不能打孩子這5個(gè)部位

藝術(shù)要聞

你能認(rèn)出毛主席手書的全部嗎?揭秘其中隱藏的秘密!

教育要聞

馬上要出分了!山東2026藝考成績(jī)查詢方式及一分一段表!

旅游要聞

最新消息!什剎海冰場(chǎng)計(jì)劃今日開(kāi)業(yè)

軍事要聞

特朗普:已開(kāi)始從委石油資源中賺錢

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版