国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

上交大提出新注意力機(jī)制模型:利用文本描述設(shè)計(jì)蛋白質(zhì)序列

0
分享至



蛋白質(zhì)工程向來(lái)是生物學(xué)領(lǐng)域中不可忽視的一項(xiàng)重要領(lǐng)域,其中蛋白質(zhì)設(shè)計(jì)關(guān)系到藥物開(kāi)發(fā)與酶工程等多種極具潛力的應(yīng)用領(lǐng)域。

相較于傳統(tǒng)設(shè)計(jì)策略,研究員或許更為眼饞如 AI 文生圖這種大眾化設(shè)計(jì),直接告訴 AI 自己需要什么蛋白質(zhì),讓 AI 去生成就行。而現(xiàn)在,上海交通大學(xué)的一支團(tuán)隊(duì)就成功開(kāi)發(fā)出了一種全新細(xì)粒度多模態(tài)數(shù)據(jù)交互框架 ProtDAT,能夠根據(jù)描述性蛋白質(zhì)文本輸入設(shè)計(jì)蛋白質(zhì)。

該研究以「Ab-initio amino acid sequence design from protein text description with ProtDAT」為題,于 2025 年 11 月 26 日發(fā)布在《Nature Communications》。



論文鏈接:https://www.nature.com/articles/s41467-025-65562-w

從「文本描述」到「蛋白序列」

用過(guò) AI 生圖的大家大概可以想象這么一個(gè)畫(huà)面:在紙上寫(xiě)下一句話,描述想要的蛋白,比如 「一個(gè)能在 37°C 下穩(wěn)定、對(duì) pH 7.4 敏感、有較強(qiáng)親水界面的酶」,然后點(diǎn)擊「生成」。幾秒鐘后,一串氨基酸序列出現(xiàn)——這可能是一種全新的蛋白。

這大概就是對(duì) ProtDAT 比較親切的一種描述。學(xué)術(shù)界以往的成果表明,從文本中生成蛋白質(zhì)序列是可行的。受大語(yǔ)言模型啟發(fā),團(tuán)隊(duì)就一個(gè)基于任何指定文本描述訓(xùn)練數(shù)據(jù)集生成蛋白質(zhì)序列的蛋白質(zhì)設(shè)計(jì)框架,在模態(tài)融合解碼器層設(shè)計(jì)了多模態(tài)交叉注意力機(jī)制(MCM),用于實(shí)現(xiàn)不同模態(tài)信息的細(xì)粒度蛋白質(zhì)序列-文本交互。



圖 1:ProtDAT 的概述。

這讓 AI 能把「人類對(duì)功能的文字描述」直接映射到「分子級(jí)別、可編碼的蛋白序列空間」。鑒于 ProtDAT 是一個(gè)從頭開(kāi)始訓(xùn)練的框架,這也讓它解決了 PLMs 在蛋白質(zhì)序列生成中因蛋白質(zhì)描述文本指導(dǎo)不足而存在的重大問(wèn)題。

ProtDAT 提出了一種新的交叉注意力機(jī)制,即 MCM,專門(mén)設(shè)計(jì)用于處理綜合信息,為蛋白質(zhì)設(shè)計(jì)提供直觀、符合人類邏輯的路徑。它將兩種不同模態(tài)的交互集成在單個(gè)模型中,從基礎(chǔ)層面建立更穩(wěn)定的鏈接。

在 ProtDAT 框架內(nèi)對(duì)瑞士蛋白數(shù)據(jù)庫(kù) Swiss-Prot 中的 20,000 對(duì)文本序列進(jìn)行實(shí)驗(yàn),結(jié)果表明其準(zhǔn)確度高于實(shí)驗(yàn)中最佳方法的性能,pLDDT 提高了 23.34%,TM-score 提高了 76.45%,RMSD 降低了 24.41%。

MCM 測(cè)試表現(xiàn)

既然 ProtDAT 提出了一種全新的機(jī)制 MCM,那就來(lái)關(guān)注一下它的作用與實(shí)際測(cè)試結(jié)果。



圖 2:ProtDAT 性能的綜合評(píng)價(jià)。

團(tuán)隊(duì)觀察到,隨著序列長(zhǎng)度的增加(最大至 500),平均注意力權(quán)重也在變化。標(biāo)示蛋白質(zhì)提示貢獻(xiàn)度的數(shù)據(jù)雖然也在下降,但序列長(zhǎng)度達(dá)到 1000 后,這個(gè)值穩(wěn)定在了約 20%。這進(jìn)一步證明文本描述在生成早期階段確保了對(duì)關(guān)鍵氨基酸標(biāo)記的準(zhǔn)確指令,并在蛋白質(zhì)序列增長(zhǎng)時(shí)繼續(xù)提供方向性支持。

這說(shuō)明 MCM 解決了現(xiàn)有方法中蛋白質(zhì)描述文本指導(dǎo)不足的問(wèn)題,促進(jìn)了多模態(tài)整合。而在消融實(shí)驗(yàn)中,ProtDAT 在多個(gè)評(píng)估維度上相較于 ProtDAT(不含 MCM)取得了顯著改進(jìn)。蛋白質(zhì)序列與結(jié)構(gòu)評(píng)估前者全面碾壓后者;亞細(xì)胞定位里 MCM 的數(shù)據(jù)提升更明顯;在功能相似性檢索里返回值與檢索指標(biāo)也更為優(yōu)秀。

文字生成蛋白質(zhì)

論文用設(shè)計(jì)遠(yuǎn)程同源蛋白質(zhì)序列、生成有天然蛋白質(zhì)特征的序列等案例揭示了 MCM 這個(gè)新型注意力機(jī)制的優(yōu)秀性能。實(shí)驗(yàn)結(jié)果表明,ProtDAT 生成的蛋白質(zhì)序列有效地整合了文本信息,在結(jié)構(gòu)合理性、功能性和結(jié)構(gòu)相似性方面取得了顯著性能,pLDDT 平均提高了 18.65,0.TM-score 提高了 26,RMSD 減少了 1.2 ?。

團(tuán)隊(duì)計(jì)劃利用更廣泛的標(biāo)注蛋白質(zhì)數(shù)據(jù)集擴(kuò)展 ProtDAT 的語(yǔ)言能力,并采用不同領(lǐng)域的訓(xùn)練數(shù)據(jù)集來(lái)擴(kuò)大其覆蓋規(guī)模。相關(guān)研究可于 Github 獲取。

https://github.com/GXY0116/ProtDAT

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《老舅》開(kāi)播登頂!卻被罵上熱搜?這國(guó)產(chǎn)劇到底咋了?

《老舅》開(kāi)播登頂!卻被罵上熱搜?這國(guó)產(chǎn)劇到底咋了?

小片片說(shuō)大片
2025-12-25 11:25:09
美軍火還未抵臺(tái),洪秀柱突然表態(tài),大陸告知臺(tái)當(dāng)局,祖國(guó)勢(shì)必統(tǒng)一

美軍火還未抵臺(tái),洪秀柱突然表態(tài),大陸告知臺(tái)當(dāng)局,祖國(guó)勢(shì)必統(tǒng)一

起喜電影
2025-12-26 01:30:04
世界棋仙戰(zhàn)16強(qiáng)5盤(pán)中韓對(duì)抗,丁浩申真谞再相遇,楊楷文PK樸廷桓

世界棋仙戰(zhàn)16強(qiáng)5盤(pán)中韓對(duì)抗,丁浩申真谞再相遇,楊楷文PK樸廷桓

L76號(hào)
2025-12-25 16:35:17
為什么反感滿清的情緒,會(huì)在今天突然集中爆發(fā)?

為什么反感滿清的情緒,會(huì)在今天突然集中爆發(fā)?

西域都護(hù)
2025-12-13 23:55:19
這5種硼砂重災(zāi)區(qū)食物!很多人愛(ài)吃,商販自己都不碰,早看早避坑

這5種硼砂重災(zāi)區(qū)食物!很多人愛(ài)吃,商販自己都不碰,早看早避坑

菜衛(wèi)衛(wèi)的日常美食
2025-11-12 12:39:56
36年過(guò)去了,莊月明的死,依舊是李澤楷的心頭刺,咽不下也拔不出

36年過(guò)去了,莊月明的死,依舊是李澤楷的心頭刺,咽不下也拔不出

小熊侃史
2025-12-20 11:00:05
為楊瀚森鳴不平?利拉德連發(fā)2圖疑內(nèi)涵球隊(duì)主帥:驢覺(jué)得它是獅子

為楊瀚森鳴不平?利拉德連發(fā)2圖疑內(nèi)涵球隊(duì)主帥:驢覺(jué)得它是獅子

夕落秋山
2025-12-25 14:15:31
破3萬(wàn)!這個(gè)計(jì)劃單列市,房?jī)r(jià)卷瘋了

破3萬(wàn)!這個(gè)計(jì)劃單列市,房?jī)r(jià)卷瘋了

城市財(cái)經(jīng)
2025-12-25 11:46:21
霍啟剛沒(méi)想到,44歲郭晶晶再傳喜訊,讓霍震霆和香港闊太圈沉默了

霍啟剛沒(méi)想到,44歲郭晶晶再傳喜訊,讓霍震霆和香港闊太圈沉默了

涵豆說(shuō)娛
2025-12-24 16:48:02
施瓦辛格出軌丑聞14年后與前妻圣誕重聚

施瓦辛格出軌丑聞14年后與前妻圣誕重聚

領(lǐng)悟看世界
2025-12-26 01:02:42
徐湖平已被帶走調(diào)查!鄰居曝細(xì)節(jié),家中收藏很多,兒子身份有貓膩

徐湖平已被帶走調(diào)查!鄰居曝細(xì)節(jié),家中收藏很多,兒子身份有貓膩

葉公子
2025-12-25 20:29:35
金與正的婚姻決定震驚朝鮮內(nèi)外:再也不會(huì)有第二個(gè)張成澤!

金與正的婚姻決定震驚朝鮮內(nèi)外:再也不會(huì)有第二個(gè)張成澤!

阿校談史
2025-07-23 16:33:19
藍(lán)營(yíng)支持度暴跌5.2%!蔡正元敲響警鐘:別再用民調(diào)不準(zhǔn)自我安慰了

藍(lán)營(yíng)支持度暴跌5.2%!蔡正元敲響警鐘:別再用民調(diào)不準(zhǔn)自我安慰了

達(dá)文西看世界
2025-12-24 21:18:45
新婚快樂(lè),山東泰山球員高準(zhǔn)翼在老家延吉舉辦婚禮

新婚快樂(lè),山東泰山球員高準(zhǔn)翼在老家延吉舉辦婚禮

懂球帝
2025-12-25 19:58:06
臺(tái)南軍系贈(zèng)“手槍”力挺,謝龍介:終結(jié)賴清德本命區(qū)32年綠營(yíng)執(zhí)政

臺(tái)南軍系贈(zèng)“手槍”力挺,謝龍介:終結(jié)賴清德本命區(qū)32年綠營(yíng)執(zhí)政

海峽導(dǎo)報(bào)社
2025-12-25 17:40:15
從憂心忡忡到大喜過(guò)望,日本潛艇動(dòng)力造假中國(guó)海軍有多少好處

從憂心忡忡到大喜過(guò)望,日本潛艇動(dòng)力造假中國(guó)海軍有多少好處

探源歷史
2025-12-25 13:15:41
100億!約1342畝!南昌迎來(lái)超大項(xiàng)目!

100億!約1342畝!南昌迎來(lái)超大項(xiàng)目!

南昌樓市情報(bào)
2025-12-25 18:41:24
妻兒三人被害案,家屬索賠295萬(wàn),兇手表示沒(méi)錢(qián)賠償,還欠了網(wǎng)貸

妻兒三人被害案,家屬索賠295萬(wàn),兇手表示沒(méi)錢(qián)賠償,還欠了網(wǎng)貸

奇思妙想草葉君
2025-12-25 22:53:43
日本為什么挑釁中國(guó),西班牙專家:中國(guó)錯(cuò)就錯(cuò)在沒(méi)跟日本徹底清算

日本為什么挑釁中國(guó),西班牙專家:中國(guó)錯(cuò)就錯(cuò)在沒(méi)跟日本徹底清算

我心縱橫天地間
2025-12-08 18:32:33
2026年元旦后,運(yùn)勢(shì)悄然翻盤(pán),未來(lái)十年越走越順的三個(gè)星座請(qǐng)留意

2026年元旦后,運(yùn)勢(shì)悄然翻盤(pán),未來(lái)十年越走越順的三個(gè)星座請(qǐng)留意

小晴星座說(shuō)
2025-12-23 20:33:05
2025-12-26 02:56:49
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1190文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報(bào)復(fù)

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報(bào)復(fù)

體育要聞

約基奇有多喜歡馬?

娛樂(lè)要聞

朱孝天把阿信好意當(dāng)球踢!

財(cái)經(jīng)要聞

新規(guī)來(lái)了,年化超24%的小貸被即刻叫停

汽車要聞

速來(lái)!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

旅游
游戲
房產(chǎn)
公開(kāi)課
軍事航空

旅游要聞

市屬公園三大雪場(chǎng)今起全面開(kāi)放

逆水寒頂流主播沉迷倩女!三界的魅力藏不住了

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬(wàn)家,又一波巨頭涌向海南!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基版“和平計(jì)劃”透露哪些信息

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版