国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

深度科學(xué)| Nature: MOSAIC專用模型如何實現(xiàn)智能化學(xué)合成

0
分享至

編者語:

該方法避免了嚴(yán)格定義反應(yīng)類型的局限性,轉(zhuǎn)而讓系統(tǒng)直接從Voronoi單元中發(fā)現(xiàn)并利用轉(zhuǎn)化模式間的相似性。

01


背景介紹

在當(dāng)今科學(xué)飛速發(fā)展的時代,化學(xué)領(lǐng)域正面臨著一個前所未有的挑戰(zhàn):信息爆炸。每年有數(shù)十萬個新化學(xué)反應(yīng)被報道,加入已經(jīng)包含數(shù)百萬個已知反應(yīng)的龐大知識庫。然而,手動查閱文獻變得低效且高度依賴個人經(jīng)驗,這些海量信息逐漸成為了化學(xué)家的負擔(dān)。并且,傳統(tǒng)的化學(xué)合成依賴研究人員的專業(yè)知識和直覺,往往需要通過反復(fù)試錯來優(yōu)化反應(yīng)條件(圖1)。即使是經(jīng)驗豐富的化學(xué)家,也難以掌握所有快速發(fā)展的實驗方法學(xué)。這種局限性也影響了自動化合成平臺,缺失的實驗方案常常需要人工干預(yù)關(guān)鍵參數(shù)。盡管大型語言模型(LLMs)在化學(xué)領(lǐng)域已展現(xiàn)出應(yīng)用潛力,但現(xiàn)有系統(tǒng)難以可靠地處理各種全新化合物的復(fù)雜轉(zhuǎn)化,且在提供可重復(fù)、完整、帶可信度評估的實驗方案方面存在明顯不足。


1. 傳統(tǒng)經(jīng)驗式試錯合成(AI圖)

2026年01月19日,耶魯大學(xué)Victor S. Batista與Timothy R. Newhouse團隊在Nature期刊發(fā)表題為“Collective intelligence for AI-assisted chemical synthesis”的研究論文。該研究開發(fā)了一種名為“多優(yōu)化專家AI輔助化學(xué)預(yù)測”的計算框架(MOSAIC框架,Multiple Optimized Specialists for AI-assisted Chemical Prediction),旨在讓化學(xué)家能夠利用數(shù)百萬反應(yīng)方案的集體知識(圖2)。MOSAIC基于Llama-3.1-8B-instruct架構(gòu)構(gòu)建,在Voronoi聚類劃分的空間中訓(xùn)練了2,498個高度專業(yè)化的化學(xué)專家模型。該方法能夠為復(fù)雜合成提供可復(fù)現(xiàn)、可執(zhí)行的實驗方案,并附帶置信度評估指標(biāo)。實驗驗證顯示,其整體成功率達到71%,實現(xiàn)了 35 種以上新化合物的合成,涵蓋藥物、材料、農(nóng)用化學(xué)品和化妝品等多個領(lǐng)域。值得注意的是,MOSAIC還能夠發(fā)現(xiàn)超出其訓(xùn)練專家知識范圍的全新反應(yīng)方法,這是推動化學(xué)合成發(fā)展的關(guān)鍵能力。通過將龐大知識領(lǐng)域劃分為可搜索的專家區(qū)域,這一可擴展范式為在信息增長速度超越知識獲取與應(yīng)用效率的領(lǐng)域中實現(xiàn)AI輔助發(fā)現(xiàn),提供了一種具有普適性的解決策略。


2. 圖文總覽

02


圖文解析

1.革命性設(shè)計:從通用模型到化學(xué)專家委員會

研究團隊首先開發(fā)了一種稱為核度量網(wǎng)絡(luò)(KMN)的系統(tǒng)(圖3),能夠?qū)⒒瘜W(xué)反應(yīng)轉(zhuǎn)化為128維的“反應(yīng)特異性指紋”。這種指紋類似于人類的指紋,能夠唯一標(biāo)識每個化學(xué)反應(yīng)的特征。通過FAISS相似性搜索庫,化學(xué)反應(yīng)空間被劃分為2,500個Voronoi區(qū)域,每個區(qū)域由專門的專家模型負責(zé)。

這種設(shè)計的巧妙之處在于:當(dāng)遇到一個新的合成問題時,系統(tǒng)會先確定這個問題屬于哪個化學(xué)空間區(qū)域,然后激活對應(yīng)的專家提供解決方案。這就好比不是詢問一個“通才”,而是咨詢一個專門研究此類反應(yīng)的“領(lǐng)域?qū)<摇薄?/p>

MOSAIC的核心創(chuàng)新在于其獨特的架構(gòu)設(shè)計。與傳統(tǒng)的單一大型語言模型不同,MOSAIC基于Llama-3.1-8B-instruct架構(gòu),訓(xùn)練了2,498個專業(yè)化學(xué)專家,每個專家負責(zé)特定的化學(xué)反應(yīng)空間。


3.MOSAIC系統(tǒng)框架示意圖

2.專業(yè)化優(yōu)勢

研究團隊還MOSAIC與當(dāng)前的主流大語言模型進行了系統(tǒng)比較,包括ChatGPT-4o mini、Claude 3.5 Haiku、Claude 3.5 Sonnet和ChatGPT-o1 Pro。評估涵蓋了12種重要反應(yīng)類型,包括Suzuki偶聯(lián)、烯烴復(fù)分解、Buchwald-Hartwig胺化等。結(jié)果表明,盡管MOSAIC只有80億參數(shù),遠小于ChatGPT-o1 Pro和Claude 3.5 Sonnet等模型,但其在提供明確化學(xué)合成指導(dǎo)方面表現(xiàn)更優(yōu)(圖4)。這表明在專業(yè)領(lǐng)域,針對性的微調(diào)和化學(xué)特定的優(yōu)化可以克服原始參數(shù)數(shù)量的優(yōu)勢。評估還發(fā)現(xiàn),遵循指令的能力與化學(xué)知識同樣重要。通用模型在相同提示下表現(xiàn)出顯著不同的響應(yīng)一致性。例如,Claude 3.5 Haiku在一次試驗中能提供詳細回答,而在另一次試驗中則拒絕回答,聲稱信息不足。這種不一致性給尋求可靠幫助的用戶帶來了挑戰(zhàn)。


4. 提示設(shè)計與量化評估指標(biāo)

3.從預(yù)測到實踐:71%的成功率驗證

實驗驗證表明,該系統(tǒng)在合成超過35種新化合物時達到了71%的整體成功率。這些化合物涵蓋藥物、材料、農(nóng)用化學(xué)品和化妝品等多個領(lǐng)域(圖5和圖6)。

更為重要的是,MOSAIC展現(xiàn)出了強大的預(yù)測能力:當(dāng)轉(zhuǎn)化反應(yīng)與專家知識域距離較近(距離<100)時,成功率超過75%;即使距離較遠(>100),仍能達到約50%的成功率。這為實驗優(yōu)先級提供了量化依據(jù)——研究人員可以優(yōu)先嘗試高置信度的預(yù)測,同時將資源合理分配于探索性研究。

具體案例充分展示了MOSAIC的實用價值。在Buchwald-Hartwig胺化反應(yīng)中(藥物分子中普遍存在的碳氮鍵形成反應(yīng)),MOSAIC不僅準(zhǔn)確預(yù)測了條件,還展示了深刻的化學(xué)洞察力,為不同底物提出了鈀催化的Buchwald-Hartwig、銅催化的Goldberg和SNAr反應(yīng)作為可行替代方案(圖5)。

在合成具有臨床重要性的化合物衍生物,如抗抑郁藥去甲替林和降膽固醇藥物非諾貝特時,這種多功能性被證明非常寶貴。MOSAIC還成功指導(dǎo)了Heck偶聯(lián)反應(yīng),其中先前報道的轉(zhuǎn)化已被證明不成功,展示了其解決合成瓶頸的潛力。


5.基于計算預(yù)測指導(dǎo)的全新化合物合成

4.超越已知:發(fā)現(xiàn)全新反應(yīng)方法學(xué)

MOSAIC最引人注目的能力是能夠發(fā)現(xiàn)訓(xùn)練數(shù)據(jù)中不存在的新反應(yīng)方法學(xué)。在案例研究中,研究團隊使用雜芳基二鹵化物的級聯(lián)環(huán)化來形成吲哚的生物電子等排體類似物。研究表明,5-氮雜吲哚衍生物的合成在現(xiàn)有方法下無法進行。基于這一局限性,MOSAIC指導(dǎo)開發(fā)了一種通過雜芳基二鹵化物與N-烷基烯丙胺的未報道環(huán)化反應(yīng)來合成各種氮雜吲哚的新方案(圖6, 13a-d)。

對于形成目標(biāo)產(chǎn)物的反應(yīng),最近的專家質(zhì)心距離為320,遠高于典型的置信閾值(<150)。缺乏密切相關(guān)的前例反應(yīng)表明,該預(yù)測遠遠超出了知識空間,從預(yù)測專家的角度來看,這是一個真正的新轉(zhuǎn)化。


6. 面向跨化學(xué)工業(yè)轉(zhuǎn)化應(yīng)用合成的化合物

5.實際應(yīng)用:從藥物開發(fā)到材料科學(xué)

MOSAIC的實際影響跨越多個化學(xué)工業(yè)領(lǐng)域。在藥物研發(fā)方面,它準(zhǔn)確預(yù)測了類藥分子的合成路線;在材料科學(xué)中,精確預(yù)測了電子器件共軛化合物的合成路線;在農(nóng)業(yè)化學(xué)中,實現(xiàn)了用于作物保護的pyrabactin變體的創(chuàng)建;在消費品領(lǐng)域,成功合成了潛在香料和抗衰老化合物(圖6)。

特別值得關(guān)注的是,在37種實現(xiàn)的化合物中,有35種使用排名最高的預(yù)測一次嘗試即成功,只有兩種需要較低排名的程序。這些成功應(yīng)用代表了所檢查轉(zhuǎn)化的大多數(shù),盡管并非所有預(yù)測都產(chǎn)生了成功的結(jié)果。

03


總結(jié)

這種利用計算搜索的方法原則隨著數(shù)據(jù)和資源的增加而有效擴展。通過將巨大的化學(xué)反應(yīng)空間劃分為可搜索的Vonoroi區(qū)域并將專家分配給這些區(qū)域,MOSAIC可以隨著更多數(shù)據(jù)的可用而不斷擴展其覆蓋范圍和精度。通過FAISS的搜索機制實現(xiàn)了高效導(dǎo)航,使系統(tǒng)能夠快速識別任何給定查詢的最相關(guān)專家模型。MOSAIC的價值不在于取代化學(xué)專業(yè)知識,而在于快速調(diào)查廣闊的化學(xué)空間,確定有希望的實驗方向,否則這些方向需要廣泛的文獻回顧和積累的經(jīng)驗。它將傳統(tǒng)的迭代試錯方法轉(zhuǎn)變?yōu)橹樘剿鳎铀龠M入以前未知的化學(xué)空間區(qū)域。

文獻信息

Haote Li, Sumon Sarkar, Wenxin Lu, Patrick O. Loftus, Tianyin Qiu, Yu Shee, Abbigayle E. Cuomo, John-Paul Webster, H. Ray Kelly, Vidhyadhar Manee, Sanil Sreekumar, Frederic G. Buono, Robert H. Crabtree, Timothy R. Newhouse & Victor S. Batista, Collective intelligence for AI-assisted chemical synthesis, Nature, 2026, https://doi.org/10.1038/s41586-026-10131-4

聲明:

1. 版權(quán):推送內(nèi)容僅供學(xué)習(xí)交流分享使用,無任何商業(yè)用途,如有侵權(quán),請聯(lián)系后臺刪除或修改,感謝支持。

2. 投稿:非常歡迎各位老師在公眾號上介紹課題組前沿或經(jīng)典研究成果!后臺或郵箱聯(lián)系即可!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
章澤天穿小香風(fēng)接待卡塔爾公主,兩人見面就擁抱,老板娘很大氣!

章澤天穿小香風(fēng)接待卡塔爾公主,兩人見面就擁抱,老板娘很大氣!

庭小娛
2026-03-29 13:19:47
錢再多有什么用?霍啟剛夫婦身家百億,如今卻為12歲兒子操碎了心

錢再多有什么用?霍啟剛夫婦身家百億,如今卻為12歲兒子操碎了心

阿纂看事
2026-03-28 18:30:52
公元627年十二月的濃霧中,一位年近五十的皇帝提槍縱馬沖入波斯軍陣——尼尼微戰(zhàn)役與拜占庭帝國最輝煌也最心酸的回光返照

公元627年十二月的濃霧中,一位年近五十的皇帝提槍縱馬沖入波斯軍陣——尼尼微戰(zhàn)役與拜占庭帝國最輝煌也最心酸的回光返照

史海殘云
2026-03-28 23:13:18
中共九大唯一與毛主席平起平坐的人,后為民棄官,晚年甘做鍋爐工

中共九大唯一與毛主席平起平坐的人,后為民棄官,晚年甘做鍋爐工

諾言卿史錄
2026-03-29 07:05:13
“白天800晚上900元”,女子陪爬泰山時,被一男子“白嫖”800元

“白天800晚上900元”,女子陪爬泰山時,被一男子“白嫖”800元

江山揮筆
2026-03-28 16:50:15
75年奶奶收留了一對落難姐弟,多年后一位年輕軍官找上了門

75年奶奶收留了一對落難姐弟,多年后一位年輕軍官找上了門

人間百態(tài)大全
2026-03-29 06:35:03
4月“惹不起”的3生肖,遇貴人光芒照人,事業(yè)取得重大突破!

4月“惹不起”的3生肖,遇貴人光芒照人,事業(yè)取得重大突破!

毅談生肖
2026-03-29 10:54:00
Deepseek現(xiàn)在怎么沒聲音了,梁文峰的低調(diào)錯失了寶貴的發(fā)展時機?

Deepseek現(xiàn)在怎么沒聲音了,梁文峰的低調(diào)錯失了寶貴的發(fā)展時機?

上林院
2026-03-29 10:30:20
炸鍋!美媒突曝猛料,福特號起火趴窩,布什號航母火速馳援中東

炸鍋!美媒突曝猛料,福特號起火趴窩,布什號航母火速馳援中東

安安說
2026-03-29 13:39:51
一場134-109讓快船無奈!西部附加賽對陣基本敲定,勇士難上加難

一場134-109讓快船無奈!西部附加賽對陣基本敲定,勇士難上加難

小徐講八卦
2026-03-29 12:53:33
孫中山獨子孫科:蔣介石三次喊他去臺灣他都不去,49年后在大陸的結(jié)局讓人意外

孫中山獨子孫科:蔣介石三次喊他去臺灣他都不去,49年后在大陸的結(jié)局讓人意外

老杉說歷史
2026-03-22 22:46:21
外媒:以色列警方驅(qū)散特拉維夫反戰(zhàn)集會

外媒:以色列警方驅(qū)散特拉維夫反戰(zhàn)集會

參考消息
2026-03-29 13:29:11
臺北101大廈董事長賈永婕將代表民進黨選臺北市?

臺北101大廈董事長賈永婕將代表民進黨選臺北市?

總在茶余后
2026-03-29 00:30:01
太霸道了!特朗普突然發(fā)難,劍指全球,中俄歐一個都跑不掉

太霸道了!特朗普突然發(fā)難,劍指全球,中俄歐一個都跑不掉

Hi科普啦
2026-03-28 12:55:15
暴跌25%!曾經(jīng)一包難求的頂級奢侈品,如今五折甩賣都沒人要?

暴跌25%!曾經(jīng)一包難求的頂級奢侈品,如今五折甩賣都沒人要?

青眼財經(jīng)
2026-03-27 22:55:18
7旬男子陪老伴住院,醫(yī)生看了他一眼發(fā)現(xiàn)其面部有猝死先兆,將其從死亡邊緣拉回

7旬男子陪老伴住院,醫(yī)生看了他一眼發(fā)現(xiàn)其面部有猝死先兆,將其從死亡邊緣拉回

觀威海
2026-03-26 09:55:04
臺媒爆料,大陸海警扣押一艘臺灣船只,船東反常沉默引發(fā)外界質(zhì)疑

臺媒爆料,大陸海警扣押一艘臺灣船只,船東反常沉默引發(fā)外界質(zhì)疑

知法而形
2026-03-28 13:34:02
中國電磁炮專家,竟是美國間諜,出賣大量情報,讓國家損失慘重

中國電磁炮專家,竟是美國間諜,出賣大量情報,讓國家損失慘重

青煙小先生
2026-03-02 17:17:14
馬英九再提統(tǒng)一條件,島內(nèi)炸鍋大陸沉默,他在幫誰說話?

馬英九再提統(tǒng)一條件,島內(nèi)炸鍋大陸沉默,他在幫誰說話?

娛樂的宅急便
2026-03-28 21:16:56
臺灣地區(qū),長期阻礙中國統(tǒng)一就是馬英九。這個人非常之狡猾!

臺灣地區(qū),長期阻礙中國統(tǒng)一就是馬英九。這個人非常之狡猾!

安安說
2026-03-28 11:40:47
2026-03-29 14:36:49
原子量 incentive-icons
原子量
探索科學(xué)魅力,實踐科技創(chuàng)新;分享化學(xué)奇趣,服務(wù)知識交流。
69文章數(shù) 11關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

網(wǎng)約車司機被騙網(wǎng)貸后車內(nèi)輕生:我不想死 但扛不住了

頭條要聞

網(wǎng)約車司機被騙網(wǎng)貸后車內(nèi)輕生:我不想死 但扛不住了

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

張凌赫事件持續(xù)升級!官方點名怒批

財經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態(tài)度原創(chuàng)

親子
本地
健康
旅游
軍事航空

親子要聞

睡著的兩個姐妹,不安分的小樣,媽媽在旁邊心被萌化!

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

干細胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

四川的山有何特別之處?三位百萬粉絲博主暢聊“一城一山”:“山水藏?zé)熁?四季皆風(fēng)光”

軍事要聞

美軍中東基地損失最新披露

無障礙瀏覽 進入關(guān)懷版