国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

UNSW、中科大蘇高院等聯(lián)合發(fā)布AtomWorld材料建?;鶞?zhǔn)測(cè)試流程

0
分享至



作者 | 論文團(tuán)隊(duì)

編輯 | ScienceAI

在材料科學(xué)研究中,結(jié)構(gòu)建模是探索材料特性與功能的起點(diǎn),傳統(tǒng)流程依賴(lài)研究者基于專(zhuān)業(yè)知識(shí)手動(dòng)搭建晶體結(jié)構(gòu)、調(diào)整原子排布,不僅耗時(shí)耗力,還受限于個(gè)人空間認(rèn)知與操作經(jīng)驗(yàn)。當(dāng)前,大語(yǔ)言模型(LLM)雖在文本理解與基礎(chǔ)推理領(lǐng)域展現(xiàn)潛力,開(kāi)始嘗試應(yīng)用于晶體生成、坐標(biāo)解析等任務(wù),但由于缺乏標(biāo)準(zhǔn)化評(píng)估體系,其對(duì) 3D 原子結(jié)構(gòu)的空間推理能力 —— 如按指令精準(zhǔn)執(zhí)行原子添加、旋轉(zhuǎn)、替換等操作 —— 始終無(wú)法被系統(tǒng)衡量,難以滿足科研場(chǎng)景中自動(dòng)化建模的實(shí)際需求。

為解決這一關(guān)鍵難題,近日,中國(guó)科學(xué)技術(shù)大學(xué)蘇州高等研究院、澳大利亞新南威爾士大學(xué)(UNSW)等機(jī)構(gòu)聯(lián)合發(fā)布了「AtomWorld 材料建?;鶞?zhǔn)測(cè)試流程」,以晶體學(xué)信息文件(CIF)這一標(biāo)準(zhǔn)格式為核心,首次構(gòu)建了針對(duì) LLM 晶體學(xué)基礎(chǔ)技能的標(biāo)準(zhǔn)化評(píng)估框架,填補(bǔ)了大模型原子級(jí)空間推理能力評(píng)測(cè)的空白。



論文地址:https://arxiv.org/abs/2510.04704v2

項(xiàng)目代碼倉(cāng)庫(kù):https://github.com/MasterAI-EAM/atomworld

核心設(shè)計(jì):聚焦科研實(shí)用場(chǎng)景,以 10 類(lèi)原子操作構(gòu)建標(biāo)準(zhǔn)化評(píng)測(cè)體系



AtomWorld 基準(zhǔn)測(cè)試流程圖

不同于傳統(tǒng)評(píng)測(cè)僅關(guān)注模型的文本匹配或數(shù)值計(jì)算能力,AtomWorld 深度貼合材料科研實(shí)際需求,將評(píng)測(cè)核心聚焦于「原子級(jí)結(jié)構(gòu)編輯操作」—— 這是研究者搭建晶體模型、優(yōu)化材料結(jié)構(gòu)的首要環(huán)節(jié)。通過(guò)模擬真實(shí)科研中的操作場(chǎng)景,AtomWorld 構(gòu)建了 10 大核心任務(wù)類(lèi)別,全面覆蓋材料建模全流程中的關(guān)鍵步驟:

1.原子替換(Changing):按指令替換特定位置的原子種類(lèi),如將鈣鈦礦結(jié)構(gòu)中的鉛原子替換為錫原子;

2.原子移除(Removal):刪除結(jié)構(gòu)中冗余或特定功能的原子,模擬缺陷結(jié)構(gòu)構(gòu)建過(guò)程;

3.原子添加(Addition / Insertion-between):在指定晶格間隙或兩個(gè)原子間插入新原子,測(cè)試模型對(duì)原子間距與空間占位的理解;

4.原子交換(Swapping):交換兩個(gè)不同位置原子的坐標(biāo),驗(yàn)證模型對(duì)原子身份與空間位置關(guān)聯(lián)的認(rèn)知;

5.原子移動(dòng)(Move / Move-toward):將原子移動(dòng)至指定坐標(biāo),或向另一個(gè)原子方向移動(dòng)特定距離,評(píng)估模型的定量空間控制能力;

6.繞原子旋轉(zhuǎn)(Rotate-around):以某一原子為中心旋轉(zhuǎn)目標(biāo)原子(或原子團(tuán)),考驗(yàn)?zāi)P蛯?duì) 3D 空間旋轉(zhuǎn)幾何的推理能力;

7.表面生成(Delete-below):刪除晶體結(jié)構(gòu)中某一平面以下的原子,模擬材料表面結(jié)構(gòu)的構(gòu)建過(guò)程;

8.超胞擴(kuò)展(Supercell-creation):按指定倍數(shù)擴(kuò)展原胞形成超胞,測(cè)試模型對(duì)晶體周期性與晶格對(duì)稱(chēng)性的理解。

這些任務(wù)均以 CIF 文件為輸入輸出載體,該格式是最為通用的原子結(jié)構(gòu)表示方式之一,同時(shí)可經(jīng)過(guò)簡(jiǎn)單操作轉(zhuǎn)換為 VASP、Lammps 等主流計(jì)算材料學(xué)軟件的輸入格式,確保評(píng)測(cè)結(jié)果可直接對(duì)接真實(shí)科研流程,為后續(xù)模型優(yōu)化提供明確的方向指引。

評(píng)測(cè)結(jié)果:大模型空間推理能力存明顯短板,工具輔助提升有限

為驗(yàn)證 AtomWorld 的有效性,研究團(tuán)隊(duì)對(duì)當(dāng)前主流前沿模型(包括 Gemini 2.5 Pro、Qwen 3 等)及工具輔助型 LLM(Tool-Augmented LLMs)進(jìn)行了系統(tǒng)性測(cè)試,結(jié)果揭示了當(dāng)前大模型在原子級(jí)空間推理領(lǐng)域的核心局限:

  • 基礎(chǔ)任務(wù)表現(xiàn)穩(wěn)定,但復(fù)雜操作失誤率高:模型在原子移除、簡(jiǎn)單移動(dòng)等基礎(chǔ)任務(wù)中準(zhǔn)確率可達(dá) 70% 以上,但在「繞原子旋轉(zhuǎn)」「原子交換」等需要深度空間認(rèn)知的任務(wù)中表現(xiàn)顯著下滑 —— 其中「原子交換」任務(wù)的錯(cuò)誤率高達(dá) 85%。這將會(huì)造成真實(shí)建模場(chǎng)景中多部操作誤差大量累計(jì);
  • 材料結(jié)構(gòu)理解能力有限,依賴(lài)死記硬背:在 CIF-Gen(生成標(biāo)準(zhǔn)結(jié)構(gòu))任務(wù)中,模型對(duì)原型結(jié)構(gòu) + 常見(jiàn)化合物的生成表現(xiàn)比對(duì)同一原型、非常見(jiàn)化合物(如 NaCl vs MgSe)更好。這有可能說(shuō)明模型更多是記住例子模式,而不是真正理解基礎(chǔ)晶體結(jié)構(gòu)。
  • 工具輔助提升有限,難以突破本質(zhì)瓶頸:盡管集成了 pymatgen 計(jì)算工具的 LLM 在簡(jiǎn)單任務(wù)上有提升,尤其是插入原子操作提升了 37.4%,但對(duì)于復(fù)雜操作的理解依舊限制了性能提升。

這些結(jié)果表明,當(dāng)前 LLM 的「空間推理」更多依賴(lài)文本訓(xùn)練數(shù)據(jù)中的模式匹配,而非真正理解 3D 原子結(jié)構(gòu)的幾何規(guī)律與材料學(xué)原理 —— 這也正是 AtomWorld 基準(zhǔn)的核心價(jià)值所在:通過(guò)標(biāo)準(zhǔn)化任務(wù),精準(zhǔn)定位模型短板,為后續(xù)的微調(diào)訓(xùn)練、算法優(yōu)化提供明確目標(biāo)。



a. 在 AtomWorld、CIF-Repair、CIF-Gen 和 StructProp 數(shù)據(jù)集上的成功率指標(biāo)。b. 在 AtomWorld 和 CIF-Gen 數(shù)據(jù)集上的平均最大距離指標(biāo)。c、d. Qwen3 系列的模型尺寸效應(yīng)結(jié)果。



CIF 生成任務(wù)中每種結(jié)構(gòu)類(lèi)型正確生成的 CIF 文件數(shù)量。紅色方框表示生成的單例正確結(jié)果為該結(jié)構(gòu)標(biāo)準(zhǔn)原型的情況(如巖鹽結(jié)構(gòu)對(duì)應(yīng) NaCl)。右側(cè)展示了每種類(lèi)型對(duì)應(yīng)的具體三維晶體結(jié)構(gòu),其中紅色標(biāo)注的化學(xué)成分代表標(biāo)準(zhǔn)原型。

核心價(jià)值:不止于評(píng)測(cè),更是大模型材料建模能力的「訓(xùn)練加速器」

AtomWorld 的意義遠(yuǎn)不止于「測(cè)試工具」,其創(chuàng)新性地兼具「基準(zhǔn)評(píng)測(cè)」與「數(shù)據(jù)生成器」雙重屬性,為推動(dòng) LLM 在材料科學(xué)中的落地提供關(guān)鍵支撐:

  • 標(biāo)準(zhǔn)化評(píng)測(cè),統(tǒng)一行業(yè)「能力標(biāo)尺」:此前,并未有對(duì)于 LLM 材料建模能力的標(biāo)準(zhǔn)評(píng)估方式,因此基于材料計(jì)算任務(wù)的智能體框架之間缺乏結(jié)果可比性,AtomWorld 首次建立了基礎(chǔ)操作 - 空間推理 - 材料結(jié)構(gòu)認(rèn)知的評(píng)測(cè)鏈條,讓不同模型的性能可量化、可對(duì)比,推動(dòng)行業(yè)從「定性描述」轉(zhuǎn)向「定量評(píng)估」;
  • 可擴(kuò)展數(shù)據(jù)生成,支撐模型微調(diào)優(yōu)化:基于 10 大任務(wù)類(lèi)別,AtomWorld 可自動(dòng)生成海量帶標(biāo)注的「操作指令 - CIF」訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)遵循 CIF 格式,可直接用于 LLM 的微調(diào)與強(qiáng)化學(xué)習(xí),幫助模型快速掌握原子操作的空間邏輯;
  • 銜接科研流程,推動(dòng)建模自動(dòng)化落地:AtomWorld 的任務(wù)設(shè)計(jì)完全貼合實(shí)際科研需求,通過(guò)該基準(zhǔn)優(yōu)化后的模型,可直接對(duì)接 VASP 等主流材料計(jì)算工具,實(shí)現(xiàn)「自然語(yǔ)言指令→自動(dòng)生成合規(guī) CIF 文件→直接用于后續(xù)計(jì)算」的全流程自動(dòng)化,大幅降低建模門(mén)檻、提升研究效率。

未來(lái)展望:從「空間推理」到「智能建?!梗铀俨牧峡茖W(xué) AI 化進(jìn)程

AtomWorld 的發(fā)布,為 LLM 在材料科學(xué)領(lǐng)域的應(yīng)用開(kāi)辟了新路徑。后續(xù)研究團(tuán)隊(duì)將圍繞兩大方向持續(xù)迭代:

  • 任務(wù)擴(kuò)展:新增「缺陷結(jié)構(gòu)設(shè)計(jì)」、「表界面構(gòu)建」等更復(fù)雜的科研場(chǎng)景任務(wù),進(jìn)一步貼近高性能材料研發(fā)需求;
  • 工具鏈開(kāi)發(fā):基于 AtomWorld 基準(zhǔn),開(kāi)發(fā)適配 LLM 的「智能建模插件」,實(shí)現(xiàn)與主流材料計(jì)算軟件的無(wú)縫集成,讓研究者通過(guò)自然語(yǔ)言即可完成從結(jié)構(gòu)設(shè)計(jì)到參數(shù)設(shè)置的全流程操作。

AtomWorld 正以標(biāo)準(zhǔn)化評(píng)測(cè)打破大模型原子級(jí)空間推理的能力瓶頸。未來(lái),隨著模型優(yōu)化與工具鏈完善,LLM 有望真正成為材料研究者的「智能建模助手」,推動(dòng)材料發(fā)現(xiàn)從「手動(dòng)試錯(cuò)」走向「AI 驅(qū)動(dòng)」的新紀(jì)元。

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
華為旗艦Mate新機(jī)官宣,12月27日正式開(kāi)售,滿血版終于上線

華為旗艦Mate新機(jī)官宣,12月27日正式開(kāi)售,滿血版終于上線

小8說(shuō)科技
2025-12-28 01:14:20
房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費(fèi),80塊錢(qián)就能搞定

房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費(fèi),80塊錢(qián)就能搞定

室內(nèi)設(shè)計(jì)師有料兒
2025-12-07 16:05:28
陳妍希最近這段采訪,真的讓人聽(tīng)完心里咯噔一下

陳妍希最近這段采訪,真的讓人聽(tīng)完心里咯噔一下

小光侃娛樂(lè)
2025-12-26 08:55:05
特殊島:希望加入中國(guó)大陸或與臺(tái)灣省合并,但絕對(duì)不會(huì)承諾日本!

特殊島:希望加入中國(guó)大陸或與臺(tái)灣省合并,但絕對(duì)不會(huì)承諾日本!

比利
2025-12-22 19:59:22
桑切斯過(guò)56歲生日,深情告白貝佐斯,說(shuō)以前想不到自己會(huì)這么幸福

桑切斯過(guò)56歲生日,深情告白貝佐斯,說(shuō)以前想不到自己會(huì)這么幸福

小書(shū)生吃瓜
2025-12-27 18:06:23
湖北一大媽跳了20多年廣場(chǎng)舞后,拿100多個(gè)金鐲子去賣(mài),說(shuō)家里還有金項(xiàng)鏈沒(méi)拿,我人好,都是別人送的

湖北一大媽跳了20多年廣場(chǎng)舞后,拿100多個(gè)金鐲子去賣(mài),說(shuō)家里還有金項(xiàng)鏈沒(méi)拿,我人好,都是別人送的

LULU生活家
2025-12-24 18:51:10
什么情況?比特幣一度“閃崩”超70%至24111美元 趙長(zhǎng)鵬發(fā)文回應(yīng)

什么情況?比特幣一度“閃崩”超70%至24111美元 趙長(zhǎng)鵬發(fā)文回應(yīng)

FX168鏈界觀察
2025-12-27 08:20:10
河南美女“大晨”去世,年僅28歲,開(kāi)的奧迪,喝酒畫(huà)面曝光引唏噓

河南美女“大晨”去世,年僅28歲,開(kāi)的奧迪,喝酒畫(huà)面曝光引唏噓

詩(shī)意世界
2025-12-17 10:00:03
劉衛(wèi)東被查前,干了兩件最不要臉的事。

劉衛(wèi)東被查前,干了兩件最不要臉的事。

南權(quán)先生
2025-12-18 16:50:39
姜昆翻車(chē),美國(guó)境內(nèi)唱紅歌,早年抵制洋節(jié)掛在嘴邊,回應(yīng)未移民!

姜昆翻車(chē),美國(guó)境內(nèi)唱紅歌,早年抵制洋節(jié)掛在嘴邊,回應(yīng)未移民!

你食不食油餅
2025-12-26 06:13:35
“鍍鉻版猛禽”亮相 美國(guó)航空攝影師再次拍到采用鏡面涂層的F-22

“鍍鉻版猛禽”亮相 美國(guó)航空攝影師再次拍到采用鏡面涂層的F-22

hawk26講武堂
2025-12-26 12:11:08
防止規(guī)模性返鄉(xiāng)滯鄉(xiāng),能采取哪些手段?

防止規(guī)模性返鄉(xiāng)滯鄉(xiāng),能采取哪些手段?

基本常識(shí)
2025-11-18 23:54:24
姜昆赴美風(fēng)波大反轉(zhuǎn)!時(shí)間線扒得透亮,項(xiàng)立剛力挺老藝術(shù)家有苦衷

姜昆赴美風(fēng)波大反轉(zhuǎn)!時(shí)間線扒得透亮,項(xiàng)立剛力挺老藝術(shù)家有苦衷

情感大頭說(shuō)說(shuō)
2025-12-28 00:54:14
汽車(chē)國(guó)家隊(duì)重回牌桌中央

汽車(chē)國(guó)家隊(duì)重回牌桌中央

華爾街見(jiàn)聞官方
2025-12-27 16:12:31
你老公“免死金牌”怎么來(lái)的?網(wǎng)友:跟婆婆吵多兇 都感恩一輩子

你老公“免死金牌”怎么來(lái)的?網(wǎng)友:跟婆婆吵多兇 都感恩一輩子

夜深?lèi)?ài)雜談
2025-12-24 16:45:13
青島勝山西,球迷:楊翰森走了,本以為會(huì)很差,沒(méi)想到比去年還好

青島勝山西,球迷:楊翰森走了,本以為會(huì)很差,沒(méi)想到比去年還好

小樓侃體育
2025-12-28 00:05:09
中俄絕不答應(yīng)!剛拿到中方48億投資,轉(zhuǎn)頭就給美國(guó)送去“大禮”?

中俄絕不答應(yīng)!剛拿到中方48億投資,轉(zhuǎn)頭就給美國(guó)送去“大禮”?

花花娛界
2025-12-27 16:26:44
內(nèi)娛遮羞布被撕開(kāi)!一線頂流被曝棄養(yǎng)私生子,線索直指某位男星

內(nèi)娛遮羞布被撕開(kāi)!一線頂流被曝棄養(yǎng)私生子,線索直指某位男星

君笙的拂兮
2025-12-26 15:16:37
越來(lái)越多孩子得白血???醫(yī)生坦言:家里4樣?xùn)|西是禍根,趁早扔了

越來(lái)越多孩子得白血???醫(yī)生坦言:家里4樣?xùn)|西是禍根,趁早扔了

DrX說(shuō)
2025-11-19 14:42:09
定了!深圳4條地鐵12月28日上午10時(shí)18分開(kāi)通!

定了!深圳4條地鐵12月28日上午10時(shí)18分開(kāi)通!

深圳本地寶
2025-12-27 18:56:17
2025-12-28 02:28:49
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1191文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱(chēng)終端再不漲明年必虧

頭條要聞

臺(tái)灣地震視頻:房屋狂搖 汽車(chē)警報(bào)響成一片

頭條要聞

臺(tái)灣地震視頻:房屋狂搖 汽車(chē)警報(bào)響成一片

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車(chē)要聞

好音響比大屏更重要?車(chē)企開(kāi)始“聽(tīng)”用戶(hù)的

態(tài)度原創(chuàng)

游戲
房產(chǎn)
旅游
公開(kāi)課
軍事航空

我真幸運(yùn):《泰拉瑞亞》1.4.5更新定檔1月份!

房產(chǎn)要聞

年銷(xiāo)20億+!中交·藍(lán)色港灣用好房子致敬好生活

旅游要聞

沒(méi)游虎丘等于白來(lái)蘇州?這3個(gè)景點(diǎn)必打卡!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄稱(chēng)已控制庫(kù)皮揚(yáng)斯克 正清繳烏軍

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版