By 超神经
AI 工具 GNoME 发现 220 万种新晶体,相当于人类科学家 800 年的实验产出,其中 38 万种新晶体可以成为未来高新技术的稳定材料。
从计算机芯片、电池到太阳能电池板,都离不开结构稳定的无机晶体 (inorganic crystals)。
传统意义上,发现或者研发一种全新的稳定的无机晶体,往往需要长达数月的艰苦实验。如今借助 Google DeepMind 发布的深度学习工具 GNoME,科研人员在短时间内就发现了 220 万种新晶体(相当于人类科学家近 800 年的知识积累),其中 38 万种新晶体具备稳定的结构,成为最有可能通过实验合成并投入使用的潜在新材料。
阅读论文原文:
https://www.nature.com/articles/s41586-023-06735-9
公众号后台回复「无机晶体」,获取完整 PDF
GNoME:用于新材料研发的 SOTA GNN 模型
GNoME 全称 Graph Networks for Materials Exploration,是一个用于新材料研发的 SOTA GNN 模型,它利用深度学习,可以在极短时间内预测新材料的稳定性,极大提高了材料研发的速度和效率,展现了利用 AI 大规模开发新材料的潜力。
注:GNN 的输入数据采用 graph 形式,跟原子之间的连接类似,这一特性也使得 GNN 特别适用于新晶体材料的探索。
GNoME 流程示意图
GNoME 流程可分为 4 个步骤:
* Structural pipeline:创建与已知晶体结构类似的候选者 (Candidate)
* Compositional pipeline:遵循基于化学公式的更随机的方法
* 使用 DFT 计算(密度泛函理论,Density Functional Theory)对两个 pipeline 的 output 进行评估
* 将评估结果添加到 GNoME 数据库中,为下一轮的主动学习提供信息
其中前两个步骤,主要目的是确定低能量(稳定)材料,第三个步骤中的 DFT 技术,用于反复测试模型性能,最后一个步骤中主动学习 (active learning) 策略的应用,则极大地提高了 GNoME 的性能。
数据选择:前人肩膀上的数据集快照
在数据的选择上,科研人员特别借鉴了先前的研究成果,包括 Materials Project、OQMD、WBM 以及 ICSD。
为了保证可复现,GNoME 使用了固定时间点保存的两个数据集的快照,包含:
* Materials Project 2021 年 3 月的数据
* OQMD 2021 年 6 月的数据
以上两部分结构被用作所有发现(包括通过 SAPS)的基础,并通过 GNoME 生成了稳定晶体目录。
为了对更新数据进行比较,2023 年 7 月科研人员对 Materials Project、OQMD 和 WBM 又进行了另一次快照。在同样的设置下进行了约 216,000 次 DFT 计算,用于比较 GNoME 的发现率与同时进行的研究工作的发现率。
过往工作成果参考:
* Materials Project:https://next-gen.materialsproject.org/
* OQMD:https://oqmd.org/
* WBM:https://www.nature.com/articles/s41524-020-00481-6
* ICSD:https://icsd.products.fiz-karlsruhe.de/
实验结果
GNoME 将已知稳定晶体的数量提升近 8 倍
已知稳定晶体的数量变化
上图由内到外展示了:
* ICSD 数据库中,通过人类实验确定的稳定晶体数量约为 20,000 个
* Materials Project、Open Quantum Materials Database 以及 WBM 数据库的计算方法,将稳定晶体数量增加至 48,000 个
* GNoME 将人类已知的稳定材料数量增加至 421,000 个
2019-2022 年发现稳定材料的数量
浅色表示外部数据库,深色表示 GNoME 结果
2021 年至 2023 年,GNoME 以外的稳定晶体数量从 35,000 个增加到 48,000 个,与本文介绍的凸包 (convex hull) 上的 381,000 个全新稳定晶体结构相比,数量悬殊。
实验结果表明,GNoME 模型发现了 220+ 万种新晶体,更新后的凸包 (convex hull) 包含 381,000 万个新条目,结合先前研究,稳定晶体数数量达到 421,000 个,与先前的研究成果 48,000 相比,稳定晶体的数量有了数量级的扩展。
行业专家:国内代表学者梳理
雷鸣(教授、博导)
北京邮电大学
信息光子学与光通信国家重点实验室
研究方向:无机光电功能纳米材料及相关光电特性、能量存储与转换材料与器件、新型异质纳米结构光催化剂、有机分子材料与场效应晶体管
个人页面:
https://kyy.bupt.edu.cn/info/1136/3409.htm
詹义强(教授、博导)
复旦大学信息科学与工程学院
有机无机杂化电子课题组
研究方向:有机或有机无机杂化薄膜太阳能电池研究、基于有机半导体或无机纳米材料的新型柔性电子器件研究、新型智能传感器应用研究、新型忆阻器及其神经网络应用研究
个人页面:
http://www.it.fudan.edu.cn/Data/View/1150
刘淼(研究员)
中国科学院物理研究所
研究方向:原子尺度探索物质原理、数据驱动的材料科学方法、人工智能+材料科学、机器人材料科学家
个人页面:
https://edu.iphy.ac.cn/moreintro.php?id=3190
王宗国(硕导,副研究员)
中国科学院大学
中国科学院计算机网络信息中心
研究方向:计算机应用技术、计算机技术、材料信息学与计算材料学、机器学习
个人页面:
https://people.ucas.ac.cn/~0070145
—— 完 ——
往期推荐
1. 千年密码新解读,DeepMind 开发 Ithaca 破译希腊铭文
2. DeepMind 利用无监督学习开发 AlphaMissense,预测 7100 万种基因突变
3. DeepMind 发布强化学习通用算法 DreamerV3,AI 成精自学捡钻石
扫描二维码,加入讨论群
获得更多优质数据集
了解人工智能落地应用
关注顶会&论文
回复「读者」了解更多
戳“阅读原文”,免费获取海量数据集资源!