通过训练生成模型来加快科学发现并推动各个科学领域的重大进展,尤其是发现具备良好性能的新型无机材料是一项关键挑战,不同于文本或图像数据,材料,特别是晶体结构,由多种类型的变量组成,包括晶格矢量、原子位置和原子种类,本研究探索一种基于 Transformer 架构的新型扩散模型,用于生成具有所需性质的晶体结构,并证明我们的模型在多样性方面优于先前方法,而我们的实证结果表明,最佳条件方法因数据集而异。
Jun, 2024
利用基于扩散模型的生成式机器学习模型,我们能够成功解决模拟的小至 10 安培、包含来自七个晶体系统的各种对称性和复杂性的 200 种材料的纳米晶体结构,并且能够处理真实实验中噪声扩散模式收集的结构解决方案,这表明数据驱动的方法将提供解决以前未解决的纳米材料结构的途径。
提出了一种名为几何促进分子扩散(GFMDiff)的新型分子生成方法,通过引入双轨 Transformer 网络(DTN)和几何促进损失(GFLoss)解决了构成二元边和模型分子几何形状的多体间相互关系的建模问题。在现有基准上的全面实验证明了 GFMDiff 的优越性。
Jan, 2024
本文提出了一种名为 Geodiff 的新型生成模型,它将分子中的每个原子视为粒子,并学习直接反向扩散过程来预测分子构象,通过 Markov 的方式进行建模,Markov 核通过维持等变性来实现不变性分布,实验表明,该方法在多个基准测试中优于或与现有的最先进方法相媲美。
Mar, 2022
DiffCSP 是一种新颖的扩散模型,它通过使用周期性 E (3)- 等变去噪模型联合生成晶体的晶格和原子坐标,以更好地建模晶体几何结构,并在计算成本更低的情况下显著优于现有的结晶结构预测方法,包括从头开始的晶体生成。
Jul, 2023
本研究提出了一个基于 UniMat 的晶体结构生成方法,通过训练扩散概率模型,能够高度还原大规模和复杂化学系统的晶体结构,并且在评估指标上胜过之前基于图结构的方法,同时提出了针对材料的新评估指标,并展示了条件生成在大规模晶体数据集上的可扩展性,优于结构发现的当前方法。
Oct, 2023
本文提出了一种新的扩散模型来解决 3D 分子生成中的两大挑战,即缺乏分子间关系和探索不足,该模型表现明显优于现有方法。
Sep, 2022
使用机器学习生成模型生成具有所需性质(如化学稳定性和指定化学组成)的新晶体结构,并展示其在不同化学体系和晶体群中生成新候选结构的功能。
通过对扩散模型进行调查,我们希望能更好地理解它们的预测与基于物理计算的结果之间的比较,以利用机器学习来显著加速电子结构计算,而无需昂贵的原理数据集进行训练。我们发现一种流行的扩散模型用于全新分子生成的推理过程可以分为探索阶段和弛豫阶段,其中模型选择原子种类的同时调整原子坐标以找到低能几何形状。随着训练的进行,我们发现该模型最初学习的是位能曲面的一阶结构,然后逐渐学习高阶结构。我们还发现扩散模型的弛豫阶段可以用于对构象进行玻尔兹曼分布采样,并进行结构弛豫。对于结构弛豫,该模型对小型有机分子的能量较经典力场产生的结构低约 10 倍。在密度泛函理论 (DFT) 弛豫中,从扩散生成的结构开始与从经典力场弛豫的结构开始相比,可以使 DFT 弛豫速度提高超过 2 倍。
Nov, 2023
本论文提出了两个使用周期等变建筑同时作用于晶体晶格和原子位置的统一模型,具有学习任意晶体晶格变形并将总能量降至热力学稳定性的能力。
Jun, 2023