使用面向对象的等变基元反应扩散模型生成准确的转化态
该研究通过引入一种基于随机扩散方法的新型机器学习模型 TSDiff,从分子连接性的 2D 图中生成转化态的 3D 几何结构,生成模型方法使得模型能够采样出多种有效的转化态构象,可以用于探索复杂反应及考虑多种转化态构象的反应研究。
Apr, 2023
本研究基于 3D 等变扩散模型实现有标的分子设计,并提出了一种综合的评估框架来评估样本分子的质量,实验结果表明,该模型能够更好地生成具有更逼真的 3D 结构和更好的与蛋白靶点的亲和力,而且在不重新训练的情况下能够提高结合亲和力排名和预测质量。
Mar, 2023
在化学反应的推理中,我们引入了一个基于三维结构的反应物和生成物构建的等变神经网络 EquiReact,展示了它在 GDB7-22-TS、Cyclo-23-TS 和 Proparg-21-TS 数据集的活化能预测中的竞争性能,对于原子映射信息的包含程度不同的数据集,相比于最新模型,EquiReact 提供了:(i)一个灵活的模型,缓解了原子映射变量之间的敏感性,(ii)更好的对未知化学反应的外推能力,(iii)在反应物 / 生成物的三维几何变化较为微小的数据集中表现出色的预测误差,(iv)对几何质量的敏感性减少以及(iv)出色的数据效率。
Dec, 2023
本研究通过现有方法引入的近似误差视角,系统研究了 SE (3) 不变空间中的扩散机制,从而在投影微分方程的背景下发展了更精确的近似方法,并提出了一种新的加速方案,可以在 SE (3) 不变空间中以 50 倍至 100 倍的速度生成高质量的分子构象。
Oct, 2023
通过反向扩散实验,我们提出了一种新颖的统计方法,利用生成扩散模型去除杂乱输入,从而学习简化的伪势能面,省去非平衡结构的计算,实现在计算化学中找到非平衡结构的平衡状态。
Apr, 2024
深度生成扩散模型在材料科学和药物发现中是一种有前途的新途径。然而,它们的效用仍受到大分子结构和有限的训练数据的限制。本研究通过对连续和离散状态空间的相互作用进行广泛的比较分析,探索了 E (3) 等变扩散模型的设计空间并提出了 EQGAT-diff 模型。该模型在 QM9 和 GEOM-Drugs 数据集上的表现显著优于现有模型,并通过引入连续原子位置、分类化学元素和键类型,并采用时间依赖的损失加权,显著提高了训练收敛性和生成样本的质量。我们还研究了将在 PubChem3D 数据集上针对隐式氢训练的 EQGAT-diff 模型迁移到具有显式氢的目标分布的可行性,并通过若干迭代的微调进一步推动数据集上的最新性能。本研究的发现有望在基于结构的药物设计中应用,尤其对于复杂分子的小数据集的生成模型的准确性至关重要。
Sep, 2023
通过对扩散模型进行调查,我们希望能更好地理解它们的预测与基于物理计算的结果之间的比较,以利用机器学习来显著加速电子结构计算,而无需昂贵的原理数据集进行训练。我们发现一种流行的扩散模型用于全新分子生成的推理过程可以分为探索阶段和弛豫阶段,其中模型选择原子种类的同时调整原子坐标以找到低能几何形状。随着训练的进行,我们发现该模型最初学习的是位能曲面的一阶结构,然后逐渐学习高阶结构。我们还发现扩散模型的弛豫阶段可以用于对构象进行玻尔兹曼分布采样,并进行结构弛豫。对于结构弛豫,该模型对小型有机分子的能量较经典力场产生的结构低约 10 倍。在密度泛函理论 (DFT) 弛豫中,从扩散生成的结构开始与从经典力场弛豫的结构开始相比,可以使 DFT 弛豫速度提高超过 2 倍。
Nov, 2023
使用 KREED(Kraitchman 反射等变扩散)模型,可以根据分子公式、转动惯量和未签名的同位素置换坐标来推断分子的完整三维结构,该模型在 QM9 和 GEOM 数据集上以 > 98% 的准确率确定了正确的三维结构,并且在实验测定的取自文献的置换坐标测试集中,KREED 在 33 个案例中的 25 个案例中预测出正确的全原子三维结构,证明了其在旋转光谱学中的实验适用性。
Oct, 2023
通过微分几何的视角,本研究对 SE (3) 不变空间中的扩散机制进行了数学界定,揭示了坐标与点间距流形之间的相互作用行为,并提出了准确且无需投影的扩散 SDE 和 ODE 公式,从而提高了生成路径的性能和速度,并为其他包含 SE (3) 不变性的系统提供了有价值的见解。
Mar, 2024