Sep, 2023

基于等变扩散的生成模型的设计空间对于全新的 3D 分子生成的导航

TL;DR深度生成扩散模型在材料科学和药物发现中是一种有前途的新途径。然而,它们的效用仍受到大分子结构和有限的训练数据的限制。本研究通过对连续和离散状态空间的相互作用进行广泛的比较分析,探索了 E (3) 等变扩散模型的设计空间并提出了 EQGAT-diff 模型。该模型在 QM9 和 GEOM-Drugs 数据集上的表现显著优于现有模型,并通过引入连续原子位置、分类化学元素和键类型,并采用时间依赖的损失加权,显著提高了训练收敛性和生成样本的质量。我们还研究了将在 PubChem3D 数据集上针对隐式氢训练的 EQGAT-diff 模型迁移到具有显式氢的目标分布的可行性,并通过若干迭代的微调进一步推动数据集上的最新性能。本研究的发现有望在基于结构的药物设计中应用,尤其对于复杂分子的小数据集的生成模型的准确性至关重要。