Jun, 2024

肉豆蔻和香料:生物分子机器学习的模型和数据

TL;DRSPICE 数据集的第 2 版是一个用于训练机器学习势能的量子化学计算集合,通过更多地对化学空间进行采样和提供更多非共价相互作用的数据,扩展了原始数据集。在其中,我们使用名为 Nutmeg 的一组潜在能量函数。它们采用一种新的机制,在带电和极性分子上改善性能,将预先计算的部分电荷注入模型以提供大规模电荷分布的参考。对新模型的评估表明,它们在重现构象之间的能量差异方面表现出色,即使在高度带电的分子或比训练集中的分子显着更大的情况下,也能够产生稳定的分子动力学轨迹,并且足够快以用于对小分子的常规模拟。