自编码分子增强采样技术:即时集体变量发现与自由能较快探索
通过发现 Bayesian 推理问题中的 collective variables,开发了增强采样方法,结合机器学习和变分推断方法,计算了精细尺度原子结构的样本,对物理化学属性的预测可为理解未知复杂系统的机制提供量化评估。
Sep, 2018
为机器学习的原子间势提供了能够代表分子系统可访问配置空间的数据集的生成方法,该方法利用不确定性作为集体变量以引导获取与化学相关的数据点,重点关注机器学习模型预测最不确定性的配置空间区域,并在丙氨酰二肽基准系统上验证了该方法在克服能量壁垒和探索未知能量最小值方面的有效性。
Feb, 2024
本研究论文介绍了使用 Gaussian mixture variational autoencoder(GMVAE)进行分子模拟数据的降维和聚类,以及其在构建 Markov 状态模型方面的潜在应用。
Dec, 2019
本研究中,我们提出了一种基于图神经网络的学习方法,使用自编码器来从实验晶体结构中观测到的特征中得出低维变量。然后,通过增强采样来偏置这些变量,以观察状态间的转换和可靠的热力学权重。我们的方法使用简单的卷积和池化方法。为了验证我们的协议的有效性,我们考察了各种铁和甘氨酸同素异形体和多晶体从熔融态到化合物相的核化过程。通过合理温和的元动力学,我们的图潜变量始终显示状态间的转换,并且在与实验一致的自由能计算中取得准确的结果,这两个结果都是可靠采样的指标。这突显了我们的图神经网络变量在改进采样方面的力量和潜力。此处展示的协议对于其他系统和其他采样方法应适用。
Oct, 2023
使用基于评分的扩散模型的去偏方法对温度加速分子动力学(TAMD)模拟进行测试,结果表明这种去偏方法显著优于传统的去偏方法,并且能够生成准确的无偏构象集合,适用于具有较高 CV 数量的模拟。
Dec, 2023
本文研究了深度学习算法在构建高维次稳态分子系统的共同变量及其有效模拟中的应用,在基于无穷小生成器或转移算子与基础动力学相关的领先特征函数计算或通过最小化重构误差来学习自动编码器之间提出了一个简洁的概述,并在说明性示例上对这两种方法进行了比较的数值研究
Jul, 2023
通过生成流网络,我们的 TPS-GFN 方法在不依赖 CV 的情况下通过分子轨迹进行能量感知抽样,从而产生比之前的不依赖 CV 的机器学习方法更真实和多样化的转变路径。
May, 2024
通过应用最近发展的网络嵌入技术,以压缩系统维度来实现小分子化学空间的高效探索,我们提出了一种数据驱动的方法,通过聚类分子结构的势能景观,获得通过嵌入函数定义的潜在变量。为了提高方法的扩展性,我们还结合了一种基于 Metadynamics 和 Transition Path Theory 的熵敏感的自适应能级采样方案来进行能量景观的分层采样。通过考虑系统能量景观所暗示的动力学信息,在降维中解释动态节点之间的关系。我们通过 Lennard-Jones(LJ)聚簇和人类 DNA 序列展示了该框架。
Jan, 2024
本文提出一种基于变分自编码的图结构模型,用于生成符合已有数据分布的化学分子结构,并通过实验数据分析表明该模型在分子生成任务上表现较好,同时使用合适的隐空间设计允许生成具备特定性质的分子。
May, 2018