小数据量下的 NMR 位移预测
利用迭代自训练的深度学习模型,我们提出了一种预测原子二维核磁共振(NMR)位移并标记实验光谱峰值的方法,该方法能准确处理中等和大分子,包括多糖。
Mar, 2024
利用 E (3) 等变图神经网络预测碳水化合物核磁共振光谱,并取得了显著的平均绝对误差降低,为了加速制药应用、生物化学和结构生物学的研究,提供更快速、可靠的分子结构分析,进一步迈向一个数据驱动的光谱学新时代。
Nov, 2023
分子表示学习(MRL)是一种将分子转化为数值表示并保留其化学特性的功能强大的工具,在机器学习和化学科学之间架起了桥梁。在糖科学领域,MRL 方法的探索相对较少,这主要归因于糖特定数据集的有限可用性和缺乏针对糖数据所提出的机器学习流程。为了解决这个挑战,推动糖科学的进展,丰富 MRL 社区的数据资源,我们引入了 GlycoNMR,其包含两个经过精心策划的数据集,共有 2,609 个糖结构和 211,543 个标注的核磁共振(NMR)化学位移以进行精确的原子级预测。我们针对这个问题定制了特定于糖的功能并改进了现有的 MRL 模型,在我们的新数据集上对四种修改后的 MRL 模型进行了基准测试。
Nov, 2023
使用领域知识为 Qm9 数据集的分子离子化能量预测选择高效的训练集和 ML 技术,通过最大化训练集中分子的多样性,提高线性和非线性回归技术(如核方法和图神经网络)的鲁棒性,并基于速率扭曲解释框架的模型不可知解释器来检查图神经网络的预测可靠性。
Jun, 2023
介绍了一种将机器学习纠正与计算便宜且近似的遗留量子方法相加的组合策略,从而实现了对化学热力学性质的高度准确预测,实现了化学精度和低计算成本的平衡。
Mar, 2015
本文提出了一种在无需进行结构阐明的情况下,利用核磁共振(NMR)数据直接对化合物进行分类的方法,使用卷积神经网络(CNN)进行分类,并表明深度学习可以解决化学信息学中的自动化问题。
Nov, 2022
本篇论文提出了一种基于局部相互作用模型和主动学习算法的新型机器学习算法,可以在较小的训练集上提供高精度预测,并显著减少异常值误差,从而为材料设计和药物发现等领域提供更有效的高通量筛选方法。
Sep, 2017
本文提出了一种基于机器学习的策略来预测分子红外光谱的方法,建立在从头分子动力学模拟的基础上,利用各种机器学习技术加速模拟并扩展可处理的系统大小,其中包括环境依赖性神经网络电荷的分子偶极矩模型和 Behler 和 Parrinello 的神经网络势能。通过引入完全自动化的采样方案和神经网络势能训练期间的分子力,我们能够仅基于少量的电子结构参考点来获得非常精确的机器学习模型,同时在甲醇分子,含有多达 200 个原子的正构烷和质子化的丙氨酸三肽的情况下,将其应用于模拟红外光谱,并发现与理论和实验光谱具有出色的一致性。
May, 2017
我们引入了一个机器学习模型来预测有机分子的原子化能,基于核电荷和原子位置。该回归模型是通过将求解分子 Schr"odinger 方程的问题映射为复杂度较低的非线性统计回归问题。我们使用杂化密度泛函理论计算的原子化能进行回归模型的训练和比较。通过对超过七千个小有机分子进行交叉验证,得到的平均绝对误差为~10 kcal/mol。该模型的适用性已经通过预测分子原子化潜能曲线得到证明。
Sep, 2011