分子性质的机器学习:局部性和主动学习
结合现代科学计算和电子结构理论,基于深度多任务人工神经网络的机器学习模型能够对上千个有机分子的多个电子基态和激发态性质进行预测,从而实现对合成可及的虚拟化合物库的高通量筛选,成本极低且准确度与现代量子化学方法相当甚至更优。
May, 2013
本研究基于局部化学环境和贝叶斯统计学习的机器学习模型,提供了一个统一的框架,可以预测原子尺度的稳定性和不同类别的分子的化学精度,可以区分活性和非活性的蛋白质配体,这种方法可以对材料和分子的势能面提供新的洞察。
Jun, 2017
基于分子结构预测和增强固有性质对于医学、材料科学和环境管理中的设计任务至关重要,本研究介绍了一种主动学习方法,通过智能抽样和干预来辨识潜在的因果关系,以优化在未接触到的化学空间内的设计任务。
Apr, 2024
机器学习技术在计算化学中的应用被认为是加速原子模拟和材料设计的无可或缺的工具。此外,机器学习方法有潜力提高计算效率高的电子结构方法(如密度泛函理论)的预测能力,纠正密度泛函方法中的基础错误。本文回顾了机器学习在提高密度泛函和相关近似方法准确性方面的最新进展,并通过将有希望的模型应用于训练集之外的系统的例子,讨论了构建适用于不同化学和材料类别的可迁移学习模型的前景和挑战。
Nov, 2023
通过使用主动学习 (AL),可以以经济的时间和资源投入及最少的人工干预构建具有鲁棒数据效率的潜力。实现了构建可靠的数据高效势能,并在牵引谱模拟、生化分子构象搜索和 Diels-Alder 反应的时间分辨机理研究中展示了该协议的多功能性。
Apr, 2024
机器学习在药物发现中预测小分子性质方面具有很大潜力。本文提供了对近年来为此目的引入的各种机器学习方法的综合概述,并对结合亲合力、溶解度和 ADMET(吸收、分布、代谢、排泄和毒性)等多个性质预测和优化技术进行了讨论。我们还评估了模型预测方面的技术,特别是在药物发现中关键决策方面提供模型预测理解的技术。总的来说,这篇综述为药物发现中小分子性质预测的机器学习模型提供了深入了解。尽管有多种多样的方法,但它们的性能通常相当。神经网络虽然更加灵活,但并不总是优于更简单的模型。这表明高质量的训练数据对于训练准确的模型仍然至关重要,并且需要标准化的基准、额外的性能指标和最佳实践,以便更好地比较不同技术和模型之间的差异。
Aug, 2023
本文提出了一种基于深度学习的量子力学波函数预测框架,以实现分子结构的反向设计,用于优化目标电子性质,表明这种方法打开了机器学习和量子化学更协同的前景。
Jun, 2019
发展了一种统一的机器学习方法,用于有机分子的电子结构,使用 CCSD (T) 计算作为训练数据,模型在计算成本和各种量子化学性质的预测准确度上优于常用的 B3LYP 泛函。将模型应用于芳香化合物和半导体聚合物上,对基态和激发态性质进行了验证,展示了其对于复杂系统的准确性和概括能力。
May, 2024
我们基于主动学习算法,提出了一种全自动方法,用于生成分子能量的数据集,能够支持深度学习算法 ANI 在含有 CHNO 的有机分子的所有情况下实现精确的能量和力预测。
Jan, 2018