使用注意力机制和贝叶斯学习精准、可靠和可解释的药物分子溶解度预测
本文介绍了一种使用具有预测不确定性的深度学习模型来计算水溶性的方法,并且该模型可以在不使用服务器的情况下在静态网页上运行,提高了计算效率和易用性,同时实现了分子性质预测模型的不确定性和易用性的平衡。
Jul, 2023
利用现代计算资源,本研究采用线性回归模型和图卷积神经网络模型分析多个实验数据集,预测分子的溶解度,结果表明 GCNN 模型具有最佳性能,同时线性回归模型的特征重要性分析揭示了化学影响机制,为设计新药物时了解化学结构对化学性质的影响提供了重要参考。未来的工作应该将 GCNN 模型的高性能与线性回归模型的解释性相结合,以推动下一代高通量筛选的新突破。
Aug, 2023
本研究旨在探讨基于贝叶斯学习的图神经网络在分子筛选中的预测性能和可靠性,结果表明贝叶斯学习能够为不同的神经网络结构和分类任务提供良好的校准预测,并在虚拟筛选中发挥重要作用,从而产生更高的发现成功率。
Jun, 2020
机器学习在药物发现中预测小分子性质方面具有很大潜力。本文提供了对近年来为此目的引入的各种机器学习方法的综合概述,并对结合亲合力、溶解度和 ADMET(吸收、分布、代谢、排泄和毒性)等多个性质预测和优化技术进行了讨论。我们还评估了模型预测方面的技术,特别是在药物发现中关键决策方面提供模型预测理解的技术。总的来说,这篇综述为药物发现中小分子性质预测的机器学习模型提供了深入了解。尽管有多种多样的方法,但它们的性能通常相当。神经网络虽然更加灵活,但并不总是优于更简单的模型。这表明高质量的训练数据对于训练准确的模型仍然至关重要,并且需要标准化的基准、额外的性能指标和最佳实践,以便更好地比较不同技术和模型之间的差异。
Aug, 2023
通过引入深度学习框架,结合基于注意力机制的转换器、长短期记忆神经网络和图卷积网络,我们的研究旨在提高溶解度预测的准确性,为药物设计和选择提供新的见解和支持,为药物发现中的深度学习发挥重要作用展示了巨大潜力。
Jun, 2024
预测药物特性在药物发现中是关键,以便在昂贵的临床试验之前减少风险,并更快地找到高活性化合物。尽管机器学习社区对此表现出了兴趣并提出了各种标准数据集和方法,然而对于从业人员而言,目前仍不清楚哪种方法或途径最适用,因为不同的论文以不同的数据集和方法进行基准测试,导致得出的结论各不相同且难以比较。我们的大规模实证研究将不同数据集和方法的众多相关作品联系到一起,从而全面概述了现有的属性类别、数据集及其与不同方法的相互作用。我们强调不确定性量化以及应用这些方法在药物开发决策周期中的时间和成本的重要性。我们发现最佳方法取决于数据集,并且具备经典机器学习方法的工程特征通常优于深度学习。具体而言,经典方法(如高斯过程)通常最适合分析 QSAR 数据集,而树或深度学习方法(如图神经网络或语言模型)有时更适合描述 ADMET 数据集。我们的研究强调了从业人员尚无可靠的、直接可行的程序可供依赖,并为创建与从业人员相关的基准测试案例奠定了先例。深度学习方法必须在这些基准测试案例中得到验证才能成为药物特性预测的实际选择方法。
Jul, 2023
使用领域知识为 Qm9 数据集的分子离子化能量预测选择高效的训练集和 ML 技术,通过最大化训练集中分子的多样性,提高线性和非线性回归技术(如核方法和图神经网络)的鲁棒性,并基于速率扭曲解释框架的模型不可知解释器来检查图神经网络的预测可靠性。
Jun, 2023
本篇论文提出了一种基于局部相互作用模型和主动学习算法的新型机器学习算法,可以在较小的训练集上提供高精度预测,并显著减少异常值误差,从而为材料设计和药物发现等领域提供更有效的高通量筛选方法。
Sep, 2017
本研究基于局部化学环境和贝叶斯统计学习的机器学习模型,提供了一个统一的框架,可以预测原子尺度的稳定性和不同类别的分子的化学精度,可以区分活性和非活性的蛋白质配体,这种方法可以对材料和分子的势能面提供新的洞察。
Jun, 2017