现实世界中药物属性预测的当前方法

Jul, 2023

现实世界中药物属性预测的当前方法

Current Methods for Drug Property Prediction in the Real World

Jacob Green, Cecilia Cabrera Diaz, Maximilian A. H. Jakobs, Andrea Dimitracopoulos, Mark van der Wilk...

TL;DR预测药物特性在药物发现中是关键，以便在昂贵的临床试验之前减少风险，并更快地找到高活性化合物。尽管机器学习社区对此表现出了兴趣并提出了各种标准数据集和方法，然而对于从业人员而言，目前仍不清楚哪种方法或途径最适用，因为不同的论文以不同的数据集和方法进行基准测试，导致得出的结论各不相同且难以比较。我们的大规模实证研究将不同数据集和方法的众多相关作品联系到一起，从而全面概述了现有的属性类别、数据集及其与不同方法的相互作用。我们强调不确定性量化以及应用这些方法在药物开发决策周期中的时间和成本的重要性。我们发现最佳方法取决于数据集，并且具备经典机器学习方法的工程特征通常优于深度学习。具体而言，经典方法（如高斯过程）通常最适合分析 QSAR 数据集，而树或深度学习方法（如图神经网络或语言模型）有时更适合描述 ADMET 数据集。我们的研究强调了从业人员尚无可靠的、直接可行的程序可供依赖，并为创建与从业人员相关的基准测试案例奠定了先例。深度学习方法必须在这些基准测试案例中得到验证才能成为药物特性预测的实际选择方法。

Abstract

Predicting drug properties is key in drug discovery to enable de-risking of assets before expensive clinical trials, and to find highly active compounds faster. Interest from the machine learning community has le

drug properties machine learning benchmark datasets uncertainty quantification deep learning

发现论文，激发创造

机器学习药物发现中的小分子性质

机器学习在药物发现中预测小分子性质方面具有很大潜力。本文提供了对近年来为此目的引入的各种机器学习方法的综合概述，并对结合亲合力、溶解度和 ADMET（吸收、分布、代谢、排泄和毒性）等多个性质预测和优化技术进行了讨论。我们还评估了模型预测方面的技术，特别是在药物发现中关键决策方面提供模型预测理解的技术。总的来说，这篇综述为药物发现中小分子性质预测的机器学习模型提供了深入了解。尽管有多种多样的方法，但它们的性能通常相当。神经网络虽然更加灵活，但并不总是优于更简单的模型。这表明高质量的训练数据对于训练准确的模型仍然至关重要，并且需要标准化的基准、额外的性能指标和最佳实践，以便更好地比较不同技术和模型之间的差异。

Aug, 2023

分子属性预测和药物发现的高级图形和序列神经网络

我们开发了一套深度学习方法和综合工具，针对分子属性预测和药物发现，跨越不同的计算模型、分子表示和损失函数。我们将分子表示为图和序列，并围绕这些表示所构建的深度模型进行学习。为了有效地从高度不平衡的数据集中学习，开发了优化精度 - 召回曲线下面积的先进损失函数。在在线和离线抗生素发现和分子属性预测任务中的结果表明，我们的方法相对于之前的方法实现了持续的改进，并在与 COVID-19 相关的 AI Cures Open Challenge 中以 ROC-AUC 和 PRC-AUC 方面均排名第一。

Dec, 2020

领域知识和多模态对智能分子性质预测的影响：一项系统调查

综合审视和数量分析基于各种基准的最新深度学习方法，我们发现融合分子信息不仅能提高分子属性预测回归和分类任务的准确性，还能通过同时利用 1 维和 2 维信息的 3 维信息大幅增强分子属性预测进展，在药物研发中具有重要指导意义。

Feb, 2024

化学动力学性质的超出分布通用预测方向

利用机器学习（ML）技术，本研究探索了化学动力学性质的估计。通过 “AI4drug discovery” 发现的药物分子为基础，下一步的关键是以人工智能驱动的设计高通量化学合成过程，并估计未知反应和未探索分子的性质。为此，对于动力学性质预测的现有 ML 方法需要具备 Out-Of-Distribution（OOD）的可推广性。本文将 OOD 动力学性质预测分为三个级别（结构，条件和机制），揭示了这些问题的独特方面。在这个框架下，我们创建了全面的数据集，用于评估（1）在 OOD 设置中用于反应预测的最新 ML 方法，以及（2）用于动力学性质预测问题的最新图形 OOD 方法。我们的结果展示了 OOD 动力学性质预测中的挑战和机遇。我们的数据集和基准可以进一步支持这一研究方向。

Oct, 2023

PotentialNet 用于分子性质预测

该论文介绍了使用基于深度神经网络的机器学习方法来改进药物发现过程中分子属性预测的性能，包括设计出的 PotentialNet 结构和 EF$_{chi}^{(R)}$ 指标以及交叉验证策略等，并在多个基于配体的任务中验证了模型性能的创新性。

Mar, 2018

从表示学习中暂停：分子性质预测

本研究对比了随机森林、MolBERT 和 GROVER 三种基于 Extended-Connectivity Fingerprint、SMILES 字符串和分子图的分子表示学习模型，评估了其在 MoleculeNet 数据集和类阿片类物质数据集预测方面的效果，并探讨了数据集分布、活性悬崖、模型评价、任务设定和化学空间泛化等方面对模型效果的影响，旨在为提高该领域人工智能技术贡献可能的思路。

Sep, 2022

Uni-QSAR: 分子属性预测的自动化机器学习工具

该论文提出了一个名为 Uni-QSAR 的深度学习自动机器学习工具，结合了分子表示学习和预训练模型，利用大规模无标签数据得到丰富的表示，优于 SOTA 并在药物发现领域具有实际用途。

Apr, 2023

分子性质的机器学习：局部性和主动学习

本篇论文提出了一种基于局部相互作用模型和主动学习算法的新型机器学习算法，可以在较小的训练集上提供高精度预测，并显著减少异常值误差，从而为材料设计和药物发现等领域提供更有效的高通量筛选方法。

Sep, 2017

分析学习的分子表征进行性质预测

在分子属性预测的算法解决方案中，神经机器技术的进步导致了一系列算法解决方案，其中神经网络应用于计算分子指纹或专家制作的描述符以及构造学习分子表示的图卷积神经网络最为有效，这项研究进行了广泛的基准测试，并提出了优于现有模型的图卷积模型的实证发现。

Apr, 2019

构象合集下的分子机器学习

利用多个构象的 3D 信息可以改善深度学习模型在分子性质预测中的表现，我们介绍了多重深度学习模型，并将其在二维、三维和四维表示中的表现进行了测试，深度学习模型可以学习每个构象的可解释性关注权重。

Dec, 2020