Jul, 2023

现实世界中药物属性预测的当前方法

TL;DR预测药物特性在药物发现中是关键,以便在昂贵的临床试验之前减少风险,并更快地找到高活性化合物。尽管机器学习社区对此表现出了兴趣并提出了各种标准数据集和方法,然而对于从业人员而言,目前仍不清楚哪种方法或途径最适用,因为不同的论文以不同的数据集和方法进行基准测试,导致得出的结论各不相同且难以比较。我们的大规模实证研究将不同数据集和方法的众多相关作品联系到一起,从而全面概述了现有的属性类别、数据集及其与不同方法的相互作用。我们强调不确定性量化以及应用这些方法在药物开发决策周期中的时间和成本的重要性。我们发现最佳方法取决于数据集,并且具备经典机器学习方法的工程特征通常优于深度学习。具体而言,经典方法(如高斯过程)通常最适合分析 QSAR 数据集,而树或深度学习方法(如图神经网络或语言模型)有时更适合描述 ADMET 数据集。我们的研究强调了从业人员尚无可靠的、直接可行的程序可供依赖,并为创建与从业人员相关的基准测试案例奠定了先例。深度学习方法必须在这些基准测试案例中得到验证才能成为药物特性预测的实际选择方法。