通过审查回归标签提升药物发现中的不确定性量化
文章通过对5个基准数据集的系统评估,研究不同的不确定性量化方法在回归任务中的性能表现,发现没有一种方法完全优于其他方法,也没有一种特别可靠的错误排名。作者建议在已有的技术中进行选择。
May, 2020
给出一个透过Q-SAVI集成药物领域的显性先验知识来预测新型更有效治疗方法的概率模型,通过在建模过程中引入药物化学空间的上下文先验知识,取得了令人瞩目的预测准确度和校准度表现。
Jul, 2023
机器学习在药物发现中预测小分子性质方面具有很大潜力。本文提供了对近年来为此目的引入的各种机器学习方法的综合概述,并对结合亲合力、溶解度和ADMET(吸收、分布、代谢、排泄和毒性)等多个性质预测和优化技术进行了讨论。我们还评估了模型预测方面的技术,特别是在药物发现中关键决策方面提供模型预测理解的技术。总的来说,这篇综述为药物发现中小分子性质预测的机器学习模型提供了深入了解。尽管有多种多样的方法,但它们的性能通常相当。神经网络虽然更加灵活,但并不总是优于更简单的模型。这表明高质量的训练数据对于训练准确的模型仍然至关重要,并且需要标准化的基准、额外的性能指标和最佳实践,以便更好地比较不同技术和模型之间的差异。
Aug, 2023
预测药物特性在药物发现中是关键,以便在昂贵的临床试验之前减少风险,并更快地找到高活性化合物。尽管机器学习社区对此表现出了兴趣并提出了各种标准数据集和方法,然而对于从业人员而言,目前仍不清楚哪种方法或途径最适用,因为不同的论文以不同的数据集和方法进行基准测试,导致得出的结论各不相同且难以比较。我们的大规模实证研究将不同数据集和方法的众多相关作品联系到一起,从而全面概述了现有的属性类别、数据集及其与不同方法的相互作用。我们强调不确定性量化以及应用这些方法在药物开发决策周期中的时间和成本的重要性。我们发现最佳方法取决于数据集,并且具备经典机器学习方法的工程特征通常优于深度学习。具体而言,经典方法(如高斯过程)通常最适合分析QSAR数据集,而树或深度学习方法(如图神经网络或语言模型)有时更适合描述ADMET数据集。我们的研究强调了从业人员尚无可靠的、直接可行的程序可供依赖,并为创建与从业人员相关的基准测试案例奠定了先例。深度学习方法必须在这些基准测试案例中得到验证才能成为药物特性预测的实际选择方法。
Jul, 2023
在临床试验结果预测中,将不确定性量化、选择性分类和层次交互网络(HINT)相融合的方法显著提高了模型的性能,其中PR-AUC指标相对基础模型提高了32.37%、21.43%和13.27%,在预测III期试验时达到了0.9022的PR-AUC得分,表明该策略在临床试验预测领域具有鲁棒性和前景潜力。
Jan, 2024
通过计算深度回归树获得的方差,我们提出了一种方法来估计每个样本的不确定性,显示深度回归森林方差提高了规范化归纳预测模型在药物反应预测任务中的效率和覆盖率。
Feb, 2024
在机器学习中,剂量-反应预测是癌症领域的一个活跃应用领域。该研究使用大型 extit{in-vitro}药物敏感性筛选库,旨在开发准确的预测模型,用于指导实验设计或决策治疗。通过改进以前的工作,利用置换不变的多输出高斯过程,我们开发了一种变分近似模型,以提供可扩展性建模,并对缺失数据进行自然处理。此外,我们提出使用深度生成模型以连续方式编码化学空间,从而能够预测新药物和新组合。我们在简单的高通量数据集中展示了模型的性能,并证明该模型能够有效地借用输出信息。
Jun, 2024
本研究针对个体连续治疗与结果之间的剂量-反应关系,提出了一种新方法,以解决现有方法在不确定性量化方面的不足。我们将因果剂量-反应问题框架化为协变量转移,通过加权符合预测生成预测区间,结果显示该方法在生成稳健的预测区间方面具有显著意义,能够有效支持个性化医疗决策。
Sep, 2024