生存分析的可解释预测与特征选择
该研究提出了一种深度循环生存分析模型,结合了深度学习和生存分析,通过对每个样本的条件概率建模,捕获时间依赖性,预测真实事件发生的可能性并估计被审查数据的生存率,同时不需要假设任何特定形式的事件概率分布,在三个不同领域的实验中,该模型在各种度量标准下明显优于现有解决方案。
Sep, 2018
本文介绍一种新的参数方法来评估具有截尾数据的时间事件预测问题中的相对风险,通过联合学习输入协变量的深度非线性表示,我们展示了我们的方法在多个不同程度的截尾实际世界数据集上估算生存风险的优势,并证明我们的模型在竞争风险情景中的优势。据我们所知,这是在存在截尾时进行全参数生存时间与竞争风险估计的第一项研究。
Mar, 2020
本文介绍了如何通过机器学习方法进行生存分析,并解决了生存数据缺失和不平衡的问题。我们提出了一种新的生存度量和相应的差异度量,并将其应用于多个存活数据集进行领域适应。我们在两个肿瘤数据集上进行了实验,取得了出色的性能,有望提供更好的治疗建议。
Dec, 2022
提出了一种混合生存分析方法,结合了区分性和生成性机制,以描述混合模型形式下的生存数据。通过该模型可以实现个体实例的可解释子集聚类、权重学习以及时间预测。
Jan, 2023
介绍Survex R包,通过应用可解释的人工智能技术,提供了一种解释任何生存模型的协同框架,能够理解和诊断生存模型,并揭示决策过程中的洞察力,透明度和责任性增强,有助于敏感领域(如生物医学和医疗领域)的可靠模型评估和偏差检测。
Aug, 2023
我们提出了一种新颖的生存分析流程,既能解释模型预测结果,又能与最先进的生存模型竞争。通过改进的生存堆叠模型将生存分析问题转化为分类问题,使用ControlBurn进行特征选择,并使用可解释的增强学习机器生成可解释的预测结果。我们使用大型电子健康记录数据库预测心力衰竭的风险,该流程实现了最先进的性能并提供了关于心力衰竭风险因素的有趣且新颖的见解。
Oct, 2023
利用Transformer模型和合成数据生成,本研究介绍了“SurvTimeSurvival:对多次访问/记录的患者进行生存分析”,在处理时间变化的协变量和协变量数据的复杂性方面取得了显著进展,解决了生存分析数据中常见的数据稀疏性问题,并展示了我们的方法在协变量和时间变化的协变量数据集上的优越性能,旨在提高对各种医疗状况下个体患者生存轨迹的理解,从而提高预测准确性,并在临床试验的设计和新疗法的创立中发挥关键作用。
Nov, 2023
在这项工作中,我们提出了一种灵活的基于深度学习的生存分析方法,同时适应了相关的审查,并消除了关于地面真实模型的要求。我们从广泛的数据集实验证明,与现有方法相比,我们的方法成功地识别了潜在的依赖结构,并显著减少了生存估计偏差。
Dec, 2023
应用不同的生存分析方法比较其性能,结果表明深度学习(DeepSurv)在歧视度和校准性方面表现最佳,而AutoScore-Survival则通过最小变量集实现了较好的性能和解释性。
Mar, 2024
通过对现有的解释性机器学习方法的综述,我们详细介绍了如何将常用的解释性机器学习方法应用于生存分析,以实现对模型决策或预测的理解。并且通过对加纳儿童5岁以下死亡率的实际数据的应用,展示了如何在实践中使用这些技术来促进对模型决策或预测的理解。
Mar, 2024