使用异构现实世界生存数据开发联邦时间事件评分
在医学领域,生存分析是一种基本工具,用于建模人群中出现感兴趣事件的时间。然而,在现实世界的应用中,生存数据通常是不完整、被审查、分布式和保密的,尤其是在关键性的医疗环境中,隐私保护至关重要。本研究提出了一种名为 FedSurF++ 的 Federated Survival Forest 算法的扩展,这种联邦集成方法在异构联邦中构建随机生存森林。FedSurF++ 相比于现有方法具有可比较的性能,只需要完成一轮通信,通过从客户端森林采样进行了广泛的实证调查,从算法和隐私保护角度来看,显着提高了效率、鲁棒性和隐私性,同时在两个真实数据集上展示了 FedSurF++ 在医疗领域研究中的成功。我们的结果强调了 FedSurF++ 在分布式环境中提高生存分析的可伸缩性和效果的潜力,同时保护用户隐私。
Aug, 2023
应用不同的生存分析方法比较其性能,结果表明深度学习(DeepSurv)在歧视度和校准性方面表现最佳,而 AutoScore-Survival 则通过最小变量集实现了较好的性能和解释性。
Mar, 2024
生存分析提供了关于各个领域中部分不完整的事件发生时间数据的关键洞察。它也是概率机器学习的一个重要示例。我们的提案以一种通用的方式利用了预测的概率特性,使用(适当的)评分规则而不是基于似然的优化来进行模型拟合过程。我们建立了不同的参数和非参数子框架,允许不同程度的灵活性。结合神经网络,它导致了一种计算高效和可扩展的优化程序,产生了最先进的预测性能。最后,我们展示了使用我们的框架,我们能够恢复各种参数模型,并证明在与基于似然方法相比时,优化同样有效。
Mar, 2024
当数据存在右侧截断情况时,生存分析可以计算 “事件发生时间”。多类别的结果导致了一种分类变种:预测最可能的事件,即已知的竞争风险,这方面的研究较少。为了构建一个估计这种情况下的结果概率的损失函数,我们引入了一个严格正确的修正分离的评分规则,这个规则可以在部分数据上进行优化,因为评估是独立于观测的。它可以用于训练梯度提升树来进行竞争风险分析。与 11 种现有模型相比,这个模型 “MultiIncidence” 在生存和竞争风险的结果概率估计上表现最佳。它可以在任何时间点进行预测,并且比现有的替代方法快得多。
Jun, 2024
通过将 Survival Analysis 模型的完整表达分解为聚合基线风险和独立分布的生存得分,改善了该模型的训练和推断方法,实现了对右删失观测的动态处理,并在各种真实世界数据集中取得了与其他最先进方法相媲美的性能,无需进行微调或超参数优化。
Dec, 2023
本文讨论了个性化生存分布(ISD)模型以及它们与标准模型的区别,探讨了 ISD 模型的评估方法,提出了一种新的方法 D-Calibration,用于确定模型的概率估计是否有意义,并使用这些方法来评估多种 ISD 预测工具。
Nov, 2018
本篇论文研究了四种主要的适用于生存分析中的严格得分规则推广,并且证明了这些扩展在离散化条件下是适当的,并通过真实数据集比较了这些扩展得分规则的估计性能,发现对数分值和布赖尔分值的扩展效果最好。
May, 2023
手术后并发症风险的准确预测使用电子健康记录和人工智能显示出巨大潜力,而联邦学习模型可在数据保护壁垒较高的多个机构的大规模数据上训练出健壮且具有广泛适用性的模型。
Apr, 2024