Apr, 2024

隐私保护的统计数据生成:用于脓毒症检测的应用

TL;DR在生物医学领域中,合成数据生成方法的兴起为数据驱动技术提供了有希望的机会。本研究提出了一种统计方法用于分类问题的合成数据生成。我们评估了核密度估计和 K 最近邻采样(KDE-KNN)生成的合成数据在现实环境中的实用性和隐私影响,特别关注其在败血症检测中的应用。我们强调了 KDE-KNN 相对于当前合成数据生成方法的优势,并考察了合成数据引入模型训练过程的效果。这项研究为了解合成数据生成技术在缓解生物医学领域的监管约束方面的有效性提供了宝贵的见解。