本篇论文提出了一种基于扩散模型的生成模型,可以成功地应用于电子病历数据。该模型提出了一种基于分类条件的采样机制以保留标签信息,并引入了一种新的采样策略来加速推理速度。经实验证明,该模型优于现有的其他合成电子病历生成方法。
Feb, 2023
电子健康记录生成的新方法 (EHR-D3PM) 以离散的扩散模型为基础,通过高质量的数据生成、数据增强和隐私安全性等方面的实验表明它在生成质量、潜在风险和任务效果方面优于现有方法。
Apr, 2024
使用扩散模型生成混合类型的电子病历在数据质量、效用和增强方面超过其他现有模型,但在隐私方面存在同质化风险。
通过引入基于扩散的 EHR 数据生成模型 EHRPD 来解决电子健康记录数据生成中存在的局限性,并从真实性、隐私性和实用性的角度对其进行实验验证。
Jun, 2024
提出了一种基于生成对抗网络的新颖生成模型 TimEHR,该模型将时间序列数据视为图像,并基于两个条件生成对抗网络,第一个生成对抗网络生成缺失模式,第二个生成对抗网络生成基于缺失模式的时间序列值。三个真实世界的电子健康记录数据集上的实验结果表明,TimEHR 在保真度、实用性和隐私指标方面优于现有方法。
Feb, 2024
本文介绍了一种名为 MedDiffusion 的新型端到端扩散风险预测模型,通过在训练期间创建合成患者数据来增加样本空间,通过逐步关注机制揭示患者访问之间的隐藏关系,能够自动保留生成高质量数据所需的最重要信息,实验结果表明 MedDiffusion 在 PR-AUC、F1 和 Cohen's Kappa 等指标方面优于 14 种前沿基线模型。
Oct, 2023
通过使用从 CEHR-BERT 导出的特定患者表征,我们展示了使用 GPT 模型来生成患者序列,并能够无缝转换为 OMOP 数据格式的能力。
本文介绍了一种通用的基准测试框架,以评估生成对抗网络等方法合成的医疗数据的实用性和隐私度量,并发现在共享用于电子健康记录的合成数据时存在实用性和隐私度量的折中。
Aug, 2022
使用电子健康记录进行循证医学和准确预测,通过 Fast Healthcare Interoperability Resources (FHIR) 格式表示病人的原始病历记录,并使用深度学习方法进行多中心的多个医疗事件预测,包括住院死亡率、未经计划的 30 天再入院率、医院停留时间延长、所有患者的最终出院诊断等。
Jan, 2018
对基于电子健康记录数据的深度学习预测模型的最新进展进行系统综述,并讨论了预测建模在医疗保健中的挑战、基准和工具,以及未来研究的方向。