电子病历时间序列的快速可靠生成方法

Oct, 2023

电子病历时间序列的快速可靠生成方法

Fast and Reliable Generation of EHR Time Series via Diffusion Models

Muhang Tian, Bernie Chen, Allan Guo, Shiyi Jiang, Anru R. Zhang

TL;DR使用去噪扩散概率模型（DDPM）生成多样且逼真的合成电子健康记录时间序列数据，提高数据效用且减少训练工作量，从而改善医疗数据分析。

Abstract

electronic health records (EHRs) are rich sources of patient-level data, including laboratory tests, medications, and diagnoses, offering valuable resources for medical data analysis. However, concerns about priv

electronic health records privacy-preserving denoising diffusion probabilistic models synthetic data medical data analysis

发现论文，激发创造

利用加速去噪扩散模型生成电子健康记录

本篇论文提出了一种基于扩散模型的生成模型，可以成功地应用于电子病历数据。该模型提出了一种基于分类条件的采样机制以保留标签信息，并引入了一种新的采样策略来加速推理速度。经实验证明，该模型优于现有的其他合成电子病历生成方法。

Feb, 2023

电子病历生成的导向离散扩散

电子健康记录生成的新方法 (EHR-D3PM) 以离散的扩散模型为基础，通过高质量的数据生成、数据增强和隐私安全性等方面的实验表明它在生成质量、潜在风险和任务效果方面优于现有方法。

Apr, 2024

使用扩散模型综合混合类型的电子健康记录

使用扩散模型生成混合类型的电子病历在数据质量、效用和增强方面超过其他现有模型，但在隐私方面存在同质化风险。

Feb, 2023

预测扩散模型综合多模态电子健康记录

通过引入基于扩散的 EHR 数据生成模型 EHRPD 来解决电子健康记录数据生成中存在的局限性，并从真实性、隐私性和实用性的角度对其进行实验验证。

Jun, 2024

TimEHR：基于图像的电子健康档案时间序列生成

提出了一种基于生成对抗网络的新颖生成模型 TimEHR，该模型将时间序列数据视为图像，并基于两个条件生成对抗网络，第一个生成对抗网络生成缺失模式，第二个生成对抗网络生成基于缺失模式的时间序列值。三个真实世界的电子健康记录数据集上的实验结果表明，TimEHR 在保真度、实用性和隐私指标方面优于现有方法。

Feb, 2024

MedDiffusion：通过基于扩散的数据增强提升健康风险预测

本文介绍了一种名为 MedDiffusion 的新型端到端扩散风险预测模型，通过在训练期间创建合成患者数据来增加样本空间，通过逐步关注机制揭示患者访问之间的隐藏关系，能够自动保留生成高质量数据所需的最重要信息，实验结果表明 MedDiffusion 在 PR-AUC、F1 和 Cohen's Kappa 等指标方面优于 14 种前沿基线模型。

Oct, 2023

CEHR-GPT：生成具有时间轴的电子健康记录

通过使用从 CEHR-BERT 导出的特定患者表征，我们展示了使用 GPT 模型来生成患者序列，并能够无缝转换为 OMOP 数据格式的能力。

Feb, 2024

合成电子病历生成模型的多方面基准测试

本文介绍了一种通用的基准测试框架，以评估生成对抗网络等方法合成的医疗数据的实用性和隐私度量，并发现在共享用于电子健康记录的合成数据时存在实用性和隐私度量的折中。

Aug, 2022

可扩展和准确的电子健康记录深度学习

使用电子健康记录进行循证医学和准确预测，通过 Fast Healthcare Interoperability Resources (FHIR) 格式表示病人的原始病历记录，并使用深度学习方法进行多中心的多个医疗事件预测，包括住院死亡率、未经计划的 30 天再入院率、医院停留时间延长、所有患者的最终出院诊断等。

Jan, 2018

电子健康记录预测建模的最新进展

对基于电子健康记录数据的深度学习预测模型的最新进展进行系统综述，并讨论了预测建模在医疗保健中的挑战、基准和工具，以及未来研究的方向。

Feb, 2024