预测扩散模型综合多模态电子健康记录

Jun, 2024

预测扩散模型综合多模态电子健康记录

Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models

Yuan Zhong, Xiaochen Wang, Jiaqi Wang, Xiaokun Zhang, Yaqing Wang...

TL;DR通过引入基于扩散的 EHR 数据生成模型 EHRPD 来解决电子健康记录数据生成中存在的局限性，并从真实性、隐私性和实用性的角度对其进行实验验证。

Abstract

Synthesizing electronic health records (EHR) data has become a preferred strategy to address data scarcity, improve data quality, and model fairness in healthcare. However, existing approaches for EHR data generation

electronic health records data generation temporal dependencies time-aware visit embedding ehrpd

发现论文，激发创造

使用扩散模型综合混合类型的电子健康记录

使用扩散模型生成混合类型的电子病历在数据质量、效用和增强方面超过其他现有模型，但在隐私方面存在同质化风险。

Feb, 2023

电子病历时间序列的快速可靠生成方法

使用去噪扩散概率模型（DDPM）生成多样且逼真的合成电子健康记录时间序列数据，提高数据效用且减少训练工作量，从而改善医疗数据分析。

Oct, 2023

利用加速去噪扩散模型生成电子健康记录

本篇论文提出了一种基于扩散模型的生成模型，可以成功地应用于电子病历数据。该模型提出了一种基于分类条件的采样机制以保留标签信息，并引入了一种新的采样策略来加速推理速度。经实验证明，该模型优于现有的其他合成电子病历生成方法。

Feb, 2023

电子病历生成的导向离散扩散

电子健康记录生成的新方法 (EHR-D3PM) 以离散的扩散模型为基础，通过高质量的数据生成、数据增强和隐私安全性等方面的实验表明它在生成质量、潜在风险和任务效果方面优于现有方法。

Apr, 2024

MedDiffusion：通过基于扩散的数据增强提升健康风险预测

本文介绍了一种名为 MedDiffusion 的新型端到端扩散风险预测模型，通过在训练期间创建合成患者数据来增加样本空间，通过逐步关注机制揭示患者访问之间的隐藏关系，能够自动保留生成高质量数据所需的最重要信息，实验结果表明 MedDiffusion 在 PR-AUC、F1 和 Cohen's Kappa 等指标方面优于 14 种前沿基线模型。

Oct, 2023

基于时间感知的异构图变换器与自适应注意力合并的健康事件预测

通过利用电子健康记录 (EHR) 数据在医学领域的广泛应用，使用深度学习方法在疾病风险预测方面取得了早期成功。然而，现有研究对 EHR 数据的潜力未能充分利用，存在着许多关键问题，如融入疾病领域知识、异构学习疾病表示以及捕捉疾病进展的时间动态等。为了克服这些限制，本研究引入了一种新型的异构图学习模型，旨在融合疾病领域知识，阐明药物和疾病之间错综复杂的关系。该模型创新性地将时间数据融入到访问级嵌入中，并利用一个考虑时间的 Transformer 和自适应注意机制来生成患者表示。经过两个医疗数据集的评估，我们的方法在预测准确性和可解释性方面表现出显著提升，为个性化和主动式的医疗管理迈出了实质性的进展。

Apr, 2024

CEHR-GPT：生成具有时间轴的电子健康记录

通过使用从 CEHR-BERT 导出的特定患者表征，我们展示了使用 GPT 模型来生成患者序列，并能够无缝转换为 OMOP 数据格式的能力。

Feb, 2024

可扩展和准确的电子健康记录深度学习

使用电子健康记录进行循证医学和准确预测，通过 Fast Healthcare Interoperability Resources (FHIR) 格式表示病人的原始病历记录，并使用深度学习方法进行多中心的多个医疗事件预测，包括住院死亡率、未经计划的 30 天再入院率、医院停留时间延长、所有患者的最终出院诊断等。

Jan, 2018

通过分层自回归语言模型合成极高维长期电子医疗记录

通过提出一种分层自回归语言模型（HALO），我们可以生成长期的高维电子病历，这些病历既保留了真实病历的统计特性，又不会泄露隐私；同时可以用于训练准确的机器学习模型，而无需进行可变量的选择或聚合，从而提高 ML 模型的准确性，并能通过将真实和人造数据进行结合来增强 ML 模型的准确性。

Apr, 2023

TimEHR：基于图像的电子健康档案时间序列生成

提出了一种基于生成对抗网络的新颖生成模型 TimEHR，该模型将时间序列数据视为图像，并基于两个条件生成对抗网络，第一个生成对抗网络生成缺失模式，第二个生成对抗网络生成基于缺失模式的时间序列值。三个真实世界的电子健康记录数据集上的实验结果表明，TimEHR 在保真度、实用性和隐私指标方面优于现有方法。

Feb, 2024