预测扩散模型综合多模态电子健康记录
本篇论文提出了一种基于扩散模型的生成模型,可以成功地应用于电子病历数据。该模型提出了一种基于分类条件的采样机制以保留标签信息,并引入了一种新的采样策略来加速推理速度。经实验证明,该模型优于现有的其他合成电子病历生成方法。
Feb, 2023
电子健康记录生成的新方法 (EHR-D3PM) 以离散的扩散模型为基础,通过高质量的数据生成、数据增强和隐私安全性等方面的实验表明它在生成质量、潜在风险和任务效果方面优于现有方法。
Apr, 2024
本文介绍了一种名为 MedDiffusion 的新型端到端扩散风险预测模型,通过在训练期间创建合成患者数据来增加样本空间,通过逐步关注机制揭示患者访问之间的隐藏关系,能够自动保留生成高质量数据所需的最重要信息,实验结果表明 MedDiffusion 在 PR-AUC、F1 和 Cohen's Kappa 等指标方面优于 14 种前沿基线模型。
Oct, 2023
通过利用电子健康记录 (EHR) 数据在医学领域的广泛应用,使用深度学习方法在疾病风险预测方面取得了早期成功。然而,现有研究对 EHR 数据的潜力未能充分利用,存在着许多关键问题,如融入疾病领域知识、异构学习疾病表示以及捕捉疾病进展的时间动态等。为了克服这些限制,本研究引入了一种新型的异构图学习模型,旨在融合疾病领域知识,阐明药物和疾病之间错综复杂的关系。该模型创新性地将时间数据融入到访问级嵌入中,并利用一个考虑时间的 Transformer 和自适应注意机制来生成患者表示。经过两个医疗数据集的评估,我们的方法在预测准确性和可解释性方面表现出显著提升,为个性化和主动式的医疗管理迈出了实质性的进展。
Apr, 2024
通过使用从 CEHR-BERT 导出的特定患者表征,我们展示了使用 GPT 模型来生成患者序列,并能够无缝转换为 OMOP 数据格式的能力。
Feb, 2024
使用电子健康记录进行循证医学和准确预测,通过 Fast Healthcare Interoperability Resources (FHIR) 格式表示病人的原始病历记录,并使用深度学习方法进行多中心的多个医疗事件预测,包括住院死亡率、未经计划的 30 天再入院率、医院停留时间延长、所有患者的最终出院诊断等。
Jan, 2018
通过提出一种分层自回归语言模型(HALO),我们可以生成长期的高维电子病历,这些病历既保留了真实病历的统计特性,又不会泄露隐私;同时可以用于训练准确的机器学习模型,而无需进行可变量的选择或聚合,从而提高 ML 模型的准确性,并能通过将真实和人造数据进行结合来增强 ML 模型的准确性。
Apr, 2023
提出了一种基于生成对抗网络的新颖生成模型 TimEHR,该模型将时间序列数据视为图像,并基于两个条件生成对抗网络,第一个生成对抗网络生成缺失模式,第二个生成对抗网络生成基于缺失模式的时间序列值。三个真实世界的电子健康记录数据集上的实验结果表明,TimEHR 在保真度、实用性和隐私指标方面优于现有方法。
Feb, 2024