IGNITE：时间序列电子健康记录的个体化填补生成

Jan, 2024

IGNITE：时间序列电子健康记录的个体化填补生成

IGNITE: Individualized GeNeration of Imputations in Time-series Electronic health records

Ghadeer O. Ghosheh, Jin Li, Tingting Zhu

TL;DR我们提出了一个新的深度学习模型 IGNITE，利用条件双变分自编码器和双阶段注意力，在多元数据上学习了时间上的患者动态变化，生成个性化的真实值，根据个体的人口特征和治疗条件调节。我们进一步扩展了 IGNITE 的应用范围，从填补缺失值发展为个性化数据合成器，用于生成未曾观察到的缺失电子健康记录或者甚至生成新的患者，应用于各种应用中。我们在三个大型公开数据集上验证了我们的模型，并展示了 IGNITE 在缺失数据重建和任务预测方面优于现有方法。

Abstract

electronic health records present a valuable modality for driving personalized medicine, where treatment is tailored to fit individual-level differences. For this purpose, many data-driven →

electronic health records personalized medicine machine learning missing data data synthesis

发现论文，激发创造

个体化表征中的时间序列电子健康记录缺失理解

研究介绍了对于个性化医学中的缺失表示和学习缺失模式的关注不足，提出了关于实际电子健康记录中缺失模式的新见解和影响，旨在实现真正个性化的预测建模。

Feb, 2024

医疗时间序列的知识增强条件插补

这项研究提出了一种新颖的方法来解决多元时间序列中缺失数据的挑战，特别关注医疗数据的复杂性。我们的条件自注意力填补模型（CSAI），基于变换器框架，引入了针对医学时间序列数据的条件隐藏状态初始化。此方法与传统填补技术不同之处在于专门针对医疗数据集中经常被忽视的缺失数据分布的不平衡进行调整。通过整合先进的知识嵌入和非均匀掩蔽策略，CSAI 能够灵活调整至电子病历中缺失数据的独特模式。

Dec, 2023

缺失感知多分支自注意力编码器用于不规则纵向电子健康档案的 MUSE-Net

大数据时代使大量的临床数据变得容易获得，特别是以电子健康记录（EHRs）的形式，提供了发展数据驱动诊断工具以增强临床决策的前所未有的机会。然而，将 EHRs 应用于数据驱动建模面临着使时间间隔不规则的多变量时间序列、不完整问题和数据不平衡等挑战。因此，我们提出了一种新颖的适应缺失感知的多分支自注意编码器（MUSE-Net），以应对对数据驱动疾病预测中对长期 EHRs 建模的挑战。MUSE-Net 利用带有缺失值掩码的多任务高斯过程（MGP）进行数据插补，采用多分支架构解决数据不平衡问题，并利用时间感知自注意编码器考虑长期 EHRs 中不规则的时间间隔。我们使用合成和真实数据集对提出的 MUSE-Net 进行评估。实验结果表明，我们的 MUSE-Net 优于广泛用于研究纵向信号的现有方法。

Jun, 2024

TimEHR：基于图像的电子健康档案时间序列生成

提出了一种基于生成对抗网络的新颖生成模型 TimEHR，该模型将时间序列数据视为图像，并基于两个条件生成对抗网络，第一个生成对抗网络生成缺失模式，第二个生成对抗网络生成基于缺失模式的时间序列值。三个真实世界的电子健康记录数据集上的实验结果表明，TimEHR 在保真度、实用性和隐私指标方面优于现有方法。

Feb, 2024

基于时间的迭代插补策略用于多变量纵向临床数据

本文提出了一种简单的新方法，即基于时间依赖的迭代插补（TDI），用于填补临床数据中的缺失值，该方法针对多变量和纵向数据，并基于数据的临床模式（包括缺失率和测量频率）引入了患者、变量和观察特定的动态加权策略。对 MIMIC III 和 COVID-19 住院病例进行的测试表明，TDI 可提高风险预测的准确性。

Apr, 2023

PromptEHR: 基于 Prompt 学习的条件式电子健康记录生成

本文提出了一种基于语言模型将电子医疗记录 (EHRs) 的生成形式转化为文本翻译任务的方法，使得事件插入更加灵活。该方法实现了根据数值和分类人口特征来控制生成的提示学习方式，其评估了两个迷惑度度量，考虑了纵向和跨模态插值的关系，同时利用了隐私保护评估的两个对手，展现了其在 MIMIC-III 数据上生成现实 EHRs 的优越性 (平均 longitudinal imputation perplexity 降低 53.1% 和平均 cross-modality imputation perplexity 降低 45.3% 与最佳基线相比)。

Oct, 2022

基于对比学习的基于电子健康记录的入院死亡风险模型中的填补与预测网络

通过使用电子健康记录（EHR）数据，基于对比学习模型的插补 - 预测网络预测住院死亡风险，提供患者健康状况的早期警告给医护人员，并解决 EHR 数据不规则性和缺失值的问题。实验表明，该方法在插补和预测任务中胜过当前的最先进方法。

Aug, 2023

利用 EHR 中信息缺失的核在多变量时间序列中进行挖掘

本研究提出了一种新的核方法，名为 TCK$_{IM}$，通过集成学习策略和新型混合贝叶斯混合模型，能够有效利用电子健康记录中的多变量时间序列的缺失数据，避免了插值方法的使用，具有无标签学习的鲁棒性。通过在三个真实世界的临床数据集上进行实验，证明了所提出核方法的有效性。

Feb, 2020

利用非规则多模态电子病历建模改进医疗预测

本论文通过手工建模和学习内插嵌入，采用分离机制建模不规则的时间序列；采用时间注意力机制，将临床记录的一系列表示为多元不规则时间序列，并采用交织注意机制跨时间步骤进行多模态融合，以整合多模态表示。结果表明，我们提出的方法在单一模态和多模态情景下都优于现有方法，说明了我们方法的有效性和模拟不规则性的价值。

Oct, 2022

SMART：面向预训练缺失感知模型的患者健康状态预测

通过自我监督的预训练方法，SMART（自我监督的缺失感知表示学习方法）通过详细的注意力机制对缺失信息进行编码，并通过学习潜在空间中的缺失数据表示来填补缺失值，从而提高了患者健康状况预测的泛化性和鲁棒性。在六个电子健康记录任务上进行的广泛实验验证了 SMART 的有效性，表明其优于现有方法。

May, 2024