医疗时间序列的知识增强条件插补

Dec, 2023

医疗时间序列的知识增强条件插补

Knowledge Enhanced Conditional Imputation for Healthcare Time-series

Linglong Qian, Zina Ibrahim, Hugh Logan Ellis, Ao Zhang, Yuezhou Zhang...

TL;DR这项研究提出了一种新颖的方法来解决多元时间序列中缺失数据的挑战，特别关注医疗数据的复杂性。我们的条件自注意力填补模型（CSAI），基于变换器框架，引入了针对医学时间序列数据的条件隐藏状态初始化。此方法与传统填补技术不同之处在于专门针对医疗数据集中经常被忽视的缺失数据分布的不平衡进行调整。通过整合先进的知识嵌入和非均匀掩蔽策略，CSAI 能够灵活调整至电子病历中缺失数据的独特模式。

Abstract

This study presents a novel approach to addressing the challenge of missing data in multivariate time series, with a particular focus on the complexities of healthcare data. Our →

missing data multivariate time series healthcare data conditional self-attention imputation electronic health records

发现论文，激发创造

IGNITE：时间序列电子健康记录的个体化填补生成

我们提出了一个新的深度学习模型 IGNITE，利用条件双变分自编码器和双阶段注意力，在多元数据上学习了时间上的患者动态变化，生成个性化的真实值，根据个体的人口特征和治疗条件调节。我们进一步扩展了 IGNITE 的应用范围，从填补缺失值发展为个性化数据合成器，用于生成未曾观察到的缺失电子健康记录或者甚至生成新的患者，应用于各种应用中。我们在三个大型公开数据集上验证了我们的模型，并展示了 IGNITE 在缺失数据重建和任务预测方面优于现有方法。

Jan, 2024

GP-VAE：深度概率时间序列插值

本文提出一种新的深度顺序潜变量模型，通过高斯过程在时间上平滑演化的抽象低维表示来实现缺失数据的非线性降维和数据插值，旨在解决在医疗和金融等领域中常见的缺失数据问题。我们的方法优于传统的和基于深度学习的数据插值方法，并提供可解释的不确定性估计。

Jul, 2019

SMART：面向预训练缺失感知模型的患者健康状态预测

通过自我监督的预训练方法，SMART（自我监督的缺失感知表示学习方法）通过详细的注意力机制对缺失信息进行编码，并通过学习潜在空间中的缺失数据表示来填补缺失值，从而提高了患者健康状况预测的泛化性和鲁棒性。在六个电子健康记录任务上进行的广泛实验验证了 SMART 的有效性，表明其优于现有方法。

May, 2024

CDSA: 跨维度自注意力用于多元、地理标记时间序列插补

本论文利用自我关注机制来处理多元、地理标记的时间序列数据中的缺失值，并通过跨维度自我关注 (CDSA) 的新方法，提出了一种具有低计算复杂度的序列建模算法，超越了现有的标准预测和补全方法。

May, 2019

利用非规则多模态电子病历建模改进医疗预测

本论文通过手工建模和学习内插嵌入，采用分离机制建模不规则的时间序列；采用时间注意力机制，将临床记录的一系列表示为多元不规则时间序列，并采用交织注意机制跨时间步骤进行多模态融合，以整合多模态表示。结果表明，我们提出的方法在单一模态和多模态情景下都优于现有方法，说明了我们方法的有效性和模拟不规则性的价值。

Oct, 2022

可学习的提示作为伪填充：重新评估传统电子病历数据填充在下游临床预测中的必要性

基于电子健康记录（EHR）分析患者的健康状况是医学信息学中的一个基础研究问题。现有的深度学习训练协议需要使用统计信息或填补模型来重构缺失值，但是这限制了模型性能。本文引入了 Learnable Prompt as Pseudo Imputation（PAI）作为一种新的训练协议，通过构建可学习的提示来模拟下游模型对缺失值的隐含偏好，从而显著提高所有 EHR 分析模型的性能。此外，实验结果表明，在数据不足和高缺失率的情况下，PAI 表现出更高的鲁棒性。更重要的是，在涉及零射评估的跨机构数据的真实应用中，PAI 展现了更强的模型泛化能力，特别是对非重叠特征。

Jan, 2024

基于时间的迭代插补策略用于多变量纵向临床数据

本文提出了一种简单的新方法，即基于时间依赖的迭代插补（TDI），用于填补临床数据中的缺失值，该方法针对多变量和纵向数据，并基于数据的临床模式（包括缺失率和测量频率）引入了患者、变量和观察特定的动态加权策略。对 MIMIC III 和 COVID-19 住院病例进行的测试表明，TDI 可提高风险预测的准确性。

Apr, 2023

利用 EHR 中信息缺失的核在多变量时间序列中进行挖掘

本研究提出了一种新的核方法，名为 TCK$_{IM}$，通过集成学习策略和新型混合贝叶斯混合模型，能够有效利用电子健康记录中的多变量时间序列的缺失数据，避免了插值方法的使用，具有无标签学习的鲁棒性。通过在三个真实世界的临床数据集上进行实验，证明了所提出核方法的有效性。

Feb, 2020

时间序列健康数据深度填补缺失值：综述与基准评估

本文以五个时间序列健康数据集和六个实验条件为基准，展开数据中心的方法来评估最先进的深度插补方法，发现没有单一的插补方法在所有五个数据集上表现最佳，插补表现取决于数据类型，变量统计，缺失率和类型，这表明在选择多变量时间序列数据的缺失值插补方法时要考虑数据的特定情况。

Feb, 2023

ImputeFormer: 用于可推广的时空插补的图变换器

这篇论文研究了使用深度神经网络架构解决多元时间序列插补问题。通过利用低秩插补方法的经验和专长，我们为传统的 Transformer 模型添加了三项知识驱动的增强，包括投影时间注意力、全局自适应图卷积和 Fourier 插补损失。这些面向任务的归纳偏置利用了不完整时间序列的内在结构，使得我们的模型适用于多种插补问题。我们通过在包括交通速度、交通流量、太阳能、智能电表和空气质量等异构数据集上进行全面的案例研究来进一步加强其可解释性，并通过有希望的实证结果有力地证明了将低秩属性等时间序列原始特征纳入模型可以大幅促进通用化模型的开发，从而解决广泛的时空插补问题。

Dec, 2023