医疗时间序列的知识增强条件插补
我们提出了一个新的深度学习模型 IGNITE,利用条件双变分自编码器和双阶段注意力,在多元数据上学习了时间上的患者动态变化,生成个性化的真实值,根据个体的人口特征和治疗条件调节。我们进一步扩展了 IGNITE 的应用范围,从填补缺失值发展为个性化数据合成器,用于生成未曾观察到的缺失电子健康记录或者甚至生成新的患者,应用于各种应用中。我们在三个大型公开数据集上验证了我们的模型,并展示了 IGNITE 在缺失数据重建和任务预测方面优于现有方法。
Jan, 2024
本文提出一种新的深度顺序潜变量模型,通过高斯过程在时间上平滑演化的抽象低维表示来实现缺失数据的非线性降维和数据插值,旨在解决在医疗和金融等领域中常见的缺失数据问题。我们的方法优于传统的和基于深度学习的数据插值方法,并提供可解释的不确定性估计。
Jul, 2019
通过自我监督的预训练方法,SMART(自我监督的缺失感知表示学习方法)通过详细的注意力机制对缺失信息进行编码,并通过学习潜在空间中的缺失数据表示来填补缺失值,从而提高了患者健康状况预测的泛化性和鲁棒性。在六个电子健康记录任务上进行的广泛实验验证了 SMART 的有效性,表明其优于现有方法。
May, 2024
本论文利用自我关注机制来处理多元、地理标记的时间序列数据中的缺失值,并通过跨维度自我关注 (CDSA) 的新方法,提出了一种具有低计算复杂度的序列建模算法,超越了现有的标准预测和补全方法。
May, 2019
本论文通过手工建模和学习内插嵌入,采用分离机制建模不规则的时间序列;采用时间注意力机制,将临床记录的一系列表示为多元不规则时间序列,并采用交织注意机制跨时间步骤进行多模态融合,以整合多模态表示。结果表明,我们提出的方法在单一模态和多模态情景下都优于现有方法,说明了我们方法的有效性和模拟不规则性的价值。
Oct, 2022
基于电子健康记录(EHR)分析患者的健康状况是医学信息学中的一个基础研究问题。现有的深度学习训练协议需要使用统计信息或填补模型来重构缺失值,但是这限制了模型性能。本文引入了 Learnable Prompt as Pseudo Imputation(PAI)作为一种新的训练协议,通过构建可学习的提示来模拟下游模型对缺失值的隐含偏好,从而显著提高所有 EHR 分析模型的性能。此外,实验结果表明,在数据不足和高缺失率的情况下,PAI 表现出更高的鲁棒性。更重要的是,在涉及零射评估的跨机构数据的真实应用中,PAI 展现了更强的模型泛化能力,特别是对非重叠特征。
Jan, 2024
本文提出了一种简单的新方法,即基于时间依赖的迭代插补(TDI),用于填补临床数据中的缺失值,该方法针对多变量和纵向数据,并基于数据的临床模式(包括缺失率和测量频率)引入了患者、变量和观察特定的动态加权策略。对 MIMIC III 和 COVID-19 住院病例进行的测试表明,TDI 可提高风险预测的准确性。
Apr, 2023
本研究提出了一种新的核方法,名为 TCK$_{IM}$,通过集成学习策略和新型混合贝叶斯混合模型,能够有效利用电子健康记录中的多变量时间序列的缺失数据,避免了插值方法的使用,具有无标签学习的鲁棒性。通过在三个真实世界的临床数据集上进行实验,证明了所提出核方法的有效性。
Feb, 2020
本文以五个时间序列健康数据集和六个实验条件为基准,展开数据中心的方法来评估最先进的深度插补方法,发现没有单一的插补方法在所有五个数据集上表现最佳,插补表现取决于数据类型,变量统计,缺失率和类型,这表明在选择多变量时间序列数据的缺失值插补方法时要考虑数据的特定情况。
Feb, 2023
这篇论文研究了使用深度神经网络架构解决多元时间序列插补问题。通过利用低秩插补方法的经验和专长,我们为传统的 Transformer 模型添加了三项知识驱动的增强,包括投影时间注意力、全局自适应图卷积和 Fourier 插补损失。这些面向任务的归纳偏置利用了不完整时间序列的内在结构,使得我们的模型适用于多种插补问题。我们通过在包括交通速度、交通流量、太阳能、智能电表和空气质量等异构数据集上进行全面的案例研究来进一步加强其可解释性,并通过有希望的实证结果有力地证明了将低秩属性等时间序列原始特征纳入模型可以大幅促进通用化模型的开发,从而解决广泛的时空插补问题。
Dec, 2023