Jan, 2024

可学习的提示作为伪填充:重新评估传统电子病历数据填充在下游临床预测中的必要性

TL;DR基于电子健康记录(EHR)分析患者的健康状况是医学信息学中的一个基础研究问题。现有的深度学习训练协议需要使用统计信息或填补模型来重构缺失值,但是这限制了模型性能。本文引入了 Learnable Prompt as Pseudo Imputation(PAI)作为一种新的训练协议,通过构建可学习的提示来模拟下游模型对缺失值的隐含偏好,从而显著提高所有 EHR 分析模型的性能。此外,实验结果表明,在数据不足和高缺失率的情况下,PAI 表现出更高的鲁棒性。更重要的是,在涉及零射评估的跨机构数据的真实应用中,PAI 展现了更强的模型泛化能力,特别是对非重叠特征。