- tPARAFAC2:追踪(不完整)时序数据中的演变模式
为了捕捉底层演化模式,引入了具有时间平滑正则化的 tPARAFAC2,使用交替优化和交替方向乘法器方法实现模型拟合。在处理丢失的数据方面,对比了不同方法,结果表明时间平滑正则化的有效性。
- 加权缺失线性判别分析:用于具有缺失数据的可解释分类方法
提出了一种新颖的方法 WLDA,用于在缺失数据下进行线性判别分析,通过权重矩阵对缺失值进行惩罚,在医学、金融等高风险领域中能比传统方法更好地解释和分类数据。
- 机器学习模型在缺失数据下的可解释性
模型解释中,遗漏数据与解晰人工智能相关联的相关领域的一个主要因素,在本文中,经验性地研究了各种填充方法对 Shapley 值(一种解释复杂机器学习模型的流行技术)的计算的影响。通过比较不同填充策略,评估其对 Shapley 值决定的特征重要 - 光学时间序列图像中的多尺度缺失数据修复与遮挡时空注意力网络
提出了一种基于深度学习的新方法 MS2TAN (Multi-scale Masked Spatial-Temporal Attention Network),用于重建时间序列的遥感图像,通过充分利用空时辅助信息,得到更高的恢复准确性。
- Hinge-FM2I:一种使用图像修复技术插值非多元时间序列中缺失数据的方法
本文提出了一种处理单变量时间序列数据中缺失数据值的新方法 Hinge-FM2I,通过选择最准确的预测来解决数据质量问题,实验证明 Hinge-FM2I 在处理缺失数据方面明显优于线性 / 样条插值、K 最近邻算法(K-NN)和 ARIMA - MagiNet:面向不完整交通数据的掩码感知图填充网络
我们提出了一种名为 MagiNet 的 Mask-Aware Graph imputation Network,该方法旨在通过学习不完整数据的潜在表示,并捕捉不完整交通数据中固有的空间和时间依赖性,来填补缺失值。在五个真实世界交通数据集上的 - 梯度引导的假设:在稀缺和噪声数据情境下启用机器学习模型的统一解决方案
在本研究中,我们提出了一种架构无关的算法,梯度引导假设(GGH),旨在应对数据质量方面的挑战。GGH 通过分析假设的梯度作为数据中不同且可能相互矛盾的模式的代理来解决缺失和噪声数据问题,并通过机器学习训练中的额外步骤将梯度包含或排除在反向传 - 医学应用中基于多方计算的隐私保护数据填充
本研究利用安全多方计算提出了隐私保存插补方法,以在医疗和保健领域对敏感数据进行保护,并在糖尿病数据集上验证了其正确性和可伸缩性。
- 从不完整数据中学习分阶段树
该研究介绍了处理缺失数据的阶梯树学习算法,通过模型的全似然性能直接估计模型,证明了在学习阶梯树时考虑不同的缺失模式是可行的。
- SEGAN:半监督学习方法用于缺失数据插补
本文提出了一种基于半监督学习的缺失数据完整性模型 SEGAN,它通过引入生成器、判别器和分类器等三个重要模块,使生成器在预测缺失数据值时更充分地利用已知数据和标签信息,同时通过引入缺失提示矩阵使判别器能够更有效地区分已知数据和生成器填充的数 - SMART:面向预训练缺失感知模型的患者健康状态预测
通过自我监督的预训练方法,SMART(自我监督的缺失感知表示学习方法)通过详细的注意力机制对缺失信息进行编码,并通过学习潜在空间中的缺失数据表示来填补缺失值,从而提高了患者健康状况预测的泛化性和鲁棒性。在六个电子健康记录任务上进行的广泛实验 - 追求更好分类的数据插补:一种监督式基于核函数的方法
提出一种新的框架,通过利用监督信息来完成缺失数据,使其有利于分类,并在四个真实数据集上证明了该方法的优越性能。
- 处理特殊缺失机制下的缺失数据综述
在数据科学中,缺失数据是一个重要的挑战,它对决策过程和结果产生影响。本文回顾了现有文献对处理缺失数据的方法进行了比较和对比,揭示了现有文献中的研究空白,并提出了未来研究的潜在方向。这个综述将帮助数据分析人员和研究人员在实际问题中采用和推广处 - 地球观测应用模型预测中缺失数据的影响评估
地球观测应用中使用机器学习模型来处理复杂和异构的数据源,但是对于数据源的持久性可用性存在一种常见的假设。本研究评估了训练模型中缺失时间性和静态的观测数据源对于四个数据集中分类和回归任务的影响,并比较了不同方法的预测质量,发现其中一些方法对于 - HuLP: 人工干预提高预测准确性
该研究介绍了 HuLP,一种用于临床环境中改善预后模型的可靠性和可解释性的人机协同模型。HuLP 通过人机协作,赋予临床医生与模型进行交互和纠正预测的能力,从而生成更准确的预后结果。此外,HuLP 利用神经网络和个性化方法有效地处理缺失数据 - 负二项随机伽玛马尔科夫过程用于异质超离散计数时间序列
提出了一种负二项式随机化的伽马马尔科夫过程来建模计数数列的转换结构和爆发性动态,从而改善了动力学系统的预测性能和推理算法的快速收敛,同时估计了基于因子结构和图结构的转换动态以获得更可解释的潜在结构,比相关模型更好地填补了缺失数据和预测未来观 - 从不完整数据学习循环因果模型
在本研究中,我们提出了一种名为 MissNODAGS 的新框架,用于从部分缺失的数据中学习循环因果图。通过合成实验和真实的单细胞干预数据,我们证明在部分缺失的干预数据上使用最先进的填充技术后进行因果学习相比之下,MissNODAGS 表现出 - 利用缺失数据进行结构学习的最优传输
使用基于最优传输的打分算法,从缺失数据中学习因果结构,通过广泛的模拟和实验,论文证明了该方法在各种模拟和真实数据实验中比基线更有效地恢复了真实的因果图。
- 短时间缺失数据分类的多变量函数线性判别分析
在大多元和不完整数据时代,需要一个能够计算可行地估计特征之间统计依赖并处理缺失值的方法。我们开发了 MUDRA(多元 FLDA 的多元版本)来解决这个问题,并描述了一种高效的期望 / 条件最大化算法来推断其参数。我们在 “Articular - 医学黑暗物质中隐藏着什么?在医疗实践中学习丢失的数据
研究聚焦于统计方法和机器学习进行缺失数据理解、解释和数据填充,基于儿科急诊数据和英国最大的创伤伤害数据库的数据,研究发现缺失数据非随机,与医疗专业实践模式相关性高,得出使用 1 近邻(1NN)填充方法最佳,表明了临床决策常见的模式。