是否进行插补:关于多模态生物特征融合的建议
本文比较了不同的方法在监督分类任务中填补缺失分类数据的效果,并证明了方法可以提高预测准确性,并达到了Missing-data perturbation和k-nearest-neighbors imputation下准确率的最新水平。
Oct, 2016
本研究提出了一种新的框架,以数字方式评估在统计分析背景下处理缺失数据的策略,特别关注多重插补技术,并在National COVID Cohort Collaborative提供的大型2型糖尿病患者队列上进行了实证研究,结果显示多重插补技术可以有效地处理缺失数据。
Jun, 2022
本文提出了一个新的算法 MISNN,用于处理高维缺失数据的多重插补问题,该算法借助于神经网络的逼近能力,将特征选择嵌入 MI 模型中,经过实验证明在插补准确度、统计一致性和计算速度等方面优于现有的 Bayesian Lasso 和矩阵补全等最新算法。
May, 2023
该论文提出了两种结合多重填补模型的新方法,以实现更高的准确性和更少的偏差,其中一种方法利用多个填补模型创建置信区间,并应用阈值来忽略低置信度的伪标签,另一种方法通过过滤不准确的数据和找到准确可靠的子集来减少偏差,在MCAR和MNAR情况下显示出高效,实验证明该方法在分类准确性和减少偏差方面优于现有方法。
Aug, 2023
本研究在不同应用中使用六个真实数据集,分析缺失值模式以及插补算法的适用条件。基于分析得到的结构和属性,我们提出了优化模型和算法,在仅使用已知评分信息的情况下最小化评分提供者之间的总评分不一致性,用于插补组合评分列表中的缺失评分。实验结果表明,所提出的方法在插补准确性方面优于文献中的现有通用插补方法。
Nov, 2023
研究论文旨在探讨如何使用标签信息来提高缺失数据的填补,并提出了一种同时处理标签和输入数据的分类策略,该策略可适用于连续、分类或混合类型的数据,并取得了令人满意的准确性结果。
Nov, 2023
该研究比较了七种填补技术在三个医疗数据集上的表现,结果显示Missforest填补法表现最好,其次是MICE填补法;此外,研究还表明在处理包含缺失值的数据时,首先进行填补再进行特征选择效果更好。
Mar, 2024
ITI-IQA是一套评估各种填补缺失值方法可靠性、选择最佳填补器和筛选不符合质量标准的特征的工具集。它还包括一套诊断方法和图形工具,用于在处理缺失数据期间和之后检查测量和结果。
Jul, 2024
本研究解决了动态多模态生物识别系统中缺失评分的问题,特别是针对验证和识别任务进行的双重分析。通过应用多种评分填补方法结合简单的加权融合,研究表明即使在缺失评分达到90%的情况下,也能显著提高识别准确率,特别是K近邻的迭代填补方法在各类任务中表现优异。
Aug, 2024