Nov, 2022

解决数据集中缺失问题的方法论研究及其在人口健康数据集中的应用

TL;DR本研究提出了一种处理健康数据集中缺失数据的方法,通过结合生成合成数据集、缺失数据插补和深度学习方法来解决缺失数据问题,并使用高斯混合模型、聚类、分类和直接插补分析等综合性能分析框架评估,得出当采用 DAE 方法进行插补时,模型的对数损失最低且性能表现较好,该方法对于处理其他领域的缺失数据同样适用。