May, 2011

MissForest - 混合类型数据的非参数缺失值填补

TL;DR提出了一种非参数方法,使用随机森林(random forest)基于迭代插补(iterative imputation)处理混合类型数据中的缺失值,相较于其他插值方法,特别是在疑似存在复杂交互作用和非线性关系的数据集中,该方法表现出较高的性能,且具有良好的计算效率和处理高维度数据的能力。