Sep, 2023

缺失值处理的三元决策树

TL;DR这篇论文介绍了 Trinary 决策树,一种旨在改善决策树回归器和分类器中处理缺失数据的算法。通过理论计算和使用真实数据集的数值说明,与已有算法在不同缺失数据情景(完全随机缺失(MCAR)和信息缺失(IM))中性能的比较,Trinary 决策树在 MCAR 设置中表现优于其他方法,尤其是当数据只在样本外缺失时,而在 IM 设置中略显不足。一个混合模型 TrinaryMIA 树,结合了 Trinary 决策树和 Missing In Attributes (MIA) 方法,在所有类型的缺失中表现出稳健的性能。尽管训练速度较慢可能是一个潜在的缺点,但 Trinary 决策树提供了一种有希望且更准确处理决策树算法中缺失数据的方法。