Nov, 2022
缺失指示器法:从低维到高维
The Missing Indicator Method: From Low to High Dimensions
Mike Van Ness, Tomas M. Bosschieter, Roberto Halpin-Gregorio, Madeleine Udell
TL;DR本文介绍了一种用于处理缺失数据的方法 ——Missing Indicator Method,该方法通过在特征矩阵中添加缺失模式指示变量来搭配数据的填充,能够提高模型性能,同时还针对高维数据可能出现的模型过拟合问题,提出了一种 SMIM 扩展方法,并在实际的临床数据任务中表明了方法的实用性。