Jan, 2024

特征选择的二进制特征掩码优化

TL;DR我们提出了一个新颖的框架,通过考虑模型的预测结果来选择特征。我们使用一种新颖的特征屏蔽方法,在选择过程中消除特征,而不是完全从数据集中删除它们,从而可以在特征选择过程中继续使用同一 ML 模型。我们通过 ML 模型的预测结果获得屏蔽运算符,为模型的预测性能提供了关键特征子集的全面视图。我们使用 LightGBM 和多层感知机作为 ML 模型,在不同设置下的真实数据集上展示了显著的性能改进。此外,我们公开分享了我们方法的实现代码,以鼓励在此领域的研究和贡献。