Aug, 2023

FeatGeNN:基于相关性特征提取的表格数据模型性能改进

TL;DR自动特征工程(AutoFE)是任何机器学习项目的重要任务,可以帮助改善模型性能并为统计分析提供更多信息。为了解决当前 AutoFE 方法中存在的手动特征创建和特征数量过多问题,我们提出了一种基于相关性的卷积方法 ——FeatGeNN。我们在各种基准数据集上评估了我们的方法,并证明 FeatGeNN 在模型性能方面优于现有的 AutoFE 方法。我们的结果表明,在表格数据应用中,基于相关性的池化可以成为 AutoFE 中替代 max-pooling 的有前景的选择。