Mar, 2024

利用分类器作为回归辅助构建变量:实证评估

TL;DR该论文提出了一种自动创建变量的方法(在回归的情况下),以补充初始输入向量中包含的信息。该方法作为预处理步骤工作,将要回归的变量的连续值离散化为一组间隔,然后利用这些间隔定义值阈值。然后训练分类器来预测要回归的值是否小于或等于每个阈值。分类器的不同输出以附加向量的形式连接起来,丰富回归问题的初始向量。实施的系统因此可以被认为是一个通用的预处理工具。我们在 33 个回归数据集上测试了提出的丰富方法,并得到了实验结果,确认了该方法的可行性。