Dec, 2018

决策树超参数调整的实证研究

TL;DR本文提供了一种全面的方法,用于研究超参数调整对CART,C4.5和CTree三种决策树归纳算法的影响。实验结果表明,超参数调整仅在三分之一的数据集中为C4.5和CTree提供了显著的改进,在大多数数据集中却为CART提供了显著的改进。不同的树算法可能呈现不同的调优场景,但总体而言,调优技术仅需要很少的迭代就能找到准确的解决方案。此外,所有算法的最佳技术都是Irace。最后,我们发现调整特定的一小部分超参数对于可达到的最佳预测性能做出了最大的贡献。