Apr, 2021

正则化目标编码在具有高基数特征的监督式机器学习中优于传统方法

TL;DR本文基于机器学习算法对分类变量进行编码技术探究,通过对比不同编码策略和算法的实验结果,发现对训练数据中的特征进行正则化后的目标编码技术能够提供最好的结果,并且传统编码技术在部分情况下不如目标编码技术。