Apr, 2016

分类变量的实体嵌入

TL;DR本文介绍了如何将分类变量映射为欧氏空间中的实体嵌入,通过在标准监督训练过程中让神经网络进行学习。实体嵌入不仅可以减少内存使用和加速神经网络,更重要的是通过将相似的值映射到嵌入空间中靠近的位置,揭示了分类变量的内在属性,并帮助神经网络在稀疏且统计学未知的数据集上更好地泛化,因此在具有许多高基数特征的数据集上尤其有用,并且可以用于可视化分类数据和数据聚类。