Sep, 2023

增强推荐系统中的跨类别学习:多层嵌入训练

TL;DR现代的基于 DNN 的推荐系统依赖于对稀疏特征进行训练得到的嵌入。输入的稀疏性使得对于很少出现的类别难以获得高质量的嵌入,因为它们的表示不经常更新。我们通过有效的跨类别学习在训练时演示了一种产生优越嵌入的技术,并从理论上解释了它的出人意料的有效性。这种称为多层嵌入训练(MLET)的方案使用嵌入层的分解来训练嵌入,内部维度高于目标嵌入维度。为了提高推理效率,MLET 将经过训练的双层嵌入转换为单层嵌入,从而保持推理时模型大小不变。在多个最先进的点击率(CTR)预测任务的推荐模型上进行测试时,MLET 始终产生更好的模型,特别是对于罕见的项目。在保持模型质量不变的情况下,MLET 允许模型的嵌入维度和模型大小分别减少高达 16 倍和平均减少 5.8 倍。