Feb, 2024

Helen: 频率导向Hessian特征值正则化优化CTR预测模型

TL;DR通过优化的角度来解决CTR预测问题,研究发现CTR预测中最大的挑战在于特征频率与最大海森矩阵特征值之间的正相关关系,即频繁出现的特征倾向于收敛于尖锐的局部最小值,从而导致亚优化性能。基于锐度感知最小化的最新进展,我们提出了一种专门为CTR预测设计的优化器,命名为Helen。Helen通过基于归一化特征频率的自适应扰动来实现特征频率相关的海森矩阵特征值正则化。在开源基准框架下的实证结果突显了Helen的有效性。它成功地约束了海森矩阵的最大特征值,并在三个公共基准数据集上应用于七种流行模型时,与广泛使用的优化算法相比具有明显优势。我们的代码位于github.com/NUS-HPC-AI-Lab/Helen。