关键词optimization perspective
搜索结果 - 3
- WWWHelen: 频率导向 Hessian 特征值正则化优化 CTR 预测模型
通过优化的角度来解决 CTR 预测问题,研究发现 CTR 预测中最大的挑战在于特征频率与最大海森矩阵特征值之间的正相关关系,即频繁出现的特征倾向于收敛于尖锐的局部最小值,从而导致亚优化性能。基于锐度感知最小化的最新进展,我们提出了一种专门为 - 优化在双下降中的作用理解
通过优化视角,我们研究了模型智能双下降现象,提出了一种简单的基于优化的解释,同时证明了多样的因素对于模型智能双下降的贡献,并且通过一系列实验展示了这种基于优化的统一观点,从而得出结论:模型智能双下降在实际的机器学习环境中很不可能出现问题。
- 知识蒸馏在部分方差降低方面发挥作用
本文揭示了知识蒸馏方法的内在机制,对应于一种新型的随机方差缩减机制。通过在线性模型和深度线性模型的背景下实现这一方法,表明知识蒸馏可以降低随机梯度噪声,从而减少模型复杂度,但是需要进行参数化的调整。