Jun, 2024

洗发水前置护理新视角

TL;DRShampoo 是一种二阶优化算法,使用 Kronecker 积预处理器,它近来引起了机器学习界的广泛关注。我们提供了 Shampoo 的最佳 Kronecker 积近似与 Shampoo 使用的近似之间的明确而新颖的联系。我们通过各种数据集和架构的实证研究,证明这种近似非常接近最佳的 Kronecker 积近似。此外,我们还通过实证研究探讨了在 Hessian 近似视角下使用各种实用技巧(如使用批量梯度和经验 Fisher)来提高 Shampoo 的计算效率对 Hessian 近似质量的影响。