Nov, 2023

一种计算高效的稀疏化在线牛顿方法

TL;DR我们介绍了一种记忆高效的二阶算法:Sparsified Online Newton (SONew) 方法,并将其用于大规模基准测试中,获得了更快的收敛速度、更好的验证性能和更高的训练损失改善。该方法利用结构化稀疏模式来加速收敛,同时相对于其他记忆高效的一阶方法而言,实现上更简单且更易于扩展。