ICLRMay, 2023

ISAAC Newton:基于输入的牛顿法近似曲率

TL;DR我们提出了 ISAAC(基于输入的近似曲率),一种使用选择的二阶信息来调节梯度的新方法,其计算开销渐近消失,假设批量小于神经元数量。我们表明,可以基于相应层的输入计算出一个良好的调节器,而不会有大量的计算开销。该方法允许在小批随机模式下进行有效训练,这使它能够与一阶和二阶方法相竞争。