ICLRSep, 2018

用于 SGD 的矩阵李群上的预条件器

TL;DR本文研究了两种类型的预处理器和预处理随机梯度下降(SGD)方法,这些预处理器可以从一个框架中导出,并且可以在用户指定的任何矩阵李群上使用自然或相对梯度下降进行有效估计。