Oct, 2023

大规模阻尼自然梯度下降的高效数值算法

TL;DR我们提出了一种新的算法,用于在参数数量明显超过可用样本数量的大规模场景中高效解决阻尼 Fisher 矩阵的问题,这对于自然梯度下降和随机重新构建来说非常重要。我们的算法基于 Cholesky 分解,具有广泛的适用性,并且基准结果表明该算法比现有方法快得多。