May, 2023

有偏差 SGD 指南

TL;DR本文分析了带偏估计器的随机梯度下降(BiasedSGD)算法在凸和非凸环境下的效果并比较了带偏估计器和无偏估计器的优缺点,同时提出了一组新的比以往任何假设更弱的假设,并通过实验结果验证了理论发现。