ICLRNov, 2020

方向很重要:关于中等学习率的随机梯度下降的隐式偏差

TL;DR本研究针对模型学习速率为中等并逐渐降低的情况,研究了 SGD 和 GD 在超参数调节中的常见行为,以此试图解决机器学习中的算法偏差问题,并得出了不同方向偏差可能导致最终预测结果差异的结论。