May, 2023

如何逃离尖锐的极小值

TL;DR探讨了如何高效地找到近似的优化算法的平坦极值,提出了基于梯度和随机扰动的算法,在训练数据成本函数的情况下,提出了更快的算法。