Jun, 2020

熵梯度下降算法与宽平坦最小值

TL;DR论文讨论了神经网络的经验风险景观的平坦极小值的特性,提出了增加最大平坦度算法,可以得到更好的分类效果。