Jul, 2018

贝叶斯过滤统一自适应和非自适应神经网络优化方法

TL;DR通过贝叶斯滤波的方法,我们提出了一种新的神经网络优化器AdaBayes,能够自适应地在SGD和Adam之间切换,并且能够恢复出AdamW的效果,同时具有和SGD相当的泛化性能。