Jul, 2018

贝叶斯过滤统一自适应和非自适应神经网络优化方法

TL;DR通过贝叶斯滤波的方法,我们提出了一种新的神经网络优化器 AdaBayes,能够自适应地在 SGD 和 Adam 之间切换,并且能够恢复出 AdamW 的效果,同时具有和 SGD 相当的泛化性能。