Oct, 2018

Kalman 梯度下降:随机优化中自适应方差减小

TL;DR介绍一种使用卡尔曼过滤器进行随机优化的算法,并分析了其在非凸设置下收敛性的理论,并在神经网络和黑盒变分推理等许多机器学习领域上展示了其改进的性能。同时,介绍了一种分布式版本的算法,并将其扩展到 SGD 动量和 RMSProp。