May, 2016
无梯度训练神经网络:一种可扩展的 ADMM 方法
Training Neural Networks Without Gradients: A Scalable ADMM Approach
Gavin Taylor, Ryan Burmeister, Zheng Xu, Bharat Singh, Ankit Patel...
TL;DR本文提出了一种不依赖于梯度的训练方法,该方法使用交替方向方法和 Bregman 迭代来训练神经网络,以解决传统优化算法在大规模集群设置中不适用的问题,并在分布式环境中实现了线性加速。