Mar, 2018

深度学习中块坐标下降的全局收敛性

TL;DR本文介绍了一种针对深度学习中常用的两分和三分网络结构的 Block Coordinate Descent 方法,论证了它的全局收敛性和迭代收敛速度。