Dec, 2018

Batch Normalization 自动调速的理论分析

TL;DR本篇论文为Batch Normalization提供理论支持:即使在不同的学习速率下,通过gradient descent求解, BN仍然可以使得收敛的速度达到最佳水平。