May, 2017

神经网络的对角缩放

TL;DR定义了一种二阶神经网络随机梯度训练算法,其块对角结构有效地实现了单元激活的归一化,并研究了该算法在稳健性方面的不足之处,揭示了步长缩放的新方式以及处理成本曲率快速变化的重要性。