Jun, 2015
预训练和 Dropout 的收敛速率:通过网络结构指导学习参数
Convergence rates for pretraining and dropout: Guiding learning
parameters using network structure
TL;DR本文探讨了网络结构、学习机制和参数收敛速率之间的关系,提出了一种基于一阶信息的通用顺序反向传播方法,并将去噪自动编码器和dropout方法应用到该方法中,通过界定深度网络的收敛速率来提供学习参数和网络大小选择方面的见解。