ICLRNov, 2016

深度学习中的身份问题

TL;DR该研究提出了深度学习中的 identity parameterization 理论,从理论和实验方面探讨了残差网络的优越性,证明了含 ReLU 激活的残差网络在可表示样本函数的有限表达能力方面优于单纯的前馈网络,并提出了不含 batch normalization, dropout 或 max pool 的残差卷积层和 ReLU 激活的新型网络架构,在 CIFAR10,CIFAR100 和 ImageNet 分类基准测试中表现显著提高。