Sep, 2014

深度监督网络

TL;DR本文提出了一种名为深度监督网络(DSN)的方法,该方法同时最小化分类错误并使隐藏层的学习过程变得直接和透明;通过研究深层网络中的新表述,从卷积神经网络结构的三个方面来提高分类性能:中间层到整体分类的透明度、学习特征的区分能力及健壮性(特别是在早期层),以及存在爆炸和消失梯度的有效训练。我们在个别隐藏层中引入 “伴随目标”,并结合随机梯度方法来分析算法。实验结果表明,相对于现有方法,我们的方法具有显著的性能提升(例如在 MNIST,CIFAR-10,CIFAR-100 和 SVHN 等基准数据集上的表现均优于现有技术的最新水平)。