Apr, 2018

深度学习的信息论视角

TL;DR通过理论分析,文章探讨了深度神经网络的泛化能力与网络深度之间的关系,并且指出卷积层等具有信息损失的深层结构可以提高整个网络的泛化性能。但是随着网络深度的增加,拟合数据的信息损失也会增大,也就是网络深度与训练误差之间有一定的条件关系。此外,文章还表明深度神经网络具有一定的稳定性,随着网络深度的增加,样本复杂度会降低。