Dec, 2019

深度神经网络中可训练性和泛化能力的分离

TL;DR本文通过分析神经核算法的光谱,提供了对于训练和推广条件的表征,特别地,在讨论极深和宽的神经网络时,发现神经核数仅仅维持有限的数据相关性,并考虑各种网络模型在很大的超参数空间区域内训练集过度拟合而且通常无法推广;同时,与深度神经网络及其卷积形式的全局平均池化相关的理论和实验结果得到了分析。