BriefGPT.xyz
Dec, 2019
深度神经网络中可训练性和泛化能力的分离
Disentangling trainability and generalization in deep learning
HTML
PDF
Lechao Xiao, Jeffrey Pennington, Samuel S. Schoenholz
TL;DR
本文通过分析神经核算法的光谱,提供了对于训练和推广条件的表征,特别地,在讨论极深和宽的神经网络时,发现神经核数仅仅维持有限的数据相关性,并考虑各种网络模型在很大的超参数空间区域内训练集过度拟合而且通常无法推广;同时,与深度神经网络及其卷积形式的全局平均池化相关的理论和实验结果得到了分析。
Abstract
A fundamental goal in
deep learning
is the characterization of
trainability
and
generalization
of neural networks as a function of their a
→