Oct, 2021

数据会在深度学习中引起容量控制吗?

TL;DR通过对分类数据集进行研究,我们发现输入相关矩阵的特征值谱具有指数级范围的均匀分布特征,这种结构体现在训练出的网络的 Hessian 矩阵和 Fisher 信息矩阵的特征值谱中,我们称这种特征值谱为 “懒散”,我们还发现非懒散的训练集可能导致深度学习模型泛化性能降低,最后我们提出一种基于这个发现的数据分布依赖型 PAC-Bayes 先验,可以实现准确的泛化边界估计。