Oct, 2020

训练速度和模型选择的贝叶斯视角

TL;DR从贝叶斯角度出发,通过线性模型的训练速度和边缘似然之间的联系揭示其两个主要见解,即模型的训练速度可以用来估计其边缘似然,同时在一定条件下,这个度量量可以预测线性模型组合中模型的相对权重,实验证明这种直觉在深层神经网络的无穷宽度限制和随机梯度下降的训练中也成立,我们的结果揭示了一个指向解释为什么使用随机梯度下降训练的神经网络会偏向于良好泛化的函数的有希望的新方向。