Jun, 2023

重尾 SGD 训练的超参数神经网络的隐式可压缩性

TL;DR本研究提出了一种基于随机梯度下降和添加重尾噪声的简单修改方法,使算法输出可压缩。研究表明通过增加隐藏层减小过拟合,该方法在训练和测试误差上拥有更高的压缩性。