May, 2023

稀疏和密集神经网络小批量大小的相变

TL;DR本研究在教师 - 学生模型下,以不同复杂度的任务为研究对象,探究了小批量训练方式对两层神经网络学习的影响。结果发现,小批量大小对学生的泛化性能有显著影响,当小批量大小小于阈值时,学生无法学习;而当小批量大小大于阈值时,学生可以完美学习或非常好地泛化至教师。此外,发现通过改变小批量大小可以引起相变,也带出了有关超参数的重要问题。