May, 2024

解开样本大小和初始效果对单神经元目标完美泛化的影响

TL;DR过参数化模型,如深度神经网络,具有通过较少的采样数据点恢复目标函数的有趣能力。本研究集中研究了单神经元目标恢复场景,并系统地考察了初始化和样本大小对双层神经网络性能的影响。我们的实验证明,更小的初始化尺度与改善泛化有关,并确定了一个关键数量,称为 “初始不平衡比”,它管理着小初始化下的训练动力和泛化能力,该结果得到理论证明的支持。此外,我们经验性地划分了两个关键的样本大小阈值,称为 “乐观样本大小” 和 “分离样本大小”,与已有理论框架相契合。我们的结果表明了模型恢复目标函数能力的一个转变:在乐观样本大小之下,恢复是不可行的;在乐观样本大小时,通过零测度初始化集合,恢复变得可行。当达到分离样本大小时,可以成功恢复目标函数的初始化集合从零测度转变为正测度。这些从简化的背景中得出的见解,为理解过参数化神经网络中完美泛化的复杂性提供了观点。