May, 2024

过参数化神经网络中的对称性:一种均场视角

TL;DR我们以平均场(Mean-Field)视角分析参数过多的人工神经网络在对称数据条件下的学习动态,探讨了采用随机梯度下降和可能的对称性增强技术(如数据增广、特征平均或等变体系结构)训练的广义浅层网络的学习动态,研究结果发现在对称数据的情况下,数据增广、特征平均和自由训练的模型在平均场动态下具有相同的行为。