BriefGPT.xyz
May, 2024
过参数化神经网络中的对称性:一种均场视角
Symmetries in Overparametrized Neural Networks: A Mean-Field View
HTML
PDF
Javier Maass Martínez, Joaquin Fontbona
TL;DR
我们以平均场(Mean-Field)视角分析参数过多的人工神经网络在对称数据条件下的学习动态,探讨了采用随机梯度下降和可能的对称性增强技术(如数据增广、特征平均或等变体系结构)训练的广义浅层网络的学习动态,研究结果发现在对称数据的情况下,数据增广、特征平均和自由训练的模型在平均场动态下具有相同的行为。
Abstract
We develop a
mean-field
(MF) view of the learning dynamics of overparametrized
artificial neural networks
(NN) under data symmetric in law wrt the action of a general compact group $G$. We consider for this a cla
→