Mar, 2024

基于核视角的两层神经网络的均场分析

TL;DR在这篇论文中,我们通过核方法的视角研究了两层神经网络在均场极限下的特征学习能力。我们利用两个时间尺度的极限来聚焦于第一层产生的核动态,从而将学习问题转化为对内在核的最小化问题。我们还展示了均场 Langevin 动力学的全局收敛性,并推导了时间和粒子离散化误差。此外,我们证明了两层神经网络可以比任何核方法更高效地学习多个再现核希尔伯特空间的并集,并且神经网络可以获得与目标函数对齐的数据相关核。我们还开发了一种标签噪声过程,该过程收敛到全局最优解,并展示了自由度作为一种隐式正则化现象。