Apr, 2023
离散与连续权重的非凸神经网络中的典型和非典型解
Typical and atypical solutions in non-convex neural networks with discrete and continuous weights
Carlo Baldassi, Enrico M. Malatesta, Gabriele Perugini, Riccardo Zecchina
TL;DR本文研究了二进制和连续的负边缘感知器作为学习随机规则和关联的简单非凸神经网络模型,并探讨了两种模型解决方案的几何学特征。结果发现,即使在高度非约束的情况下,存在大量的极宽、极平的最小值,这有助于提高学习器的泛化性能。