Feb, 2024

泛化与平坦极小之间的 PAC-Bayesian 联系

TL;DR现代机器学习通常涉及超参数设置(训练参数数量大于数据集大小),它们的训练结果不仅在训练数据上表现良好,而且具有良好的泛化能力。本文通过与 PAC-Bayes 工具箱相结合的 Poincaré 和 Log-Sobolev 不等式提供了新的包含梯度项的泛化界限,避免了对预测空间维度的明确依赖。我们的结果突出了 “平坦极小值” 对泛化性能的积极影响,直接涉及了优化阶段的益处。