神经网络谱范数归一化边缘界限的 PAC-Bayesian 方法
本文提出了一种基于边界的多类神经网络概化界限,其与神经网络谱规范化的 “谱复杂度” 成比例,谱规范化的含义是权重矩阵谱范数的乘积与一定的校正因子。在 mnist 和 cifar10 数据集上,使用 SGD 训练标准的 AlexNet 网络进行了实验研究,同时使用原始标签和随机标签,结果显示:界限、Lipschitz 常数和超限风险都直接相关,这表明 SGD 选择的预测器的复杂度与学习任务的难度成比例。
Jun, 2017
深度神经网络容易受到对抗性攻击的影响,本研究聚焦于鏈基于 PAC-Bayes 方法的基于范数复杂性,并提供了一种光谱正则化的鲁棒泛化边界,相比现有边界,该边界不依赖于额外假设且更加紧致,进一步将结果拓展到抵抗一般非 l_p 攻击和其他神经网络架构。
Oct, 2023
本文基于 PAC-Bayesian 方法推导出了两种主要的图神经网络(GCNs 和 MPGNNs)的泛化界,进一步显示节点最大度数和权重的谱范数支配了这两种模型的泛化界。
Dec, 2020
在这篇论文中,我们使用 PAC-Bayesian 框架为两种流行的图神经网络,图卷积网络(GCN)和消息传递图神经网络,提供了对抗鲁棒性泛化界限的结果。我们的结果揭示出图上扩散矩阵的谱范数、权重的谱范数以及扰动因子决定了这两个模型的鲁棒性泛化界限。同时,我们的界限避免了在标准设置中指数依赖于最大节点度的问题。作为推论,我们在标准设置中为 GCN 导出了更好的 PAC-Bayesian 鲁棒性泛化界限,避免了在(Liao 等人,2020)中对最大节点度的指数依赖。
Feb, 2024
本文研究了过参数化的深层网络使用随机梯度下降法(SGD)能够良好推广的能力,提出了一种 PAC-Bayesian 框架,利用这种能力为原始网络提供界限,同时不会受到权重矩阵谱范数乘积的影响。
May, 2019
本论文提出通过四个可导且计算速度高的界来计算二维卷积层的谱范数并将四个界的最小值作为卷积层谱范数的紧致可导下界,在 MNIST 和 CIFAR-10 上实验并证明其有效提高了深度网络的泛化性和鲁棒性。
Nov, 2019
提出一种实用的 PAC-Bayes 训练框架,通过使用无需多重超参数调整的算法,结合 Stochastic Gradient Descent(SGD)或 Adam 优化算法和正则化技术等方法,实现了与常规方法相当的测试性能,同时实现了深度神经网络的鲁棒性和可解释性。
May, 2023
本研究旨在通过使用谱规范化方法,为深度神经网络在对抗性环境下的训练提供一种有效的正则化策略,以解决其在输入微小的对抗性扰动下缺乏鲁棒性的问题。同时,我们将边界损失延伸到对抗性环境,并限制了多个梯度攻击方案下深度神经网络的泛化误差。
Nov, 2018
在这篇论文中,我们推导了一个 PAC-Bayes 界限,用于一类特殊的离散时间非线性动力系统的监督时间序列设置。这个类别包括稳定的递归神经网络(RNN),而这项工作的动机就是应用于 RNN。我们在允许的模型上施加一些稳定性约束,这里的稳定性是以动力系统的概念来理解的。对于 RNN,这些稳定性条件可以表示为关于权重的条件。我们假设所涉及的过程在本质上是有界的,并且损失函数是利普希茨的。所提出的对于泛化差距的界限依赖于数据分布的混合系数和数据的本质上最大值。此外,随着数据集大小的增加,这个界限收敛于零。在这篇论文中,我们 1)正式化了学习问题,2)为这类系统推导了一个 PAC-Bayesian 误差界限,3)讨论了这个误差界限的各种结果,以及 4)展示了一个说明性例子,并讨论了计算所提出的界限的方法。与其他可用的界限不同,这个推导的界限适用于非独立同分布的数据(时序数据),并且它不随 RNN 的步骤数增长。
Dec, 2023