- 自适应对抗性交叉熵损失用于尖锐感知最小化
近期学习算法的进展表明,损失曲面的陡峭程度是提高泛化差距的有效指标。本研究引入创新的方法进一步增强模型泛化能力,提出了自适应对抗交叉熵(AACE)损失函数替代 Sharpness-Aware Minimization(SAM)的扰动,同时提 - 分子图转换模型的高效锐度感知极小化优化
通过近似梯度和损失景观的限制,GraphSAM 算法减少了 Sharpness-aware minimization(SAM)的训练成本,并提高了图变压器模型的泛化性能。
- 渐进无偏样本采样加速尖锐感知最小化
使用渐近无偏采样技术加速 Sharpness-Aware Minimization (SAM) 优化算法,提供超过 70% 的加速效果,同时保持性能。
- 无偏锐度感知最小化
在这项工作中,我们探索了锐度感知极小化(SAM)和模型不可知元学习(MAML)之间的联系,特别是在增强模型泛化方面。我们引入了一种新方法 Agnostic-SAM,它结合了 SAM 和 MAML 的原则。Agnostic-SAM 通过优化模 - ICMLSAM 动力学中的模型偏差扰动式遗忘
基于 SAM 的训练动力学,我们提出了扰动遗忘的新观点,以解释 SAM 的学习信号对泛化性能的改进,我们的结果表明,SAM 的好处可以通过一种不需要损失函数平坦性的替代机制原理来解释。
- 通过平衡学习提高特征质量的锐度感知最小化
Sharpness-Aware Minimization (SAM) 提供了一种替代随机梯度下降(SGD)的有效优化器,该方法通过平衡特征质量来改善数据集中冗余特征的学习。
- 局部估计的全局扰动优于本地扰动的联邦锐度感知最小化
通过在联邦学习中本地估计全局扰动的方向,FedLESAM 算法提高了联邦 Sharpness-Aware Minimization(SAM)方法的质量和效率。
- SADDLe: 具有异构数据的尖锐感知去中心化深度学习
本文提出 SADDLe,一种利用 Sharpness-Aware Minimization (SAM) 的锐度感知的分布式深度学习算法,以解决分布式训练中的局部过拟合、全局模型泛化不佳和高通信成本等实际挑战。实验结果表明,与现有技术相比,S - MM遗传编程中的适应度敏感最小化
通过利用两种简单的方法来利用程序树的输入和输出进行扰动,适应性最小化(SAM)被用于树形遗传编程(TGP)来估计锋利度并用作进化过程中的第二个优化标准。实验结果表明,在 TGP 中使用任何两种提议的 SAM 改进方法都能显著减少种群中的树大 - 回归中进化特征构建的锐度感知最小化
通过使用 PAC-Bayesian 理论中的 sharpness-aware 最小化方法,在语义空间中寻找表现稳健的符号特征,该方法能够有效减轻遗传规划的过拟合问题,并在限定实例数量和标签噪声存在的情况下表现优于标准遗传规划和其他先进的复杂 - SAM 对标签噪声具有鲁棒性的原因
Sharpness-Aware Minimization 对标签噪声鲁棒性的理解需要考虑到对误差曲面中 “较平坦” 区域最小值的鲁棒性以及提前停止对峰值性能的影响。通过对 logit 项和网络 Jacobian 的改变进行分解,我们推断深层 - 充分利用数据:改变训练数据分布以提高内分布泛化性能
我们通过比较梯度下降(GD)和锐度感知最小化(SAM)的归纳偏差,证明了 SAM 在早期阶段更均匀地学习易于和困难的特征,因此我们提出了一种基于网络输出的示例聚类算法并上采样那些没有易于特征的示例,从而改善了原始数据分布上(S)GD 的泛化 - 重新审视随机参数扰动以有效地提升泛化能力
通过对随机权重扰动的目标进行最小化以提高泛化能力的研究表明,改进深度神经网络(DNNs)的泛化能力是机器学习中的一个基本挑战。通过两个分支方法提出了分别由锋利度感知最小化(SAM)和随机权重扰动(RWP)引导的方法,通过对最差情况邻域损失进 - CVPR友好的锐度感知最小化
SAM 的关键组件有助于改进模型泛化性能,而 F-SAM 则通过移除全梯度成分并利用随机梯度噪声来进一步提高模型的泛化性能。
- ICLR领域一致性降低的未知领域泛化方法
这篇论文介绍了一种针对域泛化的目标,将参数和数据扰动区域结合起来进行域泛化,以减少源域与未知域之间的损失景观不一致性,实验证实了该方法在多个域泛化基准数据集上的性能优于现有方法,尤其是在对域信息限制较多的情况下显示出了显著改进。
- FlatNAS:优化神经架构搜索中的平坦度,提升抗越界鲁棒性
该研究引入了一种名为 Flat Neural Architecture Search (FlatNAS) 的新型 NAS 解决方案,其探索了基于对权重扰动的鲁棒性和使用 Sharpness-Aware Minimization (SAM) - 通过方差估计加速锐度感知最小化的有效梯度样本大小
通过采用自适应采样方法基于 PSF 变化的原则,本文提出了一种简单且高效的采样方法,以显著加速模型优化过程中的计算速度,并在广泛的网络架构上实现了与 SAM 相当的最新准确度。
- WWWHelen: 频率导向 Hessian 特征值正则化优化 CTR 预测模型
通过优化的角度来解决 CTR 预测问题,研究发现 CTR 预测中最大的挑战在于特征频率与最大海森矩阵特征值之间的正相关关系,即频繁出现的特征倾向于收敛于尖锐的局部最小值,从而导致亚优化性能。基于锐度感知最小化的最新进展,我们提出了一种专门为 - 关于尖锐度感知极小化和对抗性训练之间的对偶性
通过对比 Adversarial Training (AT) 和 Sharpness-Aware Minimization (SAM) 的对偶关系,本研究发现单独使用 SAM 可以提高对抗性稳健性,同时不牺牲准确性,这为将 SAM 作为准确 - 通过简单的重标准化策略稳定锐度感知最小化
通过提出稳定的 SAM 策略,我们解决了使用 SAM 训练神经网络的不稳定性问题,并通过理论分析发现稳定 SAM 在扩展学习率范围内能够比 SAM 表现更好,并在多个数据集和任务上验证了其改进的性能。