Jun, 2023

规范层是 Sharpness-Aware 最小化的全部需求

TL;DR本文研究了对小部分参数进行扰动的 Sharpness-aware minimization (SAM) 的性能,并通过实验结果证明,只操作正规化处理中几乎不占比例的仿射变换参数能比全局扰动得到更好的效果。