Apr, 2024

充分利用数据:改变训练数据分布以提高内分布泛化性能

TL;DR我们通过比较梯度下降(GD)和锐度感知最小化(SAM)的归纳偏差,证明了 SAM 在早期阶段更均匀地学习易于和困难的特征,因此我们提出了一种基于网络输出的示例聚类算法并上采样那些没有易于特征的示例,从而改善了原始数据分布上(S)GD 的泛化性能。同时,我们证明该方法与 SAM 和现有的数据增强策略相结合,在 CIFAR10、STL10、CINIC10、Tiny-ImageNet 上训练 ResNet18,在 CIFAR100 上训练 ResNet34,以及在 CIFAR10 上训练 VGG19 和 DenseNet121 中,取得了目前最佳的性能。