Apr, 2024

充分利用数据:改变训练数据分布以提高内分布泛化性能

TL;DR我们通过比较梯度下降(GD)和锐度感知最小化(SAM)的归纳偏差,证明了SAM在早期阶段更均匀地学习易于和困难的特征,因此我们提出了一种基于网络输出的示例聚类算法并上采样那些没有易于特征的示例,从而改善了原始数据分布上(S)GD的泛化性能。同时,我们证明该方法与SAM和现有的数据增强策略相结合,在CIFAR10、STL10、CINIC10、Tiny-ImageNet上训练ResNet18,在CIFAR100上训练ResNet34,以及在CIFAR10上训练VGG19和DenseNet121中,取得了目前最佳的性能。