Dec, 2023

理解数据增强的有害类级效应

TL;DR数据增强(DA)对模型在图像分类任务中的性能具有关键影响,然而,最近的研究表明,DA 的影响可以高度依赖于类别:达到最佳的平均准确率会显著损害个别类别准确率,如在 ImageNet 上可降低 20%。本研究通过使用更高质量的多标签注释系统地对受影响的类别进行分类,发现大部分类别具有固有的模糊性、共现性或细粒度差异,而 DA 会控制模型对紧密相关类别的偏好。通过基于该框架的简单类别条件的增强策略,我们改善了负面影响类别的性能。