ICMLMay, 2020

关于数据增强中线性变换的泛化效果

TL;DR本文考察了一系列线性变换及其对于过参数化线性回归问题中的岭回归估计量的影响,证实了保留数据标签的变换能够通过扩大训练数据空间来提高估计精度,而混合数据的变换则能够达到一种正则化效果。在此基础上,提出一种根据模型不确定性搜索变换空间的数据增强方案,并在图像和文本数据集上测试,证实了其表现优于已有的 RandAugment 方法及能够达到现有 SoTA 方法的精度。