ICLROct, 2022
数据增强价值的探究:关于规模定律、不变性和隐式正则化的调查
How Much Data Are Augmentations Worth? An Investigation into Scaling Laws, Invariance, and Implicit Regularization
Jonas Geiping, Micah Goldblum, Gowthami Somepalli, Ravid Shwartz-Ziv, Tom Goldstein...
TL;DR本文旨在研究数据扩展的机制,通过评估增强数据与额外真实数据之间的交换率发现,多样而不一致的增强数据可以比额外的训练数据更有价值,在小和中型训练集上,鼓励不变性的数据扩展可以比不变性本身更有价值,并证明了增强数据在训练过程中引入额外的随机性,从而有效地平稳了损失函数。