ICMLJul, 2020

在少数据情况下,添加表面上无用的标签有助于 improving

TL;DR本文研究表明,使用大规模数据集训练的网络之所以具有良好的泛化能力,并非仅仅因为有众多的训练示例,还因为类别的多样性鼓励了富有表现力特征的学习。当数据匮乏时,使用额外的标签进行学习是否仍然具有优势?本文针对乳腺 X 光图像中的肿瘤分割任务展开研究。我们发现,在低数据设置下,通过将专家注释与非专家注释者提供的看似无关乎的标签相结合,将任务变为多分类问题,可以提高性能。我们揭示了这些增益在专家数据较少时增加的情况,并通过进一步的研究揭示了几个有趣的属性。我们在 CSAW-S 上证明了我们的发现,并在两个公共数据集上进行了确认。