Apr, 2021
大规模图像分类数据集高效标注的良好实践
Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets
TL;DR本文研究了一种高效的策略收集多类别图像集的分类标签,使用自监督学习技术并将标注问题视为半监督学习问题,并提出了有效的标注指南,用此方案对ImageNet100图像集进行模拟实验,结果表明每张图像平均仅需0.35个标注,即可标注到80%的top-1准确率,相比之前的工作和手动注释,分别提高了2.7倍和6.7倍。