ICLRJun, 2020

MCAL:最小成本人机主动标注

TL;DR本文提出了一种迭代方法,通过联合确定用人工分标注哪些样本和用训练有素的分类器进行标注哪些样本来最小化总体成本,从而解决通过云端注释服务生成数据集的成本过高的问题。作者在 Fashion-MNIST、CIFAR-10、CIFAR-100 和 ImageNet 等公共数据集上验证了该方法,并表明其总成本比完全使用人工标注数据集的成本低 6 倍,且始终比最便宜的竞争策略便宜。