ACLOct, 2021

清洗或标注:如何使用有限的数据采集预算

TL;DR本文提出了一种通过在注释过程中专门清理高概率错误样本的方法,以优化注释过程,并在三种模型变化和四个自然语言处理任务上进行的实验证明,该方法在分配相同的有限注释预算时优于聚合注释和高级去噪方法。