COLINGDec, 2020

通过动态自动冲突解决改善人工标记的数据

TL;DR本文提出了一种可扩展的方法,用于评估典型众包语义注释任务产生的标签嘈杂程度并减少标注过程中的错误,称之为动态自动冲突解决 (DACR)。该方法无需基本真值数据集,而是基于项目间注释不一致性,从而使 DACR 不仅更加准确,而且适用于各种标注任务。本文介绍了 DACR 在商业个人助手的大规模文本分类任务中的结果,并评估了与其他常见标注策略相比发现的内在歧义。