EMNLPSep, 2021
同意不同意:在冒犯性词语数据集上注释注解者的不同意见
Agreeing to Disagree: Annotating Offensive Language Datasets with Annotators' Disagreement
Elisa Leonardelli, Stefano Menini, Alessio Palmero Aprosio, Marco Guerini, Sara Tonelli
TL;DR本文提出了一种用于创建自然语言数据集的方法,通过将标注者的观点选为不同的训练集和测试集,可以提高分类器的性能和鲁棒性,为社交媒体中的恶意语言检测提供更好的数据准备。