EMNLPSep, 2021

同意不同意:在冒犯性词语数据集上注释注解者的不同意见

TL;DR本文提出了一种用于创建自然语言数据集的方法,通过将标注者的观点选为不同的训练集和测试集,可以提高分类器的性能和鲁棒性,为社交媒体中的恶意语言检测提供更好的数据准备。