EMNLPOct, 2023

K-HATERS:针对特定目标的韩文仇恨言论检测语料库

TL;DR本研究介绍了 K-HATERS,这是一种用于韩文中仇恨言论检测的新语料库,其中含有大约 192K 个新闻评论,附有针对特定目标的冒犯程度评分。该语料库是韩文中最大的冒犯性语言语料库,是首个提供针对三级李克特量表的特定目标评分的语料库,能够检测韩文中不同程度的仇恨表达。我们进行实验来展示该语料库的有效性,并与现有数据集进行比较。此外,为了解决人类注释中的潜在噪声和偏差,我们探索了一种新颖的想法,即采用认知反思测试作为标签质量的代理。研究结果表明,得分最低的个体的注释往往会导致针对特定目标群体的预测模型存在偏差,且准确性较低。本研究对于仇恨言论检测和资源构建的自然语言处理研究具有重要贡献。您可以在该 URL 访问代码和数据集。