Apr, 2023

反犹信息?高质量注释指南和推文标注数据集指南

TL;DR构建了一个进行反犹太主义言论自动检测的标注过的数据集,该数据集通过有关关键词,并给予标注人员对一个常用定义的反犹太主义进行刻意强制应用来涵盖广泛的讨论主题,并包括 1250 条符合国际大屠杀纪念联盟关于反犹太主义的定义,并且未被错误标记的推文,该数据集是针对 Twitter 在 2019 年 1 月至 2021 年 12 月期间的英文推文。