May, 2022

RaFoLa: 检测强制劳动指标的基于理由注释的语料库

TL;DR本研究提供第一个公开可访问的英文语料库,其中包括了由专业数据源检索到的 989 篇新闻文章,并根据 ILO 的风险指标对其进行了注释。对于每篇新闻文章,都进行了两个方面的注释:强迫劳动的指标作为分类标签和证明标注决策的文本片段。数据集可促进关于多类别和多标签文本分类的可解释性的研究。