ACLMar, 2022

ToxiGen:一个大规模机器生成的用于对抗和隐式仇恨言论检测的数据集

TL;DR本论文介绍了 ToxiGen,一个新的大规模自动生成的 274k 毒性和良性陈述数据集,用于检测涉及 13 个少数群体的文本。通过使用基于展示的提示框架和诱导循环解码方法来生成微妙的毒性和良性文本,ToxiGen 能够覆盖范围更广的暗含毒性文本,包括更多样化的人口群体。与此同时,研究者通过人类评估表明,94.5%的毒性示例被人类标注者标记为仇恨言论。合理的数据利用对文本分类器的提高有积极的作用。