Nov, 2023

微妙的女性歧视检测与缓解:一个由专家注释的数据集

TL;DR使用新颖的数据集开发方法,Biasly 数据集以与文献中独特的方式捕捉了对女性的厌恶的微妙之处。与多领域专家和标注员合作构建的数据集包含了电影字幕的标注,捕捉了北美电影中的口语表达对女性的厌恶。该数据集可用于各种 NLP 任务,包括分类、严重程度评分回归和文本重写的生成。在本文中,我们讨论了所使用的方法学,分析了获得的标注,并在对女性厌恶检测和缓解的背景下使用常见的 NLP 算法提供了基线。我们希望这项工作能促进 AI 在 NLP 中的社会价值,用于偏见检测、解释和消除。