Oct, 2022
检测有毒语料库中的意外社会偏见
Detecting Unintended Social Bias in Toxic Language Datasets
TL;DR本研究介绍了一个新的数据集ToxicBias,这是从Kaggle竞赛中现有的数据集“Jigsaw Unintended Bias in Toxicity Classification”中精心策划的,旨在检测社交偏见及其类别和目标群体。我们使用我们策划的数据集对基于转换器的模型进行训练,并报告了偏见识别、目标生成和偏见影响的基线性能。研究还详细讨论了模型偏见及其缓解。