Apr, 2024

Bipol 下的数据偏差:男性天生右派,女性的角色是跟随他们的领导

TL;DR我们介绍了关于三种语言中偏见的新的大型标记数据集,并通过实验证明了在评估的 5 种语言中的 10 个数据集中都存在偏见,包括英语 GLUE/SuperGLUE 排行榜上的基准数据集。 我们使用 SotA 多语言预训练模型 mT5 和 mBERT 对这些数据集进行了基准测试。在 AI 和大型语言模型(LLMs)的最新事件中,基于偏见的社会偏见是无处不在的。受到这一挑战的驱使,我们开始估计多个数据集中的偏见。我们比较了一些最近的偏见指标,并使用具有度量解释性的 bipol。我们还通过使用 95%的置信水平和 7%的误差范围在有害评论的数据集群中随机抽取了 200 个样本,以确认没有经过验证的假设即偏向存在。 在 200 个样本中,有 30 个样本被随机分布以确保标注的质量。我们的研究结果确认了许多数据集存在男性偏见(对女性的偏见),除其他类型的偏见。我们公开发布了新的数据集、词典、模型和代码。