Apr, 2023

Bipol: 一种新型的 NLP 多轴偏见评估指标和可解释性

TL;DR引入了 bipol,这是一种具有可解释性的新度量,用于评估文本数据中的社会偏见。通过评估两个受敏感术语频率和模型分类影响的过程,我们使用 SotA 架构创建了新模型来检测多个方面的偏见,并评估了两个流行的 NLP 数据集 (COPA 和 SQUAD)。同时,我们还创造了一个含有近 200 万标记样本的大型数据集,以便训练偏见检测模型,并将其公开发布。