EMNLPMay, 2022
在综合描述符数据集中发现语言模型中的新偏见
"I'm sorry to hear that": Finding New Biases in Language Models with a Holistic Descriptor Dataset
Eric Michael Smith, Melissa Hall, Melanie Kambadur, Eleonora Presani, Adina Williams
TL;DR本文介绍了一种全新的包含 13 个不同人口统计学轴线近 600 个描述符的、基于 HolisticBias 的更加包容性的偏差测量数据集,结合一组偏差测量模板产生超过 45 万个独特的句子提示,用于探索、识别和减少几个生成模型中的新型偏差。