May, 2022

在综合描述符数据集中发现语言模型中的新偏见

TL;DR本文介绍了一种全新的包含13个不同人口统计学轴线近600个描述符的、基于HolisticBias的更加包容性的偏差测量数据集,结合一组偏差测量模板产生超过45万个独特的句子提示,用于探索、识别和减少几个生成模型中的新型偏差。