ACLMay, 2022

通过开放式语言生成测量偏见的挑战

TL;DR本文分析了影响社会偏见结果的文本补全的具体选择、度量、自动工具和抽样策略,发现在不同的实验设置下,测量偏见的实践很容易产生相互矛盾的结果,并提供了有关开放式语言生成中报告偏见的建议,从而更完整地展示给定语言模型所展示的偏见。