Apr, 2021

通过强化校准缓解语言模型中的政治偏见

TL;DR本文提出了度量 GPT-2 生成中政治偏差的度量标准,并提出了一种强化学习框架来减轻生成文本中的政治偏差。在三个属性上的实证实验中,我们的方法减少了偏见,同时保持了可读性和语义连贯性。