May, 2022

公平自然语言处理的扰动增强

TL;DR本研究探讨了在人口统计方面出现的偏差对自然语言处理中的模型和数据集的影响,通过对大量的人工标注文本扰动数据的训练,得出采用人口统计扰动数据进行预训练和调优可以使语言模型更加公平,并且能在不牺牲下游任务性能的前提下减少模型的偏差。