Sep, 2024

通过类别低方差正则化实现下游任务中的无标签去偏倚

TL;DR本研究解决语言模型在下游任务中重新引入偏见的问题,现有的方法需依赖受保护属性标签或偏见指示词。我们提出了一种新颖的去偏倚正则化技术,基于嵌入的类别方差,不需要属性标签,并能够针对任意属性。实验结果表明,该方法在保持目标任务性能的同时,优于依赖目标属性标签的现有去偏倚基线。