Feb, 2024

内容条件去偏差以实现公平的文本嵌入

TL;DR在自然语言处理领域,解决机器学习模型中的偏见问题日益受到关注。本文提出了一种学习公平文本嵌入的新方法,通过确保在内容条件下敏感属性与文本嵌入之间的条件独立性,同时实现公平性并保持效用平衡。通过使用大型语言模型将文本扩充为不同敏感组,解决了缺乏适当训练数据的问题。我们的广泛评估表明,我们的方法在提高公平性的同时保持了嵌入的实用性,是在实现公平文本嵌入的条件独立性方面的先驱性工作。