Dec, 2023

公平 SISA:集成后处理以提高 LLMs 的公平性

TL;DR这篇论文研究了大型语言模型(LLMs)的反学习和公平性之间的相互作用,特别关注了一种称为 SISA 的流行反学习框架的性能 - 公平性权衡,并提出了后处理偏差缓解技术用于 SISA 生成的模型集合,证明其中的一种方法是模型集合的最佳公平预测器,在实验证明了我们提出的后处理框架 'FairSISA' 的有效性。