Oct, 2022

通过对抗属性邻域强化学习实现公平

TL;DR提出一种基于 Robust Adversarial Attribute Neighbourhood (RAAN) Loss 的公平分类模型优化方法,将样本划分为不同的敏感属性群组并使用对抗性的鲁棒权重来调整模型,达到不同群组之间分布更公平的目的。并提出了 stochastic adaptive (Adam-style) 和 non-adaptive (SGD-style) 算法框架,具有可证明的理论保证,实验证明该方法有效。