Jan, 2019

避免偏见的对抗性分布:无需重新训练的修复方法

TL;DR利用机器学习模型的输出和输入的概率分布对基于敏感属性(如性别或种族)的性能不均衡进行量化,并通过扰动劣势群体的输入变量的分布来减少固定分类模型对感兴趣人群的影响,从而通过数据预处理器实现消除性能差异的目的。