Nov, 2020

基于 Wasserstein 的机器学习模型公平性解释框架

TL;DR本文介绍了一种公平解释性框架,用于在分布级别上测量和解释分类和回归模型中的偏见。通过使用 Wasserstein 度量,在模型输出的亚群分布上测量模型偏差,考虑模型和预测变量相对于非受保护类的有利性,使用运输理论进行量化,并通过博弈理论的技术实现偏见解释的可加性。