Dec, 2020

利用模型解释探究图像分类中的偏差

TL;DR本文通过突出有歧视的特征从而消除对敏感属性的依赖来评估模型解释是否能够高效检测图像分类中的偏见,发现模型解释的弱点在于难以准确评估偏见程度、可能引入额外的偏见分析并且有些情况下效率不高。