AAAISep, 2021

IFBiD: 推理无关的偏差检测

TL;DR利用卷积神经网络的权重分析来检测模型的偏差,本文在使用有色 MNIST 数据库的玩具例子和使用最先进的方法和实验资源进行性别识别的现实案例研究中,发现无需对特定输入进行模型推理,查看权重即可判断模型是否存在偏差。在 MNIST 模型中,我们能够以超过 99% 的准确率检测出是否存在强烈或微弱的偏见,并且还能以超过 70% 的准确率分类四个偏见水平。对于面部模型,我们在区分针对亚洲人、黑人或白人的有偏见模型方面实现了 90% 的准确率。