Apr, 2023

深度神经网络中的公平性缺陷信息论测试与调试

TL;DRDICE 是一种信息论测试和调试框架,通过量化含有决策数据的受保护信息来识别和定位深度前馈神经网络中的公平缺陷,在此基础上提出了一种因果调试框架来定位不足训练的层和神经元,并通过实验有效地生成有歧视性的实例。