关键词discriminatory behavior
搜索结果 - 2
- 机器学习中解释性不可信的原因:对部分依赖图的敌对攻击
该论文提出了一种对机器学习任务中基于排列的解释方法的脆弱性进行揭示的对抗性框架,特别关注了偏依赖图。通过修改原始黑盒模型以操作外推领域的实例预测,该框架能产生欺骗性的偏依赖图,可掩盖歧视行为并保留原模型大部分预测,从而使黑盒模型在 PD 图 - KDDGroupMixNorm 层用于学习公平模型
提出了一种基于 GroupMixNorm 层的处理方法,通过混合样本的组级特征统计数据来减轻深度学习模型中的偏见,该方法在减少偏见的同时对整体准确性影响较小。实验结果表明该方法在标准数据集上取得了最先进的性能,同时还表明 GroupMixN