May, 2024

DispaRisk: 数据集中不平等风险的评估和解释

TL;DR介绍 DispaRisk,这是一种新颖的框架,旨在在 ML 流程的初期阶段,主动评估数据集中差异的潜在风险。通过与公平研究中常用的数据集进行基准测试,我们发现 DispaRisk 能够识别具有高歧视风险、易受偏见影响的模型家族以及增加 ML 流程中歧视敏感性的特征。