Jul, 2023

关于机器学习随机性对群体公平性的影响

TL;DR探究机器学习中算法跨不同组别表现差异的群体公平性的统计度量,发现这些度量在不同训练实例之间存在高方差,从而使得它们无法提供可靠的公平性实证评估。研究表明,群体公平性度量的方差来源于在少数群体上的学习过程的高波动性,而数据顺序的随机性被认为是主要的随机性源。基于这些发现,我们展示如何通过在单个时期改变数据顺序来控制群体级准确性(即模型公平性),高效并对模型整体性能影响微乎其微。