May, 2024

SGD 训练中偏差动态的理论洞见

TL;DR机器学习系统通常通过利用数据中的不希望的特征获得偏差,对不同的亚群体造成不同程度的精确度影响。本文探讨了在教师 - 学生模型中,模拟不同数据亚群体的高斯混合模型,偏差如何演化的问题。我们提供了这种设置下线性分类器随机梯度下降动力学的解析描述,该描述在高维度下被证明是准确的。值得注意的是,我们的分析揭示了亚群体的不同属性在不同时间尺度上如何影响偏差,展示了分类器在训练过程中偏好的转变。将我们的发现应用于公平性和鲁棒性,我们阐述了异质数据和虚假特征如何生成和放大偏差的时间与方式。通过在合成数据集和真实数据集(包括 CIFAR10,MNIST 和 CelebA)上训练更深层次的网络来经验性地验证我们的结果。