Nov, 2020

不变学习中的公平性和鲁棒性: 毒性分类的案例研究

TL;DR本文关注于通过鲁棒性机器学习算法,提高在有偏数据集上训练、在无偏数据集上测试的分类器的公平性和鲁棒性。其中,作者使用了一种称为“不变风险最小化(IRM)”的领域泛化算法,并将其应用于公正预测互联网评论的毒性。作者发现,IRM算法在提高分类器的公平性和超出分布准确性方面,优于经验风险最小化方法。