Nov, 2020
不变学习中的公平性和鲁棒性: 毒性分类的案例研究
Fairness and Robustness in Invariant Learning: A Case Study in Toxicity
Classification
TL;DR本文关注于通过鲁棒性机器学习算法,提高在有偏数据集上训练、在无偏数据集上测试的分类器的公平性和鲁棒性。其中,作者使用了一种称为“不变风险最小化(IRM)”的领域泛化算法,并将其应用于公正预测互联网评论的毒性。作者发现,IRM算法在提高分类器的公平性和超出分布准确性方面,优于经验风险最小化方法。