Apr, 2022

公平准确:学习仇恨言论检测中最佳准确性与公平性权衡

TL;DR本文提出一种可微分度量方法来优化神经分类模型的团体公平性,继而展示了两个适用于不同组神经分类模型的 Pareto 最优化参数化的 MOO 框架,并在 Hate Speech Detection 任务上获得了优于先前方式的实证结果。