Apr, 2022
公平准确:学习仇恨言论检测中最佳准确性与公平性权衡
Fairly Accurate: Learning Optimal Accuracy vs. Fairness Tradeoffs for Hate Speech Detection
Venelin Kovatchev, Soumyajit Gupta, Anubrata Das, Matthew Lease
TL;DR本文提出一种可微分度量方法来优化神经分类模型的团体公平性,继而展示了两个适用于不同组神经分类模型的 Pareto 最优化参数化的 MOO 框架,并在 Hate Speech Detection 任务上获得了优于先前方式的实证结果。