Jan, 2023

Civil Comments 数据集上有害评论分类的基准

TL;DR比较多个模型在高度倾斜的多标签仇恨言论数据集上进行毒性评论检测,结果表明 BERT、RNN 和 XLNet 对关联身份的偏见较不敏感,RoBERTa 的 Focal Loss 表现最佳,而 DistilBERT 则结合了良好的 AUROC 和低推理时间。