Nov, 2022

RAFT:针对少样本滥用语言检测的理由适配器

TL;DR研究旨在通过使用 RAFT (Rationale Adaptor for Few-shoT classification) 来检测网络社交媒体中的恶意语言。该方法使用多任务学习设置联合学习合理性、目标和标签,建立了两种合理性集成的 BERT-based 架构。在五个不同的虐待性语言数据集上,与基线模型相比,RAFT-based 模型在少量样本分类方面的性能提高了约 7%的宏 F1 分数,并在可信性方面胜过了 LIME / SHAP-based 方法。