Apr, 2023

HausaNLP 在 SemEval-2023 任务 10 中的应用:传递学习、合成数据和侧面信息用于多级别性别歧视分类

TL;DR本文对 SemEval-2023 Task 10 的 EDOS 任务进行了参与和研究,讨论了将两个语言模型:XLM-T 和 HateBERT 迁移用于英语 Gab 和 Reddit 数据集的多层次分类,进一步细分至性别歧视或非性别歧视,并使用人工标签数据和中间类信息实现了用于最大化模型性能的综合分类。我们提交的系统在 Task A 排名第 49,F1 得分为 0.82,并且仅低于最优系统 F1 得分 0.052%,表现具有较竞争力。