ACLJul, 2020

Duluth 在 SemEval-2019 任务 6 中:识别和分类具有攻击性的推文的词汇方法

TL;DR本研究介绍了 Duluth 系统在 SemEval-2019 Task 6 中的表现,主要采用传统机器学习的方法,通过手动标记的训练数据中的词汇特征构建分类器来识别和分类社交媒体中的冒犯性语言,其中最成功的分类方法是基于规则的黑名单方法并尝试将两个不同但相关的 SemEval 任务的训练数据合并,最终在三个 OffensEval 任务中的最佳系统在比较评估中排名中等。