Mar, 2022

SemEval-2022 任务 4 中的 SATLab:仅使用字符和词 N-grams 尝试检测居高临下和轻蔑的语言

TL;DR该研究针对 SemEval-2022 PCL 任务提出了一种只使用字符和单词 n-gram 的逻辑回归模型,该模型得到了平均水平的表现,远高于不使用任何任务知识的猜测系统,但低于最优团队。在表明提出的模型与在识别仇恨言论和冒犯内容方面表现良好的模型非常相似的同时,该论文证实了 PCL 检测的难度。