Apr, 2023

LAHM:用于多领域和多语言仇恨言论识别的大型注释数据集

TL;DR本文介绍一种新的多语言仇恨言论分析数据集,涵盖了英语、印地语、阿拉伯语、法语、德语和西班牙语等六种语言,针对辱骂、种族主义、性别歧视、宗教仇视和极端主义等五大领域进行多角度分类,采用多任务学习方法对数据进行测试,以期提高仇恨言论检测和分类的准确性。