EMNLPOct, 2023

BanglaAbuseMeme:孟加拉语辱骂梗分类数据集

TL;DR使用社交媒体平台增加了信息共享,也导致在线滥用的急剧增加。Memes 是一种滥用个人或社群的简单而有效的方式,因此有必要开发检测和标记滥用 Memes 的高效模型。本文构建了一个孟加拉 Memes 数据集,并使用该数据集实现了多种基准模型来对滥用 Memes 进行分类。我们观察到使用文本和视觉信息的多模态模型优于单模态模型,最佳模型的宏 F1 分数达到了 70.51。最后,我们对最佳文本、图像和多模态模型的错误分类的 Memes 进行了定性错误分析。