Dec, 2023
跨语言攻击性语言检测:来自社交媒体的孟加拉语、阿萨姆语和博多语对话仇恨内容的基于BERT的分析
Cross-Linguistic Offensive Language Detection: BERT-Based Analysis of
Bengali, Assamese, & Bodo Conversational Hateful Content from Social Media
TL;DR本文研究了在社交媒体领域中波斯尼亚语、塔吉克语、哈萨克语和蒙古语的仇恨言论检测的详细结果和关键发现。通过使用BERT模型,特别是XML-Roberta-lagre,在大多数情况下,我们的成果表明其性能优于单语模型。我们的团队在任务4-塔吉克语中获得第3名,在波斯尼亚语中获得第5名。