Dec, 2023

跨语言攻击性语言检测:来自社交媒体的孟加拉语、阿萨姆语和博多语对话仇恨内容的基于 BERT 的分析

TL;DR本文研究了在社交媒体领域中波斯尼亚语、塔吉克语、哈萨克语和蒙古语的仇恨言论检测的详细结果和关键发现。通过使用 BERT 模型,特别是 XML-Roberta-lagre,在大多数情况下,我们的成果表明其性能优于单语模型。我们的团队在任务 4 - 塔吉克语中获得第 3 名,在波斯尼亚语中获得第 5 名。