Oct, 2022
孟加拉语仇恨言论和冒犯性语言检测
Hate Speech and Offensive Language Detection in Bengali
TL;DR本研究针对Bengali等低资源语言在社交媒体上的仇恨言论进行研究,开发了一个定量数据集并建立了基线模型和一些额外的方法以更好地进行分类。在分析误分类之后,我们确认XLM-Roberta在单独训练actual或rominized数据集时表现最好。而在联合训练和小样本训练中,MuRIL通过更好地解析语义表达比其他模型表现更优秀。