Dec, 2023

TuPy-E:通过新数据集和广泛模型分析检测巴西葡萄牙语社交媒体中的仇恨言论

TL;DR社交媒体成为人类交流和表达的重要平台,然而,这些平台上仇恨言论的增加给个人和社区带来了重大风险。鉴于葡萄牙语的丰富词汇、复杂语法和地区差异,检测和解决仇恨言论尤其具有挑战性。为了解决这个问题,我们引入了TuPy-E,用于仇恨言论检测的最大葡萄牙语标注语料库。TuPy-E采用开源方法,促进了研究界的合作。我们使用BERT模型等先进技术进行了详细分析,为学术研究和实际应用做出了贡献。