Nov, 2024
混合语言嵌入在仇恨言论识别中的重要性
On Importance of Code-Mixed Embeddings for Hate Speech Identification
TL;DR本研究解决了传统自然语言处理工具在处理混合语言数据时面临的挑战,特别是在仇恨言论检测任务中的问题。我们通过分析混合语言嵌入的重要性,发现HingBERT模型在Hindi-English数据集的训练后,在仇恨言论文本数据集上的表现优于BERT模型。此项研究表明,混合语言模型在多语言社区中的应用潜力巨大。