利用预训练的句子变换器在印度语言中进行冒犯性语言检测

Oct, 2023

利用预训练的句子变换器在印度语言中进行冒犯性语言检测

Harnessing Pre-Trained Sentence Transformers for Offensive Language Detection in Indian Languages

Ananya Joshi, Raviraj Joshi

TL;DR我们的研究探讨了恶意言论检测领域，特别关注孟加拉语、阿萨姆语和古吉拉特语这三种资源匮乏的印度语言。我们通过HASOC 2023数据集对预训练的BERT和SBERT模型进行微调，评估它们在恶意言论识别中的有效性。研究发现，单语句BERT模型表现出卓越的优势，特别是在孟加拉语方面表现最佳。然而，阿萨姆语和古吉拉特语的性能仍有改进的机会。我们的目标是通过打击恶意言论的泛滥来促进包容性的在线空间。

Abstract

In our increasingly interconnected digital world, social media platforms have emerged as powerful channels for the dissemination of hate speech and offensive content. This work delves into the domain of hate speech dete

发现论文，激发创造

利用多语言转换器来进行仇恨言论检测

该论文基于Transformer语言模型，研究了在社交媒体文本中检测和分类仇恨的问题，并将其固定为三类，同时证明了多语言训练模式的有效性和特定特征对体系结构分类表现的影响。

Jan, 2021

利用Transformer模型检测会话式混合代码推文中的仇恨言论

本文介绍了 MIDAS-IIITD 团队针对 HASOC 2021 二号子任务提出的系统，用于检测推特上混合使用印地语和英语的谈话中的仇恨言论。我们采用神经网络方法，并利用transformer的跨语言嵌入来进行低资源语录下的贴性言论分类，其中最佳表现的系统 [(Indic-BERT, XLM-RoBERTa, 和 Multilingual BERT) 的难度投票集成方法，Macro F1得分达到0.7253，排名第一。

Dec, 2021

马拉地语中仇恨言论检测和文本分类的单语和多语BERT案例研究

在本文中，我们使用 Marathi 语言的标准多语言模型和单语模型比较分析，通过五种不同的下游任务微调实验证明了单语 MahaBERT 模型的性能比多语言 BERT 变体更好。同时，我们还评估了来自这些模型的句子嵌入。

Apr, 2022

HateCheckHIn：对印地语仇恨言论检测模型的评估

针对社交媒体中存在的多语言仇恨言论，本文提出了一种针对多语言仇恨言论模型的功能集，被用于对现有模型的诊断分析。通过以印地语为基础语言，构建了 HateCheckHIn 评估数据集，测试了最先进的基于 Transformer 的 m-BERT 模型以及 Perspective API。

Apr, 2022

孟加拉语仇恨言论和冒犯性语言检测

本研究针对Bengali等低资源语言在社交媒体上的仇恨言论进行研究，开发了一个定量数据集并建立了基线模型和一些额外的方法以更好地进行分类。在分析误分类之后，我们确认XLM-Roberta在单独训练actual或rominized数据集时表现最好。而在联合训练和小样本训练中，MuRIL通过更好地解析语义表达比其他模型表现更优秀。

Oct, 2022

传递爱而不是仇恨：削弱仇恨预训练对于仇恨言论检测的重要性

本文研究了针对原本有恶意情绪的文本进行预训练是否为识别恶意言论最佳的预训练方法，结果表明从目标领域的非恶意文本进行预训练可以提供类似或更好的结果，同时介绍了第一批公开开放的印度语Hindi和Marathi的基于BERT的分类模型 HindTweetBERT 和 MahaTweetBERT 。

Oct, 2022

基于Twitter BERT的Marathi语攻击性语言检测方法

本文介绍了我们在印度低资源口语马拉地语中的Offensive Language Identification的工作, 讨论了使用BERT模型进行文本分类任务以识别推文是否冒犯，比较了不同BERT模型在HASOC 2022测试集上的表现，包括从其他现有Marathi仇恨言论语料库HASOC 2021和L3Cube-MahaHate进行的扩充等，并且当将MahaTweetBERT模型在结合数据集（HASOC 2021 + HASOC 2022 + MahaHate）上进行微调时，其在HASOC 2022测试集上取得了98.43的F1得分，这也是HASOC 2022 / MOLD v2测试集的新最优表现。

Dec, 2022

多语言冒犯性语言识别的文本对文本模型

社交媒体上冒犯内容的普遍存在是公司和政府组织越来越关注的问题。本研究提出了第一个具有编码器-解码器结构的预训练模型，用于冒犯语言识别，并在两个大型冒犯语言识别数据集（SOLID和CCTK）上训练。研究结果表明，预训练的T5模型在多个英文基准测试中优于其他基于变压器的模型，在多语言场景中，多语言预训练模型在所有上述数据集上实现了新的最优表现。

Dec, 2023

印度-雅利安语言中的仇恨言论和冒犯内容检测：基于LSTM和Transformers的对抗

该研究在五种不同语言中展开了对仇恨言论的广泛比较分析，使用多种预训练模型评估其在这些语言中识别仇恨言论的性能，并为多语言环境下构建强大的仇恨言论检测系统提供了有益的见解。

Dec, 2023

跨语言攻击性语言检测：来自社交媒体的孟加拉语、阿萨姆语和博多语对话仇恨内容的基于BERT的分析

本文研究了在社交媒体领域中波斯尼亚语、塔吉克语、哈萨克语和蒙古语的仇恨言论检测的详细结果和关键发现。通过使用BERT模型，特别是XML-Roberta-lagre，在大多数情况下，我们的成果表明其性能优于单语模型。我们的团队在任务4-塔吉克语中获得第3名，在波斯尼亚语中获得第5名。

Dec, 2023