利用现有数据解决少样本辱骂内容检测问题

May, 2023

利用现有数据解决少样本辱骂内容检测问题

How to Solve Few-Shot Abusive Content Detection Using the Data We Actually Have

Viktor Hangya, Alexander Fraser

TL;DR本文提出了一种两步法的方法，使用现有的包含多种任务相关的虐待性语言检测数据集进行多任务学习，再进行少量的适应性训练以针对新的标签集或语言。实验结果表明这种方法可以提高模型的性能，并且可以在不同语言中实现跨语言识别。

Abstract

Due to the broad range of social media platforms and their user groups, the requirements of abusive language detection systems are varied and ever-changing. Already a large set of annotated corpora with different

abusive language detection annotated corpora few-shot adaptation multitask learning model performance

发现论文，激发创造

異質環境下的辱罵語言檢測：數據集收集與監督注意力的作用

本文提出了一种注重异质性的辱骂评论的检测算法，使用带监督的注意机制和多任务学习来提高性能，并在一个包含 11000 条评论的 YouTube 数据集上进行了实验比较。

May, 2021

一种用于滥用检测的统一深度学习架构

此研究使用深度学习技术基于 Twitter 数据，对社交媒体中的仇恨言论、辱骂言论、性别歧视、种族主义与欺凌行为开展综合研究，并提出了一种基于元数据和文本的检测方法，效果优于现有的检测方法。

Feb, 2018

推特恶意语言检测的一步和两步分类

针对社交媒体中滥用语言的检测问题，我们提出了一种两步分类的方法，并将其与一步多分类检测性别主义和种族主义语言的方法进行了比较。在英语 Twitter 语料库上的实验结果表明，我们的方法比使用逻辑回归的两步法和使用 HybridCNN 的一步法分别提高了 0.827 和 0.824 的 F-measure 性能指标。

Jun, 2017

推特上滥用语言的比较研究

本文研究了在 Twitter 上关于仇恨言论和辱骂的数据集，考察了不同的学习模型和额外特征的加入，并得出了使用双向 GRU 网络结合潜在主题聚类模型的最优模型，F1 得分为 0.805。

Aug, 2018

创建图像和文本混合数据集以研究辱骂语言

使用 CREENDER 开发了一个注释工具，用于创建图像和滥用评论的多模态数据集，该数据集在不同角度被分析，发现图像中是否存在人会增加触发攻击性评论的概率。

May, 2020

滥用言论具有语境性，那么 NLP（自然语言处理）呢？语境在滥用言论注释和检测中的作用

本研究通过给出上下文，重新注释部分英文侮辱语言检测数据集，比较了基于上下文和不基于上下文两种数据集上三种分类算法的性能，发现基于上下文的分类更具挑战性，但也更类似于实际应用场景。

Mar, 2021

基于神经网络字符组合的滥用检测模型

本研究设计了一个可以为未知单词组合嵌入的模型，与现有的自然语言处理技术相比，本方法可以更好地检测社交媒体上的滥用言论，数据集包含 Twitter 和 Wikipedia talk page。

Sep, 2018

利用弱标注数据在混合代码 Hinglish 中进行仇恨言论检测：基于可行性驱动的迁移学习方法与大型语言模型

采用大语言模型（LLMs）进行很少标记的训练，结合零样本学习和少样本学习等方法，成功应用于 Hinglish 中的仇恨言论检测和粗细粒度的厌女症分类，研究表明使用 Bidirectional Auto-Regressive Transformers（BART）大模型的零样本分类和使用 Generative Pre-trained Transformer- 3（ChatGPT-3）的少样本提示获得了最佳结果。

Mar, 2024

改进基于数据引导的印度语恶意语言检测方法，提高低资源环境下的检测效果

本篇论文探讨针对印度尼西亚语多语种辱骂性言论的大规模分析，研究不同的语言转移机制及该领域的多语种模型的表现，同时探究此类模型对抗性攻击的能力，并进行了误判分析。

Apr, 2022

扩展仅有少量资源的语言中仇恨言论检测的数据高效策略

本文旨在研究如何在少资源语言情况下进行有效的仇恨言论检测，发现只需少量目标语言数据即可获得良好性能，并初步发现在英语数据的支持下，fine-tuning 可在一定程度上替代目标语数据并提高模型泛化性能。

Oct, 2022