针对仇恨言论的 T5 增强数据和集成方法

Oct, 2022

针对仇恨言论的 T5 增强数据和集成方法

T5 for Hate Speech, Augmented Data and Ensemble

Tosin Adewumi, Sana Sabah Sabry, Nosheen Abid, Foteini Liwicki, Marcus Liwicki

TL;DR本研究使用不同最新模型对自动检测仇恨言论进行全面探究，发现数据增强和集成方法对模型有何优点，并使用两种可解释人工智能算法揭示模型如何做出预测。同时，发现缺乏数据注释和质量控制，提出了一个简单的机制用于纠正 T5 模型中的错误预测，并公开模型代码以提高研究透明度。

Abstract

We conduct relatively extensive investigations of automatic hate speech (HS) detection using different state-of-the-art (SoTA) baselines over 11 subtasks of 6 different datasets. Our motivation is to determine which of the recent SoTA models is best for automatic hate speech detection

automatic hate speech detection state-of-the-art models data augmentation ensemble methods explainable artificial intelligence

发现论文，激发创造

HaT5: 使用文本转换转换器进行仇恨语言识别

本研究使用 T5 架构及自回归模型对包含 5 个不同任务的 2 个数据集进行性能比较与错误分析，提出了一种新的数据增强方法以及训练方法并通过解释性人工智能算法提高了预测准确率。

Feb, 2022

FIRE 2021 HASOC 子赛道概观：英语和印度－雅利安语言中的仇恨言论和攻击性内容识别

该研究论文介绍了 HASOC 子轨道，旨在为英语、印地语和马拉地语开发基准数据集，以支持在线平台的内容审核。他们解释了两种分析方法，分别为二元分类和精细分类问题，并提供分类算法的性能结果。

Dec, 2021

FIRE 2020 上 HASOC 赛道概述：印欧语系中的仇恨言论与攻击内容识别

本文介绍了在社交媒体中迅速增长的仇恨言论现象以及如何使用多语言算法进行检测，其中包括 Hindi、德语和英语等三种语言，使用的数据集是通过机器学习系统对 Twitter 进行分类得到的，并使用了变压器结构 BERT 进行实验。

Aug, 2021

运用情感、情绪与目标探测的多任务学习技术识别仇恨言论和攻击性语言

研究如何通过多任务学习模型，利用情感分析、情感识别、目标识别等相关领域的数据，改进恶意言论识别系统，在 2019 年和 2021 年的数据集上，HOF 的召回率分别提高了 6pp 和 3pp，适用于社交媒体平台上的预警系统。

Sep, 2021

一种简单的、与语言无关的却非常强大的基线系统，用于仇恨言论和攻击性内容的识别

通过使用基于字符 n-gram 的经典监督算法，SATLab 团队提出了一种自动识别推文中仇恨言论和冒犯性内容的系统，该系统与语言无关。在优化特征加权和分类器参数后，该系统在英语中达到了中等表现水平，在印地语和马拉地语这两种资源较少的语言中表现更好，甚至在这些语言的三项任务中的平均表现要比许多深度学习方法更好。表现表明该方法是一个有趣的参考水平，可用于评估使用更复杂方法（例如深度学习或考虑补充资源）的好处。

Feb, 2022

基于 BERT 的集成方法用于仇恨言论检测

本文聚焦于利用包括 BERT 在内的多个深度模型以及集成学习等技术，对社交媒体上的仇恨言论进行分类，使用三个公开 Twitter 数据集进行实验并考察多种方法的分类性能，最终以新数据集 DHO 进行多标签分类，取得了不错的成果，尤其在集成学习方面表现良好，如在 Davidson 数据集上采用 stacking 技术得到了 97% 的 F1 得分，而在 DHO 数据集上汇聚集成学习技术得到了 77% 的 F1 得分。

Sep, 2022

使用预训练语言模型和数据增强的集成方法进行阿拉伯推文中的仇恨言论检测

利用集成学习和半监督学习，基于先前手动标记的数据，提出了一种新的方法来解决阿拉伯推文的仇恨言论分类任务，并通过对标记的阿拉伯推文进行分类实验，实验证明：（1）基于预训练语言模型的集成学习优于现有相关工作；（2）我们提出的数据增强方法改进了阿拉伯推文中仇恨言论检测的准确性，并优于现有相关工作。我们的主要贡献是在阿拉伯语仇恨言论检测中取得了鼓舞人心的结果。

Jul, 2024

基于排序和 LLM 融合的图像标注描述性改进

本文提出了一种将 SoTA 模型生成的不同字幕进行有效融合的新方法，通过使用图像文本度量来排名模型生成的字幕，然后使用大语言模型（LLM）融合前两个字幕，实验结果表明，我们的方法可以增强字幕的质量和吸引力，缩小了自动化系统与人类生成的描述之间的差距，并开辟了为视觉 - 语言和字幕模型生成更适宜的字幕的新可能性。

Jun, 2023

Arabic Hate Speech 2022 中的 Meta AI：具有自校正功能的多任务学习用于仇恨言论分类

该研究旨在解决阿拉伯细粒度仇恨言论识别的任务，并展示了在该任务的三个子任务中相比于基准结果的显著改进。最终的解决方案是一种采用多任务学习和自一致性校正方法的模型集成，在仇恨言论子任务中获得了 82.7％的准确率，相对于之前的工作有 3.4％的相对改进。

May, 2022

AlexU-AIC 参加 2022 阿拉伯语仇恨言论：对比分类

本篇研究介绍了使用阿拉伯语推特数据集提交阿拉伯语言仇恨言论 2022 共享任务的解决方案。为了解决细粒度仇恨言论检测中过度拟合的问题，研究人员探究了多种训练模式，如对比学习和多任务学习，最终使用分类微调和五种模型的集成，取得了良好的性能。在子任务 A，B 和 C 中分别实现了 0.841，0.817 和 0.476 的宏 F1 平均分数。

Jul, 2022