社交媒体上仇恨言论分类的终身学习

Jun, 2021

社交媒体上仇恨言论分类的终身学习

Lifelong Learning of Hate Speech Classification on Social Media

Jing Qian, Hong Wang, Mai ElSherief, Xifeng Yan

TL;DR本文提出一种使用变分学习算法（VRL）和基于LB-SOINN的记忆模块结合的方法在社交媒体上实现仇恨言论分类的终身学习，结果表明该方法比常用的终身学习技术具有更好的表现。

Abstract

Existing work on automated hate speech classification assumes that the dataset is fixed and the classes are pre-defined. However, the amount of data in social media increases every day, and the hot topics changes

发现论文，激发创造

仇恨言论检测：已解决的问题？Twitter上长尾案例的挑战

该研究旨在解决社交媒体上自动检测仇恨言论的问题。作者提出了一种基于深度神经网络结构的特征提取器，在Twitter上的仇恨言论检测方面表现出比目前最佳方法高出5个百分点的效果。

Feb, 2018

利用用户内部和用户间的表示学习进行自动化的仇恨言论检测

本文通过在Twitter上收集和分析用户历史记录来建模用户内部Tweet表示，以及使用增强的用户间表示学习技术，对其他用户发布的类似推文进行建模，从而显着提高了强双向LSTM基线模型的f-score10.1％。

Apr, 2018

针对细粒度仇恨言论分类的分层式 CVAE

本文提出了一种新的细粒度仇恨言论分类任务的方法，使用条件变分自编码器作为判别模型，并扩展到分层架构，利用附加的仇恨类别信息进行更准确的预测，实验证明采用该方法显著提高了分类性能且优于常用的判别式模型。

Aug, 2018

基于预测嵌入的推特仇恨言论检测

利用预训练的词嵌入和最大/平均池化的神经网络方法，能够预测在三个公开数据集上的仇恨言论情况，相较于以往方法使用更少的参数和特征预处理，其在所有三个数据集上达到或超过了最新的F1表现。

Sep, 2018

DeL-haTE: 偏见言论检测的深度学习可调整集成模型

针对社交媒体上在线仇恨言论问题，提出了一种基于集成深度学习模型的新框架，包括对未标记数据集的自动分类、调整因子和弱监督学习方法，可有效提高依恋集等小众平台的恶意言论检测率。

Nov, 2020

从最差的情况学习：动态生成数据集以提高在线仇恨检测能力

本研究提出了一种利用人员与模型共同协作的动态数据集生成和训练模型的方法，生成了大约40,000项新数据并标注为15,000项令人挑战的扰动。通过这种方法训练出的模型性能大幅提升，具有更高的鲁棒性和更好的性能。

Dec, 2020

动态精化正则化以提高跨语料库的仇恨言论检测

自动识别和减少虚假相关，并使用动态精修词汇表来规范已有的分类器以提高跨数据集的表现。

Mar, 2022

基于深度神经网络的改进型 Twitter 两阶段仇恨言论分类

本文借助改进的LSTM神经网络架构，提出了一种基于One-vs-Rest分类器的两阶段方案，用于在社交媒体上自动检测仇恨性内容，并在公共语料库和其他数据集上进行了实验，结果显示其在仇恨言论检测任务中具有卓越的分类性能。

Jun, 2022

基于领域感知的自监督预训练，用于标签少的模因分析

我们提出了两种自监督预训练方法，即Ext-PIE-Net和MM-SimCLR，通过采用现成的多模态仇恨言论数据和多个专门的预设任务实现了自监督学习，为模因分析提供了必要的复杂多模态表示学习，通过标签有效训练，在所有三个任务中性能优于基线并证实了我们的方法的泛化性。

Sep, 2022

跨数据集弱监督仇恨言论分类

本篇论文提出了一种基于极弱监督策略的方法以解决仅存在于部分数据集的种族主义言辞（HS）的识别问题，并探究了HS分类模型泛化能力不佳的原因。

May, 2023