社交媒体上仇恨言论分类的终身学习
该研究旨在解决社交媒体上自动检测仇恨言论的问题。作者提出了一种基于深度神经网络结构的特征提取器,在Twitter上的仇恨言论检测方面表现出比目前最佳方法高出5个百分点的效果。
Feb, 2018
本文通过在Twitter上收集和分析用户历史记录来建模用户内部Tweet表示,以及使用增强的用户间表示学习技术,对其他用户发布的类似推文进行建模,从而显着提高了强双向LSTM基线模型的f-score10.1%。
Apr, 2018
本文提出了一种新的细粒度仇恨言论分类任务的方法,使用条件变分自编码器作为判别模型,并扩展到分层架构,利用附加的仇恨类别信息进行更准确的预测,实验证明采用该方法显著提高了分类性能且优于常用的判别式模型。
Aug, 2018
利用预训练的词嵌入和最大/平均池化的神经网络方法,能够预测在三个公开数据集上的仇恨言论情况,相较于以往方法使用更少的参数和特征预处理,其在所有三个数据集上达到或超过了最新的F1表现。
Sep, 2018
针对社交媒体上在线仇恨言论问题,提出了一种基于集成深度学习模型的新框架,包括对未标记数据集的自动分类、调整因子和弱监督学习方法,可有效提高依恋集等小众平台的恶意言论检测率。
Nov, 2020
本研究提出了一种利用人员与模型共同协作的动态数据集生成和训练模型的方法,生成了大约40,000项新数据并标注为15,000项令人挑战的扰动。通过这种方法训练出的模型性能大幅提升,具有更高的鲁棒性和更好的性能。
Dec, 2020
本文借助改进的LSTM神经网络架构,提出了一种基于One-vs-Rest分类器的两阶段方案,用于在社交媒体上自动检测仇恨性内容,并在公共语料库和其他数据集上进行了实验,结果显示其在仇恨言论检测任务中具有卓越的分类性能。
Jun, 2022
我们提出了两种自监督预训练方法,即Ext-PIE-Net和MM-SimCLR,通过采用现成的多模态仇恨言论数据和多个专门的预设任务实现了自监督学习,为模因分析提供了必要的复杂多模态表示学习,通过标签有效训练,在所有三个任务中性能优于基线并证实了我们的方法的泛化性。
Sep, 2022