Hateminers:检测针对女性的仇恨言论
本文介绍了 TU Berlin 小组在 2021 年印欧语言仇恨言论与攻击性内容检测共享任务的 1A 和 1B 子任务中采用的不同自然语言处理模型,包括基于循环神经网络的单词和字符级别模型以及基于 Bert 的转移学习方法,并评估了不同模型在比赛中的表现。结果表明,基于转移学习的模型在两个子任务中均取得了最佳结果。
Jan, 2022
社交媒体上有毒内容的普及,如仇恨言论、冒犯性语言和厌女症,已经引起了自然语言处理领域的广泛关注。本文介绍了首个阿拉伯语厌女症识别任务的提交系统,并研究了基于预训练 MARBERT 语言模型的多任务学习模型和单任务对应模型。而所有提交的模型在厌女症识别和分类任务中都取得了最佳表现(排名前三)。
Jun, 2022
本文提出了一种利用机器学习方法,针对推特中的恶意信息、攻击性言论以及清晰文本进行分类的方法,并通过比较实验,得出了最高达 95.6% 准确率的分类模型,同时还开发了中间模块使用户可以方便地访问此工具。
Sep, 2018
使用人工智能技术识别厌女症是一种打击网络对女性的有害言论的方式。本文中,我们提出了一种多任务学习方法,利用主体性解释厌女症的主题来提高识别系统性别歧视内容的性能。通过结合不同注释者的多样性观点,考虑六个配置文件组的性别和年龄,在模型设计方面进行了广泛实验和错误分析,并使用两种语言模型验证了我们提出的四种替代的多任务学习技术设计来识别英文推文中存在的厌女症内容。结果表明,结合多样化的观点增强了语言模型解释不同形式厌女症的能力。此研究推进了内容辅助管理,并强调了拥抱多元观点来构建有效的在线管理系统的重要性。
Jun, 2024
本文描述了我们提交到 SemEval-2022 Task 5 的分类系统,旨在通过分析文本和 meme 图像一起识别多方面的厌恶内容,我们提出了两种基于预训练 UNITER 模型的模型和一种基于词表图卷网络的模型,并探索了一个集合方法,我们最好的模型在 Sub-task A 达到 71.4% 的 F1 值,在 Sub-task B 达到 67.3%的 F1 值,这将我们的团队排在排行榜的前三分之一。我们在 GitHub 上发布了我们的代码和实验。
May, 2022
本文介绍了我们基于梯度提升机、BERT 和 LASER 嵌入式开发的 HateMonitor 模型,在 Indo-European Languages HASOC(FIRE 2019 的任务之一)中排名第一,用于令人讨厌和令人反感的内容识别。
Sep, 2019
本文介绍了一种机器学习和自然语言处理模型,通过自动识别网页文本中的仇恨言论以及利用迁移学习技术构建了一个识别仇恨言论的表示方法,并开发了一个可视化工具用于多个数据集的简要分析。
Jun, 2019
本文描述了我们团队在 SemEval-2022 任务 5 中开发的自动鄙视女性言论辨识系统,该系统采用了 Bertweet 和 ResNet-18 等多种模型进行文本和图像分析,取得了较好的分类效果,排名 15 和 11 位。
Feb, 2022
本篇论文探索了基于 Transformer 的多种机器学习模型,用于探测英语和印度 - 雅利安语中的仇恨言论和冒犯性内容,研究团队 “超级马里奥” 采用 mBERT、XLMR-large、XLMR-base 等多种模型,我们在 Code-Mixed 数据集排名第二(宏平均 F1:0.7107)、在印地语二分类中排名第二(宏平均 F1:0.7797)、在英语四分类中排名第四(宏平均 F1:0.8006),在英语二分类中排名第十二(宏平均 F1:0.6447)。
Nov, 2021
本文通过使用字符 n-gram、单词 n-gram 和单词 skip-gram 的方法,利用最近发布的 annotated dataset 建立基于词汇的垃圾言论检测任务,并成功实现了 78% 的准确率。研究结果表明,区分垃圾言论和粗俗言论之间的主要难题在于歧视。最后,文章提出了未来的研究方向。
Dec, 2017