跨领域有害文本片段检测

Jun, 2023

Cross-Domain Toxic Spans Detection

Stefan F. Schouten, Baran Barbarestani, Wondimagegnhue Tufa, Piek Vossen, Ilia Markov

TL;DR本文探讨了检测有害文本段落时跨领域条件下的分布偏移现象，并评估了基于词汇库、原理提取和微调语言模型三种方法的效果，结果表明在跨领域条件下，采用通用的词汇库进行检测的方法效果最好。此外，该研究发现，(1) 基于原理提取的方法容易产生假阴性，(2) 对于本域情况，语言模型的表现最好，但是回溯的有害词汇比词汇库更少，且容易出现某些类型的假阳性，文章提出的代码公开可用。

Abstract

Given the dynamic nature of toxic language use, automated methods for detecting toxic spans are likely to encounter distributional shift. To explore this phenomenon, we evaluate three approaches for detecting toxic spans under cross-domain conditions: lexicon-based, →

toxic language use cross-domain detection lexicon-based approach rationale extraction fine-tuned language models

发现论文，激发创造

2021 年 SemEval 第 5 任务：毒性在哪里？：利用 Transformer 从在线评论中提取多个毒性段

该论文描述了 Cisco 团队提出的用于发现英文文本中的有毒段落的系统，该系统主要采用了序列标注和依赖解析方法，并提供了其结果和模型表现的详细分析。

May, 2021

社交媒体上毒性建模中的跨地理偏见检测

本文提出了一种弱监督的方法来检测在更广泛的地理文化背景下的词汇偏见，通过公开获取的有毒检测模型案例研究，展示了我们的方法如何识别跨地理误差的显著群体，并展示这些分组如何反映这些地理背景下人类对攻击性和无攻击性语言的判断.

Apr, 2021

SemEval-2021 第 5 项任务：使用 BERToxic 进行仔细检测仇恨言论的孤松松树算法

该研究描述了 Toxic Spans Detection 问题的解决方法，其中使用 BERToxic 系统，通过微调预训练的 BERT 模型来定位给定文本中的有害文本段，并利用附加后处理步骤来优化其性能。

Apr, 2021

从一到多：扩大语言模型中毒素缓解的范围

多语言毒性缓解中的复杂性研究及其对未来研究的重要影响

Mar, 2024

利用基于 BERT 的标记分类和跨度预测技术进行有毒跨度检测的 SemEval-2021 任务 5 的 NLRG

该研究探讨了基于 BERT 的模型在 SemEval-2021 毒性跨度检测任务中的性能，研究了多种模型，包括 Token 分类或跨度预测，最佳模型达到 F1 得分 0.6753，在基线模型上提高了 3%。

Feb, 2021

SemEval-2021 任务 5：使用命名实体识别和问答方法进行有害语段检测的 UIT-E10dot3

该研究通过命名实体识别和问答结合分析 SemEval-2021 的毒性评论任务，提高了评论毒性区分的准确性。

Apr, 2021

使用知识图谱增强的 Transformer 进行跨领域方面提取

本文介绍了一种自动构建领域特定知识图谱的方法，并通过将其注入到 Transformer 模型中以识别 aspect terms，提高了跨域情感分析中的性能表现。

Oct, 2022

促进中文有害语言的细粒度检测：分层分类法、资源和基准

本文介绍了一种精细检测中文毒性语言的方法，包括构建一个监控毒性框架、建立 ToxiCN 数据集、构建侮辱词汇表等。实验证明了这种方法的有效性，并对结果进行了系统定量和定性分析。

May, 2023

ToxCCIn: 毒性内容分类与解释能力

本文提出一种改进 transformer-based models 解释性的技术，通过假设一篇文章至少和其最有毒的部分一样有毒，并将其纳入训练过程来提高模型的可解释性，实验证明该方法优于逻辑回归分析，具备更高的质量和解释性。

Mar, 2021

HLE-UPC 在 SemEval-2021 任务 5 中的表现：用于检测有害语句的多层 DistilBERT

研究使用多深度 DistilBERT 模型来检测文本中的有毒片段，定量结果表明使用多个深度的嵌入可提高模型性能，并定性分析了最佳模型。

Apr, 2021