ACLMay, 2023

促进中文有害语言的细粒度检测:分层分类法、资源和基准

TL;DR本文介绍了一种精细检测中文毒性语言的方法,包括构建一个监控毒性框架、建立 ToxiCN 数据集、构建侮辱词汇表等。实验证明了这种方法的有效性,并对结果进行了系统定量和定性分析。