Jun, 2023

跨领域有害文本片段检测

TL;DR本文探讨了检测有害文本段落时跨领域条件下的分布偏移现象,并评估了基于词汇库、原理提取和微调语言模型三种方法的效果,结果表明在跨领域条件下,采用通用的词汇库进行检测的方法效果最好。此外,该研究发现,(1) 基于原理提取的方法容易产生假阴性,(2) 对于本域情况,语言模型的表现最好,但是回溯的有害词汇比词汇库更少,且容易出现某些类型的假阳性,文章提出的代码公开可用。