May, 2023

利用现有数据解决少样本辱骂内容检测问题

TL;DR本文提出了一种两步法的方法,使用现有的包含多种任务相关的虐待性语言检测数据集进行多任务学习,再进行少量的适应性训练以针对新的标签集或语言。实验结果表明这种方法可以提高模型的性能,并且可以在不同语言中实现跨语言识别。