Aug, 2023

因果引导的跨平台仇恨言论检测中的解缠

TL;DR社交媒体平台上存在有害内容的传播问题,目前的深度学习和自然语言处理模型在检测这些有害内容时过于依赖特定领域术语,影响了它们在泛化仇恨言论检测方面的能力。我们的研究提出了一种跨平台仇恨言论检测模型,可以在一个平台的数据上进行训练,并推广到多个未知平台。通过将输入表示分解为不变特征和依赖平台的特征,学习因果关系,我们能够获得对分布转换具有鲁棒性的特征用于预测泛化的仇恨言论。我们在四个平台上进行了大量实验,结果显示我们的模型在检测泛化仇恨言论方面比现有的最先进方法具有更好的效果。