Sep, 2023

审视滥用语言检测中的时间偏见

TL;DR在线辱骂言语的使用已成为一个日益普遍的问题,对个人和社会造成损害,其影响从心理伤害一直升级到现实暴力甚至死亡。该研究旨在调查在不同语言中的辱骂言语检测中时间偏差的性质和影响,并探索缓解方法。我们评估了不同时间段辱骂数据集上的模型性能。我们的结果表明,时间偏差对辱骂言语检测是一个重大挑战,历史数据训练的模型表现随时间显著下降。我们还从历时的角度对这些辱骂数据集进行了广泛的语言学分析,旨在探索语言演变和性能下降的原因。该研究揭示了辱骂言语检测中时间偏差的普遍问题,为了解语言演变和缓解时间偏差提供了关键的见解。