Nov, 2023

自动文本规范化用于仇恨言论检测

TL;DR社交媒体数据是研究的宝贵资源,非标准词汇是对NLP工具运行的一种障碍。我们采用了一种简单的序列到序列模型,通过文本规范化的实验结果显示准确率接近70%,同时也提升了2%左右的仇恨言论检测任务的准确性,展示了提高复杂NLP任务性能的潜力。