Mar, 2024

自然语言处理数据增强在仇恨言论检测中的综合研究:传统方法、BERT 和 LLMs

TL;DR本研究探讨了数据增强方法,包括传统方法和当代实践,如大型语言模型(LLM)在仇恨言论检测中的应用。同时,我们提出了基于 BERT 的编码器模型和上下文余弦相似度过滤的优化利用,通过降低标签改变率从而提高 F1 得分表现。与传统方法相比,使用 GPT-3 增加数据量可避免过拟合,并提高嵌入空间覆盖率和分类 F1 得分。