Apr, 2025
针对英文文本仇恨言论的多标签分类机器学习模型与数据集调查
A Survey of Machine Learning Models and Datasets for the Multi-label
Classification of Textual Hate Speech in English
TL;DR本研究解决了在线仇恨言论分类中缺乏多标签处理的科学盲点。通过系统性回顾46篇相关文献,提出了28个适用于多标签分类模型的数据集,并指出现有模型在评估上的不一致性及数据集小、稀疏等问题。研究结果为未来的研究提供了十条建议,以促进该领域的规范化与发展。