Apr, 2022
面向多标签分类的韩国在线仇恨言论数据集:社会科学如何改进仇恨言论数据集?
Korean Online Hate Speech Dataset for Multilabel Classification: How Can Social Science Improve Dataset on Hate Speech?
TaeYoung Kang, Eunrang Kwon, Junbum Lee, Youngeun Nam, Junmo Song...
TL;DR我们提供了一个多标签的韩国在线仇恨言论数据集,考虑了文化和语言背景,建议了从社会科学角度构建更具多元文化背景的仇恨言论数据集的方法。基于 2.4 万的数据集测试模型,经过结合 1.1 万个额外数据,模型的 LRAP 准确率从 0.892 提高至 0.919。