Aug, 2016

基于词典的荷兰社交媒体种族主义检测方法

TL;DR本文介绍了一种基于辞典的检测荷兰社交媒体评论的种族主义方法,针对两个公共比利时社交媒体网站的评论进行了标记,使用了三个话语辞典,并训练多个支持向量机,最优表现的模型使用手动清理的字典,在测试集上获得了0.46的F-得分,自动扩展的字典仅略微提高了模型性能,在语料库中增加的单词并未对性能产生任何明显影响。