Apr, 2019

QCRI-MIT 团队在 SemEval-2019 任务 4 中:宣传分析与超极端新闻检测相遇

TL;DR本文报道了我们在 SemEval-2019 任务 4 中提出的超级党派新闻检测系统,该系统主要使用一些原本用于检测宣传的工程特征。我们训练了一个基于逻辑回归模型的分类器,并使用从简单单词袋到词汇丰富度和文本可读性等特征来训练它。我们的系统在手动注释的测试数据上实现了 72.9% 的准确率,而在带有远程监督标注的测试数据上则实现了 60.8% 的准确率。另外的实验表明,使用更好的特征预处理可以大幅提高性能。