Nov, 2019

r/Fakeddit: 细粒度虚假新闻检测的新多模态基准数据集

TL;DR使用机器学习分类模型是打击假新闻传播的有效方法,但缺乏有效的全面数据集一直是假新闻研究和检测模型发展的问题。Fakeddit 是一个新颖的多模态数据集,包括一百万个多个类别的假新闻样本,并通过远程监督进行两种,三种和六种分类。我们构建了混合文本 + 图像模型并进行了多个变体的分类实验,证明了 Fakeddits 的多模式和精细分类的重要性。