COLINGMar, 2024

一份包含人类和机器洞见的法国虚假新闻多标签数据集

TL;DR我们提供了一个被 8 名注解者使用 11 个标签注释的 100 份文件的语料库,该文件语料库从 17 个被专家机构认为不可靠的法国新闻来源中选取。通过收集比通常更多的标签和注解者,我们可以确定人类认为是伪新闻特征,并将其与自动分类器的预测进行比较。我们使用 Gate Cloud 进行主题和体裁分析,显示语料库中类似讽刺的文本的普遍性。然后,我们使用主观性分析器 VAGO 以及其神经版本,以澄清主观标签和伪新闻标签之间的关联。可在以下 URL 在线获取注释数据集:this https URL