Feb, 2022

利用标签精炼从社交媒体话语中构建大规模的虚假信息标记数据集

TL;DR本研究提出一种基于新闻来源可信度标签的弱监督学习方法,通过自监督或重新标注等方式纠正可能存在的标签不准确性,构建大规模、多样化的新领域虚假信息数据集。同时,本文应用提出的方法提供了一个 COVID-19 疫苗虚假信息数据集。