Jan, 2021

VoterFraud2020: 一份包含推特上选举欺诈指控的多模态数据集

TL;DR研究了美国 2020 年选举期间 Twitter 上关于选举舞弊的讨论,发布了包含 760 万条推文和 2560 万条转推以及 260 万个用户的 VoterFraud2020 数据集,并对其进行了增强,包括聚类标签、用户暂停状态和推送图像的知觉哈希等。初步分析表明,Twitter 的用户暂停措施主要影响了选举舞弊的推动者社区,并揭示了数据中分享的最常见的 URL、图片和 YouTube 视频。