ArCOV-19:带传播网络的第一个阿拉伯 COVID-19 Twitter 数据集
本文介绍了 2020 年 1 月 1 日以来首个收集的新冠肺炎疫情下阿拉伯语推特数据集,该数据集可帮助研究人员和决策者研究与该大流行相关的不同社会问题,包括行为变化、信息共享、流言传播等等。
Apr, 2020
本研究介绍了一个阿拉伯语 COVID-19 Twitter 数据集,用于支持虚假信息检测研究,其中包含 138 个已验证的断言和 9.4K 个相关推文。该数据集支持在 Twitter 上进行两个水平的虚假信息检测,并介绍了 Tweet 级验证的基准结果。
Oct, 2020
为了更好地了解公众行为、兴趣话题、政府要求、推特来源等等,并防止有关病毒或不良治疗方法的谣言和误报的传播,在研究中,我们提供了一个人工标注的阿拉伯语推特最大数据集,描述了其注释指南、分析了数据集并构建了有效的机器学习和 Transformer 模型以进行分类。
Dec, 2020
该研究通过开发和发布人工注释的大规模阿拉伯推文数据集 ArCovidVac 来解决 COVID-19 疫苗接种期间社交媒体上流传的谣言和阴谋论的鉴别问题,并通过对数据的深入分析和基于 transformer 模型的评估来探究推文内容、态度和类型的时空变化。
Jan, 2022
该文介绍了 GeoCoV19—— 一个包含 524 百万条推文的大规模 Twitter 数据集,通过基于地名词典的方法来推断推文的地理位置,而这一大规模、多语言、地理定位的社交媒体数据可以帮助研究社区评估社会如何共同应对这一前所未有的全球危机,以及建立计算方法来应对如识别假新闻,理解社区的知识差距,建立疾病预测和监测模型等挑战。
May, 2020
描述了 TweetsCOV19 的基本特征和分析,这是一个公开可用的包含超过 800 万推特的知识库,旨在为大量知识发现任务提供前所未有的数据集。
Jun, 2020
本文描述了自 2020 年 1 月 22 日以来我们不断收集的多语种新冠状病毒 Twitter 数据集,旨在通过研究在线谈话动态以及科学信息和未经验证的谣言的跟踪等方面,了解这一全球性危机的影响。最终,该数据集可能有助于推动针对这一全球危机的知情决策和有针对性的政策干预。
Mar, 2020
Mega-COV 是一个包含十亿条推特数据的数据集,涵盖 268 个国家,可用于研究 COVID-19 的相关现象。该数据集具有多语言、地理位置等多种特征,并配备了两个强大的模型,可以识别与疫情有关的推特和 COVID-19 的错误信息。
May, 2020
该研究提供了一个多语种的新冠病毒 Instagram 数据集,旨在帮助研究社区更好地了解 Instagram 这一主要社交媒体中这一现象背后的动态,并帮助研究这一疫情相关的错误信息的传播。
Apr, 2020
本研究旨在推广社交媒体研究对抗 COVID-19 及其他传染病。通过对 COVID-19 微博的量化和定性分析,我们提供了多种处理数据集的方法,并分享了一个多语种社交媒体数据集,供研究人员使用。
Apr, 2020