COVID-19 的大规模阿拉伯语 Twitter 数据集
为了更好地了解公众行为、兴趣话题、政府要求、推特来源等等,并防止有关病毒或不良治疗方法的谣言和误报的传播,在研究中,我们提供了一个人工标注的阿拉伯语推特最大数据集,描述了其注释指南、分析了数据集并构建了有效的机器学习和 Transformer 模型以进行分类。
Dec, 2020
本文描述了自 2020 年 1 月 22 日以来我们不断收集的多语种新冠状病毒 Twitter 数据集,旨在通过研究在线谈话动态以及科学信息和未经验证的谣言的跟踪等方面,了解这一全球性危机的影响。最终,该数据集可能有助于推动针对这一全球危机的知情决策和有针对性的政策干预。
Mar, 2020
本文介绍了一份阿拉伯语 COVID-19 Twitter 数据集 ArCOV-19,该数据集可以用于自然语言处理、信息检索和社交计算等多个领域的研究
Apr, 2020
本研究旨在推广社交媒体研究对抗 COVID-19 及其他传染病。通过对 COVID-19 微博的量化和定性分析,我们提供了多种处理数据集的方法,并分享了一个多语种社交媒体数据集,供研究人员使用。
Apr, 2020
该研究提供了一个多语种的新冠病毒 Instagram 数据集,旨在帮助研究社区更好地了解 Instagram 这一主要社交媒体中这一现象背后的动态,并帮助研究这一疫情相关的错误信息的传播。
Apr, 2020
本文介绍了一份包含 1 月 1 日至 4 月 4 日之间各地 152 万条与 COVID-19 有关的推文的数据集,为研究社交动态、情感反应等提供支持。
Apr, 2020
本研究介绍了一个阿拉伯语 COVID-19 Twitter 数据集,用于支持虚假信息检测研究,其中包含 138 个已验证的断言和 9.4K 个相关推文。该数据集支持在 Twitter 上进行两个水平的虚假信息检测,并介绍了 Tweet 级验证的基准结果。
Oct, 2020
该文介绍了 GeoCoV19—— 一个包含 524 百万条推文的大规模 Twitter 数据集,通过基于地名词典的方法来推断推文的地理位置,而这一大规模、多语言、地理定位的社交媒体数据可以帮助研究社区评估社会如何共同应对这一前所未有的全球危机,以及建立计算方法来应对如识别假新闻,理解社区的知识差距,建立疾病预测和监测模型等挑战。
May, 2020
本研究利用推特对澳大利亚 COVID-19 病例进行情感分析和话题模型分析,探究社交媒体对疫情预测的作用,结果表明加入社交媒体变量可以改进疫情预测模型的准确性,并发布全球的 MegaGeoCOV 数据集,以帮助更好地理解全球疫情的动态。
Jun, 2022
该研究通过开发和发布人工注释的大规模阿拉伯推文数据集 ArCovidVac 来解决 COVID-19 疫苗接种期间社交媒体上流传的谣言和阴谋论的鉴别问题,并通过对数据的深入分析和基于 transformer 模型的评估来探究推文内容、态度和类型的时空变化。
Jan, 2022