COVID-19 的 Instagram 首个数据集
本文描述了自 2020 年 1 月 22 日以来我们不断收集的多语种新冠状病毒 Twitter 数据集,旨在通过研究在线谈话动态以及科学信息和未经验证的谣言的跟踪等方面,了解这一全球性危机的影响。最终,该数据集可能有助于推动针对这一全球危机的知情决策和有针对性的政策干预。
Mar, 2020
本研究旨在推广社交媒体研究对抗 COVID-19 及其他传染病。通过对 COVID-19 微博的量化和定性分析,我们提供了多种处理数据集的方法,并分享了一个多语种社交媒体数据集,供研究人员使用。
Apr, 2020
本文介绍了 2020 年 1 月 1 日以来首个收集的新冠肺炎疫情下阿拉伯语推特数据集,该数据集可帮助研究人员和决策者研究与该大流行相关的不同社会问题,包括行为变化、信息共享、流言传播等等。
Apr, 2020
本文介绍了一份包含 1 月 1 日至 4 月 4 日之间各地 152 万条与 COVID-19 有关的推文的数据集,为研究社交动态、情感反应等提供支持。
Apr, 2020
本研究从新浪微博采集了超过 4000 万条由 2019 年 12 月 1 日至 2020 年 4 月 30 日期间发表的 COVID-19 的微博数据,包含了微博级别的信息、互动信息、位置信息和转发网络,以期促进从多个角度开展 COVID-19 研究,并有助于更好地和更快地抑制这一大流行病的传播。
May, 2020
本研究通过分析 Twitter、Instagram、YouTube、Reddit、Gab 等社交媒体平台上信息扩散的情况,探讨了 COVID-19 话题的传播情况,并运用流行病学模型分析了每个社交媒体平台在信息传播方面的表现,发现每个平台都存在不同程度的虚假信息和谣言传播,但可靠和可疑来源的信息传播模式并无不同。最后,该研究提供了各社交媒体平台特定的谣言放大估计数值。
Mar, 2020
该文介绍了 GeoCoV19—— 一个包含 524 百万条推文的大规模 Twitter 数据集,通过基于地名词典的方法来推断推文的地理位置,而这一大规模、多语言、地理定位的社交媒体数据可以帮助研究社区评估社会如何共同应对这一前所未有的全球危机,以及建立计算方法来应对如识别假新闻,理解社区的知识差距,建立疾病预测和监测模型等挑战。
May, 2020
通过大规模数据采集和分析,本文发现新冠疫情期间社交媒体的信息泛滥现象(infodemic)给医疗建议和经济造成了负面影响,因此应采取危机管理和社交网络管理策略,确保信息可靠和可信。
May, 2020
本研究提供了一个大规模的、符合 Twitter 隐私政策、FAIR 原则的开放数据集,该数据集基于全球自 2021 年 11 月 COVID-19 德尔塔毒株被首次发现以来与网上学习相关的推文。这份工作还简要概述了使用该数据集进行在线学习研究的一些潜在应用,包括大数据、数据挖掘和自然语言处理。
Jul, 2022
本论文通过分析推特数据集,使用多种机器学习算法评估情感,并对数据集的情境进行学习,以识别正面、负面和中性情绪,并向公众传达积极意见,提高公众意识和预防新冠病毒。
Nov, 2021