COVID-19 的 Instagram 首个数据集

Apr, 2020

A First Instagram Dataset on COVID-19

Koosha Zarei, Reza Farahbakhsh, Noel Crespi, Gareth Tyson

TL;DR该研究提供了一个多语种的新冠病毒 Instagram 数据集，旨在帮助研究社区更好地了解 Instagram 这一主要社交媒体中这一现象背后的动态，并帮助研究这一疫情相关的错误信息的传播。

Abstract

The novel coronavirus (covid-19) pandemic outbreak is drastically shaping and reshaping many aspects of our life, with a huge impact on our social life. In this era of lockdown policies in most of the major citie

coronavirus covid-19 social media infodemic dataset

发现论文，激发创造

追踪社交媒体上关于 COVID-19 大流行的话题：公共冠状病毒 Twitter 数据集的建立

本文描述了自 2020 年 1 月 22 日以来我们不断收集的多语种新冠状病毒 Twitter 数据集，旨在通过研究在线谈话动态以及科学信息和未经验证的谣言的跟踪等方面，了解这一全球性危机的影响。最终，该数据集可能有助于推动针对这一全球危机的知情决策和有针对性的政策干预。

Mar, 2020

NAIST COVID：跨语言 COVID-19 Twitter 和 Weibo 数据集

本研究旨在推广社交媒体研究对抗 COVID-19 及其他传染病。通过对 COVID-19 微博的量化和定性分析，我们提供了多种处理数据集的方法，并分享了一个多语种社交媒体数据集，供研究人员使用。

Apr, 2020

COVID-19 的大规模阿拉伯语 Twitter 数据集

本文介绍了 2020 年 1 月 1 日以来首个收集的新冠肺炎疫情下阿拉伯语推特数据集，该数据集可帮助研究人员和决策者研究与该大流行相关的不同社会问题，包括行为变化、信息共享、流言传播等等。

Apr, 2020

一个用于开放科学研究的大规模 COVID-19 推特聊天数据集 -- 一个国际合作项目

本文介绍了一份包含 1 月 1 日至 4 月 4 日之间各地 152 万条与 COVID-19 有关的推文的数据集，为研究社交动态、情感反应等提供支持。

Apr, 2020

Weibo-COV: 来自微博平台的大规模 COVID-19 社交媒体数据集

本研究从新浪微博采集了超过 4000 万条由 2019 年 12 月 1 日至 2020 年 4 月 30 日期间发表的 COVID-19 的微博数据，包含了微博级别的信息、互动信息、位置信息和转发网络，以期促进从多个角度开展 COVID-19 研究，并有助于更好地和更快地抑制这一大流行病的传播。

May, 2020

COVID-19 社交媒体信息疫情

本研究通过分析 Twitter、Instagram、YouTube、Reddit、Gab 等社交媒体平台上信息扩散的情况，探讨了 COVID-19 话题的传播情况，并运用流行病学模型分析了每个社交媒体平台在信息传播方面的表现，发现每个平台都存在不同程度的虚假信息和谣言传播，但可靠和可疑来源的信息传播模式并无不同。最后，该研究提供了各社交媒体平台特定的谣言放大估计数值。

Mar, 2020

GeoCoV19: 一个拥有数亿条多语言 COVID-19 推文和位置信息的数据集

该文介绍了 GeoCoV19—— 一个包含 524 百万条推文的大规模 Twitter 数据集，通过基于地名词典的方法来推断推文的地理位置，而这一大规模、多语言、地理定位的社交媒体数据可以帮助研究社区评估社会如何共同应对这一前所未有的全球危机，以及建立计算方法来应对如识别假新闻，理解社区的知识差距，建立疾病预测和监测模型等挑战。

May, 2020

社交网络信息疫情对抗新冠病毒 COVID-19 大流行的关键影响：基于 Twitter 的研究及未来方向

通过大规模数据采集和分析，本文发现新冠疫情期间社交媒体的信息泛滥现象（infodemic）给医疗建议和经济造成了负面影响，因此应采取危机管理和社交网络管理策略，确保信息可靠和可信。

May, 2020

当前 COVID-19 Omicron 波在线学习的 Twitter 谈话的大规模数据集

本研究提供了一个大规模的、符合 Twitter 隐私政策、FAIR 原则的开放数据集，该数据集基于全球自 2021 年 11 月 COVID-19 德尔塔毒株被首次发现以来与网上学习相关的推文。这份工作还简要概述了使用该数据集进行在线学习研究的一些潜在应用，包括大数据、数据挖掘和自然语言处理。

Jul, 2022

新冠疫情微博数据情感分析

本论文通过分析推特数据集，使用多种机器学习算法评估情感，并对数据集的情境进行学习，以识别正面、负面和中性情绪，并向公众传达积极意见，提高公众意识和预防新冠病毒。

Nov, 2021