利用标签分析与 COVID-19 相关的开源项目的目的和技术应用
本篇论文通过对早期疫情时期远程软件开发团队在 GitHub 上的仓库进行系统分析,发现了疫情对这些团队的生产力和活跃成员数量产生的显著影响。并进一步研究了事件对于各个团队的异质性影响,发现在疫情前团队的某些特点与其韧性高度相关,并通过靴带回归分析揭示出哪些团队对于如此的冲击更具韧性和稳健性。
Jan, 2023
基于 CORD-19 文本摘要的 CORToViz 可视化工具,利用最新科技,通过聚类文章并提取主题的方法,提供快速可视化主题内容和趋势的交互式仪表盘,适用于任何文本文档语料库的数据准备和结果可视化。
Oct, 2023
本文提供了一种结合大型数据建模、信息制图和趋势分析的新型自动化主题可视化方法,用于快速发现 COVID-19 疫情下的主题和研究资源,结果显示了有关社交隔离、医疗话题、病毒在不同地区的演变轨迹等信息,同时也表明了迫切需要快速自动化地进行大规模数据的搜索和浏览。
May, 2020
本文描述了自 2020 年 1 月 22 日以来我们不断收集的多语种新冠状病毒 Twitter 数据集,旨在通过研究在线谈话动态以及科学信息和未经验证的谣言的跟踪等方面,了解这一全球性危机的影响。最终,该数据集可能有助于推动针对这一全球危机的知情决策和有针对性的政策干预。
Mar, 2020
本文介绍了一份包含 1 月 1 日至 4 月 4 日之间各地 152 万条与 COVID-19 有关的推文的数据集,为研究社交动态、情感反应等提供支持。
Apr, 2020
本研究通过多种数据源建立了多个机器学习模型对当前 COVID-19 研究场景进行了表征,包括识别潜在主题、分析出版物相似性和情感。结果表明 PubMed 和 ArXiv 中的研究类型存在显著区别,前者在 COVID-19 相关问题的多样性方面具有更大的多样性,后者则更关注预测 / 诊断 COVID-19 的智能系统 / 工具。研究团队对高危人群和并发症患者的特别关注也得到了证实。
Jul, 2020
本研究利用自然语言处理、文本挖掘和网络分析等方法,对与 COVID-19 大流行有关的推文语料库进行分析,识别不同时期应对疫情的常见方法并揭示其差异,同时揭示了从疫情早期开始通过 Twitter 传播信息和谣言的方式。最后,本研究介绍了一个跨多种语言及来源国家采集的推文数据集,有助于为决策者提供应对未来大流行的参考,并可用于获取有价值的知识以缓解当前 COVID-19 大流行。
Mar, 2020
通过大规模数据采集和分析,本文发现新冠疫情期间社交媒体的信息泛滥现象(infodemic)给医疗建议和经济造成了负面影响,因此应采取危机管理和社交网络管理策略,确保信息可靠和可信。
May, 2020
本研究通过对近 530,000 条使用波斯语发布的推文进行内容分类和频率统计,分析伊朗公众对 COVID-19 的反应和演变趋势。其中,居家隔离生活经验是讨论的主要话题之一。此方法还可用于检测伊朗公众对国内外相关政策和事件的反应。
May, 2020
本研究利用推特对澳大利亚 COVID-19 病例进行情感分析和话题模型分析,探究社交媒体对疫情预测的作用,结果表明加入社交媒体变量可以改进疫情预测模型的准确性,并发布全球的 MegaGeoCOV 数据集,以帮助更好地理解全球疫情的动态。
Jun, 2022