COVIDHealth: 一个基于 Twitter 的数据集和基于机器学习的网络应用程序,用于分类 COVID-19 讨论
通过使用嵌入、深度学习模型和网格搜索算法对 Twitter COVID-19 数据集进行情感分类,本研究提出了八种不同的混合深度学习模型,旨在提高模型的整体准确性,研究表明,COVID-19 疫苗接种的公众情绪随时间逐渐改善,所提出的模型在广泛的评估中报告了 98.86% 的增加准确性,超过其他模型。
Jun, 2024
通过对新冠病毒相关的推特数据进行情感分析和机器学习分类研究,对美国公众持续恐慌的情感变化进行监测和分析,结果表明短推特使用 Naive Bayes 算法能得到 91% 的分类准确率。
May, 2020
提取了 COVID-19 推文的关键主题和情感,使用深度学习模型实现了更好的主题标签提取和情感分析,以及最高的准确率。
Dec, 2023
本研究为 Constraint 2021 年 COVID-19 虚假新闻检测共享任务做出了贡献,提出了将经典机器学习算法与语言学特征相结合的方法,在数据预处理方面进行了多种尝试并得到了不错的结果。通过使用线性支持向量机算法,在测试数据上获得了 95.19% 的加权平均 F1 得分,名列排行榜第 80 位。
Jan, 2021
本文采用自然语言处理技术,从社交媒体中提取 COVID-19 相关的讨论,并使用主题建模和 LSTM 循环神经网络方法进行情感分类,以深入了解公众意见,指导相关决策。
Apr, 2020
本研究使用深度学习模型,利用印度 Twitter 数据集,对 COVID-19 疫情的第一至第三波进行话题建模,发现官方治理、疫苗接种和疫情管理等是话题重叠的主题,并发现 COVID-19 疫情的政治、社会和经济情况下出现了新问题。研究结果表明,不同时期的主要话题与相应时间段流行的新闻媒体有强烈的定性相关性。该研究还具有扩展到其他国家和地区捕捉 COVID-19 疫情不同阶段的主要问题的潜力。
Feb, 2023
本研究使用数据分析和情感分析等方法,以 Twitter 为研究对象,收集了截至 2020 年 7 月 COVID-19 相关的 19298967 条推文,探讨了公众舆论和社交媒体传播的重要性。
Jan, 2021
本研究提供了一个大规模的、符合 Twitter 隐私政策、FAIR 原则的开放数据集,该数据集基于全球自 2021 年 11 月 COVID-19 德尔塔毒株被首次发现以来与网上学习相关的推文。这份工作还简要概述了使用该数据集进行在线学习研究的一些潜在应用,包括大数据、数据挖掘和自然语言处理。
Jul, 2022
本研究分析了多个多标签文档分类模型在 LitCovid 数据集上的表现,发现在该数据集上微调过的预训练语言模型表现最佳,并探讨了其数据效率和可推广性,同时也提出了未来研究中需要解决的问题,数据和代码均在 GitHub 上可获取。
Jun, 2020
本文描述了自 2020 年 1 月 22 日以来我们不断收集的多语种新冠状病毒 Twitter 数据集,旨在通过研究在线谈话动态以及科学信息和未经验证的谣言的跟踪等方面,了解这一全球性危机的影响。最终,该数据集可能有助于推动针对这一全球危机的知情决策和有针对性的政策干预。
Mar, 2020