利用自然语言处理技术对伊朗 COVID-19 疫情期间波斯 / 波斯语推文进行内容分析
本文利用数据挖掘技术和情感分析工具,分析了伊朗社交媒体上关于 COVID-19 疫苗的公众舆情,结果显示该话题广泛关注,从政府问题、安全到犹豫和副作用等各个角度得到了探讨,公共接种和感染率等相关现象深刻地影响了公众情绪和用户互动。
Feb, 2023
本论文使用多语言句子嵌入的神经网络对欧洲 COVID-19 疫情爆发期间收集的 Twitter 消息进行情感分析,并将结果按来源国分离,通过与国家事件的相关性进行时间性发展的相关性分析,研究疫情对人们情绪的影响。
Aug, 2020
本研究利用推特对澳大利亚 COVID-19 病例进行情感分析和话题模型分析,探究社交媒体对疫情预测的作用,结果表明加入社交媒体变量可以改进疫情预测模型的准确性,并发布全球的 MegaGeoCOV 数据集,以帮助更好地理解全球疫情的动态。
Jun, 2022
本研究基于 2020 年 1 月 29 日至 3 月 4 日期间采集的 6700 万条推特,分析了 COVID-19 在 Twitter 上的公共讨论,研究人员从用户所在的国家、社会身份和政治倾向等方面分类,发现虽然大多数有影响力的推特来自新闻媒体、政府官员和个人新闻记者,但影响力最大的推特仍然由普通用户发布。普通用户更容易传播提到 “假新闻” URL 和虚假信息故事情节的推文,而指向 “假新闻” 站点的 URL 的推文最有可能在来源国内被转发,因此不太可能在国际上传播。
Jun, 2020
本文介绍了 2020 年 1 月 1 日以来首个收集的新冠肺炎疫情下阿拉伯语推特数据集,该数据集可帮助研究人员和决策者研究与该大流行相关的不同社会问题,包括行为变化、信息共享、流言传播等等。
Apr, 2020
本文描述了自 2020 年 1 月 22 日以来我们不断收集的多语种新冠状病毒 Twitter 数据集,旨在通过研究在线谈话动态以及科学信息和未经验证的谣言的跟踪等方面,了解这一全球性危机的影响。最终,该数据集可能有助于推动针对这一全球危机的知情决策和有针对性的政策干预。
Mar, 2020
为了更好地了解公众行为、兴趣话题、政府要求、推特来源等等,并防止有关病毒或不良治疗方法的谣言和误报的传播,在研究中,我们提供了一个人工标注的阿拉伯语推特最大数据集,描述了其注释指南、分析了数据集并构建了有效的机器学习和 Transformer 模型以进行分类。
Dec, 2020
本研究利用自然语言处理、文本挖掘和网络分析等方法,对与 COVID-19 大流行有关的推文语料库进行分析,识别不同时期应对疫情的常见方法并揭示其差异,同时揭示了从疫情早期开始通过 Twitter 传播信息和谣言的方式。最后,本研究介绍了一个跨多种语言及来源国家采集的推文数据集,有助于为决策者提供应对未来大流行的参考,并可用于获取有价值的知识以缓解当前 COVID-19 大流行。
Mar, 2020
本研究旨在推广社交媒体研究对抗 COVID-19 及其他传染病。通过对 COVID-19 微博的量化和定性分析,我们提供了多种处理数据集的方法,并分享了一个多语种社交媒体数据集,供研究人员使用。
Apr, 2020
本研究基于 Nepali 语言使用自动化的社交媒体分析工具,将 COVID-19 相关的推文自动分类为八个主题,并使用网络平台呈现结果,该研究比较了 Nepali 的两个最新多语言语言模型(mBERT 和 MuRIL)的表现。结果表明,MuRIL 在大数据集下表现更好。
Oct, 2022