中等收入国家的 COVID-19 疫苗虚假信息

EMNLPNov, 2023

中等收入国家的 COVID-19 疫苗虚假信息

COVID-19 Vaccine Misinformation in Middle Income Countries

Jongin Kim, Byeo Rhee Back, Aditya Agrawal, Jiaxi Wu, Veronika J. Wirtz...

TL;DR本研究介绍了一个涉及巴西、印度尼西亚和尼日利亚三个中等收入国家的 COVID-19 疫苗错误信息的多语言数据集。我们采用了两种方法来开发 COVID-19 疫苗错误信息检测模型：领域特定的预训练和使用大型语言模型进行文本增强。我们的最佳错误信息检测模型相较于基准模型在宏 F1 分数上的改进范围从 2.7 到 15.9 个百分点。此外，我们将我们的错误信息检测模型应用于 2020 年至 2022 年期间来自这三个国家的 1900 万条未标记推文的大规模研究，展示了我们数据集和模型在多个国家和语言中检测和分析疫苗错误信息的实际应用。我们的分析结果表明，巴西和印度尼西亚的新冠病例数量的百分比变化与 COVID-19 疫苗错误信息率呈错位的正相关，而这三个国家之间的错误信息率之间存在显著的正相关。

Abstract

This paper introduces a multilingual dataset of COVID-19 vaccine misinformation, consisting of annotated tweets from three middle-income countries: Brazil, Indonesia, and Nigeria. The expertly curated dataset includes annotations for 5,952 tweets, assessing their relevance to COVID-19

covid-19 vaccine misinformation multilingual dataset misinformation detection models large-scale study covid-19 cases

发现论文，激发创造

使用 BERT 的 COVID-19 谣言检测二阶分类器：对印尼推文的研究

本研究通过构建印度尼西亚语 COVID-19 Tweets 语料库，并使用 IndoBERT 预训练语言模型建立分类器模型，对 tweets 中的信息进行关联度和虚假性评估，结果表明，我们的模型精度达到了 87.02％。

Jun, 2022

CovidMis20: 使用深度学习模型在 Twitter 推文上检测 COVID-19 的误信息

本研究介绍 CovidMis20 数据集，该数据集收集了从 2020 年 2 月到 7 月期间 1,375,592 条推文，用于利用基于深度学习的 Bi-LSTM 和集成 CNN + Bi-GRU 的方法进行假新闻检测，后者的测试精度优于前者。

Sep, 2022

分析尼日利亚网络空间中的 COVID-19 疫苗情感：基于手动标注的 Twitter 数据集的洞察

使用 Transformer-based 语言模型研究尼日利亚人对疫苗的接受程度，数据分析及可视化表明，大多数推文对 COVID-19 疫苗持中立态度，个别人表示积极看法，对特定疫苗类型没有强烈偏好，尽管 Moderna 疫苗获得了稍微更多的积极情绪。同时发现，通过对适当数据集进行微调，即使预训练的 LLM 没有在特定语言上进行过预训练，也可以获得有竞争力的结果。

Jan, 2024

谎言的时代不好过：俄乌战争、COVID-19 和难民信息识别

本研究构建了一个新的数据集 MiDe-22，包括 5,284 条英文推文和 5,064 条土耳其推文，涵盖了包括俄罗斯 - 乌克兰战争、COVID-19 疫情和难民等几个最近事件，并提供了推文的用户参与度。研究提供了详细的数据分析和实验结果，并对误信息检测进行了基准评估。

Oct, 2022

准确 COVID-19 信息与错误信息的大规模比较研究

本文通过对超过 2.42 亿条推文的大规模计算分析，对 COVID-19 流言与准确信息的特征进行比较研究，并创建了 COVID-19 的流言分类数据集，研究发现该数据集可提高流言分类的正确率超过 9%。

Apr, 2023

跨语言 COVID-19 虚假新闻检测

本文介绍了一种利用已经被 fact-check 过的英文新闻数据集，通过建立一个名为 CrossFake 的深度学习框架来识别汉语低資源下的 COVID-19 虚假信息。经实验结果表明，CrossFake 在跨语言环境下的情况下比其他单语和跨语言虚假信息检测器更有效。

Oct, 2021

疫苗谎言：一个自然语言资源，用于学习识别关于 COVID-19 和 HPV 疫苗的错误信息

该研究收集了关于新冠疫苗和人类乳头瘤病毒疫苗的大量推文数据，并对这些推文进行了虚假信息目标分类，以便于检测和识别，从而更好了解社交媒体上针对疫苗的虚假信息以及相关担忧。

Feb, 2022

印度和美国 COVID-19 错误信息的情感特征及其对疫苗接种结果的影响

本研究旨在揭示 COVID-19 期间不实信息的情感承载者在不同国家和时期的差异，以及其对接种率的影响，研究表明，不实信息的情感承载者因地理区域和时间的不同而异，对情感的监测可以开发战略干预以打击不实信息，提高公共健康水平。

Jun, 2023

MM-COVID: 用于打击 COVID-19 虚假信息的多语言和多模态数据存储库

为了更好地应对 COVID-19 假新闻，我们提出了一个新的假新闻数据集 MM-COVID（多语言和多维 COVID-19 假新闻数据存储库），该数据集提供了多语言假新闻和相关社会背景。我们从不同角度对 MM-COVID 进行了详细的探索性分析，展示了在 COVID-19 假新闻研究的多语言和社交媒体的几个潜在应用方面的实用性。

Nov, 2020

AMIR: 自动辟谣系统 -- 基于 COVID-19 疫苗数据集的推荐系统

利用社交媒体上的已存在信息并结合经过筛选的事实核实数据仓库，本研究旨在探讨如何实现规模化的自动化辟谣，以应对 COVID-19 相关的错误信息。

Oct, 2023