基于强化学习的反误信息生成：以 COVID-19 疫苗误信息为例

WWWMar, 2023

基于强化学习的反误信息生成：以 COVID-19 疫苗误信息为例

Reinforcement Learning-based Counter-Misinformation Response Generation: A Case Study of COVID-19 Vaccine Misinformation

PDF

Bing He, Mustaque Ahamad, Srijan Kumar

TL;DR本论文旨在通过建立一个基于强化学习的生成式文本模型 MisinfoCorrect 来有效地纠正不实信息，在社交媒体和众包数据的基础上，创造了两个新的数据集，并通过定量和定性评估证明了该模型可以生成高质量的反驳回复，提高了礼貌性，事实性和反驳态度。

Abstract

The spread of online misinformation threatens public health, democracy, and the broader society. While professional fact-checkers form the first line of defense by fact-checking popular false claims, they do not engage directly in conversations with →

misinformation counter-misinformation responses generative text models social media reinforcement learning

发现论文，激发创造

基于证据驱动的在线虚假信息检索增强响应生成

通过从科学性来源收集支持证据并基于这些证据生成反错误信息响应，RARG（检索增强的在线错误信息响应生成）方法在 COVID-19 案例中展示了在数据集上始终优于基准的产生高质量反错误信息响应。

Mar, 2024

AMIR: 自动辟谣系统 -- 基于 COVID-19 疫苗数据集的推荐系统

利用社交媒体上的已存在信息并结合经过筛选的事实核实数据仓库，本研究旨在探讨如何实现规模化的自动化辟谣，以应对 COVID-19 相关的错误信息。

Oct, 2023

通过情感反应生成对抗错误信息

社交媒体平台上的信息错误传播对公共健康、社会凝聚力以及最终的民主构成了重大威胁。本文介绍了 VerMouth，这是第一个包括大约 1.2 万个声称 - 回应对的大规模数据集，涵盖了社交媒体风格和基本情感等两个在信息错误的可信度和传播中具有重要作用的因素。

Nov, 2023

群众在对抗错误信息中的作用：COVID-19 信息疫情的案例研究

本文研究了社交媒体上与 COVID-19 有关的虚假言论和事实检查，发现专业的事实检查虽然重要但可见性有限，而互联网用户通过众包的方式可以在社交平台上成功地反驳虚假言论。

Nov, 2020

人机协同评估早期谣言检测：COVID-19 治疗方案的案例研究

该研究提出了一种基于人机交互的事实检查和追踪社交媒体信息违反相关政策的评估框架，采用现代化的自然语言处理方法和特定斯坦斯分类器通过提取和聚合结构化身份，鉴定和评估可能造成风险的要求，评估基于其潜在风险的全新误导的声明，为人机协助的事实检查提供了一个合理的基准。

Dec, 2022

错误信息的困惑度高

本文提出了一种基于信息困惑度的非监督式方法来辟谣虚假言论，该方法主要通过从科学和新闻来源中提取可靠证据，然后利用信息困惑度评估言论的正确性，在 COVID-19 相关测试集上进行实证验证，表现优于现有系统。

Jun, 2020

谣言服务员：以策展推特 COVID-19 疫苗数据为基础的概念验证

我们展示了一个名为 “Misinformation Concierge” 的概念验证，它通过使用语言处理和机器学习工具来识别讨论的子主题和辨别虚假 / 误导性帖子，向决策者呈现统计报告，帮助他们及时了解流行的虚假信息的整体情况，并从数据语料库中识别具体的虚假信息，提供干预和迅速反驳虚假信息的方式。我们提供了一个通过策动数据集访问的 “Misinformation Concierge” 概念验证。

Aug, 2023

中等收入国家的 COVID-19 疫苗虚假信息

本研究介绍了一个涉及巴西、印度尼西亚和尼日利亚三个中等收入国家的 COVID-19 疫苗错误信息的多语言数据集。我们采用了两种方法来开发 COVID-19 疫苗错误信息检测模型：领域特定的预训练和使用大型语言模型进行文本增强。我们的最佳错误信息检测模型相较于基准模型在宏 F1 分数上的改进范围从 2.7 到 15.9 个百分点。此外，我们将我们的错误信息检测模型应用于 2020 年至 2022 年期间来自这三个国家的 1900 万条未标记推文的大规模研究，展示了我们数据集和模型在多个国家和语言中检测和分析疫苗错误信息的实际应用。我们的分析结果表明，巴西和印度尼西亚的新冠病例数量的百分比变化与 COVID-19 疫苗错误信息率呈错位的正相关，而这三个国家之间的错误信息率之间存在显著的正相关。

Nov, 2023

一个半监督框架用于虚假信息检测

使用半监督学习框架来解决极度类别不平衡的问题，并使用实际数据扩充少数类别，该方法在处理社交媒体中极不平衡的发布单元时比 SMOTE、ADASYN、GAN 等其他方法效果显著提高，尤其在相关的 Covid 数据上初步测试表明有效性。

Apr, 2023

面向知识驱动的仇恨言论反叙事生成

该研究提出一种基于外部知识库的完整反叙事生成管道，以对抗网上仇恨。实验证明，该模型可以在领域内和跨领域环境下生成适合和信息丰富的反叙事。

Jun, 2021