基于强化学习的反误信息生成:以 COVID-19 疫苗误信息为例
通过从科学性来源收集支持证据并基于这些证据生成反错误信息响应,RARG(检索增强的在线错误信息响应生成)方法在 COVID-19 案例中展示了在数据集上始终优于基准的产生高质量反错误信息响应。
Mar, 2024
利用社交媒体上的已存在信息并结合经过筛选的事实核实数据仓库,本研究旨在探讨如何实现规模化的自动化辟谣,以应对 COVID-19 相关的错误信息。
Oct, 2023
社交媒体平台上的信息错误传播对公共健康、社会凝聚力以及最终的民主构成了重大威胁。本文介绍了 VerMouth,这是第一个包括大约 1.2 万个声称 - 回应对的大规模数据集,涵盖了社交媒体风格和基本情感等两个在信息错误的可信度和传播中具有重要作用的因素。
Nov, 2023
本文研究了社交媒体上与 COVID-19 有关的虚假言论和事实检查,发现专业的事实检查虽然重要但可见性有限,而互联网用户通过众包的方式可以在社交平台上成功地反驳虚假言论。
Nov, 2020
该研究提出了一种基于人机交互的事实检查和追踪社交媒体信息违反相关政策的评估框架,采用现代化的自然语言处理方法和特定斯坦斯分类器通过提取和聚合结构化身份,鉴定和评估可能造成风险的要求,评估基于其潜在风险的全新误导的声明,为人机协助的事实检查提供了一个合理的基准。
Dec, 2022
本文提出了一种基于信息困惑度的非监督式方法来辟谣虚假言论,该方法主要通过从科学和新闻来源中提取可靠证据,然后利用信息困惑度评估言论的正确性,在 COVID-19 相关测试集上进行实证验证,表现优于现有系统。
Jun, 2020
我们展示了一个名为 “Misinformation Concierge” 的概念验证,它通过使用语言处理和机器学习工具来识别讨论的子主题和辨别虚假 / 误导性帖子,向决策者呈现统计报告,帮助他们及时了解流行的虚假信息的整体情况,并从数据语料库中识别具体的虚假信息,提供干预和迅速反驳虚假信息的方式。我们提供了一个通过策动数据集访问的 “Misinformation Concierge” 概念验证。
Aug, 2023
本研究介绍了一个涉及巴西、印度尼西亚和尼日利亚三个中等收入国家的 COVID-19 疫苗错误信息的多语言数据集。我们采用了两种方法来开发 COVID-19 疫苗错误信息检测模型:领域特定的预训练和使用大型语言模型进行文本增强。我们的最佳错误信息检测模型相较于基准模型在宏 F1 分数上的改进范围从 2.7 到 15.9 个百分点。此外,我们将我们的错误信息检测模型应用于 2020 年至 2022 年期间来自这三个国家的 1900 万条未标记推文的大规模研究,展示了我们数据集和模型在多个国家和语言中检测和分析疫苗错误信息的实际应用。我们的分析结果表明,巴西和印度尼西亚的新冠病例数量的百分比变化与 COVID-19 疫苗错误信息率呈错位的正相关,而这三个国家之间的错误信息率之间存在显著的正相关。
Nov, 2023
使用半监督学习框架来解决极度类别不平衡的问题,并使用实际数据扩充少数类别,该方法在处理社交媒体中极不平衡的发布单元时比 SMOTE、ADASYN、GAN 等其他方法效果显著提高,尤其在相关的 Covid 数据上初步测试表明有效性。
Apr, 2023