使用深度学习导航 COVID-19 谣言万花筒

EMNLPSep, 2021

使用深度学习导航 COVID-19 谣言万花筒

Navigating the Kaleidoscope of COVID-19 Misinformation Using Deep Learning

Yuanzhi Chen, Mohammad Rashedul Hasan

TL;DR通过系统研究表明，基于深度 Transformer 的预训练模型，虽然在混合领域转移学习方面表现出色，但无法为检测 COVID-19 社交媒体数据中的错误信息提供通用解决方案。因此，本文提出了一种使用浅层网络和卷积神经网络的分层方法来提取目标数据中的局部和全局上下文，从而实现更为具有普适性的解决方案。

Abstract

Irrespective of the success of the deep learning-based mixed-domain transfer learning approach for solving various Natural Language Processing tasks, it does not lend a generalizable solution for detecting misinformation from →

misinformation covid-19 social media convolutional neural networks global context

发现论文，激发创造

COVID-19 信息服务的无监督域自适应对比敌对域混合

本研究提出了一种基于对比学习和对抗域混合的无监督域自适应框架，用于将知识从现有数据域传递到目标 COVID-19 数据域，以适应 COVID-19 误信息检测系统。实验证明，我们的方法相比最新的基线算法能够有效地适应未知的 COVID-19 目标领域并取得显著的改进。

Oct, 2022

基于对比领域自适应的早期虚假信息检测：以 COVID-19 为例

本文提出了一种用于早期误报检测（CANMD）的对比适应网络，它通过伪标记和标签纠正组件相结合，有效地适应了未知 COVID-19 目标领域，与现有技术相比，取得了显著的改进。

Aug, 2022

使用 Transformer 和 TF-IDF 检测 COVID-19 阴谋论

研究者通过设计和应用不同的机器学习模型，在探测虚假新闻方面取得了进展，但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果，并试验了一组基于文本的模型，包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果，但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。

May, 2022

评估微调模型在假新闻检测中的泛化性能

该研究探讨了预训练和精调模型的泛化性在虚假新闻检测任务中的效果，发现现有模型在别的数据集上表现不佳但是能够在重叠数据集上取得较高的准确度，提出了基于 K-Means 聚类的快速有效的解决方法

May, 2022

基于 Transformer 的语言模型微调方法在 COVID-19 假新闻检测中的应用

本文提出了一种基于变压器的语言模型微调方法，用于检测 COVID-19 假新闻，该方法通过扩展专业短语的语义，适应热身 softmax 损失以区分硬挖掘样本，并通过对抗性训练提高模型的鲁棒性，采用 RoBERTa 和领域专用模型 CT-BERT 提取预测特征，并由一个多层感知器融合细粒度和高级别的特定表示。经 COVID-19 假新闻数据集评估，实验结果在各种评估指标上都表现优越，最好的加权平均 F1 得分为 99.02％。

Jan, 2021

MetaAdapt: 基于 Meta Learning 的领域自适应小样本谣言检测

本文提出 MetaAdapt，一个基于元学习的方法，旨在解决在社交媒体等新兴领域中针对虚假信息检测的数据稀缺性问题，具有更好的领域适应性、优秀的表现和大幅减少的参数。

May, 2023

COVID-19 假新闻检测模型的泛化能力

为了抗击 COVID-19 疫情期间社交媒体上的虚假信息，本文提出两种方法，一是 fine-tuning transformers-based language models，二是通过 influence data cleansing 去除危险的训练实例。通过在两个 COVID-19 虚假新闻测试集上评估模型，我们强调了此任务的模型泛化能力的重要性。最终模型可以达到高性能和模型泛化性能的平衡。

Jan, 2021

提高多模态假新闻检测的泛化能力

本文提出了三种基于多模态 transformer 的假新闻检测模型，并通过深入分析操纵数据的方法来探索这些模型在社交媒体上实际使用情况下的性能。研究发现，这些系统在面临被操纵的数据时会出现显著性能下降。为了减少偏差并改善模型的推广能力，本文建议使用数据增强技术对社交媒体上的假新闻检测进行更有意义的实验。所提出的数据增强技术使得模型的泛化能力得到了提高，并获得了最先进的效果。

May, 2023

利用标签精炼从社交媒体话语中构建大规模的虚假信息标记数据集

本研究提出一种基于新闻来源可信度标签的弱监督学习方法，通过自监督或重新标注等方式纠正可能存在的标签不准确性，构建大规模、多样化的新领域虚假信息数据集。同时，本文应用提出的方法提供了一个 COVID-19 疫苗虚假信息数据集。

Feb, 2022

南非社交媒体环境中的多模态错误信息检测

本研究旨在调查虚假信息检测模型在不同背景环境下的知识可转移性，为南非社交媒体环境提供一种多模态虚假信息检测模型，并引入南非虚假信息数据集。结果表明，将南非样本用于模型训练可以提高模型性能，并且多模态模型比文本和视觉单模态模型保留更多知识。研究表明，虚假信息检测模型的性能受其运行环境的文化细微差别影响，并且多模态模型有助于在不同背景环境之间的知识转移。因此，在虚假信息检测模型的训练过程中应该纳入本地数据以优化模型性能。

Dec, 2023