使用深度学习导航 COVID-19 谣言万花筒
本研究提出了一种基于对比学习和对抗域混合的无监督域自适应框架,用于将知识从现有数据域传递到目标 COVID-19 数据域,以适应 COVID-19 误信息检测系统。实验证明,我们的方法相比最新的基线算法能够有效地适应未知的 COVID-19 目标领域并取得显著的改进。
Oct, 2022
本文提出了一种用于早期误报检测(CANMD)的对比适应网络,它通过伪标记和标签纠正组件相结合,有效地适应了未知 COVID-19 目标领域,与现有技术相比,取得了显著的改进。
Aug, 2022
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022
该研究探讨了预训练和精调模型的泛化性在虚假新闻检测任务中的效果,发现现有模型在别的数据集上表现不佳但是能够在重叠数据集上取得较高的准确度,提出了基于 K-Means 聚类的快速有效的解决方法
May, 2022
本文提出了一种基于变压器的语言模型微调方法,用于检测 COVID-19 假新闻,该方法通过扩展专业短语的语义,适应热身 softmax 损失以区分硬挖掘样本,并通过对抗性训练提高模型的鲁棒性,采用 RoBERTa 和领域专用模型 CT-BERT 提取预测特征,并由一个多层感知器融合细粒度和高级别的特定表示。经 COVID-19 假新闻数据集评估,实验结果在各种评估指标上都表现优越,最好的加权平均 F1 得分为 99.02%。
Jan, 2021
本文提出 MetaAdapt,一个基于元学习的方法,旨在解决在社交媒体等新兴领域中针对虚假信息检测的数据稀缺性问题,具有更好的领域适应性、优秀的表现和大幅减少的参数。
May, 2023
为了抗击 COVID-19 疫情期间社交媒体上的虚假信息,本文提出两种方法,一是 fine-tuning transformers-based language models,二是通过 influence data cleansing 去除危险的训练实例。通过在两个 COVID-19 虚假新闻测试集上评估模型,我们强调了此任务的模型泛化能力的重要性。最终模型可以达到高性能和模型泛化性能的平衡。
Jan, 2021
本文提出了三种基于多模态 transformer 的假新闻检测模型,并通过深入分析操纵数据的方法来探索这些模型在社交媒体上实际使用情况下的性能。研究发现,这些系统在面临被操纵的数据时会出现显著性能下降。为了减少偏差并改善模型的推广能力,本文建议使用数据增强技术对社交媒体上的假新闻检测进行更有意义的实验。所提出的数据增强技术使得模型的泛化能力得到了提高,并获得了最先进的效果。
May, 2023
本研究提出一种基于新闻来源可信度标签的弱监督学习方法,通过自监督或重新标注等方式纠正可能存在的标签不准确性,构建大规模、多样化的新领域虚假信息数据集。同时,本文应用提出的方法提供了一个 COVID-19 疫苗虚假信息数据集。
Feb, 2022
本研究旨在调查虚假信息检测模型在不同背景环境下的知识可转移性,为南非社交媒体环境提供一种多模态虚假信息检测模型,并引入南非虚假信息数据集。结果表明,将南非样本用于模型训练可以提高模型性能,并且多模态模型比文本和视觉单模态模型保留更多知识。研究表明,虚假信息检测模型的性能受其运行环境的文化细微差别影响,并且多模态模型有助于在不同背景环境之间的知识转移。因此,在虚假信息检测模型的训练过程中应该纳入本地数据以优化模型性能。
Dec, 2023