X-CapsNet 用于虚假新闻检测
本文报告了一种基于 Transformer 模型(BERT、ALBERT 和 XLNET)的方法来分析 COVID-19 流行病期间社交媒体上共享信息的可靠性,以便快速检测假新闻,减少假信息的传播,该方法在 ConstraintAI 2021 共享任务 COVID19 Fake News Detection in English 中获得了 0.9855 的 f1 值,排名第 5。
Jan, 2021
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
本文介绍了 Fake News Challenge stage #1 (FNC-1) 数据集并概述了使用该数据集构建伪新闻检测系统的竞争尝试。通过使用不同的自然语言处理技术处理标题和正文文本,提取特征并使用软余弦相似性方法计算相似度。该系统使用深度学习方法进行分类,除了 “disagree” 类别外,其余类别均达到高准确性,最终分类准确率达到 84.6%,在该数据集上排名第二。
Oct, 2022
本文介绍了一种新颖的方法,该方法是由我们团队提出的,用于将来自 Latent Dirichlet Allocation(LDA)的主题分布与来自 XLNet 的情境表示相结合,用于 COVID19 假新闻检测的共享任务,并与基准线进行了比较,表明 XLNet + 主题分布通过获得 0.967 的 F1 分数而优于其他方法。
Jan, 2021
本文提出一种利用卷积神经网络和长短期循环神经网络模型的混合方法,从 Twitter 帖子中检测和分类假新闻信息的框架,精度可达 82%。该方法能够直观地识别假新闻故事的相关特征而无需领域知识。
Jun, 2018
本文研究了基于文本和图像信息的卷积神经网络 TI-CNN,通过提取虚假新闻中的显式和潜在特征,将文本和图像信息投影到统一特征空间中进行训练,以此来解决自动检测虚假新闻的问题。
Jun, 2018
研究分析了基于混合图神经网络和 transformer 模型的社交语境对于发现假新闻的作用,并且在 PolitiFact 和 Gossipcop 数据集上获得了 0.91 和 0.93 的 f1 得分,表现优于基线模型。
Jul, 2022
介绍了一种使用两个并行 BERT 网络来对全文新闻文章进行真实性检测的新方法 MWPBert,通过 MaxWorth 算法选择更有价值的新闻文本部分,最终将两个 BERT 网络的输出编码为一个输出网络,实验结果表明该模型在准确性和其他性能指标方面优于以前的模型。
Apr, 2022
该研究利用基于转换器的五种模型 (BERT、BERT without LSTM、ALBERT、RoBERTa 和 BERT & ALBERT 混合) 对 COVID 19 虚假新闻进行比较分析,其中 RoBERTa 模型在真假两类中均获得 0.98 的 F1 得分,相比其他模型表现更佳。
Aug, 2022
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022