COVIDFakeExplainer:一种基于可解释机器学习的用于检测 COVID-19 虚假新闻的 Web 应用程序
本文报告了一种基于 Transformer 模型(BERT、ALBERT 和 XLNET)的方法来分析 COVID-19 流行病期间社交媒体上共享信息的可靠性,以便快速检测假新闻,减少假信息的传播,该方法在 ConstraintAI 2021 共享任务 COVID19 Fake News Detection in English 中获得了 0.9855 的 f1 值,排名第 5。
Jan, 2021
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
该研究利用基于转换器的五种模型 (BERT、BERT without LSTM、ALBERT、RoBERTa 和 BERT & ALBERT 混合) 对 COVID 19 虚假新闻进行比较分析,其中 RoBERTa 模型在真假两类中均获得 0.98 的 F1 得分,相比其他模型表现更佳。
Aug, 2022
人们现在认为社交媒体是他们唯一的信息来源,但同时社交媒体上假新闻也呈指数级增长。本文强调可解释的假新闻检测在当前技术水平上的现状,并介绍了我们正在开展的多模态可解释假新闻检测模型研究。
Jul, 2022
本研究为 Constraint 2021 年 COVID-19 虚假新闻检测共享任务做出了贡献,提出了将经典机器学习算法与语言学特征相结合的方法,在数据预处理方面进行了多种尝试并得到了不错的结果。通过使用线性支持向量机算法,在测试数据上获得了 95.19% 的加权平均 F1 得分,名列排行榜第 80 位。
Jan, 2021
本文介绍了使用基于 Transformer 的 COVID-Twitter-BERT(CT-BERT)模型集合的方法来检测英文 COVID-19 虚假新闻的结果和表现。在约 166 个团队中,该方法在第一个共享任务的测试集上取得了最高的加权 F1 得分 98.69。
Dec, 2020
该研究提出了一种可解释和在线的分类方法,结合无监督和有监督的机器学习方法,使用自然语言处理技术基于创建者、内容和上下文的特征,识别和解释社交媒体中的虚假新闻,并通过数据流处理提供实时的早期检测、隔离和解释,从而提高社交媒体内容的质量和可信度。
May, 2024
本文提出了一种基于变压器的语言模型微调方法,用于检测 COVID-19 假新闻,该方法通过扩展专业短语的语义,适应热身 softmax 损失以区分硬挖掘样本,并通过对抗性训练提高模型的鲁棒性,采用 RoBERTa 和领域专用模型 CT-BERT 提取预测特征,并由一个多层感知器融合细粒度和高级别的特定表示。经 COVID-19 假新闻数据集评估,实验结果在各种评估指标上都表现优越,最好的加权平均 F1 得分为 99.02%。
Jan, 2021