基于 Transformer 模型(BERT,ALBERT 和 RoBERTa)在假新闻检测中的性能分析
该研究利用基于转换器的五种模型 (BERT、BERT without LSTM、ALBERT、RoBERTa 和 BERT & ALBERT 混合) 对 COVID 19 虚假新闻进行比较分析,其中 RoBERTa 模型在真假两类中均获得 0.98 的 F1 得分,相比其他模型表现更佳。
Aug, 2022
本文报告了一种基于 Transformer 模型(BERT、ALBERT 和 XLNET)的方法来分析 COVID-19 流行病期间社交媒体上共享信息的可靠性,以便快速检测假新闻,减少假信息的传播,该方法在 ConstraintAI 2021 共享任务 COVID19 Fake News Detection in English 中获得了 0.9855 的 f1 值,排名第 5。
Jan, 2021
本研究表明,通过针对 BERT 和 RobertA 模型进行微调,在检测 AI 生成的新闻中取得了最好的效果。Roberta 模型的得分为 98%,精度表现卓越,研究结论表明,神经网络可用于识别 ChatGPT 生成的虚假新闻,并表明这些模型在对抗错误信息方面能够发挥重要作用。
Jun, 2023
为了在新冠疫情期间快速检测和减轻假新闻的传播,我们开发了一种基于机器学习自然语言处理模型的两阶段自动化检测流程来检测 COVID-19 假新闻,其中第一模型利用了基于事实检查的算法,通过检索特定 COVID-19 索赔的相关事实,第二模型通过计算索赔和手动策划的 COVID-19 数据集中检索到的真实事实之间的文本蕴含程度来验证索赔的真实程度。
Nov, 2020
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022
介绍了一种使用两个并行 BERT 网络来对全文新闻文章进行真实性检测的新方法 MWPBert,通过 MaxWorth 算法选择更有价值的新闻文本部分,最终将两个 BERT 网络的输出编码为一个输出网络,实验结果表明该模型在准确性和其他性能指标方面优于以前的模型。
Apr, 2022
本论文提出了一种基于 transformer 的深度神经集成体系结构(MisRoBÆRTa),用于对谣言的检测,基于一个大型真实新闻文章数据集进行了训练和测试,并且使用两个 transformer(BART&RoBERTa)来提高分级性能,成果显示 MisRoBÆRTa 在谣言检测任务上表现优于其他 transformer 模型。
Apr, 2023
本文提出了一种基于变压器的语言模型微调方法,用于检测 COVID-19 假新闻,该方法通过扩展专业短语的语义,适应热身 softmax 损失以区分硬挖掘样本,并通过对抗性训练提高模型的鲁棒性,采用 RoBERTa 和领域专用模型 CT-BERT 提取预测特征,并由一个多层感知器融合细粒度和高级别的特定表示。经 COVID-19 假新闻数据集评估,实验结果在各种评估指标上都表现优越,最好的加权平均 F1 得分为 99.02%。
Jan, 2021
通过构建含有人工和计算机生成的标题数据集,研究表明人类只有 47.8% 的准确率识别出虚假标题,而应用于语言模型的 Transformers 却达到了 85.7% 的整体准确率,说明目前的自然语言生成模型可以被识别出来。
Sep, 2020
本研究探讨了采用不同类型的最先进的转换器模型对文本分类的性能,发现其中 RoBERTa 模型在测试数据集上表现最佳,可用于文本中灾难的检测。此外,我们发现预处理技术,词汇表中单词的性质,不平衡标签和模型参数对学习算法的性能产生影响。
Mar, 2023