人与机器协作的虚假信息检测:立场、情感,还是其他什么?
本研究旨在探索如何使用大规模深度双向转换器语言模型来准确识别包含虚假信息的新闻文章,通过使用 RoBERTa 深度双向转换器语言模型进行预训练后构建了一个大规模语言模型,在 Fake News Challenge 阶段 1 基准测试中实现了 90.01%的加权准确度,表明了在处理虚假信息识别方面,大规模语言模型可以作为强有力的构建块。
Nov, 2019
本研究旨在分析目前假新闻检测技术的应用现状,探讨解决方案并指出智能系统在检测错误信息源方面的应用方向,同时提出挑战和方法上的空白以激励未来研究。
Dec, 2020
该论文旨在研究和分析既包括事实检查和谣言检测,也包括偏见检测和情感分析的不同类别和方法之间的联系,重点关注在检测虚假信息及其分化方面的已有工作,并讨论了未来的挑战。
Feb, 2021
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
该研究提出了一种基于人机交互的事实检查和追踪社交媒体信息违反相关政策的评估框架,采用现代化的自然语言处理方法和特定斯坦斯分类器通过提取和聚合结构化身份,鉴定和评估可能造成风险的要求,评估基于其潜在风险的全新误导的声明,为人机协助的事实检查提供了一个合理的基准。
Dec, 2022
机器学习自动检测假新闻可以在其获得大量点击前阻止虚假陈述的传播。我们评估传统模型和最新开发的大型语言模型的鲁棒性,以判断它们在实际环境中的表现。我们发现,与最近开发的大型语言模型相比,传统模型较好地适应了在训练时所使用的数据分布之外的数据,但最佳模型的选择可能取决于具体任务。
Aug, 2023
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
社交媒体兴起以来,越来越多的网民在线上分享和阅读帖子和新闻。然而,泛滥于互联网的大量错误信息(例如虚假新闻和谣言)会对人们的生活产生负面影响,这引发了对谣言和虚假新闻检测的热门研究课题。网民在社交媒体帖子和新闻中表达的情绪和情感是帮助区分虚假新闻和真实新闻,以及理解谣言传播的重要因素。本文全面回顾基于情绪的误信息检测方法。我们首先解释情绪与误信息之间的紧密联系。接着,我们详细分析了多种基于情绪、情感和立场特征的误信息检测方法,描述它们的优势和劣势。最后,我们讨论了基于大型语言模型的基于情绪的误信息检测面临的一些挑战,并提出了未来的研究方向,包括数据收集(多平台、多语言)、标注、基准测试、多模态以及可解释性。
Nov, 2023
为了在新冠疫情期间快速检测和减轻假新闻的传播,我们开发了一种基于机器学习自然语言处理模型的两阶段自动化检测流程来检测 COVID-19 假新闻,其中第一模型利用了基于事实检查的算法,通过检索特定 COVID-19 索赔的相关事实,第二模型通过计算索赔和手动策划的 COVID-19 数据集中检索到的真实事实之间的文本蕴含程度来验证索赔的真实程度。
Nov, 2020