学习识别模糊和误导性新闻标题
该研究基于卷积神经网络开发了一个标题分类器,主要通过调查标题的词语分割、词性标注和情感特征等关键因素,以确定新闻文章的可信度,并将这些特征集成到分类模型中。经过实验证明,该模型的准确度可达到 93.99%。
Apr, 2022
本研究提出了一种使用深度学习方法来检测 2017 年 Clickbait Challenge 数据集中的 clickbaits 的模型,同时利用数据分析和可视化技术探索和发现数据集中的信息。该模型在均方误差方面在 Clickbait Challenge 2017 中获得了第一名。
Jun, 2018
该研究提出了一种可以用来检测标题与新闻正文之间脱节的百万级新闻标题和正文文本数据集,基于此数据集,该研究开发了两个神经网络来检测标题与正文之间的脱节,并提出了一种数据增强方法来进一步提高性能。实验结果表明,所提出的方法优于现有方法,可以有效地检测到有误导性的新闻标题。
Nov, 2018
使用 Kaggle 平台提供的包含 18 年新闻的数据集,通过 TF-IDF 特征提取和神经网络分类器,对新闻标题进行分类,实验结果表明,该神经网络在准确性评估指标上表现最佳,其准确率高达 0.8622,明显优于其它三个模型。
Jan, 2022
本文旨在提高生成式摘要的真实性,在两个流行数据集上进行了标题生成的研究,发现总结存在虚假性,且虚假性的监督数据会导致模型行为不真实,通过二分类器过滤掉虚假数据并重新训练模型可以在不影响 ROUGE 分数的情况下提高摘要标题的真实性。
May, 2020
为了应对每天都暴露在误导性和宣传性新闻文章和媒体帖子中的在线用户,我们提出了一种检测和展示这些技术的方法,以提供可解释性。特别地,我们定义了定性描述性特征,并分析了它们检测欺骗技术的适用性,同时表明我们的可解释性特征可以与预训练语言模型轻松结合,产生最先进的结果。
Aug, 2021
本研究提出新的任务,释放了新闻文章数据集 NewsAgendas,用于检测有害议程;为了有效,这些有害议程检测器必须是可解释的,并且可解释模型的表现可以与黑盒模型相媲美。
Jan, 2023
本文聚焦于自动识别在线新闻中的虚假内容,首先介绍了用于虚假新闻检测的新颖数据集,描述了收集、注释和验证过程,并提供诸多在区分真实和虚假新闻语言差异方面的探索性分析。其次,本文开展了一系列学习实验以构建准确的虚假新闻检测器,并比较了手动和自动识别虚假新闻的结果。
Aug, 2017
本文介绍了一种基于循环神经网络的神经网络架构,用于检测新闻标题中的 'clickbait',该模型依靠从大型未注释的语料库中学习的分布式词表示和通过卷积神经网络学习的字符嵌入。在新闻标题数据集上的实验结果表明,这种方法表现优于现有的 'clickbait' 检测技术,具有 0.98 的准确率,0.98 的 F1 得分和 0.99 的 ROC-AUC 度量。
Dec, 2016