该研究提出一种名为 GLORY 的新模型,通过构建全局感知的历史新闻编码器和候选新闻编码器,结合全局表示和本地表示来增强个性化推荐系统,并在公共新闻数据集上表现良好。
Jul, 2023
本研究提出了一种基于弱监督的虚假新闻检测框架 WeFEND,该框架利用用户举报作为弱监督来扩大数据集规模。我们采用增强学习方法,从弱标注数据中选择高质量样本来提高检测器的精度。实验结果表明,与现有技术相比,WeFEND 模型在微信公众号新闻数据集上实现了最优性能的虚假新闻检测。
Dec, 2019
通过机器学习算法,在两个公开数据集上进行实验分析,研究了如何检测和区分真假新闻,结果表明采用了三种分类器:被动型侵略性、朴素贝叶斯和支持向量机,这种方法具有良好的性能表现。
Jan, 2022
本研究提出了一种利用社交媒体上的弱标注信号并采用深度神经网络在元学习框架下结合少量干净数据进行训练,以提高虚假新闻的早期检测的方法,实验结果显示该方法可以有效地超越目前的最先进的基准线模型。
Apr, 2020
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
本研究提出了一个有效的无监督框架,用于利用社交媒体中四种信息类型的知识,从而检测 COVID-19 相关新闻中的虚假信息。该框架使用一个强大的噪声鲁棒的自监督学习技术和一种新颖的数据集构建技术来提高检测性能,并在现有的标记数据集上取得了显著改进。
May, 2023
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019
本文提出了一种新的结构感知多头注意力网络(SMAN),该网络通过联合优化假新闻检测和可信度预测任务,明确地利用出版商和用户的可信度进行早期假新闻检测,实验结果表明 SMAN 可以在 4 小时内以超过 91% 的准确率检测出假新闻,比现有模型快得多。
Dec, 2020
通过提供第一个标记有语法依存树的通用语言标题新闻语料库,我们旨在弥补语言处理句法分析领域对新闻标题的关注不足。通过从未标记的新闻标题 - 文章引文对中获取银标签训练数据来改进英语新闻标题的分析准确性,我们发现训练基于银标题解析的模型比仅基于黄金注释长格式文本训练的模型性能有显着提高。最终,我们发现尽管投影的银标签训练数据可以提高解析器在不同新闻媒体上的性能,但是该提高是受特定出版物特有结构的调节的。
Jan, 2023
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在 FakeNews AMT 和 Celebrity 两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020