事实核实与假新闻检测之间的联系
这篇研究通过多种神经和非神经预处理以及风格转移技术,消除了假新闻检测模型中情感、情绪、词性等易受攻击的指标,从而推断出这些模型中可能隐藏着可操纵的信号,并通过情感向量模型构建进一步证明了这一假设。
Apr, 2022
社交媒体的迅速增长导致虚假新闻泛滥,因此自动检测和验证虚假信息的研究变得尤为重要。本研究介绍了 Factify 2 任务的结果,提供了一个多模态事实验证和讽刺新闻数据集,并使用基于多模态关系将社交媒体索求与支持文件进行比较,最终得到 81.82% 的最高 F1 分数。
Jul, 2023
该论文提出了一个连接的系统,包括三个同构神经语义匹配模型,用于联合进行文献检索、句子选择和索证,以进行事实提取和验证。实验结果表明,该神经语义匹配方法在所有证据检索指标上都显著超越了常见的 TF-IDF 和编码器模型,并通过提供内部语义关联得分和词汇网特征等方法,改进了 NLI 模型的性能,从而在 FEVER 测试集上取得了最优结果。
Nov, 2018
本研究提供了一种端到端模型,该模型可对文字主张进行证据感知的可信度评估,不需要任何人类干预,并通过聚合来自外部证据文章的信号,这些文章的语言以及其来源的可信度来生成用户可理解的解释,从而提高了之前工作的局限性,实验证明其有效性。
Sep, 2018
研究者通过设计和应用不同的机器学习模型,在探测虚假新闻方面取得了进展,但现有研究对于快速变化的主题和领域特定词汇的虚假新闻重视不够。本文提出了在特定与 COVID-19 相关主题中进行三项虚假新闻检测任务的方法和结果,并试验了一组基于文本的模型,包括支持向量机、随机森林、BERT 和 RoBERTa。发现预训练转换器可以产生最佳的验证结果,但经过智能设计的随机初始化转换器也可以训练达到接近预训练转换器的准确度。
May, 2022
本研究提出了使用基于 BERT 的预训练语言模型将文本数据编码为向量,并利用神经网络模型进行分类以检测谣言,进一步比较不同语言模型的表现与可训练参数。然后在不同的短文本和长文本数据集上进行了测试,结果表明该技术的表现优于现有技术,并测试其组合数据集的表现,结果表明大数据的训练和测试对提高技术的性能具有相当大的作用。
Mar, 2022
为了在新冠疫情期间快速检测和减轻假新闻的传播,我们开发了一种基于机器学习自然语言处理模型的两阶段自动化检测流程来检测 COVID-19 假新闻,其中第一模型利用了基于事实检查的算法,通过检索特定 COVID-19 索赔的相关事实,第二模型通过计算索赔和手动策划的 COVID-19 数据集中检索到的真实事实之间的文本蕴含程度来验证索赔的真实程度。
Nov, 2020
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在 FakeNews AMT 和 Celebrity 两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020
本文探讨了事实检查模型的推理方式以及声明和证据的关系,并发现在政治事实检查数据集上,仅使用证据比同时使用声明和证据的效果更好。这凸显了现有的自动虚假新闻检测方法中构成证据的重要问题。
May, 2021
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019