检测先前事实核查声明中上下文的作用

ACLApr, 2021

检测先前事实核查声明中上下文的作用

The Role of Context in Detecting Previously Fact-Checked Claims

Shaden Shaar, Firoj Alam, Giovanni Da San Martino, Preslav Nakov

TL;DR本研究关注于政治辩论中的言论，并研究了对言论进行上下文建模（涵盖辩论和事实核查解释文档）的影响。实验结果表明，建模辩论方面的上下文最为重要，可以比现有的先进模型提高 10 个百分点以上。

Abstract

Recent years have seen the proliferation of disinformation and fake news online. Traditional approaches to mitigate these issues is to use manual or automatic →

disinformation fake news fact-checking political debate context modeling

发现论文，激发创造

使用上下文和语篇信息进行自动事实检查

本文研究了自动事实检查的问题，关注上下文和语篇信息的影响。研究并解决了两个相关任务：检测与检查有关的声明以及检查有关的声明。开发了基于神经网络、基于内核的支持向量机和两者组合的监督系统，在输入表示方面使用了丰富的话语线索和上下文特征。从政治辩论中着重关注可检查性估计任务，并在辩论的整个干预、前面和后续转变的语境中对目标声明进行建模，考虑语境元信息。从社区论坛中关注答案验证的事实检查任务，并将答案的真实性与其所在的整个问题 - 答案线程以及来自整个论坛的其他相关帖子的真实性进行建模。我们为两个任务开发了注释数据集，并进行了广泛的实验评估，确认两种信息 (尤其是上下文特征) 发挥重要作用。

Aug, 2019

生成事实检查解释

本文针对自动事实检测的不足之处，提供了首个研究可利用可用的声明上下文生成自动化证明，并且演示了一项同时优化判断准确性预测和证明生成的多任务模型平均性能更好。

Apr, 2020

检测先前事实核查过的言论

本研究主要讨论了解决当前网络上 “假新闻” 和政客言论真实性验证的问题，提出了一种基于学习排序模型的检索算法，并建立了一个相关数据集，实验结果表明该方法优于现有的基于检索和文本相似度的算法。

May, 2020

利用外部来源实现全自动事实核查

提出了一种使用外部来源进行全自动事实核查的通用框架，该框架利用深度神经网络和 LSTM 文本编码结合任务特定的嵌入来判断声称的真实性，并将来自 Web 的相关文本片段融合其中，考虑其来源可靠性，在两个任务和数据集上均表现不错。

Oct, 2017

文档级主张提取与脱离背景化以进行事实核查

我们提出了一种用于事实检查的文档级索取索赔的方法，旨在从文档中提取值得检查的要求，并将它们解除背景以便在任何环境下理解。使用自动评估指标和事实检查专业人员的评估结果表明，我们的方法比以前的工作更准确地从文档中提取出有价值的索赔，并改善了证据的检索。

Jun, 2024

自动辨别假新闻：模型是否学会了推理？

本文探讨了事实检查模型的推理方式以及声明和证据的关系，并发现在政治事实检查数据集上，仅使用证据比同时使用声明和证据的效果更好。这凸显了现有的自动虚假新闻检测方法中构成证据的重要问题。

May, 2021

自动检测虚假新闻：当前模型是 “事实核查” 还是 “直觉判断”？

这篇研究通过多种神经和非神经预处理以及风格转移技术，消除了假新闻检测模型中情感、情绪、词性等易受攻击的指标，从而推断出这些模型中可能隐藏着可操纵的信号，并通过情感向量模型构建进一步证明了这一假设。

Apr, 2022

基于证据的事实核查的隐式时间推理

研究表明，利用时间信息可以对基于证据的事实检验的认证过程起到积极的正向影响，通过对构建共享时间轴的发布日期和时间表达式进行基础建设可以建立索赔和证据之间的时间关系，从而提供给基于循环神经网络（RNN）和转换器（Transformer）的分类器时间信息以进行认证。

Feb, 2023

DeClarE: 使用证据感知深度学习揭穿虚假新闻和假言论

本研究提供了一种端到端模型，该模型可对文字主张进行证据感知的可信度评估，不需要任何人类干预，并通过聚合来自外部证据文章的信号，这些文章的语言以及其来源的可信度来生成用户可理解的解释，从而提高了之前工作的局限性，实验证明其有效性。

Sep, 2018

自动化事实核查综述

本文综述了基于自然语言处理的自动事实核查技术及其在相关学科里的应用。该技术使用自然语言处理、机器学习、知识表示和数据库等技术预测声称的可信度，同时介绍了现有数据集和模型，旨在统一各种定义并识别通用概念，最后提出了未来研究的挑战。

Aug, 2021