检测先前事实核查声明中上下文的作用
本文研究了自动事实检查的问题,关注上下文和语篇信息的影响。研究并解决了两个相关任务:检测与检查有关的声明以及检查有关的声明。开发了基于神经网络、基于内核的支持向量机和两者组合的监督系统,在输入表示方面使用了丰富的话语线索和上下文特征。从政治辩论中着重关注可检查性估计任务,并在辩论的整个干预、前面和后续转变的语境中对目标声明进行建模,考虑语境元信息。从社区论坛中关注答案验证的事实检查任务,并将答案的真实性与其所在的整个问题 - 答案线程以及来自整个论坛的其他相关帖子的真实性进行建模。我们为两个任务开发了注释数据集,并进行了广泛的实验评估,确认两种信息 (尤其是上下文特征) 发挥重要作用。
Aug, 2019
本研究主要讨论了解决当前网络上 “假新闻” 和政客言论真实性验证的问题,提出了一种基于学习排序模型的检索算法,并建立了一个相关数据集,实验结果表明该方法优于现有的基于检索和文本相似度的算法。
May, 2020
提出了一种使用外部来源进行全自动事实核查的通用框架,该框架利用深度神经网络和 LSTM 文本编码结合任务特定的嵌入来判断声称的真实性,并将来自 Web 的相关文本片段融合其中,考虑其来源可靠性,在两个任务和数据集上均表现不错。
Oct, 2017
我们提出了一种用于事实检查的文档级索取索赔的方法,旨在从文档中提取值得检查的要求,并将它们解除背景以便在任何环境下理解。使用自动评估指标和事实检查专业人员的评估结果表明,我们的方法比以前的工作更准确地从文档中提取出有价值的索赔,并改善了证据的检索。
Jun, 2024
本文探讨了事实检查模型的推理方式以及声明和证据的关系,并发现在政治事实检查数据集上,仅使用证据比同时使用声明和证据的效果更好。这凸显了现有的自动虚假新闻检测方法中构成证据的重要问题。
May, 2021
这篇研究通过多种神经和非神经预处理以及风格转移技术,消除了假新闻检测模型中情感、情绪、词性等易受攻击的指标,从而推断出这些模型中可能隐藏着可操纵的信号,并通过情感向量模型构建进一步证明了这一假设。
Apr, 2022
研究表明,利用时间信息可以对基于证据的事实检验的认证过程起到积极的正向影响,通过对构建共享时间轴的发布日期和时间表达式进行基础建设可以建立索赔和证据之间的时间关系,从而提供给基于循环神经网络(RNN)和转换器(Transformer)的分类器时间信息以进行认证。
Feb, 2023
本研究提供了一种端到端模型,该模型可对文字主张进行证据感知的可信度评估,不需要任何人类干预,并通过聚合来自外部证据文章的信号,这些文章的语言以及其来源的可信度来生成用户可理解的解释,从而提高了之前工作的局限性,实验证明其有效性。
Sep, 2018
本文综述了基于自然语言处理的自动事实核查技术及其在相关学科里的应用。该技术使用自然语言处理、机器学习、知识表示和数据库等技术预测声称的可信度,同时介绍了现有数据集和模型,旨在统一各种定义并识别通用概念,最后提出了未来研究的挑战。
Aug, 2021