- ACL训练集以外的事实核查
我们提出了针对事实检查领域的常见问题的改进算法,包括对传统的 retriever-reader 模型的性能下降问题的改进,以及对 reader 组件的改进,通过对 claims 和 evidence documents 的无序性进行训练,从 - AAAI文本和表格的异构图推理进行事实核查
我们提出了一种用于事实检查的新型基于异构图的模型,名为 HeterFC,它通过一个关系图神经网络进行信息传播,在声明和证据之间促进交互,并结合语言模型生成预测。我们引入了一个多任务损失函数来考虑证据检索的潜在不准确性。综合实验证明了 Het - 无需观察即可检测伪造视频
深度伪造攻击和事实核查是主要研究领域。FACTOR 是一种无需训练、只依赖现成特征、易于实现且在关键攻击场景中表现出色的方法,以区分真实媒体和深度伪造媒体。
- 人工智能在事实核实方面无效且有潜在危害
人工智能模型在事实检查任务中表现出令人印象深刻的能力,但该研究发现,AI 事实检查在一些特定情况下会对人们的信念和新闻共享意图造成有害影响,这凸显出了 AI 应用潜在危害性并强调了预防或减轻此类意外后果的政策的重要性。
- 3HAN: 一种用于假新闻检测的深度神经网络
我们使用基于深度学习的自动检测器,通过三层分层注意网络(3HAN)快速、准确地检测假新闻。通过实验证明,3HAN 具有 96.77% 的精确度,并提供可视化的热图帮助进一步手动事实检查。
- 利用多个 RDF 知识图谱来丰富 ChatGPT 的回答
本研究提出了一个原型系统 GPToLODS,使用它可以将 ChatGPT 的回答与 RDF 知识图谱相结合,验证问题答案的事实真伪并实时自动强化回答。
- 虚假信息和事实核查生态系统的图形模型
该研究提出了描述复杂的虚假信息与事实核查生态系统的图形模型,该模型可用于研究在线虚假信息和事实核查的效果,易于实践者和研究者使用,传统媒体和用户生成内容也在多种语境下涉及。
- Atlas: 基于检索增强语言模型的小样本学习
研究表明,在大多数任务中,大规模语言模型在少量样本上具有出色的表现,然而,当知识是关键时,如问题回答和事实检查等任务,需要使用大量参数存储知识。本文提出了 Atlas,一种精心设计和预训练的检索增强语言模型,能够利用极少的训练样本学习知识密 - CheckThat! 实验室 2022 年:推文文本的可信度标识
本文研究了使用 transformer 模型(BERT-m 和 XLM-RoBERTa-base)对社交媒体中存在的误导性信息进行事实核查的方法,实验结果表明,在荷兰语和英语中,transformer 模型优于 SVM 和 RF 模型,但在 - 使用人工智能提高维基百科的可验证性
使用神经网络为基础的系统 Side 帮助鉴定并更换可能无法验证主张的 Wikipedia 引用,结果表明人类对 Side 建议的更好的引用的选择有 70% 的偏好率。这为辅助事实核查并提高信息可靠性提供了潜在的新途径。
- 缺乏证据的事实验证
本文介绍了一个新的事实核查任务,研究了事实核查模型需要哪些信息才能做出准确的预测,并提出了一种基于对缺失信息进行对比自学习的数据增强策略,从而提高了模型的准确性。
- ACL从信息查询问题进行事实验证
本文介绍了一个大规模的事实验证数据集 FAVIQ,并指出目前最先进的模型并不能完全解决该任务,而基于该数据的训练有助于事实核查,能在专业事实核查方面胜过目前广泛使用的数据集 FEVER 或领域内数据,为自然语言理解提供了一个具有挑战性的基准 - ACL自动辨别假新闻:模型是否学会了推理?
本文探讨了事实检查模型的推理方式以及声明和证据的关系,并发现在政治事实检查数据集上,仅使用证据比同时使用声明和证据的效果更好。这凸显了现有的自动虚假新闻检测方法中构成证据的重要问题。
- 群众在对抗错误信息中的作用:COVID-19 信息疫情的案例研究
本文研究了社交媒体上与 COVID-19 有关的虚假言论和事实检查,发现专业的事实检查虽然重要但可见性有限,而互联网用户通过众包的方式可以在社交平台上成功地反驳虚假言论。
- 生成事实核查简报
通过提供自然语言简报,尤其是 QABriefs 来提高事实核查的准确性和效率,可以使众包者的准确率提高 10%,而无偿事实核查者的准确率略有提高,所需时间减少约 20%。
- EMNLP为网络主张生成事实核查摘要
SUMO 是一种基于神经注意力机制的方法,可以通过文本证据(如新闻文章或 Web 文档)来确定文本声明的正确性。SUMO 可以通过呈现来自文档的多样化句子并解释其在文本声明正确性方面的决策,生成提取式摘要。相较于传统的单纯文本素材计算机制, - 事实提取与验证综述
本文研究事实检查问题,特别是 Fact Extraction and VERification (FEVER) 任务及其相关数据集。通过分析不同方法的技术视角和在 FEVER 数据集上的性能结果,我们描述了所提出的方法,重点讨论了句子检索部 - IJCAI政治言论的多跳事实核查
研究了自然语言多重推理的多跳模型和数据集,通过构建 PolitiHop 数据集,比较现有多跳数据集,以及研究了如何将不同领域和内外资源的知识转移至 PolitiHop 数据集,最终提出了一种结构在证据片段上特定模型推理的方法,取得了最佳性能 - ACL知识密集型语言任务基准测试
介绍了一个以维基百科作为主要知识源的基准测试(KILT),用于验证条件语言任务(包括开放领域问题回答、事实检查、实体链接和插槽填充)的模型。使用共享密集向量索引和 seq2seq 模型,可以实现良好的性能,且具备互操作性,且可重用用于不同任 - ACLLogicalFactChecker:利用逻辑运算进行图模组网络事实检查
本论文提出了 LogicalFactChecker,这是一种基于神经网络的方法,能够利用逻辑操作来进行事实检查,并且在 TABFACT 数据集上实现了最先进的性能,通过 Transformer-based 架构构建基于图形模块网络的异构图使