- ACL通过合成对比论证的检索增强事实验证
通过对比论证综合检索增强的事实验证 (RAFTS) 方法能有效检索相关文档作为证据,并从不同角度评估论证,结合信息丰富的上下文示例作为先验,能在没有复杂提示的情况下显著改善受监督和 LLB 基线,且在相对较小的 LLB 上表现超过基于 GP - FactGenius:结合零 - shot 提示和模糊关系挖掘提高知识图谱事实验证
FactGenius 是一种结合零 - shot 大语言模型和模糊文本匹配的创新方法,通过使用来自维基百科的结构化链接数据集 DBpedia,利用相似性度量来提高大语言模型生成的连接的准确性,经过 FactKG 基准数据集的评估验证其在事实 - 先列举特征,再生成:局部可归因的文本生成
本文提出了一种名为 “先选后生成” 的本地可归属文本生成方法,通过将传统的端到端生成过程分为三个直观步骤:内容选择、句子规划和顺序句子生成,从而确保相关源片段同时充当输出的细粒度归属,以此解决了大规模语言模型中幻觉问题,并在多文档摘要和长篇 - AAAIFactify5WQA 中的三重团队:以精细调整设立事实验证标准
本文介绍了 Pre-CoFactv3,一种包括问题回答和文本分类组件的综合框架,用于事实验证。通过利用上下文学习、经过微调的大型语言模型(LLMs)和 FakeNet 模型,我们解决了事实验证的挑战。我们的实验探索了不同的预训练 LLMs、 - ACL重新思考事实验证的损失函数
在这篇文章中,我们探索了用于 FEVER 共享任务中事实验证的损失函数。实验结果表明,我们提出的目标函数优于标准的交叉熵,并且当这些目标函数与简单的类别加权结合时,性能进一步提高。
- FaaF: RAG 系统评估的事实函数
通过利用语言模型(LM)的函数调用能力和 RAG 事实回忆评估框架,FaaF 方法大幅提高了 LM 识别文本中不支持的事实的能力,相较于指令为基础的方法,同时提高了效率和降低成本。
- 学习上下文过滤以增强检索辅助生成
提出了 FILCO 方法,通过词汇和信息论方法识别有用的上下文,并训练上下文过滤模型以改善生成模型的质量,从而在提取式问答、复杂多跳和长篇问答、事实验证和对话生成任务上优于现有方法。
- EMNLPKG-GPT: 使用大型语言模型进行知识图谱推理的通用框架
KG-GPT 是一个多功能框架,利用大型语言模型(LLMs)进行知识图谱(KGs)相关任务的复杂推理,将句子分割、检索相关图谱组件和推导逻辑结论分为三个步骤。我们通过使用基于 KG 的事实验证和 KGQA 基准来评估 KG-GPT,发现该模 - EX-FEVER:一个用于多跳可解释事实验证的数据集
构建一个可解释的事实验证系统在复杂的多跳场景中始终受到相关高质量数据集的缺失的阻碍。为了解决这个问题,我们提出了 EX-FEVER,一个用于多跳可解释事实验证的先驱数据集。我们的数据集包括超过 60,000 个主张,每个主张都涉及 2 跳和 - EMNLP从麻烦到新闻触觉:通过跨文档证据和背景增强新闻
NEWSSENSE 使用参考无关的事实验证方法,将用户选择的主要文章与多个不同来源的相关文章链接起来,提供内嵌高亮显示来说明所选文章中特定主张是如何被其他文章的信息支持或反驳的,以帮助用户毫不费力地消化和交叉检查多个信息来源,以及识别关键信 - ACL研究事实验证中的零样本和少样本泛化能力
我们研究了事实验证(FV)的零样本和小样本泛化,目标是将在资源丰富领域(如维基百科)上训练的 FV 模型推广到缺乏人类注释的低资源领域。通过构建包含 11 个 FV 数据集的基准数据集集合,我们对这些 FV 数据集之间的泛化进行了实证分析, - AAAIFactify 2: 多模态假新闻检测研究结果
社交媒体的迅速增长导致虚假新闻泛滥,因此自动检测和验证虚假信息的研究变得尤为重要。本研究介绍了 Factify 2 任务的结果,提供了一个多模态事实验证和讽刺新闻数据集,并使用基于多模态关系将社交媒体索求与支持文件进行比较,最终得到 81. - FACTIFY3M: 基于 5W 问答的多模态事实验证基准
为解决社交媒体上大规模的多模态虚假信息检测问题,我们介绍了一个名为 FACTIFY 3M 的数据集,包含了 3 百万个样本,其中包括文本声明、图像、像素级图像热力图和 5W 问答对等元素,并且提供了可解释性的概念。
- 可解释的多跳事实验证中一致的多粒度理由提取
本文提出了一种基于多粒度证据提取的可解释多跳事实验证模型,采用差分掩蔽同时训练基于标记层和句子层的模型,确保提取粒度多、解释一致、证据可信。
- ACLFactKG: 通过知识图谱推理进行事实验证
介绍了一个名为 FactKG 的新数据集,该数据集包含 108k 个自然语言声明及其相关类型的推理,旨在通过推理知识图谱来进行事实验证,并开发了基于这些推理类型的基线方法,以提高知识图谱的可靠性和实用性。
- SIGIR再读一遍:通过重新审视证据实现忠实可解释的事实验证
提出了一种名为 “ReRead” 的验证模型,旨在通过训练证据检索器来获取可解释证据,并通过验证理财顾问提高准确性,从而达到提高验证性能的目的。
- AAAI基于结构一致性的多模态事实验证: Factify 2 中的 INO
本文介绍了我们在 AAAI2023 的多模态事实验证(FACTIFY)挑战中的方法。我们提出了一个基于结构一致性的多模态事实验证方案来分类虚假新闻,通过随机森林分类器将特征进行合并并获得了 0.8079 的加权平均 F1 分数。
- EMNLP基于自然语言逻辑的自回归多跳文档检索方法用于事实核查
我们提出了一种基于自回归公式的检索和重新排序方法,该方法用自然逻辑为基础,使用证明系统动态终止检索过程,同时使用比竞争系统少 5 到 10 倍的记忆,对 FEVER、HoVer 和 FEVEROUS-S 等数据集具有与当前最先进方法相当的性 - EMNLP用于事实验证的数据高效自回归文档检索
本文介绍了一种不需要标注的远程监督方法,可用于训练自回归召回器,以在零样本环境中获得竞争性召回率和精确率。此外,通过针对特定任务的监督微调,展示了利用少于 1/4 注释数据的情况下,基于 Wikipedia 的事实验证任务的自回归检索性能可 - EMNLPPASTA: 句表填空预训练,适用于表格操作感知的事实验证
本文介绍了一种基于数据表的事实验证的新方法 PASTA,使用已经进行了先前训练的语言模型和通过合成句子 - 数据表填空问题而得到的 1.2 百万个数据对进行预训练,PASTA 在 TabFact 和 SEM-TAB-FACTS 两个基准测试