- ACLMissci: 重建被曲解的科学错误
通过介绍新的论证理论模型和一个针对误传的数据集 Missci,我们在零 - shot 设置下评估了两个代表性的大型语言模型(LLMs)的关键推理能力,结果表明 GPT 4 取得了有希望的成果,同时也展示了这一任务的难度。
- 可靠、不可靠还是泄密?增强自动事实核查的证据验证
自动事实检查(AFC)引起越来越多研究者的关注,帮助事实核查者应对在线虚假信息的增加传播。为了解决数据的问题,作者提出了一个综合的证据验证和过滤方法,并创造了一个数据集来训练 “EVVER-Net” 以检测泄露和不可靠的证据。经过实验,该模 - AAAICFEVER:一个中文事实抽取和验证数据集
CFEVER 是一个中文数据集,用于事实提取和验证,利用中文维基百科的内容手动创建了 30,012 个声明,并标记为 “支持”、“反驳” 或 “信息不足”,同时提供详细的证据句子。这个数据集通过 Fleiss' kappa 值(0.7934 - AFaCTA: 借助可靠的 LLM 标注者辅助事实性主张检测的注释
通过生成 AI 控制虚假信息的自动事实检查方法正在变得越来越重要,然而,事实声明检测遭遇了任务定义不一致与手动注释成本高昂的两个主要问题。为了解决这些问题,我们提出了 Automtic Factual Claim deTection Ann - 使用证据总结解释真实性预测:一种多任务模型方法
通过使用多任务可解释的神经模型进行自动化的事实检验,本研究讨论了社交媒体上快速传播的虚假信息,并探究了深层神经模型在预测时所关注的要素,以寻求与人类推理相媲美的推理水平。
- 通过错误识别和解释进行自动事实检验的方法
本文介绍自动事实核查在互联网内容管理中的重要性,提出了面向缺陷的事实核查任务并引入了专门设计的框架 RefuteClaim,通过提取和转换专家审查的见解,创造了用于该任务的数据集 FlawCheck,并实验证明了 RefuteClaim 在 - 自动事实核查的主张检测:关于单语、多语和跨语言研究的调查
自动事实核查引起了过去几十年的广泛关注, 由于在线平台上虚假信息的扩散增加。本调查主要关注多语言数据和方法,讨论现有努力检测需求核查的言论。我们提出了一项综合调查,介绍了最新的多语言言论检测研究,主要涉及可验证性,优先级和相似性三个问题因素 - 基于语义三元组和知识图谱的零 - shot 事实检查
本文提出了一种新的零射击方法,将声称和证据句子转化为语义三元组并使用大型语言模型进行自然语言推理,从而在没有特定训练数据的敌对数据集和领域中广义推广,在 FEVER、FEVER-Symmetric、FEVER 2.0 和 Climate-F - 用于几乎任何语言的自动事实核查的流水线和数据集生成
利用可公开获得的语言模型和数据,本文提出了一种自动事实核查的管道,目的是使用来自基本证据语料库的证据评估文本主张的准确性。
- 基于强化学习的知识图推理用于可解释的事实核查
基于强化学习的知识图谱推理方法在可解释的事实核查中使用有效,通过提供人机交互方法增加了可信度。
- HealthFC:一份用于基于证据的医学事实核查的健康索赔数据集
在数字时代,从互联网上获取健康相关的建议已成为一种常见做法。然而,评估在线医学声明的可靠性并找到相应的证据变得越来越具有挑战性。本文介绍了一种新颖的、由医学专家标记为真实性的并提供来自临床研究的证据支持的 750 个健康相关声明的数据集。我 - ACL提供更多细节:利用潜在检索改进事实核查
该研究旨在改善自动事实核查系统,并尝试将原始文档的全文作为证据,并引入了两个丰富的数据集。实验证明,即使没有标注黄金证据句子,包括原始文档在内的证据可以提供足够的上下文线索,该系统能够在不同的设置下显著提高最佳报告模型的精度。
- 多模态自动事实核查:一项调查
本文调查了自动化事实核查并提出了一个多模式事实核查的框架,其中包含针对多模态误传播的子任务。研究重点在于文字、图像、音频和视频四种在实际事实核查中普遍存在的模态。调查了基准和模型,并讨论了未来研究的局限性和有前途的方向。
- AVeriTeC:一份集合了网络证据的真实世界主张验证数据集
本文介绍了一个新的数据集 AVeriTeC,包含 4,568 个来自 50 个不同机构的真实事实核查内容,每个内容都包含了来自在线可用资源的支持性证据和文本理由,以及多轮注释过程中的评审结果,提供了一个基于多个问题回答步骤的基线和模型评估, - 自动事实核查工具的预期使用:为什么,如何和谁
通过分析 100 篇高引用的论文并注释与预期使用相关的认识元素,我们发现大多数论文提出的手段和目标不一致,建议的策略的可行性很少有实证支持。因此,我们提出了几个关于思考和撰写事实检查工具应用的建议。
- ACL基于证据的自动事实检查中的图像阅读和推理
本文提出一种使用图表数据的自动事实检查任务,介绍了第一个对抗图表数据的自动事实检查模型 ChartBERT,结果表明其精度为 63.8%,可实现但存在挑战。
- ACL在社交媒体中检测先前经过事实检查的声明
通过对社交媒体上的观点进行众包事实核查,并运用改进的自适应训练方法进行学习,以建立一个端到端的自动事实核查框架来解决训练数据稀缺的问题,并较之现有技术提升 2 个百分点。
- 聚合成对语义差异用于少样本场景下的索断真实性分类
本文提出了一种基于向量的新颖 few-shot 分类方法,使用 pairwise 语义差异来建立类别代表向量,与现有的竞争基准相比,实验证明在自动事实检查环节准确率有显著提升。
- AAAI针对自动事实验证系统的合成虚假信息攻击
本研究探讨自动事实检查器对人工制造的对抗性证据的敏感性,研究证明这种类型的系统容易受到攻击,并讨论了现代 NLG 系统作为虚假信息生成器的威胁。
- 使用 CsFEVER 和 CTKFacts 获取捷克数据进行事实验证
本文介绍了获取捷克语数据进行自动事实核查的方法,其中提出了一种混合机器翻译和文档对齐的方法来生成一个基于 Wikipedia 的大规模 FEVER 数据集的捷克语版本,以及一种可靠应用于自然语言推理任务的 CsFEVER-NLI 版本。同时