将索赔匹配扩展到全球事实核查

ACLJun, 2021

Claim Matching Beyond English to Scale Global Fact-Checking

Ashkan Kazemi, Kiran Garimella, Devin Gaffney, Scott A. Hale

TL;DR该研究讨论了声明匹配作为扩大事实核查的可能解决方案，通过使用知识蒸馏和高质量的教师模型训练自己的嵌入模型来改善低资源语言在数据集中嵌入质量的不平衡，并与现有的多语言嵌入模型进行比较，证明在所有设置中超过了现有的解决方案，并释放注释数据集和嵌入模型以供进一步研究。

Abstract

Manual fact-checking does not scale well to serve the needs of the internet. This issue is further compounded in non-English contexts. In this paper, we discuss claim matching as a possible solution to scale

fact-checking claim matching textual messages multilingual embedding models whatsapp tipline

发现论文，激发创造

跨语言匹配推文与适用的事实检查

本研究使用多语言变换器模型和嵌入技术（如 XLM-RoBERTa、LaBSE 和 SBERT 等）自动寻找社交媒体帖子（推文）中已经被事实检查过的主张。在不同语言设置中，我们进行了分类和检索实验，并取得了令人满意的结果。我们也发现处理不同语言时存在一些 NLP 挑战，并为未来的研究提供了一个新的事实检查和相应推文的数据集。

Feb, 2022

大型语言模型的自动索赔匹配：在打击虚假信息中赋予事实检查员权力

通过使用 FACT-GPT 框架，我们介绍了一种自动化事实核查的方法，该方法利用大型语言模型 (LLMs) 的主张匹配阶段来识别新的社交媒体内容，无论是支持还是反驳之前被事实核查人员驳斥的主张。研究结果表明，我们的精细调节的 LLMs 在主张匹配任务中与更大型的预训练 LLMs 的性能相媲美，与人工标注结果密切一致。

Oct, 2023

多语种事实核查索引检索

本论文提出了一个新的多语言数据集 MultiClaim，其中包含 28k 个社交媒体帖子和 206k 个来自专业事实核查人员写的 39 种语言的事实核查。我们评估了不同的非监督方法在这个数据集上的效果，并显示对这样一个多样化的数据集进行评估具有复杂性，需要在解释结果之前采取适当的措施。我们还评估了一种监督微调方法，显著提高了非监督方法的性能。

May, 2023

跨语言转移学习在推特上识别值得检查的声明

本文研究如何使用现有数据集训练 Twitter 消息的不同语言的验证价值模型。通过使用多语言 BERT 模型，我们系统地比较了六种方法。结果表明，对于一些语言对，零 - shot 跨语言转移是可能的，并且可以与在目标语言上训练的单语模型一样好。

Nov, 2022

FACT-GPT: 通过与 LLMs 进行索引匹配的事实检查增强

我们提出了 FACT-GPT 这个系统，利用大型语言模型 (LLMs) 自动化事实核查中的索引匹配阶段。FACT-GPT 经训练后，可以识别与先前被揭穿的声明相符、相悖或无关的社交媒体内容。我们的评估结果表明，我们专门训练的 LLMs 在识别相关声明方面的准确性与更大型的模型相当，与人类判断非常接近。这项研究提供了一种高效的声明匹配自动化解决方案，展示了 LLMs 在支持事实核查员方面的潜力，并为该领域的进一步研究提供了宝贵的资源。

Feb, 2024

自动事实核查的主张检测：关于单语、多语和跨语言研究的调查

自动事实核查引起了过去几十年的广泛关注，由于在线平台上虚假信息的扩散增加。本调查主要关注多语言数据和方法，讨论现有努力检测需求核查的言论。我们提出了一项综合调查，介绍了最新的多语言言论检测研究，主要涉及可验证性，优先级和相似性三个问题因素。此外，我们详细概述了现有的多语言数据集，以及存在的挑战，并提出可能的未来发展方向。

Jan, 2024

究竟是否 “越大越好”？应用于应对虚假信息的索赔检测语言模型的全面研究

本研究比较了经过调整的模型和极大语言模型在可检测可信度主张的任务中的性能。通过使用包含不同来源和风格的文本构建了一个多语种和多主题数据集，并基于此进行了基准分析，确定了最通用的多语种和多主题主张检测器。我们选择了三个最先进的模型进行了可检测可信度主张任务的调整，并选择了三个无需任何调整的最先进极大语言模型。通过对模型进行修改以适应多语种环境，并进行了广泛的实验和评估。在域内和跨域情景中，我们评估了所有模型的准确性、召回率和 F1 分数。我们的结果表明，尽管在自然语言处理领域取得了技术进步，但针对可检测可信度主张任务的调整模型在跨域设置中仍然优于零样本方法。

Nov, 2023

使用神经语义匹配网络结合事实提取与验证

该论文提出了一个连接的系统，包括三个同构神经语义匹配模型，用于联合进行文献检索、句子选择和索证，以进行事实提取和验证。实验结果表明，该神经语义匹配方法在所有证据检索指标上都显著超越了常见的 TF-IDF 和编码器模型，并通过提供内部语义关联得分和词汇网特征等方法，改进了 NLI 模型的性能，从而在 FEVER 测试集上取得了最优结果。

Nov, 2018

迷失翻译，发现片段：多语言社交媒体中的索引辨识

CSI 是事实核查流程中的重要步骤，该文档旨在通过创建一个多语言数据集 X-CLAIM，展示基于高资源语言英语进行训练，以及使用编码器模型相比较大的生成式语言模型在低资源语言上带来的明显优势。

Oct, 2023

用跨语言检索方法提升跨语言事实核查

为了解决低资源语言事实核查数据集的缺乏问题，我们提出了一种跨语言检索的事实核查框架，该框架利用我们提出的自监督算法，使用翻译的文章标题来创建训练实例，并在多种语言下实现证据的汇集。在 X-Fact 数据集上，我们的方法在零 - shot 跨语言设置下，在绝对 F1 上获得了 2.23% 的改进。

Sep, 2022