究竟是否 “越大越好”？应用于应对虚假信息的索赔检测语言模型的全面研究

Nov, 2023

究竟是否 “越大越好”？应用于应对虚假信息的索赔检测语言模型的全面研究

Is it indeed bigger better? The comprehensive study of claim detection LMs applied for disinformation tackling

Martin Hyben, Sebastian Kula, Ivan Srba, Robert Moro, Jakub Simko

TL;DR本研究比较了经过调整的模型和极大语言模型在可检测可信度主张的任务中的性能。通过使用包含不同来源和风格的文本构建了一个多语种和多主题数据集，并基于此进行了基准分析，确定了最通用的多语种和多主题主张检测器。我们选择了三个最先进的模型进行了可检测可信度主张任务的调整，并选择了三个无需任何调整的最先进极大语言模型。通过对模型进行修改以适应多语种环境，并进行了广泛的实验和评估。在域内和跨域情景中，我们评估了所有模型的准确性、召回率和 F1 分数。我们的结果表明，尽管在自然语言处理领域取得了技术进步，但针对可检测可信度主张任务的调整模型在跨域设置中仍然优于零样本方法。

Abstract

This study compares the performance of (1) fine-tuned models and (2) extremely large language models on the task of check-worthy claim detection<

fine-tuned models extremely large language models check-worthy claim detection multilingual and multi-topical dataset benchmark analysis

发现论文，激发创造

跨语言转移学习在推特上识别值得检查的声明

本文研究如何使用现有数据集训练 Twitter 消息的不同语言的验证价值模型。通过使用多语言 BERT 模型，我们系统地比较了六种方法。结果表明，对于一些语言对，零 - shot 跨语言转移是可能的，并且可以与在目标语言上训练的单语模型一样好。

Nov, 2022

CheckThat! 2024 中的事实查找者：通过数据修剪改善 LLMs 的适用于检查的陈述检测

应用八个突出的开源语言模型（LLMs）通过精调和提示工程来从政治转录中识别值得检查的陈述，并通过两步数据修剪方法自动识别高质量训练数据实例，能够在 CheckThat！2024 的英语语言数据集方面展示有效学习和竞争性性能。

Jun, 2024

大型语言模型是否是良好的事实核查者：初步研究

该研究通过对大型语言模型在事实检查方面的潜力进行初步调查，系统评估了它们在处理特定事实检查子任务中的能力，并与预训练和最先进的低参数模型进行了性能对比分析。实验证明大型语言模型在大多数场景中取得了与其他小型模型相媲美的性能，但在处理中文事实验证和整个事实检查流程中遇到了语言不一致和虚构的挑战，这些发现强调了进一步探索和研究以增强大型语言模型作为可靠事实检查器的能力，并揭示了在事实检查任务中可能面临的挑战。

Nov, 2023

自动事实核查的主张检测：关于单语、多语和跨语言研究的调查

自动事实核查引起了过去几十年的广泛关注，由于在线平台上虚假信息的扩散增加。本调查主要关注多语言数据和方法，讨论现有努力检测需求核查的言论。我们提出了一项综合调查，介绍了最新的多语言言论检测研究，主要涉及可验证性，优先级和相似性三个问题因素。此外，我们详细概述了现有的多语言数据集，以及存在的挑战，并提出可能的未来发展方向。

Jan, 2024

多语种事实核查索引检索

本论文提出了一个新的多语言数据集 MultiClaim，其中包含 28k 个社交媒体帖子和 206k 个来自专业事实核查人员写的 39 种语言的事实核查。我们评估了不同的非监督方法在这个数据集上的效果，并显示对这样一个多样化的数据集进行评估具有复杂性，需要在解释结果之前采取适当的措施。我们还评估了一种监督微调方法，显著提高了非监督方法的性能。

May, 2023

SemEval-2024 任务 8：多领域机器生成文本检测技术的综合分析

本论文介绍了我们在 SemEval2024 Task8 中用于检测跨各个领域的机器生成文本的方法，包括统计、神经网络和预训练模型方法，并通过深入的错误分析评估了这些方法的有效性。在单语和多语境下，我们的方法在子任务 A 单语上获得 86.9％的准确率，在子任务 B 上获得 83.7％的准确率。此外，我们还强调了未来研究中的挑战和重要因素。

Mar, 2024

重新寻求真相：多轮检索增强的大型语言模型是强大的假新闻检测器

通过多轮检索策略从网络源自动抽取关键证据进行主张验证的检索增强 LLMs 框架是第一种能自动地并有目的性地从网页信息中提取关键证据的框架，通过在三个现实世界数据集上进行全面的实验证明了该框架对现有方法的优越性。重要的是，我们的模型不仅提供准确的结论，还提供可读的解释，以提高结果的可解释性。

Mar, 2024

评估大型语言模型在检测虚假新闻中的功效：一项比较分析

研究通过对比分析，评估了不同大型和小型 LLMs 在识别和过滤假新闻内容方面的有效性，并利用 Kaggle 的假新闻数据集样本探讨了当前 LLMs 在假新闻检测方面的能力和局限性，同时讨论了提高 AI 驱动信息完整性对开发人员和决策者的影响。

Jun, 2024

从文本到来源：大型语言模型生成内容的检测结果

通过探索跨模型检测、模型归因以及分类器的效果与模型规模之间的关系，该研究在大型语言模型的使用中提供了宝贵的见解。

Sep, 2023

大型语言模型能否检测科学新闻报道中的错误信息？

使用大型语言模型检测科学报道中的虚假信息，针对缺乏明确标签的情况，提出了多种基于大型语言模型的基准架构和提示方法，包括零样本、少样本和连贯思维提示等。

Feb, 2024