经济有效的大型语言模型幻觉检测

Jul, 2024

经济有效的大型语言模型幻觉检测

Cost-Effective Hallucination Detection for LLMs

Simon Valentin, Jinmiao Fu, Gianluca Detommaso, Shaoyuan Xu, Giovanni Zappella...

TL;DR本研究针对大型语言模型（LLMs）在生成不可靠输出时存在的幻觉问题，提出了一种后续幻觉检测的方法。该方法结合多种评分方法以提高检测效果，并引入经济有效的多评分框架，以降低计算成本，同时实现优于传统检测方法的表现。

Abstract

large language models (LLMs) can be prone to hallucinations - generating unreliable outputs that are unfaithful to their inputs, external facts or internally inconsistent. In this work, we address several challenges for post-hoc →

发现论文，激发创造

用于减少大型语言模型无根幻觉的自然语言推理链

提出了一个使用自然语言推理链 (CoNLI) 来进行幻觉检测和幻觉减少的层次性框架，通过后期编辑来减少幻觉生成，从而提升文本质量。该框架在幻觉检测方面取得了最先进的性能，并在不进行微调或特定领域提示工程的情况下，使用大型语言模型 (LLMs) 进行重写，展示出了在各种上下文中具有竞争力的性能。

Oct, 2023

段落级幻觉检测的新基准与反向验证方法

本研究提出了一种基于反向验证的自检方法，以零资源方式自动检测事实错误，并构建了一个基于ChatGPT生成的、由人工注释的幻觉检测基准，在段落级别进行研究和评估不同方法，揭示了零资源方法的共同局限。

Oct, 2023

增强基于不确定性的错觉检测与更强的关注

本文提出了一种新颖的无参考、基于不确定性的大语言模型(LLM)幻觉检测方法，通过关注给定文本中最具信息和重要性的关键词、历史上不可靠的标记以及标记属性（如类型和频率），实现了最新的检测方法，消除了对额外信息的需求。

Nov, 2023

HypoTermQA: 用于评估LLMs产生假设性术语倾向的假设性术语数据集

介绍了一个自动可扩展的框架，将大型语言模型（LLM）的幻觉倾向与高效的幻觉检测相结合，提供了测试和改进LLMs的机会，并有潜力生成特定领域的基准数据集。

Feb, 2024

基于大型语言模型内部状态的非监督实时幻觉检测

LLMs出现的幻觉指的是LLMs产生的回应在逻辑上是连贯的，但事实上是不准确的。本文引入了一种名为MIND的无监督训练框架，利用LLMs的内部状态实时检测幻觉，无需手动注释，并提出了用于评估多个LLMs幻觉检测的新基准HELM。我们的实验证明，MIND在幻觉检测方面优于现有的最先进方法。

Mar, 2024

幻觉检测：在大型语言模型中可靠地区分可信答案

通过使用名为RelD的鲁棒性判别器，本文提出了一种有效检测大型语言模型中幻觉问题的方法，并在构建的RelQA双语问答对话数据集上进行了训练。实验结果表明，该方法成功检测到了由不同大型语言模型生成的幻觉回答，且能够区分内部和外部分布数据集中的幻觉问题。此研究为可靠答案的检测做出了重要贡献，并对未来幻觉问题的缓解具有显著的意义。

Jul, 2024

ANAH-v2: 大规模语言模型的分析幻觉注释扩展

该论文介绍了一种迭代自训练框架，可以扩展大型语言模型幻觉注释数据集的规模，提高幻觉注释器的准确性，并且通过先进的零样本推理，在HaluEval和HalluQA上获得了全新的幻觉检测结果。

Jul, 2024

硬币的两面：利用LLMs作为LLMs的评估器进行幻觉生成和检测

本文探讨了四个大型语言模型（LLMs）（Llama 3、Gemma、GPT-3.5 Turbo和GPT-4）在幻觉生成和检测任务中的能力，并采用集成多数投票的方法将所有四个模型应用于检测任务，结果对于了解这些模型在处理幻觉生成和检测任务中的优势和不足具有有价值的见解。

Jul, 2024

成本效益高的幻觉检测方法用于大语言模型

本研究针对大语言模型中的幻觉现象（生成与输入、不实外部事实或内部不一致的输出）进行检测，提出了一种后期检测的创新方法。通过生成信心分数、根据输入和候选响应的属性进行校准，并通过阈值实现检测，研究显示多评分框架能有效结合不同评分的优点，显著提升检测效果，同时实现成本效益高的检测方法，有望减少计算开销。

Jul, 2024

THaMES：一个用于减轻和评估大型语言模型幻觉的端到端工具

该研究解决了大型语言模型中幻觉问题，即生成不准确内容的挑战，并指出现有方法的不足。论文提出THaMES，一个综合框架，能够自动生成测试集并评估幻觉的减轻效果，通过多种策略优化模型能力，结果表明商用模型在特定情况下更依赖不同的减轻策略，且参数高效微调显著提升模型表现。

Sep, 2024