基于实体的问答中的知识冲突

EMNLPSep, 2021

Entity-Based Knowledge Conflicts in Question Answering

Shayne Longpre, Kartik Perisetla, Anthony Chen, Nikhil Ramesh, Chris DuBois...

TL;DR本文研究了知识依赖任务中遇到的知识冲突问题，找出造成模型幻觉的原因，提出了一种简单的减轻过度依赖学习参数的方法，可以减少幻觉现象并提高模型的泛化性能。

Abstract

Knowledge-dependent tasks typically use two sources of knowledge: parametric, learned at training time, and contextual, given as a passage at inference time. To understand how models use these sources together, we formalize the problem of knowledge conflicts, where the →

knowledge conflicts over-reliance contextual information mitigation strategy parametric knowledge

发现论文，激发创造

丰富的知识来源会带来复杂的知识冲突：重新校准模型以反映冲突的证据

本论文探讨了问题回答模型如何使用丰富的知识源，同时我们模拟了知识冲突并发现检索性能对模型所依赖的知识源有很大影响，我们发现当前的模型大多依赖非参数化知识。为解决此问题，我们在本论文中提出了一项新的校准研究，以避免在检索出多个冲突答案选项时，让模型给出任何单一答案。

Oct, 2022

DisentQA：使用反事实问答解开参数化和语境知识的混淆

该研究提出了一种新的 QA（Question Answering）模型范式，通过引入反事实数据增强的方式，使模型能够预测基于给定语境知识和基于参数化知识的两种答案，从而改善模型的鲁棒性和生成有用的无关答案。

Nov, 2022

解决大型语言模型中的知识冲突

大型语言模型（LLMs）在识别知识冲突方面表现良好，但在确定具体的冲突知识并在相冲突的信息中给出不同的答案方面存在困难。为了解决这些问题，我们提出了一种基于指令的方法来增强 LLMs 以更好地实现这三个目标。进一步的分析显示，解决知识冲突的能力受到知识领域和提示文本等因素的巨大影响，而生成对知识冲突场景的稳健响应仍然是一个开放性的研究问题。

Oct, 2023

研究大型语言模型在现实知识冲突下的行为

通过真实冲突文档更新错误的派生参数知识来研究知识冲突，结果显示模型的正确派生参数知识对其阅读能力和行为产生负面影响。

Apr, 2024

交互式问答知识对齐减轻语言模型幻觉

介绍一种名为 MixAlign 的框架，通过与用户和知识库的交互来消除语言模型生成虚假和不支持的响应。MixAlign 利用语言模型实现自动问题 - 知识对齐，并在必要时通过人工用户澄清来进一步增强对齐，从而缓解了语言模型幻觉问题，并在实验中取得了显著改进。

May, 2023

LLM 学生的知识冲突调查

通过对大型语言模型（LLMs）的知识冲突进行深入分析，本调查报告重点研究了它们在融合上下文和参数化知识时所面临的复杂挑战。我们关注三类知识冲突：上下文 - 记忆、不同上下文之间和内部记忆冲突。这些冲突会严重影响 LLMs 的可信度和性能，尤其是在噪声和错误信息普遍存在的实际应用中。通过对这些冲突进行分类、探索其原因、研究 LLMs 在这些冲突下的行为以及回顾现有解决方案，本调查旨在为改善 LLMs 的鲁棒性提供策略，并成为推动这一发展领域研究的宝贵资源。

Mar, 2024

合并冲突！” 探究外部干扰因素对参数化知识图的影响

通过构建参数化知识图和引入外部知识，系统地研究了大型语言模型 (LLMs) 在与用户互动时，外部知识如何干扰其参数化知识；结果显示，LLMs 在遇到直接冲突或混淆信息时容易产生与其参数化知识不符的回复，暴露了整合外部知识时产生幻觉的风险。

Sep, 2023

增强 LLMs 与知识：关于幻觉防止的调查

将预训练语言模型与外部知识源相结合，可以增强其上下文处理能力，克服传统语言模型的问题，如错觉、无依据的回答和可拓展性挑战。

Sep, 2023

减轻知识驱动对话生成中的幻觉的因果观察

本文通过反事实推理方法分析了幻觉问题背后的因果关系，提出了一种可能的解决方案，即通过利用对话 - 知识交互来减轻幻觉，在不影响对话性能的同时适应不同的生成模型。希望我们的努力能够支持并呼吁更多重视开发轻量级技术以实现强大可靠的对话系统。

Apr, 2024

谈话模型产生幻觉的起因：是数据集还是模型？

这篇论文研究了知识驱动的对话模型中的幻觉问题，通过广泛的人类研究发现标准测试数据集中有超过 60％的幻觉响应，导致模型产生幻觉现象。提出了关于训练数据和模型质量的重要问题，并为未来的研究提供了公开的批注。

Apr, 2022