Feb, 2024

细粒度自我认可提高事实性和推理能力

TL;DR该研究旨在通过减少事实冲突的幻觉来改善大型语言模型在推理时的生成。我们提出了一种自我认可框架,通过对多个样本回答进行细粒度的事实级别比较,相比之前的集成方法,我们的方法可以更好地减轻幻觉,尤其是对于长篇生成任务。我们的方法可以广泛受益于更小的和开源的语言模型,因为它主要进行简单的基于内容的比较。对传记的实验表明,我们的方法可以通过简单直观的提示有效地改善生成的客观性,适用于不同规模的语言模型。此外,对 TriviaQA 和 GSM8K 的全面分析展示了自我认可在更广泛应用中的潜力。