Nov, 2023

关于大型语言模型 “令人惊讶可能” 的回答的真实性研究

TL;DR在这篇研究中,我们调查了类似于 Bayesian Truth Serum 的标准对 LLMs 的回答的相关性,并假设在一定条件下,根据这一标准最大化奖励的回答应该比仅最大化后验概率的回答更准确。通过使用包括 TruthfulQA 基准和开放可用的 LLMs(如 GPT-2 和 LLaMA-2)的基准实验证明该方法确实显著提高了准确性(例如,在 TruthfulQA 上的总体改进高达 24 个百分点,在各个问题类别上的改进高达 70 个百分点)。