May, 2023

语言模型幻觉如何滚雪球

TL;DR语言模型中常见的错误是幻觉,LM 可能会输出错误的断言,但其能够单独识别为不正确。ChatGPT 和 GPT-4 找到的解释的 87%都是错误,这被称为幻觉滚雪球。