May, 2023

LM vs LM: 通过交叉审查检测事实性错误

TL;DR本文提出了一种基于交叉验证的自然语言模型事实评估框架,通过多轮交互和另一个模型的提问来发现不一致性,实验证明该方法在捕捉事实错误方面优于现有方法和基线。