Nov, 2023

RELIC: 通过自一致性研究大型语言模型的回答

TL;DR为了解决大型语言模型生成的虚构和非事实内容的问题,我们提出了一种交互系统,通过多个样本的自一致性来评估生成文本中个别声明的置信度,从而帮助用户获取对生成文本可靠性的洞见。通过用户研究,我们证明了该方法有助于用户更好地验证生成文本的可靠性,并总结了该研究对于未来关于可靠人机对话的启示、设计影响和经验教训。