Jun, 2024

评估机器生成事实核查解释的透明度

TL;DR通过使用大型语言模型,我们研究了人工筛选与机器选择证据对解释生成的影响,发现大型语言模型使用机器选择的证据生成的解释质量相似或更高,表明精心策划(通过人工)的证据可能不是必需的。但即使使用最佳模型,生成的解释有时也不忠实于来源,因此在事实核查的解释生成方面仍有改进的空间。