Jul, 2023

生成言语模型事实性评估基准

TL;DR本文通过提出 FACTOR 方法,使用自动转换真实语料库的方式评估语言模型的事实推理能力,并通过 Wiki-FACTOR 和 News-FACTOR 两个基准测试数据集测试方法的有效性。