Jul, 2023

使用LLMs的Pairwise比较进行零样本自然语言生成评估

TL;DR通过用自然语言生成技术输出的对比评估方法来检验大型自然语言模型的表现,使得在不依靠特定域和属性情况下进行评估成为可能。