May, 2024

评估生成式大型语言模型的 Oracle-Checker 方案

TL;DR本文提出了一种名为 “Oracle-Checker 方案” 的新方法,用于评估生成式大型语言模型(LLM)给出的答案。介绍了两种类型的检查器,一种是基于属性测试思想,另一种是基于程序检查思想。分别展示了它们在实体抽取和近义词判断两个不同背景下的应用。