May, 2024
评估生成式大型语言模型的 Oracle-Checker 方案
Oracle-Checker Scheme for Evaluating a Generative Large Language Model
Yueling Jenny Zeng, Li-C. Wang, Thomas Ibbetson
TL;DR本文提出了一种名为 “Oracle-Checker 方案” 的新方法,用于评估生成式大型语言模型(LLM)给出的答案。介绍了两种类型的检查器,一种是基于属性测试思想,另一种是基于程序检查思想。分别展示了它们在实体抽取和近义词判断两个不同背景下的应用。