Jun, 2023

使用语言模型作为审核器的基础模型基准测试

TL;DR本文提出了一种新的基准测试框架,Language-Model-as-an-Examiner,其中 LM 作为一个知识丰富的考官,提出问题,并以无参考的方式评估答复,以便更全面和公平地评估模型。