Jun, 2023
使用语言模型作为审核器的基础模型基准测试
Benchmarking Foundation Models with Language-Model-as-an-Examiner
Yushi Bai, Jiahao Ying, Yixin Cao, Xin Lv, Yuze He...
TL;DR本文提出了一种新的基准测试框架,Language-Model-as-an-Examiner,其中 LM 作为一个知识丰富的考官,提出问题,并以无参考的方式评估答复,以便更全面和公平地评估模型。