Jun, 2023

PandaLM:LLM指导调优优化的自动评估基准

TL;DR通过引入一种名为 PandaLM 的大型语言模型来更公平地评估大型语言模型,该模型不依赖于基于 API 的评估,能够相对简要地比对大量 GPT 系列模型的效果,从而实现了最优超参数选择的自动化、健壮和可靠评估基准的确定。