Aug, 2023

GameEval:对话游戏下 LLM 的评估

TL;DR通过目标驱动的对话游戏,GameEval 提出了一种新的评估大型语言模型的方法,能够全面评估模型的性能,展示其解决复杂问题的综合能力。