Nov, 2023

大型语言模型的指令跟随评估

TL;DR通过引入 Instruction-Following Eval (IFEval) 作为一种简单易复制的评估基准来解决大型语言模型中遵循指令能力的评估问题。该基准专注于一组 “可验证指令”,并构建了约 500 个提示,每个提示包含一个或多个可验证指令。