Jun, 2024

层次指导分类法:大型语言模型的通用评估框架

TL;DR通过引入层次化提示分类法及其规则以及自适应层次化提示框架,研究衡量大型语言模型在解决多样任务中的效果,进而发展一种用于评估数据集复杂性和语言模型能力的通用评价指标。