ACLMay, 2024

在 CFLUE 上对大型语言模型进行基准测试 —— 中文金融语言理解评估数据集

TL;DR我们提出了中文金融语言理解评估基准 CFLUE,用于评估大型语言模型在知识评估和应用评估方面的能力。CFLUE 提供了定制的数据集,用于知识评估和应用评估,并进行了代表性大型语言模型的彻底评估。