ACLMay, 2024
在 CFLUE 上对大型语言模型进行基准测试 —— 中文金融语言理解评估数据集
Benchmarking Large Language Models on CFLUE -- A Chinese Financial Language Understanding Evaluation Dataset
Jie Zhu, Junhui Li, Yalong Wen, Lifan Guo
TL;DR我们提出了中文金融语言理解评估基准 CFLUE,用于评估大型语言模型在知识评估和应用评估方面的能力。CFLUE 提供了定制的数据集,用于知识评估和应用评估,并进行了代表性大型语言模型的彻底评估。