Jun, 2023

KoLA:大型语言模型世界知识的精细基准测试

TL;DR我们构建了一种基于知识导向的大型语言模型评估基准,并通过使用维基百科和不断收集出现的语料库来确保数据的公正比较,评估 21 个开源和商业大型语言模型的能力和知识相关度。