EMNLPOct, 2023

探索大型语言模型的认知知识结构:一种教育诊断评估的方法

TL;DR通过使用教育诊断评估方法,本研究在 MoocRadar 上进行评估,这是一个基于布鲁姆分类法的人工测试数据集,旨在揭示大型语言模型的知识结构并了解其认知能力的差异模式,从而为研究人员在 LLMs 的知识方面提供更明确、更有效的发展和利用。