EMNLPOct, 2023

运用语言模型模拟生成与评估 K-12 学生的测试:基于句子阅读效率的案例研究

TL;DR通过对大规模语言模型进行微调,以模拟先前学生对未见过的测试项目的响应,生成具有高质量的平行测试,并且通过对成千上万名 K-12 学生进行评估,证明生成的测试与人工专家编写的标准测试的难度和可靠性高度相关。