May, 2022

测验设计任务:帮助教师使用自动化题目生成器创建测验

TL;DR本篇研究旨在利用标准化的NLG指标来检测QGen模型所带来的实际效果,并以教师自动生成阅读理解测试为例进行实际应用测试。虽然我们发现近期QGen取得了显著进展,但最佳模型仅得到了10名教师中的68.4%同意接受的问题,同时也发现需要新的自动度量标准来指导QGen研究前进。