衡量五个负责任对话举措以实现规模化教学改进
通过计算分析,我们提出了一个框架来衡量教师-学生交互式对话中的引用行为,并通过应用到不同领域的教育数据集中验证了该方法的有效性,为教师的自动化专业发展提供了证据。
Jun, 2021
本文描述了一个用于理解 K-12 数学课堂中教师和学生话语的数据集,并使用它开发了TalkMoves应用程序,该应用程序可为教师提供关于他们的数学教学的自动、即时和可操作反馈。
Apr, 2022
本文探讨了指令调整对大型语言模型性能的影响,并在在线应用案例中通过增加不同比例的指令数据探究了模型的表现。结果表明,增加指令数据可改善某些任务的表现,但对于数学和代码等任务,增加数据规模的改善效果不明显。
Mar, 2023
本研究探讨是否生成式人工智能可以作为自动化教练辅助专家反馈以成为对教师训练的一种有效补充。在这个过程中,针对小学数学课堂记录文本,我们提出了生成式人工智能的三种教师培训任务,并邀请数学领域专家评估了ChatGPT模型在每种任务上的表现。研究显示,生成式AI提供的反馈意见虽然往往不是新颖或有洞察力的,但它们仍然与改善教学相关。
Jun, 2023
本研究提供了一个大的数据集,开发了一种标准对学生的评论进行分类,并提出了一种使用大型语言模型进行评论分类的最佳实践,从而建立了一个低成本的定量研究自动化体系,来处理海量的在线学生反馈。
Jun, 2023
本研究旨在通过使用NLP技术自动生成课堂讨论质量的评估得分,对90个课堂讨论文本记录进行分析和评估,在焦点为四个评估材料的基础上,研究表明在某些方面有了令人鼓舞的结果,同时也发现在其他方面还有进一步的改进空间。
Jun, 2023
应用大语言模型来估计教学支持领域中的CLASS得分,使用零-shot提示和词袋模型对教师讲话的个别话语进行分类,通过实验发现自动估计方法准确性接近人际可靠性,并结合特征提取来提供教师可解释反馈。
Oct, 2023
通过开发一个有效的教练工具,我们探索了借助大型语言模型(LLMs)提供自动化、个性化的指导教师使用GMSL的可能性,我们的研究表明LLMs在教师和学生中产生了积极的反馈,并显示了在教育领域应用LLMs时进行大规模人类评估的益处。
Oct, 2023
使用ChatGPT为实践医疗专业人员提供个性化形成性反馈,通过一小时Zoom分组活动教授数字健康计划的评估计划制定,调查表显示大多数受访者对反馈持积极看法,讨论范围广泛,但只有三个小组利用了反馈循环改进评估计划。未来教育者可以从我们的经验中学习,包括设计提示、提供使用ChatGPT的指导说明和支持最佳ChatGPT群组互动。未来研究应该探索ChatGPT在群体动态中的影响,并提出ChatGPT在协作学习中的设计原则。
Nov, 2023
评估教学质量是教育系统改进的基本组成部分。本研究首次运用自然语言处理技术来评估两种不同教育环境中的多项高推断教学实践,包括线下K-12班级和面向未来教师的模拟表现任务,并将NLP应用于广泛认可对特殊需要学生特别有效的教学实践的度量。结果表明,预训练语言模型在较为离散且需要较低推断的变量上表现与人类评分者的一致性相当,但在更复杂的教学实践上表现逐渐减弱。有趣的是,仅使用教师的话语作为输入对学生中心的变量产生了强大的结果,缓解了在线下教学环境中收集和转录高质量学生语音数据的难度问题。本研究发现了当前教育领域自然语言处理技术的潜力和局限性,并为进一步研究开辟了新的途径。
Apr, 2024