GPT-4 Turbo 在基于布鲁姆修订分类的教科书中生成学校级问题的效果如何？

Jun, 2024

GPT-4 Turbo 在基于布鲁姆修订分类的教科书中生成学校级问题的效果如何？

How Effective is GPT-4 Turbo in Generating School-Level Questions from Textbooks Based on Bloom's Revised Taxonomy?

Subhankar Maity, Aniket Deroy, Sudeshna Sarkar

TL;DR我们评估了 GPT-4 Turbo 在零样本模式下，从 NCERT 教科书中生成教育问题的有效性。我们的研究强调了 GPT-4 Turbo 在生成需要更高阶思维技能的问题方面的能力，特别是根据布鲁姆修订的分类在 “理解” 层次。虽然我们发现 GPT-4 Turbo 生成的问题在复杂性方面与人类评估的问题之间存在显著的一致性，但有时会有差异。我们的评估还揭示了人类和机器评估问题质量的差异，这种趋势与布鲁姆修订的分类水平呈相反关系。这些发现表明，尽管 GPT-4 Turbo 是一个有前景的教育问题生成工具，但其有效性在不同的认知层次上存在差异，进一步的改进是为了更好地满足教育标准的需要。

Abstract

We evaluate the effectiveness of gpt-4 turbo in generating educational questions from NCERT textbooks in zero-shot mode. Our study highlights GPT-4 Turbo's ability to generate questions that require higher-order thinking skills, especially at the "understanding" level according to Bloo

gpt-4 turbo educational question generation higher-order thinking skills bloom's revised taxonomy cognitive levels

发现论文，激发创造

优化基于布鲁姆认知目标的问题设计，减轻 ChatGPT 对教育的负面影响

本文提出了一种演化方法，旨在确定 Bloom's taxonomy 最佳关键词集，以生成 ChatGPT 难以回答的问题，以解决生成文本 AI 工具对学生学术表现的潜在负面影响和教育者评估学生成果所面临的挑战问题。使用澳大利亚堪培拉新南威尔士大学的数据结构和表示课程的问题进行的案例研究表明，优化算法能够找到不同认知水平的关键词，创造出 ChatGPT 有困难回答的问题，从而为教育者制定更有效的问题，促进学生的批判性思维提供了有价值的见解。

Mar, 2023

使用 GPT-4 进行程序练习的反馈生成

该研究探索了使用 GPT-4 Turbo 生成学生编程提交的反馈，研究结果显示相比 GPT-3.5，GPT-4 Turbo 在输出质量上有显著的改进，可以更准确地识别学生程序输出中的错误，并能为学生提供结构化和一致的反馈。此研究还增加了我们对大型语言模型在电子评估系统、教学场景和指导学生使用基于 GPT-4 的应用中潜力和限制的理解。

Mar, 2024

大型语言模型生成的教育问题有多有用？

通过人工评估，控制型文本生成与问题分类法相结合生成的高质量、多样化问题，被认为对教师和学生的教学内容质量有较大的提升作用，具有在教学环境中广泛使用的潜力。

Apr, 2023

使用 GPT-turbo 3.5 自动生成英语词汇多选填空问题

使用大型语言模型自动生成填空题，并评估其有效性和适用性，通过生成适当的句子和选择合适的答案，以提高学生的词汇掌握水平。

Mar, 2024

提升教育中主动学习的生成式人工智能：基于 GPT-3.5 和 GPT-4 的个性化测试题比较研究

研究了 LLMs，特别是 GPT-3.5 和 GPT-4，如何根据主动学习原则为九年级数学提供量身定制的问题。结果显示，GPT-4 能够生成准确、具有挑战性的问题，并且 GPT-3.5 在从 GPT-4 接受指导后在处理更复杂问题方面有了明显改善，从而突显了 LLMs 模拟和增强主动学习场景的潜力，为个性化教育中的人工智能提供了有前景的途径，需要在不同的教育环境中进一步探索。

Jun, 2024

教师如何利用大型语言模型和布鲁姆纳姆的分类法创建教育测验

应用基于大型语言模型的问题生成方法，考虑教学需求，通过实验验证教师对自动生成问题的喜好，结果显示教师更愿意使用自动生成的问题写测验，并且这样的测验在质量上不亚于手写版本，甚至可以提高测验质量，显示了课堂环境中大规模使用问题生成的潜力。

Jan, 2024

利用 LLM 在课程设计中：使用 GPT-4 支持学习目标的编写

通过评估 GPT-4 在人工智能实践课程中生成高质量学习目标的能力，本研究结果显示，自动生成的学习目标大多合理，表达准确，符合 Bloom 分类法的不同层次，可以用于支持课程和课程设计的工作。

Jun, 2023

AI 生成（GPT-4）与人工编写的编程教育选择题的比较研究

通过分析 GPT-4 在高等教育的 Python 编程课程中生成的多项选择题（MCQs），我们发现 GPT-4 能够产生具有清晰语言、单一正确选项和高质量干扰项的 MCQs，并且这些生成的题目与学习目标高度一致。这些研究结果对于希望充分利用最先进生成模型来支持多项选择题的编写工作的教育工作者具有潜在价值。

Dec, 2023

如何做到对？使用 GPT 重述错误学员回答

通过使用 GPT-4 模型，我们的研究建立一个解释性反馈系统，用于训练初级导师。研究结果表明，该模型有效地识别出三个训练课程中正确 / 错误的学员反馈，并将错误反馈转化为期望的反馈，其性能达到与人类专家相当的水平。

May, 2024

大型语言模型 (GPT) 困难回答关于代码的多选题

作者分析了三种不同的 GPT 模型（生成式预训练转换模型）在回答包括程序代码片段的多选题方面的有效性，发现包含代码片段的题目更加困难，这个发现可以帮助编程教育工作者适应他们的教学方法和评估，为学习者提供有意义的辅助。

Mar, 2023