课堂中鼓励和温暖的自动评估:利用多模态情感特征和 ChatGPT
本研究探讨是否生成式人工智能可以作为自动化教练辅助专家反馈以成为对教师训练的一种有效补充。在这个过程中,针对小学数学课堂记录文本,我们提出了生成式人工智能的三种教师培训任务,并邀请数学领域专家评估了 ChatGPT 模型在每种任务上的表现。研究显示,生成式 AI 提供的反馈意见虽然往往不是新颖或有洞察力的,但它们仍然与改善教学相关。
Jun, 2023
基于 ChatGPT 模型的广泛研究评估了 GPT-4 和 GPT-3.5 在 13 个影响计算问题上的性能,发现它们在涉及情感、情绪和毒性等问题上表现出色,但在涉及隐性信号的问题上表现较差,如参与度测量和主观性检测。
Aug, 2023
研究发现,提供具体及时的反馈可以提高人类导师的表现,但由于评估导师表现的时间消耗性质,给出具体及时的反馈存在挑战,然而使用大语言模型 (如 AI-chatbot ChatGPT) 来为实际应用中的导师提供建设性反馈有潜力。 这项工作在导师 - 学生模式下评估了由 GPT-4 生成的 30 次对话,并将两种不同的提示方法进行比较:零 - shot 思维链和少 - shot 思维链,以识别基于五个标准的有效赞扬的具体组成部分,并通过与人类评分员的结果进行比较来评估 GPT-4 是否能够准确识别每个赞扬标准。研究发现,零 - shot 和少 - shot 思维链方法产生了相似的结果。 GPT-4 在识别导师提供具体和即时赞扬的情况下表现良好,但在识别导师提供真诚赞扬的能力方面表现不佳,尤其是在没有提供真诚导师赞扬语句的零 - shot 提示场景中。未来的研究将着重于增强提示工程,开发更普遍的导师评分表,并使用实际的导师对话来进行评估。
Jul, 2023
本文详细评估了 ChatGPT 在 11 个数据集上的心理健康分析和情感推理能力,分析了不同提示策略对其分析能力和可解释性的影响,并发现情感提示可以有效提高其性能,但需要正确的情感注入方式。
Apr, 2023
本文探讨使用 ChatGPT 模型进行学生答案自动评分和理由生成的方法,并通过引入批评模块,过滤 ChatGPT 的不正确输出并细调较小的语言模型,在学生答案评分和理由生成方面实现了更好的性能,并且能够提供更详细和易理解的评估结果,从而提供了一个可行的解决方案,实现了可解释的自动评估教育。
May, 2023
ChatGPT 在自动化给予 Java 编程作业反馈方面的可行性进行了研究,调查结果表明学生们普遍认为 ChatGPT 反馈与 Shute 建立的形成性反馈准则相一致,他们更喜欢包含他们代码的反馈,此研究还提供了改进 ChatGPT 生成反馈的具体见解。
Dec, 2023
Multimodal language models (MLMs) are applied in affective computing, evaluating their performance in facial action unit recognition, micro-expression detection, and emotion recognition, highlighting challenges and potential for further study in this field.
Mar, 2024
通过敏感度分析和评估不同提示或生成参数对 foundation models 的性能敏感程度,探索 affective computing 领域中的 prompting 技术,以及对情感分析、毒性检测和讽刺检测等任务的性能影响。
Mar, 2024
该研究比较了 ChatGPT 和 32 门大学课程学生的表现,发现 ChatGPT 在许多课程中的表现相当,甚至优于许多学生。此外,其使用也难以被 AI 文本分类器可靠地检测出来,并且出现了学生使用该工具和教育者将其视为抄袭的共识,这些发现为 AI 融入教育框架的政策讨论提供了指导。
May, 2023
该研究探讨了大型语言模型(LLM),特别是 GPT-4,在课堂对话分析中的应用,这是教学诊断和质量改进的关键研究任务。研究发现传统定性方法在教育研究中具有知识密集和劳动密集的特点,调查了 LLM 在简化和增强分析过程方面的潜力。通过对中学的数据集进行分析,包括数学和语文课堂的对话,该研究对人工编码的对话进行了评估,并使用定制的 GPT-4 模型进行了分析。该研究重点比较了手动注释和 GPT-4 输出,以评估其在教育对话分析中的有效性。评估了 GPT-4 的时间效率、编码者间一致性和编码者间可靠性。结果表明,使用 GPT-4 能够显著节省时间,并且模型与人工编码者之间具有高度的一致性,尽管在某些代码上存在差异。这些发现凸显了 LLM 在教学评估和促进方面的巨大潜力。
Feb, 2024