关于运用大型语言模型促进数学学习的三个问题
数学推理是评估人类智能基本认知能力的基石。该研究调查了大型语言模型在解决数学问题方面的真正进展、障碍、数学问题类型和相关数据集、解决数学问题的 LLM 技术范围、影响 LLMs 解决数学问题的因素和问题,并提供了这一快速发展领域中的现状、成就和未来挑战的整体观点。
Jan, 2024
大型语言模型(LLMs)如 ChatGPT 因其通用的语言理解能力而备受关注,尤其是它们生成高质量文本或计算机代码的能力。在本文中,我们讨论它们在何种程度上可以辅助数学专家,并提供了现代语言模型中使用的变压器模型的数学描述。基于最近的研究,我们概述了最佳实践和潜在问题,并报告了语言模型的数学能力。最后,我们揭示了 LLMs 改变数学家工作方式的潜力。
Dec, 2023
基于大型语言模型的教育系统研究,评估其在教育能力方面的潜力,并提出统一和专家混合两种方法构建下一代智能教育系统,同时探讨了挑战和未来发展方向。
Dec, 2023
自然语言处理和大型语言模型在教育和指导方法领域取得了快速进展,特别在解决数学问题的应用方面,其中 MAmmoTH-13B 表现出了最高的能力水平,成为解决 NCERT 数学问题的可靠基准。
Apr, 2024
大型语言模型(LLMs)的发展促使人们对其推理和问题解决能力产生了更大的兴趣。本研究调查了几种 LLMs 是否能够解决认知科学文献中一种经典类型的演绎推理问题。研究发现,这些被测试的 LLMs 在传统形式上解决这些问题的能力有限。我们进行了后续实验,探究了更改展示格式和内容是否能改善模型性能。尽管我们发现了条件之间的绩效差异,但总体性能并未提高。此外,我们还发现性能与展示格式和内容以出人意料的方式相互作用,与人类表现有所不同。总的来说,我们的结果表明 LLMs 具有独特的推理偏见,其只能部分预测人类的推理表现。
Sep, 2023
大语言模型 (LLMs) 在教育领域带来了新的可能性。本综述论文从多个角度总结了 LLMs 在教育环境中的各种技术,包括学生和教师辅助、自适应学习和商业工具。我们系统地审查了每个角度的技术进展,整理了相关的数据集和基准,并识别了在教育中部署 LLMs 所面临的风险和挑战。此外,我们概述了未来的研究机会,强调潜在的有前途的方向。我们的综述旨在为教育工作者、研究人员和决策者提供一个全面的技术画面,以利用 LLMs 的力量革新教育实践,并促进更有效的个性化学习环境。
Mar, 2024
利用大语言模型在现代教育领域创新的机会,通过研究提问型大语言模型、语法错误解释和人力资源面试评估,揭示了大语言模型在改变教育实践中的潜力和限制。
May, 2024
我们提出了一种基于数学误解的大型语言模型(LLM)数学推理能力的新评估方法。我们通过模拟 LLMs 作为初学者和专家导师,旨在识别由于特定误解导致的错误答案,并识别一个错误答案背后的误解。与传统基于 LLMs 的数学评估侧重于正确回答数学问题不同,我们的方法受到教育学习科学原则的启发。我们要求 LLMs 明确地模仿初学者通过基于不完整知识的特定错误方式回答问题,并模仿专家导师识别与问题的错误答案相对应的误解。通过简单的小学数学问题实验,我们发现,尽管 LLMs 可以轻松正确回答这些问题,但它们难以识别:1)与特定不完整知识(误解)相对应的错误答案;2)解释特定错误答案的误解。我们的研究指出了增强 LLMs 数学推理能力的新机会,尤其是在教育应用中开发健壮的学生模拟和专家辅导模型方面。
Oct, 2023
大型语言模型在知识获取和统计推理方面取得了稳定进展,但在常识推理任务中仍存在局限性,纯统计学习难以应对其中的组合爆炸问题,更大并不总是更好,而且单纯追求统计改进只会加重正确答案与真正推理能力之间的危险混淆。
Apr, 2024
通过调查和总结大型模型在智能教育中的应用,本文旨在提供关于 LMM4Edu 潜力和挑战的指导和见解,并为教育者、研究人员和政策制定者深入理解和进一步推进 LMM4Edu 的发展和应用提供指导。
Nov, 2023