May, 2025

大型语言模型在智能辅导系统的逻辑问题证明和提示构建中的潜力与局限

TL;DR本研究解决了智能辅导系统在提供个性化反馈方面的缺口,因其依赖模板化的解释。研究提出了一种评估其在构建多步骤逻辑证明中的准确性的方法,发现DeepSeek-V3在步骤证明构建中表现优越,准确率达84.4%。结果表明,LLM生成的提示在一致性和清晰度上得分较高,但在解释提示原因和背景时表现不佳,显示出LLM在增强逻辑辅导系统方面的应用潜力,同时需增加修改以确保其准确性和教育适宜性。