Jun, 2024

利用学生反馈将 LLM 与助记学习相结合,形成类似于 “胶水疗法” 的智能助记

TL;DR关键词提示法是将新术语与简单关键词相连的易记解释。本研究构建了 SMART,一个根据真实学生学习新术语的反馈训练的关键词提示生成器。通过训练 SMART,采用了 LLaMA-2 对由用户编写的关键词提示进行微调,然后使用 LLM 对 SMART 进行增强,通过在闪卡应用中使用 SMART 生成的关键词提示来了解学生偏好。通过收集来自 45 名学生的 2684 条偏好数据,从评级中推测的明确偏好和从学生学习中推测的观察到的偏好,得出了三个关键发现。首先,明确偏好和观察到的偏好存在差异;学生认为有帮助的并不能完全捕捉到真正有帮助的内容。其次,贝叶斯模型可以综合多个偏好类型的互补数据,形成单一的有效性信号。SMART 通过直接优选偏好优化此信号,我们展示了这种方法能够解决典型的成对比较中的并列和缺失标签问题,从而增加 LLM 输出质量的数据量。第三,关键词提示专家评估 SMART 与 GPT-4 相匹配,并且在低部署成本下,显示了利用多样化学生反馈来调整教育中的 LLMs 的实用性。