Jan, 2024

YODA:面向语言模型的师生渐进学习

TL;DR通过模仿师生教育过程进行优化,本论文引入了 YODA,一种新颖的师生渐进式学习框架,来提高模型微调的效果。实验证明,使用 YODA 的数据训练 LLaMA2 在数学推理方面可以显著提高性能,并且使用课程学习进一步提高了学习的鲁棒性。