Jan, 2024

TPD: 通过原则发现和指导增强学生语言模型推理能力

TL;DR通过基于原则发现的教师 - 学生框架,我们在大型语言模型中有效传递推理能力,并通过对八项推理任务的广泛实验证明,相比于标准的推理提示,TPD 显著提高了学生模型的性能,平均提升了 6.2%。