Oct, 2023

通过互动演示教授语言模型自我提升

TL;DR通过 TriPosT 训练算法,这篇论文介绍如何赋予更小的模型自我改进的能力,从而减小大型语言模型与成本效益更高、运行更快的模型之间的性能差距,并且通过与大型语言模型进行互动,收集反馈和改进,并将这一经验用于训练小模型,实验证明通过学习和纠正自己的错误对于小模型改进性能至关重要。