May, 2023

逐步验证

TL;DR本文研究了监督方法对于训练语言模型的影响,发现在处理复杂的数学问题时,采用过程监督的方法能够显著提高模型的准确性,同时主动学习也可以有效增强过程监督的效果。最终文章提供了一个完整的数据集,并推荐将过程监督引入到其他相关语言模型的研究中。