May, 2024

从符号任务到代码生成:多样化产生更好的任务执行者

TL;DR通过合适的指令调整,语言模型在指令 - 输出对的训练上能够更好地适应真实世界;研究发现,提供足够多样化的任务集合能够使其在训练分布之外的情况下具备泛化和鲁棒性,并且扩展调整指令集合能够提高代码生成的性能。