May, 2024

训练 LLMs 以提升自我调试和解释代码能力

TL;DR自调试是代码生成领域的关键,并且该研究旨在提出一个训练框架,显著提高了语言模型的自调试能力,通过生成一系列解释和改进轨迹,进行自动化数据收集和筛选,进行监督微调和强化学习,并通过对代码解释和改进质量的考虑,实现对四个基准测试的性能提升。研究还表明,通过该框架训练的语言模型能够持续改进代码,并生成更有用的代码解释,帮助开发人员更好地理解源代码中的错误。