Aug, 2024

通过交互式代理基础的数据精炼提高大型语言模型的代码调试能力

TL;DR本研究针对大型语言模型在代码调试方面的能力缺乏探索的问题,提出了DEBUGEVAL,一个全面评估调试能力的基准测试。通过提出MASTER框架,生成经过精炼的数据用于监督微调,从而显著提升调试能力,实验证明该方法有效改进了大型语言模型的调试性能。