Mar, 2024

代码大型语言模型的代码比较调整

TL;DR代码比较调优 (CCT) 是用于优化大型编程语言模型(Code LLMs)以更好地处理微妙的代码错误的简单而有效的调优方法。通过在标记和序列级别上将比较的概念引入指令调优中,使模型能够辨别代码中最细微的偏差。与包含手动添加的代码错误的原始代码进行比较时,我们使用标记级别的偏好损失进行详细的标记级别比较。此外,我们将代码段组合起来,创建一个新的指令调优样本用于序列级别比较,增强了模型的错误修复能力。在HumanEvalFix基准测试中的实验结果表明,CCT在各种代码LLMs上的pass@1分数超过了指令调优4个点,并且广泛的分析证明了我们方法的有效性。