Apr, 2024

CodeFort:代码生成模型的强化训练

TL;DR用 CodeFort 框架提高代码生成模型的鲁棒性,通过丰富训练数据并采用多种训练策略,包括混合数据增强、批量数据增强、对抗性 Logits 对齐和对比学习,将基准 CodeGen 模型的平均鲁棒通过率从 14.79% 提高到 21.74%,尤其在对代码语法扰动的鲁棒性上,通过率的降低显著减少了从 95.04% 到 53.35%。